Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Γεια σας.

Ξερει κανεις πως μπορω να ons να φιλτραρω μια ιστοσελίδα, κρατώντας μόνο τους συνδέσμους URL links, από τα tags καθώς και το κείμενο κάθε συνδέσμου ?? Ευχαριστω πολυ εχω ψαξει παρα πολυ αλλα δεν μπορω να βγαλω ακρη 

Δημοσ.

Επειδή υποψιάζομαι ότι είναι εργασία σε σχολή....

 

Η λύση είναι απλή. Παίρνεις την σελίδα και μετά χρησιμοποιείς το regex της Python. Δες τι κοινό έχουν όλα τα links και φτιάξει την expression σου ανάλογα.

Δημοσ.

Το Expression το εφτιαξα αλλα δεν βγαζω ακρη απο εκει και περα  στο πως θα παρω τα urls και μετα πως θα φτιαξω τον crawler για να διαβασει το κειμενο απο τον καθε συνδεσμο

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...