Python Regular Expressions

Μαντσιος · 4 Απριλίου 2016

Γεια σας.

Ξερει κανεις πως μπορω να ons να φιλτραρω μια ιστοσελίδα, κρατώντας μόνο τους συνδέσμους URL links, από τα tags καθώς και το κείμενο κάθε συνδέσμου ?? Ευχαριστω πολυ εχω ψαξει παρα πολυ αλλα δεν μπορω να βγαλω ακρη

groot · 4 Απριλίου 2016

Επειδή υποψιάζομαι ότι είναι εργασία σε σχολή....

Η λύση είναι απλή. Παίρνεις την σελίδα και μετά χρησιμοποιείς το regex της Python. Δες τι κοινό έχουν όλα τα links και φτιάξει την expression σου ανάλογα.

Μαντσιος · 4 Απριλίου 2016

Το Expression το εφτιαξα αλλα δεν βγαζω ακρη απο εκει και περα στο πως θα παρω τα urls και μετα πως θα φτιαξω τον crawler για να διαβασει το κειμενο απο τον καθε συνδεσμο

groot · 4 Απριλίου 2016

Στις σημειώσεις του μαθήματος δεν έχετε οδηγίες; Δεν σας έκανε παραδείγματα ο καθηγητής;

akis_fc · 5 Απριλίου 2016

Keywords:

Crawler = beautifulsoup

'Φιλτράρισμα' = xpath

pmav99 · 5 Απριλίου 2016

Ρωτούσε και άλλη μια κοπέλα.

http://python.org.gr/index.php/kunenaforum/anazitisi-voitheias/2233-%CE%B5%CE%BE%CE%B1%CE%B3%CF%89%CE%B3%CE%AE-links-%CE%B1%CF%80%CF%8C-%CE%B9%CF%83%CF%84%CE%BF%CF%83%CE%B5%CE%BB%CE%AF%CE%B4%CE%B1#3574

Τι σχολή είστε;

Σύνδεση

Python Regular Expressions

Προτεινόμενες αναρτήσεις

Μαντσιος

groot

Μαντσιος

groot

akis_fc

pmav99

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση