Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Ψάχνω ένα δυνατό tutorial για web parsing σε δυναμικές σελίδες σε java.

Ιδανικά θα ήταν κάτι για htmlUnit, αλλά δεν αποκλείω κάτι διαφορετικό.

Δημοσ.

Θα πρότεινα να δεις τις λύσεις από Python. Έχει φοβερά modules. 

Keywords: 

mechanize (Python 2.X only), Beautiful soup, SeleniumRC, Mechanical soup

Ψάξε στο google βάζοντας (π.χ.) "beautiful soup tutorial python" ή "seleniumrc tutorial python". 

Δημοσ.
23 ώρες πριν, Salecon είπε

Θα πρότεινα να δεις τις λύσεις από Python. Έχει φοβερά modules. 

Keywords: 

mechanize (Python 2.X only), Beautiful soup, SeleniumRC, Mechanical soup

Ψάξε στο google βάζοντας (π.χ.) "beautiful soup tutorial python" ή "seleniumrc tutorial python". 

Θα πρέπει να ξεκινήσω πρώτα με python, που δεν την κατέχω. Και δυστυχώς, δεν έχω χρόνο.

Ευχαριστώ πάντως.

  • 1 χρόνο αργότερα...
Δημοσ.

Καντο με Python. Ευκαιρία να μάθεις, και χωρίς να έχεις την παραμικρή ιδέα, και πάλι θα είναι πολύ γρηγοροτερο να αναπτύξεις το scrapper σε python παρά σε Java. 

Δημοσ. (επεξεργασμένο)
Στις 10/9/2020 στις 9:54 ΜΜ, Lanike71 είπε

Έτσι για να ολοκληρωθεί το θέμα, βρήκα άκρη με Selenium σε java.

Ωραιος! Ο,τι θες ρωτα

 

Εδω ενα καλο plugin για να βρισκεις γρηγορα το xpath https://chrome.google.com/webstore/detail/chropath/ljngjbnaijcbncmcnjfhigebomdlkcjo

Επεξ/σία από Στεφανος123
  • 2 εβδομάδες αργότερα...
Δημοσ.

Και εγω το selenium θα σου πρότεινα για δυναμικές σελίδες μιας και το htmlUnit ειναι πολύ παλιό.. αν και προσωπικά δεν είμαι ευχαριστημένος ούτε από το selenium μιας και έχει αρκετά bugs ακόμα ( ειδικά όταν είναι headless ) αλλά δυστιχώς δεν υπάρχει κάτι καλύτερο.

Tutorial υπάρχουν άπειρα ..

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...