Προς το περιεχόμενο

Script για αποθήκευση πολλαπλών ιστοσελίδων από το Google Cache


Alexskot

Προτεινόμενες αναρτήσεις

Δημοσ.

Γεια σας, μπορεί κάποιος να μου πει πως γίνεται να αποθηκεύσω όλες τις ιστοσελίδες που έχει σαν αποτελέσματα το google με τον τελεστή site: , επειδή είναι γύρω στα 3000 τα αποτελέσματα και δεν θέλω να το κάνω ένα ένα. Ήταν ένα site που έκλεισε και θέλω να αποθηκευτούν από το cache της google και όχι το script να τα τραβάει από το server του site γιατί είναι κάτω.

 

-----------------------------------------------------------------------------------------------

 

Βρήκα ένα έτοιμο script σε python που χρησημοπιεί μια regex αλλά κατεβάζει μόνο τις δέκα πρώτες σελίδες. Θα μπορούσε να βοηθήσει κάποιος γιατί εγώ είμαι άσχετος στις regular expressions.

Ορίστε το script

Δημοσ.

Το βρήκα το πρόβλημα, έβαλα να εμφανίζονται 100 αποτελέσματα αντί για 10 ανά σελίδα στο GET αίτημα και χρειαζόταν επίσης να παίρνει άλλη ip μέσω proxy ανά 100 λήψεις αλλιώς το google με μπλόκαρε, οπότε ας κλειδώσει κάποιος διαχειριστής το θέμα.

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...