Alexskot Δημοσ. 14 Μαΐου 2011 Δημοσ. 14 Μαΐου 2011 Γεια σας, μπορεί κάποιος να μου πει πως γίνεται να αποθηκεύσω όλες τις ιστοσελίδες που έχει σαν αποτελέσματα το google με τον τελεστή site: , επειδή είναι γύρω στα 3000 τα αποτελέσματα και δεν θέλω να το κάνω ένα ένα. Ήταν ένα site που έκλεισε και θέλω να αποθηκευτούν από το cache της google και όχι το script να τα τραβάει από το server του site γιατί είναι κάτω. ----------------------------------------------------------------------------------------------- Βρήκα ένα έτοιμο script σε python που χρησημοπιεί μια regex αλλά κατεβάζει μόνο τις δέκα πρώτες σελίδες. Θα μπορούσε να βοηθήσει κάποιος γιατί εγώ είμαι άσχετος στις regular expressions. Ορίστε το script
Alexskot Δημοσ. 15 Μαΐου 2011 Μέλος Δημοσ. 15 Μαΐου 2011 Το βρήκα το πρόβλημα, έβαλα να εμφανίζονται 100 αποτελέσματα αντί για 10 ανά σελίδα στο GET αίτημα και χρειαζόταν επίσης να παίρνει άλλη ip μέσω proxy ανά 100 λήψεις αλλιώς το google με μπλόκαρε, οπότε ας κλειδώσει κάποιος διαχειριστής το θέμα.
b_real Δημοσ. 15 Μαΐου 2011 Δημοσ. 15 Μαΐου 2011 ποσταρε το κωδικα αν θες...μπορει καποιος να ενδιαφερεται για την λυση
Προτεινόμενες αναρτήσεις
Αρχειοθετημένο
Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.