Προς το περιεχόμενο

Search σε σελίδα, πολλές εγγραφές, εξαγωγή τους


HamerZ

Προτεινόμενες αναρτήσεις

Δημοσ.

Υπάρχει δυνατότητα να εξάγω τα αποτελέσματα από διάφορες σελίδες που μου τα εμφανίζει σε ομάδες των 10, δηλαδή εμφανίζει τις πρώτες 10 και μετά πατάς στην σελίδα 2 για τις 11-20 εγγραφές κτλ;

Συγκεκριμένα να αποθηκεύσω όλες τις σελίδες που μου έβγαλε το search του συγκεκριμένου site.

 

Ίσως κάτι σε php με κάποιο tutorial;

Δημοσ.

Για το πως να αποθηκεύσεις μια σελίδα, μπορείς να διαβάσεις αυτό: http://www.insomnia.gr/topic/398302-%CE%B5%CE%B3%CE%B3%CF%81%CE%B1%CF%86%CE%B7-%CF%83%CE%B5%CE%BB%CE%B9%CE%B4%CE%B1%CF%82-%CE%BC%CE%B5-php/

Για το δεύτερο που ρωτάς, κάθε σελίδα έχει το δικό της τρόπο αρίθμησης, για παράδειγμα η google έχει το www.google.gr/#q=test&start=10 ενώ το insomnia έχει το www.insomnia.gr/topic/39830/page__st__10. Γράψε μας ποια είναι η σελίδα που θες για να σου δώσουμε και το loop που πρέπει να γράψεις

Δημοσ.

Παλαιότερο θέμα "εξαγωγή πληροφοριών από σελίδα" Link

αλλά δεν με βοήθησε τόσο.

 

Ευχαριστώ, όντως είδα την αλλαγή του αριθμού πχ :

... login.php?action=sActivities&page=6&uid=48fa2994ab62fe81a573091aa1a80879b6fd170d

και αλλάζει το νούμερο &page=6&

για παράδειγμα Link.

 

Επόμενο ερώτημα είναι πως βρήσκω πληροφορίες για τις απαραίτητες εντολές, συντακτικό κτλ. Να μην τα παίρνω και όλα έτοιμα! Που βρήσκω πληροφορίες για να το κάνω για την κάθε σελίδα που μπορεί να επισκευτώ;

Δημοσ.

Υποθέτοντας ότι γνωρίζεις έστω και τα βασικά του προγραμματισμού (τι είναι οι μεταβλητές, οι βρόγχοι επανάληψης, οι συνθήκες ελέγχου κτλ), για php ο πρώτος σταθμός είναι εδώ. Από εκεί και πέρα, το πως θα το λύσεις είναι καθαρά θέμα λογικής και σειράς. Για παράδειγμα, στο δικό σου πρόβλημα μια πιθανή λύση είναι η εξής:

 

1) Παίρνεις σαν είσοδο τη σελίδα που θα γίνει η αναζήτηση

2) Παίρνεις σαν είσοδο τη λέξη αναζήτησης

3) Ανάλογα με τη σελίδα, φορτώνεις το string αναζήτησης (πχ www.google.gr/search?q=) και του προσθέτεις τη λέξη αναζήτησης. Το αποτέλεσμα το αποθηκεύεις στη μεταβλητή str

4) Τρέχεις ένα loop για τρέχουσα_σελίδα από 1 μέχρι 5000 με βήμα 10:

....i) Φτιάχνεις μια μεταβλητή temp = str + "page=" + τρέχουσα_σελίδα

....ii) Ελέγχεις αν αυτή η σελίδα με το url που έφτιαξες παραπάνω υπάρχει

....iii) Αν υπάρχει την κατεβάζεις, αν όχι θέτεις τρέχουσα_σελίδα = 5000 (για να βγεις από το loop)

 

Δε ξέρω βέβαια αν σε βοήθησα ή αν σε μπέρδεψα περισσότερο!

  • 5 εβδομάδες αργότερα...
Δημοσ.

Μετά από διάβασμα και δοκιμές έφτασα στο :

- Παίρνω το table και το περνώ

προσπάθησα να το κάνω μόνος, αλλά προέκυψε πρόβλημα:

=> στο αρχείο μου τα αποθηκεύει με πολλά κενά ή tabs ανά πληροφορία και

ενώ δοκίμασα να τα αφαιρέσω ακόμη και με διάφορα tutorials, δεν το κατάφερα

 

κάποια πρόταση;

parseTable_test.php

file1.txt

parseTable_test.php

temp1.html

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...