mike-intosh Δημοσ. 23 Μαρτίου 2009 Δημοσ. 23 Μαρτίου 2009 Καλησπέρα σε όλους. Προσπαθώ να βρω πληροφορίες για την δημιουργία ενός script με το οποίο θέλω να ανακαλύπτω τους καταλόγους μιας ιστοσελίδας. Για παράδειγμα να δέχεται ως είσοδο την ιστοσελίδα (π.χ. http://www.domain.com) και να τυπώνει στην οθόνη τους καταλόγους (φακέλους) που περιέχονται σε αυτήν. Έχω ψάξει κάποια πράγματα σε php. Παρακαλώ οποιαδήποτε πρόταση-συμβουλή είναι δεκτή. Ευχαριστώ προκαταβολικά.
macabre_sunsets Δημοσ. 23 Μαρτίου 2009 Δημοσ. 23 Μαρτίου 2009 Σε δικιά σου σελίδα το θέλεις να το κάνεις? Ή να βλέπεις καταλόγους γενικά οποιασδήποτε σελίδας? Ψάχνεις κάτι σαν αυτό στην εικόνα? http://www.webxplorer.org/phpXplorer/www/Screenshots/main.png
mike-intosh Δημοσ. 23 Μαρτίου 2009 Μέλος Δημοσ. 23 Μαρτίου 2009 Όχι σε δική μου. Σε οποιαδήποτε ιστοσελίδα. Απο την εικόνα που δείχνεις από όσο κατάλαβα δεν είναι αυτό που ψάχνω.
parsifal Δημοσ. 23 Μαρτίου 2009 Δημοσ. 23 Μαρτίου 2009 Δεν υποστηρίζεται άμεσα από το HTTP πρωτόκολλο κάτι τέτοιο, καθώς δεν υπάρχει HTTP method αντίστοιχη με τη δουλειά που κάνει π.χ. η LIST σε FTP. Μόνο με έμμεσο τρόπο: parsing + crawling. Google για php web crawler...
mike-intosh Δημοσ. 23 Μαρτίου 2009 Μέλος Δημοσ. 23 Μαρτίου 2009 Βρήκα αρκετά για php. Τα δοκίμασα και σε κάποιες ιστοσελίδες δουλεύουν σε άλλες πάλι όχι. Υπάρχει περίπτωση το Disallow σε ένα robots.txt αρχείο να είναι απαγορευτικό και για αυτό να μην εμφανίζονται οι κατάλογοι (την ώρα που σε άλλα sites δουλεύει κανονικά) ή μήπως κρύβεται κάτι ποιο advanced (δηλ. άλλος τρόπος ασφάλειας για μη-αποκάλυψη);
parsifal Δημοσ. 23 Μαρτίου 2009 Δημοσ. 23 Μαρτίου 2009 Υπάρχει περίπτωση το Disallow σε ένα robots.txt αρχείο να είναι απαγορευτικό και για αυτό να μην εμφανίζονται οι κατάλογοι (την ώρα που σε άλλα sites δουλεύει κανονικά) Ναι, φυσικά. Μπορεί το robots.txt να επιτρέπει μόνο crawlers με συγκεκριμένο user agent (π.χ. Google), να περιορίζει την πρόσβαση σε συγκεκριμένους καταλόγους κλπ. Εξαρτάται και από την PHP library που χρησιμοποίησες κατά πόσο λειτουργεί ως well-behaved robot (σέβεται το robots.txt) ή όχι. ...ή μήπως κρύβεται κάτι ποιο advanced (δηλ. άλλος τρόπος ασφάλειας για μη-αποκάλυψη); .htaccess files, δυναμικά sites που οργανώνουν τη δομή τους όχι μόνο βάσει directories αλλά και του querystring κ.ά.
Επισκέπτης Δημοσ. 23 Μαρτίου 2009 Δημοσ. 23 Μαρτίου 2009 @mike-intosh ακόμα και με ένα .htaccess αρχείο με Options -Indexes μπορούν να αποτρέψουν το directory listing...ίσως γιαυτό σε μερικά δε δουλεύει...
mike-intosh Δημοσ. 23 Μαρτίου 2009 Μέλος Δημοσ. 23 Μαρτίου 2009 Ναι γνωρίζω για τα htaccess. Οπότε κάτι τέτοιο σημαίνει πως δεν υπάρχει τρόπος (πλη των super-hackerαδικων) να βρω τους καταλόγους ενος site. Κρίμα που δεν ζει ο παππούς μου που ήταν χάκερ...
Προτεινόμενες αναρτήσεις
Αρχειοθετημένο
Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.