Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

Καλησπέρα θέλω να κάνω ένα πρόγραμμα σε java και να κάνω σε ένα site request να παίρνω κάποιες πληροφορίες και να ξεχωρίζω αυτές που θέλω και να της αποθηκεύσω κάνω το ερώτημα και παίρνω της συγκεκριμένης πληροφορίες από την όλη σελίδα αλλά τώρα δεν μπορώ να χωρίσω ctf & df και να τα αποθηκεύσω ξεχωριστά ArrayList και να κάνω το άθροισμα στο Tf

<PRE>
      ctf         df
        3          3
</PRE>
<PRE>
    docid     doclen         tf
    13268        689          1
    20199        771          1
    22948        578          1
</PRE>
 Elements p;
    String text,name,str,title, name3,name2=null;
    ArrayList<String> list= new ArrayList<String>();
    int i;
    
                   
  Document doc = Jsoup.connect("site").get();


         p = doc.getElementsByTag("pre");
         

      System.out.println(p);
      

Σας ευχαρηστώ

Δημοσ.

Καταρχήν σύνταξε καλύτερα την ερώτησή σου γιατί δεν βγαίνει κανένα απολύτως νόημα.

Απο αυτά που πόσταρες υποθέτω ότι το site έχει κάποια tags <pre> και σε αυτά βρίσκεται κάποιο text το οποίο εσύ καταφέρνεις και παίρνεις. Αλλά θέλεις να τα χωρίσεις.

 

Με λίγα λόγια θέλεις να τα κάνεις tokens. Κοίτα έναν τρόπο εδώ για να το κάνεις http://www.mkyong.com/java/java-stringtokenizer-example/

 

Σε περίπτωση που το ψάχνεις στο Jsoup το text απο ένα Element το παίρνουμε με το .text()

Δημοσ.

Αν προσπαθείς να υλοποιήσεις tf-idf retrieval model και δε μπορείς να γίνεις πιο συγκεκριμένος απ' αυτό που διατύπωσες στην ερώτηση θα έχεις μεγάλο πρόβλημα.

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...