Προς το περιεχόμενο

[Λύθηκε] Τροποποίηση του Porter Stemming Algorithm


Evangeli

Προτεινόμενες αναρτήσεις

Δημοσ.

Παιδιά σας έχω ζαλίσει με τις ερωτήσεις μου, το ξέρω. Αν σας πρήζω με τα επανειλημμένα topics μου πείτε το και θα τα ελαττώσω, δεν υπάρχει παρεξήγηση. Απλά πιστεύω ότι στην πλειοψηφία τους δεν έχουν ξανασυζητηθεί εδώ.

 

Λοιπόν, προσπαθώ να κάνω χρήση του Porter Stemming Algorithm. Έχω κάνει μια μικρή τροποποίηση ως προς τον default κώδικα ώστε να κάνει stemming σε όλες τις λέξεις απ ένα δοθέν αρχείο. (επισυνάπτω κώδικα) Όμως αυτό που θέλω στην πραγματικότητα είναι, με όσο το δυνατών λιγότερες αλλαγές, να διαβάζοντας μια λέξη την φορά, να εφαρμόζει τον αλγόριθμο και να επιστέφει την νέα λέξη. Για να μην σας πολύ παιδεύω η ερώτηση μου συνοψίζεται μάλλον ως εξής: Πιο είναι το ισοδύναμο του

 

FileInputStream in = new FileInputStream(source);

int ch = in.read();

όπου η read() reads a byte of data from this input stream για την περίπτωση που το input μου είναι ένα string και όχι μια ροή από δεδομένα του buffer? Αν σας βολεύει να κάνετε απευθείας τις αλλαγές στον κώδικα, θα σας παρακαλέσω να σχολιάστε τον παλιό.

 

Βαγγέλης.

porter.txt

Δημοσ.
δεν ξέρω αν θες κάτι σαν αυτό.

έτσι που το έθεσες ήταν λίγο μπερδεμένο

δες το και πες μου

 

Many-many thanks. That's exactly what i need!!! Μια τελευταία ερώτηση: Πιο version είναι ο αλγόριθμος γιατί δεν αναφέρεται κάτι μέσα στον κώδικα. Ποιος τον έχει τροποποιήσει? Γιατί προφανώς δεν είναι ο αλγόριθμος που δίνει το επίσημο site.

Δημοσ.

είναι αυτό που έστειλες με μια τροποποίηση

που του έκανα που δέχεται σαν όρισμα string και δίνει την απάντηση που θες

>

[color="Red"]//import java.io.*; αυτό δεν χρειάζεται πλέον[/color]


[color="Red"]public String getPorter(String line){//αυτό το [πρόσθεσα εγώ
line=line.toLowerCase();
       	b=new char[line.length()];
       	for (int j=0;j<line.length();j++) {
       		add(line.charAt(j));
       	}
       	stem();
       		String result=toString();
       		return result;
}[/color]

 

αφαίρεσα την static void μέθοδο main και την porterStemming

Αρχειοθετημένο

Αυτό το θέμα έχει αρχειοθετηθεί και είναι κλειστό για περαιτέρω απαντήσεις.

  • Δημιουργία νέου...