Προς το περιεχόμενο

Προτεινόμενες αναρτήσεις

Δημοσ.

καλημέρα, έχει κανείς υλικό για τους παραπανω αλγοριθμους; Και θεωρητικα και καμια υλοποιηση, κατα προτιίμηση σε R ή python.

 

Εχω βρει τα κλασσικά μόνο, δλδ το βιβλιο-βιντεο-ecourse του stanford

https://lagunita.stanford.edu/courses/course-v1:ComputerScience+MMDS+SelfPaced/info

 

μια υλοποίηση σε R http://ethen8181.github.io/machine-learning/clustering_old/text_similarity/text_similarity.html

 

το βιβλίο http://infolab.stanford.edu/~ullman/mmds/book.pdf

ενώ όλα τα ppt από διάφορα προγραμματα ειναι clopy paste μεταξυ τους.

Δημοσ.

ευχαριστω, ψαχνω κατι πιο εισαγωγικο για να καταλαβω τους αλγοριθμους, αλλα οτι βρισκω ασχολειται με την δημιουργια πινακων για jaccardy ομοιοτητα αρχικα, το οποιο δεν ειναι πολυ ρεαλιστικο στην περιπτωση μου (θελω να δουλεψω σε 20000 κειμενακια).

Επισκέπτης
Δημοσ.

Αν έχεις όρεξη για διάβασμα (είναι καμιά 50αριά σελίδες) έχει μια πολύ αναλυτική ερμηνεία εδώ:

http://infolab.stanford.edu/~ullman/mmds/ch3a.pdf

 

Από άποψη υλοποίησης υπάρχει ένα πολύ ωραίο library με 15 διαφορετικούς αλγόριθμους σε C#. Θα το βρεις εδώ:

https://fuzzystring.codeplex.com/

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...