Προς το περιεχόμενο

WEKA CLUSTERING SOS


Προτεινόμενες αναρτήσεις

Δημοσ.

Παιδιά καλησπέρα! Θέλω τη βοήθεια και τα φώτα σας! Έχω να παραδώσω σε 4 μέρες μια εργασία και το θέμα είναι σχετικα με το weka  και στο πρακτικό του κομμάτι εξειδικεύεται με τους αλγορίθμους συσταδοποίησης. Έχω ολοκληρώσει το θεωρητικό κομμάτι και τη βιβλιογραφική αναφορά σε πρακτικές εφαρμογές που έκαναν άλλοι με αντίστοιχο θέμα. Και τώρα μένει το το πρακτικό κομμάτι που ειβαι να πάρω δυο τρεις βάσεις δεδομένων ξαι να τος τρέξω στο πρόγραμμα. Τα έχω δει σκούρα και δεν ξέρω τι να κάνω. Είμαι εντελωσ άσχετη και μη ερωτήσετε γιατί πήρα αυτό το θέμα γιατί ούτε εγώ δεν ξέρω. Έχω ψάξει στην Kaggle για βάσεις και έχω τρέξει κάποιες αλλά εφαρμόζοντας τους αλγόριθμους (πολλούς) μου φαίνεται ότι δε μου βγάζει σωστή συσταδοποίηση ποτέ. Επισησ έχω μπερδευτεί και με την προεπεξεργασία γιατι καποεσ Βάσεις εχουν ήδη υποστεί προεπεξεργασία ομωσ Άλλες όχι. Είναι όλα τόσο μπερδεμένα και δεν υπάρχει κάποιος να τα εξηγεί βήμα βήμα. Το μόνο που υπάρχει ειναι αποσπασματικές πληροφορίες! Σώστε με!! Τα φώτα σας παρακαλώ. 

Δημοσ.

Θα ήθελα να δω ποιος θα απαντήσει σε αυτό το θέμα!

Εγώ το μόνο που μπορώ να προσφέρω είναι το tutorialpoint της weka μήπως και σου ξέφυγε και δεν το είδες και ένα ακόμα tutorial. Επίσης βλέπω αρκετά tutorials στο youtube.

https://www.tutorialspoint.com/weka/weka_clustering.htm

https://www.geeksforgeeks.org/k-means-clustering-using-weka/

 

Δημοσ.
1 ώρα πριν, micos000 είπε

Θα ήθελα να δω ποιος θα απαντήσει σε αυτό το θέμα!

Εγώ το μόνο που μπορώ να προσφέρω είναι το tutorialpoint της weka μήπως και σου ξέφυγε και δεν το είδες και ένα ακόμα tutorial. Επίσης βλέπω αρκετά tutorials στο youtube.

https://www.tutorialspoint.com/weka/weka_clustering.htm

https://www.geeksforgeeks.org/k-means-clustering-using-weka/

 

Δεν ξέρω ποιος θα απαντήσει αλλά ελπίζω να απαντήσει κάποιος που έχει γνώση του θέματος.  Έχω δει αρκετά στο YouTube όμως το θέμα είναι πως τα περισσότερα είναι πάνω στα datasets που έχει σαν αρχείο μέσα το weka για εξάσκηση και περιορισμένης  Έκτασης,  σου λένε μόνο τα πολύ βασικά. Και ίσως αυτό σε κάποιον με γνώσεις στο αντικειμενο να αρκούν αλλά για εμένα που δεν είχα καμία επαφή μέχρι τώρα δεν βοηθάνε ιδιαίτερα. Σε ευχαριστώ πολύ θα τα τσεκάρω! 

Δημοσ. (επεξεργασμένο)

Θα προσπαθησω οσο καλυτερα μπορω να σε βοηθησω μιας και ημουν βοηθος εργαστηριου στο αντιστοιχο μαθημα.

Θα ξεκινησω με το πρωτο πρωτο βημα, το οποιο ειναι να βρεις ενα ντατασετ. Μπες εδω: https://archive.ics.uci.edu/ml/datasets.php?format=&task=&att=&area=life&numAtt=&numIns=&type=&sort=nameUp&view=table
και βρες οποιο ντατασετ σε βολευει. Μαλιστα σε καθε ντατασετ λεει και για ποιο τασκ (classification/clustering etc) ειναι καταλληλα. Επισης αν ανοιξεις μεσα ενα απο αυτα λεει αν εχει ή οχι ακυρες τιμες, αν χρειαζεται προεπεξεργασια κτλπ. Δυστυχως εδω πρεπει να ψαξεις εσυ να το βρεις αυτο.

Τωρα τα βηματα για να χρησιμοποιησεις το WEKA ειναι απλα. Και οπως γραφεις εχεις ηδη τρεξει μερικες αναλυσεις. Στην περιπτωση του classification το αποτελεσματα θα ειναι κατι τετοιο: Weka - Classifiers

Θα ξεκινησω με αυτα που θα αγνοησουμε μιας και φανταζομαι πως δεν θα εχετε αυτα στην υλη: F - Measure, MCC, ROC area RPC area.
 

Σκοπος του classification ειναι να προβλεψει ο αλγορiθμος οτι ενα σετ απο δεδομενα αντιστοιχει σε μια απο τις κλασεις που το εχουν δωθει. Αν δεις γραφει Correctly Classified Instances 6 και ποσοστο 42%, το οποιο ειναι το accuracy. Αυτο σημαινει οτι απο το συνολο των 14 δεδομενων/παρατηρησεων, βρηκε σωστα τα 6 απο αυτα. Δηλαδη προβλεψε την σωστη/αντιστοιχη κλαση τους.

Αν "παιξεις" με τις παραμετρους του classifier ισως παρεις καλυτερα αποτελεσμα, αλλα θα πρεπει να τρεξεις δικα σου πειραματα να το δωσεις. Τις παραμετρους τις αλλαζεις στο πανω πανω κουτακι που διαλεγεις τον classifier.

ελπιζω να μην σε μπερδεψα, αν σε βολευει καποιο instant messaging (skype) στειλε μου ενα μηνυμα

Επεξ/σία από skepas
Δημοσ.
10 λεπτά πριν, skepas είπε

Θα προσπαθησω οσο καλυτερα μπορω να σε βοηθησω μιας και ημουν βοηθος εργαστηριου στο αντιστοιχο μαθημα.

Θα ξεκινησω με το πρωτο πρωτο βημα, το οποιο ειναι να βρεις ενα ντατασετ. Μπες εδω: https://archive.ics.uci.edu/ml/datasets.php?format=&task=&att=&area=life&numAtt=&numIns=&type=&sort=nameUp&view=table
και βρες οποιο ντατασετ σε βολευει. Μαλιστα σε καθε ντατασετ λεει και για ποιο τασκ (classification/clustering etc) ειναι καταλληλα. Επισης αν ανοιξεις μεσα ενα απο αυτα λεει αν εχει ή οχι ακυρες τιμες, αν χρειαζεται προεπεξεργασια κτλπ. Δυστυχως εδω πρεπει να ψαξεις εσυ να το βρεις αυτο.

Τωρα τα βηματα για να χρησιμοποιησεις το WEKA ειναι απλα. Και οπως γραφεις εχεις ηδη τρεξει μερικες αναλυσεις. Στην περιπτωση του classification το αποτελεσματα θα ειναι κατι τετοιο: Weka - Classifiers

Θα ξεκινησω με αυτα που θα αγνοησουμε μιας και φανταζομαι πως δεν θα εχετε αυτα στην υλη: F - Measure, MCC, ROC area RPC area.
 

Σκοπος του classification ειναι να προβλεψει ο αλγορiθμος οτι ενα σετ απο δεδομενα αντιστοιχει σε μια απο τις κλασεις που το εχουν δωθει. Αν δεις γραφει Correctly Classified Instances 6 και ποσοστο 42%, το οποιο ειναι το accuracy. Αυτο σημαινει οτι απο το συνολο των 14 δεδομενων/παρατηρησεων, βρηκε σωστα τα 6 απο αυτα. Δηλαδη προβλεψε την σωστη/αντιστοιχη κλαση τους.

Αν "παιξεις" με τις παραμετρους του classifier ισως παρεις καλυτερα αποτελεσμα, αλλα θα πρεπει να τρεξεις δικα σου πειραματα να το δωσεις. Τις παραμετρους τις αλλαζεις στο πανω πανω κουτακι που διαλεγεις τον classifier.

ελπιζω να μην σε μπερδεψα, αν σε βολευει καποιο instant messaging (skype) στειλε μου ενα μηνυμα

Ευχαριστώ πολύ γιατί μην απάντηση και τις οδηγίες. Το κομμάτι που έχω αναλάβει εγώ είναι το clustering. Έχω ήδη βρει μερικές βάσεις δεδομένων από την kaggle οι οποίες από όσο μπορώ να καταλάβω έχουν υποστεί επεξεργασία ήδη απλά δεν ξέρω αν πρέπει και εγώ να κάνω κάτι παραπάνω. Επίσης αυτό που δεν μπορώ να καταλάβω είναι με τι κριτήριο πχ θα επιλέγω να αγνοήσω κάποια attributes. Επίσης αν θα πρέπει να τρέξω  τους αλγορίθμους χρησιμοποιώντας μόνο την επιλογή use training set ή αν θα πρέπει να επαναλάβω και με την επιλογή classes to clusters evaluation. Το weka έχει απά είδες επιλογές και δυνατότητες και εγώ νιώθω χαμένη! 

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Πρέπει να είστε μέλος για να αφήσετε σχόλιο

Δημιουργία λογαριασμού

Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!

Δημιουργία νέου λογαριασμού

Σύνδεση

Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.

Συνδεθείτε τώρα
  • Δημιουργία νέου...