evi_xlou Δημοσ. 4 Φεβρουαρίου 2022 Δημοσ. 4 Φεβρουαρίου 2022 Παιδιά καλησπέρα! Θέλω τη βοήθεια και τα φώτα σας! Έχω να παραδώσω σε 4 μέρες μια εργασία και το θέμα είναι σχετικα με το weka και στο πρακτικό του κομμάτι εξειδικεύεται με τους αλγορίθμους συσταδοποίησης. Έχω ολοκληρώσει το θεωρητικό κομμάτι και τη βιβλιογραφική αναφορά σε πρακτικές εφαρμογές που έκαναν άλλοι με αντίστοιχο θέμα. Και τώρα μένει το το πρακτικό κομμάτι που ειβαι να πάρω δυο τρεις βάσεις δεδομένων ξαι να τος τρέξω στο πρόγραμμα. Τα έχω δει σκούρα και δεν ξέρω τι να κάνω. Είμαι εντελωσ άσχετη και μη ερωτήσετε γιατί πήρα αυτό το θέμα γιατί ούτε εγώ δεν ξέρω. Έχω ψάξει στην Kaggle για βάσεις και έχω τρέξει κάποιες αλλά εφαρμόζοντας τους αλγόριθμους (πολλούς) μου φαίνεται ότι δε μου βγάζει σωστή συσταδοποίηση ποτέ. Επισησ έχω μπερδευτεί και με την προεπεξεργασία γιατι καποεσ Βάσεις εχουν ήδη υποστεί προεπεξεργασία ομωσ Άλλες όχι. Είναι όλα τόσο μπερδεμένα και δεν υπάρχει κάποιος να τα εξηγεί βήμα βήμα. Το μόνο που υπάρχει ειναι αποσπασματικές πληροφορίες! Σώστε με!! Τα φώτα σας παρακαλώ.
micos000 Δημοσ. 4 Φεβρουαρίου 2022 Δημοσ. 4 Φεβρουαρίου 2022 Θα ήθελα να δω ποιος θα απαντήσει σε αυτό το θέμα! Εγώ το μόνο που μπορώ να προσφέρω είναι το tutorialpoint της weka μήπως και σου ξέφυγε και δεν το είδες και ένα ακόμα tutorial. Επίσης βλέπω αρκετά tutorials στο youtube. https://www.tutorialspoint.com/weka/weka_clustering.htm https://www.geeksforgeeks.org/k-means-clustering-using-weka/
evi_xlou Δημοσ. 4 Φεβρουαρίου 2022 Μέλος Δημοσ. 4 Φεβρουαρίου 2022 1 ώρα πριν, micos000 είπε Θα ήθελα να δω ποιος θα απαντήσει σε αυτό το θέμα! Εγώ το μόνο που μπορώ να προσφέρω είναι το tutorialpoint της weka μήπως και σου ξέφυγε και δεν το είδες και ένα ακόμα tutorial. Επίσης βλέπω αρκετά tutorials στο youtube. https://www.tutorialspoint.com/weka/weka_clustering.htm https://www.geeksforgeeks.org/k-means-clustering-using-weka/ Δεν ξέρω ποιος θα απαντήσει αλλά ελπίζω να απαντήσει κάποιος που έχει γνώση του θέματος. Έχω δει αρκετά στο YouTube όμως το θέμα είναι πως τα περισσότερα είναι πάνω στα datasets που έχει σαν αρχείο μέσα το weka για εξάσκηση και περιορισμένης Έκτασης, σου λένε μόνο τα πολύ βασικά. Και ίσως αυτό σε κάποιον με γνώσεις στο αντικειμενο να αρκούν αλλά για εμένα που δεν είχα καμία επαφή μέχρι τώρα δεν βοηθάνε ιδιαίτερα. Σε ευχαριστώ πολύ θα τα τσεκάρω!
skepas Δημοσ. 5 Φεβρουαρίου 2022 Δημοσ. 5 Φεβρουαρίου 2022 (επεξεργασμένο) Θα προσπαθησω οσο καλυτερα μπορω να σε βοηθησω μιας και ημουν βοηθος εργαστηριου στο αντιστοιχο μαθημα. Θα ξεκινησω με το πρωτο πρωτο βημα, το οποιο ειναι να βρεις ενα ντατασετ. Μπες εδω: https://archive.ics.uci.edu/ml/datasets.php?format=&task=&att=&area=life&numAtt=&numIns=&type=&sort=nameUp&view=table και βρες οποιο ντατασετ σε βολευει. Μαλιστα σε καθε ντατασετ λεει και για ποιο τασκ (classification/clustering etc) ειναι καταλληλα. Επισης αν ανοιξεις μεσα ενα απο αυτα λεει αν εχει ή οχι ακυρες τιμες, αν χρειαζεται προεπεξεργασια κτλπ. Δυστυχως εδω πρεπει να ψαξεις εσυ να το βρεις αυτο. Τωρα τα βηματα για να χρησιμοποιησεις το WEKA ειναι απλα. Και οπως γραφεις εχεις ηδη τρεξει μερικες αναλυσεις. Στην περιπτωση του classification το αποτελεσματα θα ειναι κατι τετοιο: Θα ξεκινησω με αυτα που θα αγνοησουμε μιας και φανταζομαι πως δεν θα εχετε αυτα στην υλη: F - Measure, MCC, ROC area RPC area. Σκοπος του classification ειναι να προβλεψει ο αλγορiθμος οτι ενα σετ απο δεδομενα αντιστοιχει σε μια απο τις κλασεις που το εχουν δωθει. Αν δεις γραφει Correctly Classified Instances 6 και ποσοστο 42%, το οποιο ειναι το accuracy. Αυτο σημαινει οτι απο το συνολο των 14 δεδομενων/παρατηρησεων, βρηκε σωστα τα 6 απο αυτα. Δηλαδη προβλεψε την σωστη/αντιστοιχη κλαση τους. Αν "παιξεις" με τις παραμετρους του classifier ισως παρεις καλυτερα αποτελεσμα, αλλα θα πρεπει να τρεξεις δικα σου πειραματα να το δωσεις. Τις παραμετρους τις αλλαζεις στο πανω πανω κουτακι που διαλεγεις τον classifier. ελπιζω να μην σε μπερδεψα, αν σε βολευει καποιο instant messaging (skype) στειλε μου ενα μηνυμα Επεξ/σία 5 Φεβρουαρίου 2022 από skepas
evi_xlou Δημοσ. 5 Φεβρουαρίου 2022 Μέλος Δημοσ. 5 Φεβρουαρίου 2022 10 λεπτά πριν, skepas είπε Θα προσπαθησω οσο καλυτερα μπορω να σε βοηθησω μιας και ημουν βοηθος εργαστηριου στο αντιστοιχο μαθημα. Θα ξεκινησω με το πρωτο πρωτο βημα, το οποιο ειναι να βρεις ενα ντατασετ. Μπες εδω: https://archive.ics.uci.edu/ml/datasets.php?format=&task=&att=&area=life&numAtt=&numIns=&type=&sort=nameUp&view=table και βρες οποιο ντατασετ σε βολευει. Μαλιστα σε καθε ντατασετ λεει και για ποιο τασκ (classification/clustering etc) ειναι καταλληλα. Επισης αν ανοιξεις μεσα ενα απο αυτα λεει αν εχει ή οχι ακυρες τιμες, αν χρειαζεται προεπεξεργασια κτλπ. Δυστυχως εδω πρεπει να ψαξεις εσυ να το βρεις αυτο. Τωρα τα βηματα για να χρησιμοποιησεις το WEKA ειναι απλα. Και οπως γραφεις εχεις ηδη τρεξει μερικες αναλυσεις. Στην περιπτωση του classification το αποτελεσματα θα ειναι κατι τετοιο: Θα ξεκινησω με αυτα που θα αγνοησουμε μιας και φανταζομαι πως δεν θα εχετε αυτα στην υλη: F - Measure, MCC, ROC area RPC area. Σκοπος του classification ειναι να προβλεψει ο αλγορiθμος οτι ενα σετ απο δεδομενα αντιστοιχει σε μια απο τις κλασεις που το εχουν δωθει. Αν δεις γραφει Correctly Classified Instances 6 και ποσοστο 42%, το οποιο ειναι το accuracy. Αυτο σημαινει οτι απο το συνολο των 14 δεδομενων/παρατηρησεων, βρηκε σωστα τα 6 απο αυτα. Δηλαδη προβλεψε την σωστη/αντιστοιχη κλαση τους. Αν "παιξεις" με τις παραμετρους του classifier ισως παρεις καλυτερα αποτελεσμα, αλλα θα πρεπει να τρεξεις δικα σου πειραματα να το δωσεις. Τις παραμετρους τις αλλαζεις στο πανω πανω κουτακι που διαλεγεις τον classifier. ελπιζω να μην σε μπερδεψα, αν σε βολευει καποιο instant messaging (skype) στειλε μου ενα μηνυμα Ευχαριστώ πολύ γιατί μην απάντηση και τις οδηγίες. Το κομμάτι που έχω αναλάβει εγώ είναι το clustering. Έχω ήδη βρει μερικές βάσεις δεδομένων από την kaggle οι οποίες από όσο μπορώ να καταλάβω έχουν υποστεί επεξεργασία ήδη απλά δεν ξέρω αν πρέπει και εγώ να κάνω κάτι παραπάνω. Επίσης αυτό που δεν μπορώ να καταλάβω είναι με τι κριτήριο πχ θα επιλέγω να αγνοήσω κάποια attributes. Επίσης αν θα πρέπει να τρέξω τους αλγορίθμους χρησιμοποιώντας μόνο την επιλογή use training set ή αν θα πρέπει να επαναλάβω και με την επιλογή classes to clusters evaluation. Το weka έχει απά είδες επιλογές και δυνατότητες και εγώ νιώθω χαμένη!
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα