Lux Aeterna Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 Καλησπέρα! Χρειάζομαι μία βοήθεια για να ξεμπλοκάρω με την πτυχιακή μου (κοινωνικών επιστημών) για οποιον έχει την καλή διάθεση! Έχω κάνει έρευνα με ερωτηματολόγιο σε ειδικό πληθυσμό και έχω αρκετές αναπάντητες ερωτήσεις, τόσο σε ερωτηματολογια όσο και στα δημογραφικά. Τα missing values είναι σε γενικές γραμμές κάτω από 5%, αλλά συγκεντρώνονται σε συγκεκριμένους συμμετέχοντες. Έχω λοιπόν ορισμένες απορίες για όποιον έχει την καλή διάθεση! Τα κεντρικά θέματα είναι δύο: Με ποια κριτήρια (αναφορικά με τις αναπάντητες ερωτήσεις) πετάω έξω συμμετέχοντες; Σκοπεύω να αντικατααστήσω missing values με τη μέση τιμή για την κάθε ερώτηση. Πρώτα αφαιρώ συμμετέχοντες και μετά το κάνω αυτό; Πιο συγκεκριμένα... Αναξέρτητη μεταβλητή: Κλίμακα 10 ερωτησεων που αθροίζονται και δίνουν συνολικό σκορ. Πόσα missing values μπορώ να δεχθώ στον κάθε συμμετέχοντα ώστε να μην τον βγάλω εκτός; Σκοπεύω να αντικαταστήσω τα missing values με τη μέση τιμή για τη συγκεκριμένη ερώτηση. Για μέχρι πόσα missing values μπορώ να το κάνω (στον κάθε ένα); Εξαρτημένη μεταβλητή Α: Ουσιαστικά αποτελείται από 4 ανεξάρτητες κλίμακες με 4, 4, 3 και 8 ερωτήσεις (οι κλίμακες αξιολογούνται χωριστά, δεν αθροίζονται για να δώσουν συνολική βαθμολογία). Πόσα missing values μπορώ να δεχθώ στην κάθε κλίμακα (ειδικά αυτές με τις λίγες ερωτήσεις), ώστε να μην πετάξω το ερωτηματολόγιο εκτός; Αν κάποιος δεν έχει απαντήσει μία ολόκληρη κλίμακα, μπορώ να τον κρατήσω για τις υπόλοιπες; Έχω ένα εξειδικευμένο πρόβλημα στο scoring που προκύπτει από τα missing data. Οι 4, 4 και 3 ερωτήσεις αφορουν τη συχνότητα κάποιων γεγονότων (π.χ. πόσο συχνά τσακώνεσαι). Για να βαθμολογηθεί όμως αυτή η ερώτηση, πρέπει ο συμμετέχων να έχει απαντήσει με συγκεκριμένο τρόπο σε μία ερώτηση ελέγχου που προηγείται (είναι μία ερώτηση ελέγχου για κάθε μία βαθμολογούμενη ερώτηση - θα δώσω παράδειγμα) και να λέει ότι στο ειδικό πλαίσιο αυτή η συμπεριφορά συμβαίνει συχνότερα απότ ο γενικό πλαίσιο. Π.χ. Ερώτηση ελέγχου: Πού τσακώνεσαι πιο συχνά, στο σπίτι ή στη δουλειά; - Αν απαντήσει "στο σπίτι", η αμέσως επόμενη ερώτηση (βαθμολογούμενη ερώτηση: Πόσες φορές τσακώνεσαι τον μήνα;), ανεξαρτήτως απάντησης, βαθμολογείται με 0. - Αν απαντήσει "στη δουλειά" , τότε στην αμέσως επόμενη ερώτηση (η ίδια με πριν) βαθμολογείται κλιμακωτά (π.χ. μία φορά - 1 βαθμός, δύο φορές - 2 βαθμοί, τρεις φορές - 3 βαθμοί). Πώς μπορώ, λοιπόν, να δώσω μία μέση τιμή στις missing βαθμολογούμενες ερωτήσεις, όταν έχει αφήσει αναπάντητη την ερώτηση ελέγχου; Εξαρτημένη μεταβλητή Β: Αποτελείται από 3 ανεξάρτητες κλίμακες με 7 ερωτήσεις η κάθε μία (και εδώ αξιολογούνται χωριστά). Πόσα missing values μπορώ να δεχθώ στην κάθε κλίμακα, ώστε να μην πετάξω το ερωτηματολόγιο εκτός; Αν κάποιος δεν έχει απαντήσει μία ολόκληρη κλίμακα, μπορώ να τον κρατήσω για τις υπόλοιπες; Γενικές ερωτήσεις Μπορώ να αντικαταστήσω τα missing data σε συνεχείς (π.χ. ηλικία), κατηγορικές (π.χ. εκπαιδευτικό επίπεδο) και δίτιμες κατηγορικές μεταβλητές (π.χ. εργάζεσαι σαββατοκύριακο;) στα δημογραφικά; Πολλοί δεν μου έχουν απαντήσει καθόλου στα δημογραφικά. Ωστόσο, σκόπευα να τα χρησιμοποιήσω ως τρίτες μεταβλητές για να δω αλληλεπίδραση. Τι κάνω σε αυτή την περίπτωση; Ορισμένες απαντήσεις είναι ό,τι να'ναι. Για παράδειγμα, Ερώτηση ελέγχου: Πού τσακώνεσαι πιο συχνά, στο σπίτι ή στη δουλειά; Απάντηση: Στη δουλειά. (Όλα καλά ως εδώ) Βαθμολογούμενη ερώτηση: Πόσες φορές τσακώνεσαι τον μήνα στη δουλειά; Απάντηση: Καμία. (Τι του λες τώρα;;;) Αυτό το μοτίβω το συναντάω αρκετά συχνά και σημαίνει ότι απάντησε ψευδώς σε κάποια από τις δύο ερωτήσεις. Το πρόβλημα είναι ότι αυτόυ του είδους οι ερωταπαντήσεις είναι στις κλίμακες με τις 4, 4 και 3 ερωτήσεις και η κάθε μία μετράει!! Αυτό πώς θα το χειριζόσασταν; Ευχαριστώ όσους μπήκατε στον κόπο να φτάσετε ως το τέλος!
neverme Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 Γιατί θέλεις να πετάξεις έξω συμμετέχοντες; Βάλε τα missing values σαν τέτοια στο SPSS και θα κάνει τη δουλειά του το πρόγραμμα..τα αναφερεις και στο τέλος πόσα ήταν και τελείωσες...αυτό είναι το δείγμα σου, αυτά τα δεδομένα έχεις, με αυτά θα πορευτείς... Να αντικαταστήσεις missing values με μέση τιμή;; Γιατί να το κάνεις αυτό;;; Ποιο το νόημα των εωτηματολογιων αν κάναμε τέτοια κόλπα;
Lux Aeterna Δημοσ. 31 Ιουλίου 2019 Μέλος Δημοσ. 31 Ιουλίου 2019 (επεξεργασμένο) Αυτή ήταν η οδηγία του Καθηγητή, να πετάξω έξω τα ερωτηματολόγια που είναι ελλιπώς απαντημένα και σε όσα λείπουν μια δυο απαντήσεις να τις αντικαταστήσω με τις μέσες τιμές για να μην "τραβήξει" τα αποτελέσματα προς κάποια μεριά. Επιπλέον, επειδή όι τιμές των ερωτηματολογίων αθροίζονται (π.χ. η ανεξάρτητη μεταβλητή μου είναι 10 * 1 έως 4), κάποιος που έχει 8*3 και 2 missing θα έχει σκορ 24 (αντί για 26 ελάχιστο - 32 μέγιστο) και τον εντάσσει σε διαφορετική κατηγορία. Αντιστοίχως και στις εξαρτημένες μου. Δες αυτό το snip. Επεξ/σία 31 Ιουλίου 2019 από Lux Aeterna
mourouzis2005 Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 Αδελφέ όντως ρώτησες τον άλλο πού τσακώνεται πιο πολύ και μετά απορείς που κάποιος δεν απαντά αν τσακώνεται τόσες φορές ανά μήνα? Οι περισσότεροι διαβάζουν αυτή την ερώτηση ως «πόσες φορές τσακώθηκες στη δουλειά τον ΤΕΛΕΥΤΑΙΟ ΜΗΝΑ». Δεν ήταν λάθος σου αλλά εισήγαγες μόνος σου σφάλμα. Συμφωνώ με τον από πάνω, βάλε τα δεδομένα και η εξέλιξη θα δείξει αν βγάζεις στατιστικά σημαντικά αποτελέσματα. Αν βγάζεις, καλώς, αν όχι πρέπει να έχεις και πρόσθετο πληθυσμό/δείγμα Άλλη λύση είναι να δεις τι υπάρχει από υπάρχουσα βιβλιογραφία, να χειραγωγήσεις τα δεδομένα, να πάρεις την διπλωματική και φιλάκια. Καφρίλα αλλά αν δεν θέλεις να επαναλάβεις τα πάντα.. Από τις οδηγίες του «Καθηγητή» κατάλαβα ότι δεν θα βγάλετε και πολύ trusted συμπεράσματα οπότε κάνε ό,τι θα έκαναν όλοι
Lux Aeterna Δημοσ. 31 Ιουλίου 2019 Μέλος Δημοσ. 31 Ιουλίου 2019 Το ερωτηματολόγιο είναι φτιαγμένο από τον δημιουργό κατ αυτόν τον τρόπο, δεν το έκανα μόνος μου, και συγκρίνει δύο διακριτές μεταξύ τους καταστάσεις. Είναι ορθά δομημένο έτσι Το φαινόμενο των αναπάντητων όμως είναι και σε όλα τα άλλα ερωτηματολόγια και στα δημογραφικά! Δες το snip από πάνω αν θες.
neverme Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 6 λεπτά πριν, Lux Aeterna είπε Αυτή ήταν η οδηγία του Καθηγητή, να πετάξω έξω τα ερωτηματολόγια που είναι ελλιπώς απαντημένα και σε όσα λείπουν μια δυο απαντήσεις να τις αντικαταστήσω με τις μέσες τιμές για να μην "τραβήξει" τα αποτελέσματα προς κάποια μεριά. Επιπλέον, επειδή όι τιμές των ερωτηματολογίων αθροίζονται (π.χ. η ανεξάρτητη μεταβλητή μου είναι 10 * 1 έως 4), κάποιος που έχει 8*3 και 2 missing θα έχει σκορ 24 (αντί για 26 ελάχιστο - 32 μέγιστο) και τον εντάσσει σε διαφορετική κατηγορία. Αντιστοίχως και στις εξαρτημένες μου. Δες αυτό το snip. Αν εισάγεις τα missing values σαν τέτοια, το αποτέλεσμα δεν τραβιέται πουθενά. Το SPSS δεν θα τα κάνει υπόψιν του. Αν έχεις βέβαια τέτοιες οδηγίες, πάω πάσο. Κάνε ότι σου ζήτησε ο καθηγητής και τελείωσε. Το πώς θα το κάνεις δεν έχει τόση σημασία νομίζω, καθότι τα αποτελέσματα θα είναι "μαγειρεμένα" ούτως η άλλως... 1
Επισκέπτης Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 Όπως είπε και ο καθηγητής τα αναξιόπιστα ερωτηματολόγια, να θεωρηθούν άκυρα... και να συμπληρωθούν νέα. Γενικά τα ερωτηματολόγια μετά από λίγη ώρα κουράζουν τον κόσμο και για να ξεμπερδεύουν απαντάν ότι/όπως νάνε.
logistoulis Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 https://www.ibm.com/support/knowledgecenter/en/SSLVMB_23.0.0/spss/mva/idh_miss.html
masteripper Δημοσ. 31 Ιουλίου 2019 Δημοσ. 31 Ιουλίου 2019 Βρες 1 ζάρι με το εύρος των τιμών που έχεις στο ερωτηματολόγιο και πιθανόν να "πέσεις" πιο μέσα και απο τους ερωτηθεντες...Problem solved.
Lux Aeterna Δημοσ. 1 Αυγούστου 2019 Μέλος Δημοσ. 1 Αυγούστου 2019 Έκανα compute variable για να μου δώσει συνολικό σκορ στο κάθε ερωτηματολόγιο, και βλέπω ότι όλα όσα έχουν missing (έστω και 1) τα πετάει εκτός. Άρα, εν ολίγοις, δεν ασχολούμαι καθόλου με τα missing και ό,τι έχω, έχω!
panos_90 Δημοσ. 1 Αυγούστου 2019 Δημοσ. 1 Αυγούστου 2019 Και εγώ θεωρώ πως δεν υπάρχει νόημα να τα πετάξεις εκτός τα missing values. Επειδή όπως είπες το ερωτηματολόγιο δομήθηκε από άλλον, θεωρώ πως από την στιγμή που γίνεται ηλεκτρονικά στόχος είναι να περιοριστούν. Εν κατακλείδι εφόσον είσαι κάτω από 5% συνεχίζεις την ανάλυση. Από περιέργεια ρίξε μια ματιά και στο παρακάτω link που αναφέρει κάποια πραγματάκια πάνω στο θέμα http://www.emgo.nl/kc/handling-missing-data/
Προτεινόμενες αναρτήσεις
Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε
Πρέπει να είστε μέλος για να αφήσετε σχόλιο
Δημιουργία λογαριασμού
Εγγραφείτε με νέο λογαριασμό στην κοινότητα μας. Είναι πανεύκολο!
Δημιουργία νέου λογαριασμούΣύνδεση
Έχετε ήδη λογαριασμό; Συνδεθείτε εδώ.
Συνδεθείτε τώρα