Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Hoi,

we zoeken altijd naar missing values in de data. Als je descriptives van alle variabelen zoekt, dan geeft SPSS (als er ontbrekende waarden zijn), onderaan je output een VALID N (listwise). Deze geeft het aantal 'rijen' weer waar er geen missing values zijn. Betekent dit dat je eigenlijk al die andere rijen uit je analyse mag/moet smijten, of is het iets minder gemakkelijk?

Na wat opzoekwerk werd duidelijk dat je eigenlijk moet zeggen met welke waarden SPSS geen rekening moet houden (in te vullen bij 'discrete missing values' in de kolom 'missing'). Maar als je dan in een dataset al die 'discrete missing values' hebt aangegeven, mag je er dan vlotjes van uit gaan dat je analyse dan correct is, omdat SPSS geen rekening houdt met de rijen waarin de missng values staan?
in Experimenteel Onderzoek (OEO, PB04x2) door (840 punten)

2 Antwoorden

0 leuk 0 niet-leuks
Nee, je hoeft geen missing values aan te geven aan SPSS! Dat was vroeger zo, maar dat hoeft nu niet meer.

Je rapporteert per analyse op hoeveel deelnemers die is gebaseerd.

Verder rapporteer je, als je je steekproef bespreekt, met hoeveel deelnemers je begon, waar missing data zijn, en welke patronen daarin te zien zijn, als die er zijn. Hoe gedetailleerd je dit doet hangt af van je integriteit van je data. Als je her en der een paar missing values hebt, 'at random' zoals dat heet, dan meld je alleen dat. Als je een vragenlijst hebt en na de vierde pagina valt opeens driekwart uit, dan bespreek je dat.

Maar vergeet vooral niet te zorgen dat er bij elke analyse duidelijk is om hoeveel deelnemers/datapunten het gaat!
door (77.8k punten)
0 leuk 0 niet-leuks
Meestal zal SPSS je analyses uitvoeren op de "complete cases", dus die personen waarbij alle variabelen die in die analyse zijn betrokken gevuld zijn met waarden. De missings doen dan inderdaad niet mee. Het maakt voor de analyse eigenlijk niet uit of die missings "leeg" zijn of dat er een code staat die als missing is gedefinieerd.

Het gebruiken van codes voor missings als "99" of "888" zoals vaak gebeurt, is vooral handig bij invoeren van de ruwe data en stamt mijns inziens nog uit de tijd dat dit vooral handmatig gebeurde. Je moest dan in SPSS wel opgeven dat b.v. "99" een missing waarde was, anders ging SPSS daar gewoon mee rekenen. Wanneer je dat dan vergeet, krijg je onzinnige resultaten zonder dat je het door hebt. B.v. hoge correlaties die alleen worden veroorzaakt door al die hoge scores.....is echt gebeurd, zelfs bij promovendi !!!
door (11.7k punten)
...