wat doe ik met missing values, of hoe interpreteert SPSS die

Question

wat doe ik met missing values, of hoe interpreteert SPSS die

Hoi,

we zoeken altijd naar missing values in de data. Als je descriptives van alle variabelen zoekt, dan geeft SPSS (als er ontbrekende waarden zijn), onderaan je output een VALID N (listwise). Deze geeft het aantal 'rijen' weer waar er geen missing values zijn. Betekent dit dat je eigenlijk al die andere rijen uit je analyse mag/moet smijten, of is het iets minder gemakkelijk?

Na wat opzoekwerk werd duidelijk dat je eigenlijk moet zeggen met welke waarden SPSS geen rekening moet houden (in te vullen bij 'discrete missing values' in de kolom 'missing'). Maar als je dan in een dataset al die 'discrete missing values' hebt aangegeven, mag je er dan vlotjes van uit gaan dat je analyse dan correct is, omdat SPSS geen rekening houdt met de rijen waarin de missng values staan?

gevraagd 15 maart 2017 in Experimenteel Onderzoek (OEO, PB04x2) door Patrick (840 punten)

2 Antwoorden

gjp · Answer 1 · 2017-03-15T12:23:52+0000

Nee, je hoeft geen missing values aan te geven aan SPSS! Dat was vroeger zo, maar dat hoeft nu niet meer.

Je rapporteert per analyse op hoeveel deelnemers die is gebaseerd.

Verder rapporteer je, als je je steekproef bespreekt, met hoeveel deelnemers je begon, waar missing data zijn, en welke patronen daarin te zien zijn, als die er zijn. Hoe gedetailleerd je dit doet hangt af van je integriteit van je data. Als je her en der een paar missing values hebt, 'at random' zoals dat heet, dan meld je alleen dat. Als je een vragenlijst hebt en na de vierde pagina valt opeens driekwart uit, dan bespreek je dat.

Maar vergeet vooral niet te zorgen dat er bij elke analyse duidelijk is om hoeveel deelnemers/datapunten het gaat!

Peter Verboon · Answer 2 · 2017-03-15T12:36:43+0000

Meestal zal SPSS je analyses uitvoeren op de "complete cases", dus die personen waarbij alle variabelen die in die analyse zijn betrokken gevuld zijn met waarden. De missings doen dan inderdaad niet mee. Het maakt voor de analyse eigenlijk niet uit of die missings "leeg" zijn of dat er een code staat die als missing is gedefinieerd.

Het gebruiken van codes voor missings als "99" of "888" zoals vaak gebeurt, is vooral handig bij invoeren van de ruwe data en stamt mijns inziens nog uit de tijd dat dit vooral handmatig gebeurde. Je moest dan in SPSS wel opgeven dat b.v. "99" een missing waarde was, anders ging SPSS daar gewoon mee rekenen. Wanneer je dat dan vergeet, krijg je onzinnige resultaten zonder dat je het door hebt. B.v. hoge correlaties die alleen worden veroorzaakt door al die hoge scores.....is echt gebeurd, zelfs bij promovendi !!!

Categorieën

wat doe ik met missing values, of hoe interpreteert SPSS die

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

2 Antwoorden

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om een opmerking te plaatsen.

Gerelateerde vragen

Categorieën

wat doe ik met missing values, of hoe interpreteert SPSS die

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

2 Antwoorden

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om een opmerking te plaatsen.