Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Als je voor je proefpersonen info hebt over verschillende demografische variabelen, en je wil die rapporteren per conditie (gemiddelden, sd), maar er zitten een aantal missing values in (bij verschillende respondenten op verschillende variabelen), hoe met je dat dan aanpakken in je rapportering over de onderzoeksgroep? Want meestal moet je dan bvb gemiddelde leeftijd per conditie geven, gemiddelde opleiding enz. Mag je dan een gemiddelde geven voor alle personen in die conditie, ook al heb je missing values die verschillen voor opleiding en leeftijd? Wellicht niet...

Het eenvoudigste voor de rapportering lijkt dan om alle missing values list-wise te verwijderen. Als er niet te veel missing values zijn, is dat wellicht geen probleem. Maar je verliest wel power, en als je die variabelen niet gebruikt in je analyse (als covariaat of factor), dan lijkt dat wel zonde. Zijn er hier een aantal vuistregels/tips?
in Experimenteel Onderzoek (OEO, PB04x2) door (750 punten)

1 Antwoord

0 leuk 0 niet-leuks
Vuistregels niet echt, tips wellicht:

In elke verslaglegging staat repliceerbaarheid centraal. Vaak is de keuze minder belangrijk dan de transparantie ervan. Liswise of casewise is een kwestie van smaak, ieder met voor- en nadelen, maar voor de lezer is vooral belangrijk 'wat' er gedaan is.

Hoewel er manieren zijn om missing values 'in te vullen' (imputeren), is het in de basis handig om ervan uit te gaan dat wat mist, mist. Kies een wijze van afhandelen (zoals listwise) en zorg dat bij het beschrijven van gemiddelden (en SD) dat duidelijk is wat de N was bij het berekenen van die statistieken. Een lezer zal dan aan de afwijkende N zelf kunnen bedenken dat er missings waren.

Als het aantal missings op een variabele groot wordt (> 5%) dan is de ongeschreven regel dat we zo'n aantal als systematisch kenmerken. In de discussie kan gereflecteerd worden op wat zo'n aantal missings betekent voor de inferenties die op de data getrokken worden
door (63.5k punten)
...