Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Hallo,

Op dit moment ben ik bezig met het opschonen van ruwe onderzoeksdata in het kader van mijn scriptie (masterthesis). De ruwe data bestaat uit antwoorden van respondenten die een vragenlijst hebben ingevuld. In een vragenlijst zijn items opgenomen die samen een schaal vormen. Nu hebben de respondenten niet alle items ingevuld, waardoor verschillende items op een schaal missen. 

Ik heb een vraag over het opschonen van data:

Soms kan een schaal toch gebruikt worden en krijgen de missende items een waarde van bijv. het gemiddelde van de overige items. Soms kan een schaal helemaal niet gebruikt worden omdat teveel items missen.

Mijn vraag: waar vind ik wetenschappelijke richtlijnen voor het opschonen van data of gelden er alleen vuistregels (niet gebaseerd op wetenschappelijke literatuur)? Met andere woorden: welke regels worden gehanteerd als er items van een schaal missen? En waar kan ik die vinden in de literatuur?

Alvast bedankt voor de hulp!

Met vriendelijke groet,

Mariël Postuma

(Studiecentrum Zwolle)

in Anders door (120 punten)

1 Antwoord

0 leuk 0 niet-leuks
Ik denk dat de sterkste richtlijnen gegeven worden in het boek van Tabachnik en Fidell (2013, 6th edition), waar in hoofdstuk 4 zeer uitgebreid en goed onderbouwd allerlei stappen in het dataopschoningsproces besproken worden.

Maar als je hele specifieke vragen hebt dan is het vaak krachtiger om zelf op zoek te gaan naar artikelen over het onderwerp. Veel van het algemene advies geldt vaak ook alleen maar voor algemene scenario's. Er zijn telbare factoren die in een beslissing kunnen meewegen. Het helpt om te onthouden dat zodra data zich niet perfect naar assumpties gedraagt eigenlijk alles vanaf dat moment weinig meer is dan damage control. Er is enkel nog een bak met suboptimale oplossingen.

Dus als je wilt weten wat de recentste inzichten zijn over het aantal missings in een schaal, dan kun je het beste zoeken naar methodologische artikelen hierover.

Ook kan het zinvol zijn om eens te kijken naar de literatuur over imputatietechnieken (invullen van missende waarden). Een aardig startpunt is:

Musil, C. M., Warner, C. B., Yobas, P. K., & Jones, S. L. (2002). A Comparison of Imputation Techniques for Handling Missing Data. Western Journal of Nursing Research, 24(7), 815–829. https://doi.org/10.1177/019394502762477004
door (63.5k punten)
...