Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe strikt is de eis van normale verdeling bij het gebruik parametrische toetsen?

0 leuk 0 niet-leuks
Studiecentrum: Den Haag

Bron: introductie non-parametrische technieken

Bron: Toelichting non-parametrische toetsen (van het practicum OKD)

Beste docent,

Parametrische toetsen mogen o.a. alleen gebruikt worden indien de variabele normaal is verdeeld. Echter, als er meer dan 30 respondenten zijn maakt het voor de resultaten toch niet meer uit of de variabele wel of niet normaal verdeeld is?

Mag ik er van uitgaan dat je eigenlijk alleen maar non-parametrische technieken gebruikt als de afhankelijke variabele van nominaal of ordinaal niveau is?

Met vriendelijke groet,

Ezra Niessink
gevraagd 22 mei 2014 in Non-Parametrische Data Analyse (NPDA) door ezra.niessink (510 punten)

1 Antwoord

0 leuk 0 niet-leuks

Het is nog iets complexer. Parametrische toetsen veronderstellen niet dat je variabele normaal is verdeeld (zie http://oupsy.nl/help/112/wanneer-is-mijn-data-te-scheef-niet-normaal-verdeeld). Die kun je bijna altijd gebruiken. Helemaal omdat je nooit variabelen op ordinaal of nominaal (categorisch) niveau moet meten, tenzij je echt niet anders kan.

Mocht je om een een of andere reden met een categorische variabele opgescheept zitten, dan heeft die bijna altijd een beperkt aantal categorieen (bijvoorbeeld 2 groepen, 3 groepen, of 4 groepen). In dat geval gebruik je anova (als de andere variabele interval is) of chi-square (als de andere variabele ook categorisch is).

Met die toetsen (Pearson r; t-toetsen + Cohen's d; anova + omega^2; chi-square + Cramer's V) kun je dus bijna alle combinaties toetsen. Mocht je een andere situatie hebben, leg die dan voor aan je begeleider (of evt hier in een opmerking :-)).

beantwoord 22 mei 2014 door gjp (64,700 punten)
Gjalt-Jorn, ik heb alle bronnen gelezen. Ik moet zeggen dat de centraal limietstelling nog onduidelijk is, ik bedoel hoe kunnen steekproeven een normaal verdeling opleveren als de populatie dat niet is, maar goed ik neem het aan en het is nu niet super relevant.

Gewoon voor het begrip een praktijk situatie. Stel je hebt een steekproef (n=200) en je toetst een variabele in spss waarbij blijkt dat deze variabele niet normaal verdeeld is.

Mag je dan gewoon parametrische toetsen gebruiken of moet je in dit geval non-parametrische toetsen gebruiken?

De populatieverdeling is een verdeling van individuele scores. De steekproevenverdeling ook. Echter, toetsen werken met de steekproevenverdeling, en dat is een verdeling van gemiddelden. Die wordt normaler naarmate de grootte van de steekproef toeneemt. Verder is het onderscheid 'parametrische' versus 'nonparametrische' toetsen wat verwarrend. Alle toetsen hebben immers aannames. Als je twee groepen hebt met n=100 per groep en je wil de gemiddelde vergelijken, kan dat met een t-toets, tenzij je steekproeven absurd normaal zijn verdeeld.

Gjalt-Jorn, ontzettend bedankt voor de uitleg. Het begint duidelijk te worden.

Nog een laatste vraag. Vaak worden in de psychologie variabelen die feitelijk op ordinaal niveau zijn gemeten toch als ratio variabelen behandeld. Wanneer mag dit wel en wanneer mag dit absoluut niet?
Dit is erg complex. Er zijn methoden waarmee je kunt bepalen of een bepaalde variabele op interval- of ordinaal niveau is gemeten, maar die zijn een stuk complexer dan wat in het curriculum zit.

In principe geldt dat bijna alle 'natuurlijke' (en dus psychologische) variabelen in principe interval-niveau hebben.

Je kunt deze vervolgens op lagere meet-niveau's meten (i.e. een schaal met maar 5 antwoordopties kun je als ordinaal of interval zien - kun je lange discussies over voeren - weinig categorieen betekent bijvoorbeeld niet noodzakelijk ordinaal; het feit dat ordinale variabelen vaak weinig categorieen hebben, kun je niet omdraaien; etc); en als je meerdere zulke items dan aggregeert in gemiddelden, dan krijg je alsnog weer een interval-niveau. Tenminste, voor zover het de meeste analyses betreft.

Zolang je dus zorgt dat je voldoende items hebt, kun je in de meeste situaties gewoon analyses voor interval-niveau gebruiken. Als je weinig items hebt, heb je nog wel meer problemen, zoals grote invloed van meetfout :-)
...