Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe kan ik beoordelen welke van twee variabelen het minst normaal verdeeld is?

1 leuk 1 niet-leuk
Naar aanleiding van vraag 25  op oefententamen 1 van OKD: "Welke variabele is het minst normaal verdeeld?'. Op het oog kwam ik op een andere conclusie. Van de twee variabelen kunnen immers zowel de kurtosis als de skewness verschillen van 0. Als kurtosis va de ene varabele meer afwijkt en de skewness van de andere varabel juist meer verschilt, hoe kom ik dan tot een vergelijk betreft een meer of minder normale verdeling?
gevraagd 28 mei 2015 in Methodologie door Frank van Marwijk (1,020 punten)

1 Antwoord

1 leuk 0 niet-leuks

Wow - da's een uitstekende, maar best advanced vraag!

Voordat ik de vraag echt ga beantwoorden: deze vraag in het oefententamen is inderdaad ambigu. Leeftijd (volgens het antwoordmodel het correcte antwoord) heeft een skewness van .086 (SE .287) en de grootste kurtosis (-.770, SE .566), en extraversie heeft de grootste skewness (.517, SE .287) en een kurtosis van .191 (SE .566). Het is niet overduidelijk welke van de twee het normaalst is. Je kunt de skewness en kurtosis natuurlijk uitdrukken in hun standaardfouten: dan kom je voor leeftijd op een skewness van .30 SE's en voor kurtosis op 1.36 SE's afwijking (deze zouden niet significant zijn als je ze zou toetsen), en voor extraversie op een skewness van 1.80 SE's en en voor kurtosis op .34 SE's afwijking (zouden ook geen van beiden significant zijn). Als je hiernaar kijkt, zou je zelfs zeggen dat extraversie 'minder normaal' is. In de revisie zal ik deze vraag sowieso aanpassen! Bedankt voor de 'heads up' dus!

Nu, met betrekking tot het 'echte' antwoord, mocht je deze situatie ooit 'in real life' tegenkomen. Ron weet hier misschien meer over, maar als ik even 'freewheel' kom ik tot het volgende:

1) toetsen op normaliteit vergelijken de verdeling van je steekproefscores met de normaalverdeling. Als je steekproefomvangen hetzelfde zijn, kun je de 'statistics' ('schatters') en p-waarden van deze toetsen op normaliteit dus vergelijken; de kleinste p-waarde hoort bij de verdeling die het meest afwijkt van normaliteit. Hoe zwaar kurtosis en skewness worden gewogen verschilt, denk ik, per toets. Maar, hier kun je natuurlijk weinig mee, omdat je van te voren weet dat twee p-waarden nooit even groot gaan zijn; alleen al door steekproeftoeval zullen er verschillen zijn.

2) Skewness en kurtosis hebben een standaardfout, waardoor je betrouwbaarheidsintervallen kunt berekenen. Ik heb even geprobeerd op te zoeken of skewness en kurtosis onder de nulhypothese normaal verdeeld zijn rondom 0, maar kon dit zo snel niet vinden. Aangenomen dat dit zo is, kun je kijken of de twee verdelingen op zowel skewness als kurtosis verschillen. Als ze maar op 1 van de twee verschillen heb je je antwoord. Als ze op allebei verschillen zit je weer vast.

3) Omdat dit niet vaak genoeg gezegd kan worden: had je al gezien dat normale verdelingen vaak niet nodig zijn? Zie http://oupsy.nl/help/215/hoe-toets-ik-of-een-variabele-normaal-is-verdeeld en de links.

beantwoord 29 mei 2015 door gjp (64,700 punten)
bewerkt 29 mei 2015 door gjp

Dank je wel voor je antwoord. De vraag op het voorbeeldtentamen was de volgende:

Welke variabele het minst normaal verdeeld?

Leeftijd in jaren

Rapportcijfer

Klimaatoordeel of

Extraversie

Hieronder zie je de histogrammen van ‘Leeftijd in jaren’ en ‘Extraversie’. Eerlijk gezegd vond ik het er op het oog allebei niet zo normaal uitzien. De extreme piek bij Extraversie deed mij besluiten dat die het minst normaal was. Het juiste antwoord bleek echter: ‘Leeftijd in jaren’ is het minst normaal verdeeld. Dat zag ik er op het oog echter inderdaad niet aan af. Ik vroeg me daarom af of je het op een een of andere manier kon berekenen. Ik begrijp dat dat een puzzel is. Als je de vraag meeneemt in de evaluatie, bedoel je dan specifiek deze abigue vraag of 'dit soort vragen' over vergelijken van normaliteit in het algemeen?

Mijn antwoord betreft inderdaad die vraag op het voorbeeldtentamen; de berekening die je kunt uitvoeren staat daar dus ook bij. Deze vraag in het bijzonder is ambigue omdat Leeftijd niet overtuigend 'abnormaler' is dan Extraversie. Er is discussie mogelijk, en dat is natuurlijk niet de bedoeling bij tentamenvragen.
...