Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Waarom leeftijden in een steekproef in histogram met normaalverdeling, skewness en curtosis? KDA 6.3.3

0 leuk 0 niet-leuks
Bij opdracht 6.3.3 KDA worden de leeftijden van de respondenten in een histogram gezet met een normaalverdeling. Ook wordt een skewness en curtosis berekend.

Ik begrijp dit niet, omdat het volgens mij niet logisch is dat de leeftijden normaal verdeeld zijn. Het zou net zo goed heel plat verdeeld kunnen zijn, met aan de randen (rond 20 en 65) een steile afname. In dat geval is skewness en kurtosis niet relevant. In dit geval lijkt de verdeling echter behoorlijk normaal. Is dat toeval, of bekijk ik dde leeftijdverdeling niet helemaal goed?
gevraagd 4 april 2016 in Kwantitatieve Data Analyse (KDA) door 851894069 (260 punten)

1 Antwoord

0 leuk 0 niet-leuks

Goede vraag. De verdeling van leeftijd hangt af van je steekproef. Als je 'sampled' uit de algemene populatie verwacht je geen normaalverdeling. Dat is logisch als je er over nadenkt: als er bijna niemand heel jong is, waar komen die oudere mensen dan opeens vandaan? Je zou normaal, als er geen trends in geboorten zouden zijn en morbiditeit stabiel zou blijven, een rechtsscheve verdeling verwachten. Natuurlijk zijn die trends er wel, en leeftijd is in Nederland dus zo verdeeld:

Dat is niet normaal, en dat zou je ook niet verwachten.

Tegelijkertijd geldt ook dat als je selecteert uit een andere populatie, zeg, middelbare scholieren, je wel een normale verdeling verwacht. Dit geldt dan weer voor bijna elke populatie die op de een of andere manier gedefinieerd is waardoor er een selectie op de leeftijd zit: sommige mensen zijn uitzonderling jong of oud in vergelijking met die selectie, maar de meeste mensen zitten rond het gemiddelde.

Overigens, om de eigenlijke vraag (in de titel) te beantwoorden: je moet altijd, van al je variabelen, een histogram inspecteren. Je wil altijd je data grondig inspecteren voordat je deze verder analyseert, los van welke verdelingsvorm je verwacht tegen te komen.

beantwoord 18 april 2016 door gjp (63,300 punten)
bewerkt 18 april 2016 door gjp
...