Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Beste docenten,

In verschillende opdrachten voeren wij een univariate analyse uit om bijvoorbeeld te kijken naar de scheefheid (Skewness) en spitsheid (Kurtosis), maar wanneer vormt dit nu echt een probleem. 

Bij sommige opdrachten zijn er waarden van 0.210, dit wordt aangegeven als niet problematisch (die snap ik), maar ik kom ook waarden tegen van 1,600 en 2,669 die als niet problematisch worden beschreven. 

Ik begrijp dat je vooral moet kijken naar de normaalverdeling of naar de waarden die beschreven zijn bij ontwikkeling van een meetinstrument (als hij linksscheef hoort te zijn en dat is hij ook, dan is het valide voor die doelgroep). Toch wil ik tijdens mijn analyse echt iets kunnen zeggen over of het wel of niet problematisch is voor mijn analyse, zijn hier grenswaarden voor? Stel mijn linksscheefheid is niet zo linksscheef als die bij ontwikkeling is geconstateerd is hij dan wel of niet valide, waar ligt de grens dat je zo'n besluit kan nemen?

Alvast bedankt voor jullie opheldering.

Met vriendelijke groet,

Mark van den Brink

in Univariate (descriptieve) statistiek door (280 punten)

1 Antwoord

1 leuk 0 niet-leuks
 
Beste antwoord

Je vraagt wanneer spitsheid en scheefheid een probleem vormen. Hier is geen eenduidig antwoord voor, maar alvorens ik dat niet-eenduidige antwoord formuleer, wil ik eerst bespreken waarom ze een probleem kunnen vormen; hier zijn namelijk twee verschillende redenen voor.

1. In veel onderzoek wil je een uitspraak doen over verschillen tussen groepen en over verbanden tussen variabelen.  En dat niet alleen: je wil deze uitspraken niet alleen doen over de deelnemers die toevallig in je steekproef zitten, maar je wil ze kunnen generaliseren naar de populatie. Om dit te kunnen doen, voer je een statistische toets (bijvoorbeeld een t-toets) uit en/of bereken je een betrouwbaarheidsinterval. Bij veel van dit soort statistische toetsen is een aanname dat je gemiddeldes normaal verdeeld zijn, anders zijn de resultaten van deze toets minder valide.

Dit is in de praktijk vaak overigens geen probleem. In de steekproeftheorie wordt onderscheid gemaakt tussen de populatieverdeling, de steekproefverdeling, en de verdeling van de steekproefgemiddelden. Je wil een uitspraak doen over de populatie, maar de populatie is onbekend. Omdat je de analyses vaak uitvoert op basis van de gemiddelden, is het vaak belangrijk dat de verdeling van deze gemiddelden normaal verdeeld is. Dat zal het zijn als populatie normaal verdeeld is, maar dat weet je dus niet. Het enige wat je hebt is je steekproef, en de verdeling van geobserveerde waardes binnen je steekproef: de steekproefverdeling. Dit is ook waar je vraag betrekking op heeft. Als waarden in de steekproef normaal verdeeld zijn, dan is dat waarschijnlijk representatief voor je populatie, en als je populatie normaal verdeeld is, dan is je verdeling van steekproefgemiddelden ook automatisch normaal verdeeld.

Wat nu als dat niet het geval, en steekproefverdeling is links- of rechtsscheef, en spits of juist plat? In dat geval hangt het van de steekproefgrootte af of dit een probleem vormt voor je analyses. Eerder hadden we al geconstateerd dat het bij veel statistische toesten belangrijk is dat je gemiddeldes normaal verdeeld zijn. Nu blijkt uit simulaties en mathematische logica dat steekproefgemiddelden automatisch normaal verdeeld raken bij grotere steekproeven, zelfs als de populatie niet normaal verdeeld is.

Dit wordt ook wel de centrale limietstelling genoemd, en is de grote vriend en redder in nood van iederen statistiscus. Wanneer is de steekproef voldoende groot? Hier is geen hard criterium voor (en hangt ook een beetje van de analyse af, en de veronderstelde populatieverdeling), maar pak hem beet 20 tot 25 waarnemingen per groep (waarover je een gemiddelde berekent) zijn vaak voldoende om de centrale limietstelling zijn nobele werk te kunnen laten doen.

2. De andere reden om de steekproefverdelingen te onderzoeken op normaliteit heeft te maken met de valide toepassing van het meetinstrument in de doelpopulatie. Dit is ook waar de vraag hierboven vooral betrekking op heeft. Zoals je terecht opmerkt, gaat het er hierbij niet om dat de steekproef per se normaal verdeeld is, het gaat erom dat de steekproefverdeling aan de verwachtingen voldoet, en soms is dat juist een scheve verdeling (bijvoorbeeld bij zeldzaam gedrag of attitudes). De waardes voor scheefheid en spitsheid zeggen iets over hoe normaal de verdeling is, en dus niet automatisch of er ook sprake is van een valide toepassing.

Ik heb Field (2005, 2nd Ed.) er even op nageslagen. Het antwoord op je vraag of er grenswaarden zijn is eigenlijk heel kort: nee. Helaas zijn die er niet, en voor zover die er zijn, zijn die niet echt betrouwbaar/valide. Zoals Field schrijft, de waardes voor scheefheid en spitsheid zelf zijn namelijk niet echt informatief.

Wat je eventueel zou kunnen doen is een statistische toets uitvoeren, zoals de (one sample) Kolmogorov-Smirnovtest. Als deze signicant is, dan betekent dat dat je steekproefverdeling significant afwijkt van de normaalverdeling. Maar ook dat hoeft niet per se iets te zeggen! Bedenk dat er in je steekproef altijd wel een kleine afwijking is van wat als 'perfect normaal' wordt beschouwd. En als je steekproef groot genoeg is, dan wordt zelfs de kleinste afwijking van normaliteit significant.* Het is dus altijd zaak om (ook) een visuele inspectie van de histogrammen uit te voeren.

Daarnaast kan je ook een Two Sample Kolmogorov-Smirnovtest uitvoeren. Hierbij toets je of twee steekproefverdelingen van elkaar afwijken (ipv of één verdeling afwijkt van de normaalverdeling). Hiermee zou je dus ook kunnen toetsen of de verdeling in jouw steekproef afwijkt van de verdeling in de oorspronkelijke studie. Bedenk wel dat de beperkingen die hierboven zijn beschreven ook op de Two Sample Kolmogorov-Smirnovtest van toepassing zijn. Hier vind je meer informatie over deze toets in R.

* Deze logica geldt overigens voor alle significantietoetsen. Dus staar je nooit blind op een p-waarde (die enkel iets zegt of een eventueel verschil aan toeval te wijten zou kunnen zijn), maar kijk vooral ook naar de effectgrootte van eventuele verschillen.

door (3.5k punten)
geselecteerd door
Bedankt voor de uitleg, zeer duidelijk beschreven
...