Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Bij verwerkingsopdracht 4.8.3 kom ik bij statken2 op een skewnesswaarde van -0.611. Bij één van de verwerkingsopdrachten in studietaak 2 staat de volgende uitwerking: Behalve de spitsheid van Statken1 liggen de waarden van scheefheid en spitsheid van alle intervalvariabelen binnen de grenzen van -1 en +1. Er wordt dan soms gezegd dat de variabelen (behalve Statken1) bij benadering normaal verdeeld zijn. 

 In de uitwerking van opdracht 4.8.3 wordt echter wel gesproken over een verdeling die linksscheef lijkt te zijn. Mijn eigen conclusie was dat de skewness bij benadering normaal is (vanwege de waarde tussen -1 en +1), maar dat er juist wel sprake is van een spitse verdeling (kurtosis) in statken1 (de kurtosis-waarde is 1,127).

In dit vragenforum vond ik een gerelateerde vraag, waarin gesproken werd over het handmatig bepalen van significantie van de skewness (en kurtosis), door de skewness-waarde te delen door de standaard-error van skewness. 

Ik kom dan op -0.611/0.187=-3.267. Nu is mijn vraag hoe bepaald kan worden of dit significant is (qua linksscheefheid) of niet. Ik vind zelf na zoeken op internet twee mogelijkheden (zijn deze legitiem?):

* als deze handmatig berekende waarde lager dan -2 is of hoger dan +2, kun je een normale verdeling verwerpen

* je moet kijken naar hoeveel standaardfouten de door jou bepaalde waarde afwijkt van 0 (voor mijn gevoel kun je hier niet van standaarddeviaties spreken en/of geen standaarddeviatie van skewness bepalen door de SE te vermenigvuldigen met de wortel van N, omdat je skewness-waarde bepaald is op basis van al je waardes). 95% (of 99.7 %) van de steekproeven zouden tot een skewness-waarde leiden die binnen 2 (of 3) standaardfouten van 0 zouden vallen en daarom kun je hier spreken van een significante afwijking van skewness.

in Inleiding Onderzoek (OIO - was Inleiding Data Analyse, IDA) door (280 punten)

1 Antwoord

0 leuk 0 niet-leuks
Als het gaat om verdelingen zijn er, net zoals met veel dingen in de statistiek, geen absolute regels wanneer iets nu wel of niet afwijkt, dus we kunnen ook niet bij elk voorbeeld met zekerheid zeggen dat iets normaal verdeeld is of niet. Meestal vinden we het goed genoeg als het bij benadering normaal verdeeld is. Er zijn verschillende vuistregels die je daarvoor kunt gebruiken, een daarvan is inderdaad dat de waarden tussen de -1 en 1 liggen, maar er zijn ook ruimere vuistregels die statistici en onderzoeker gebruiken.

Dus in het voorbeeld waarbij Statken1 een waarde heeft van -0.611, kun je EN stellen dat dit dus (enigszins) linksscheef is EN dat dit echter bij benadering nog steeds normaal verdeeld is (want het is slechts een kleine afwijking).

Er zijn veel verschillende formules in gebruik om tot met een toets uit te kunnen rekenen of een waarde nu wel of niet te veel afwijkt om te spreken van een normale verdeling. Ook dat geeft geen absoluut antwoord, het helpt je alleen om - samen met de andere gegevens die je hebt over de verdeling - tot een onderbouwde conclusie te komen over de verdeling van je variabele.

De meeste software pakketten bevatten ook berekeningen hiervoor, het is dus eigenlijk niet nodig dit met de hand uit te rekenen. Als je dit echter wel doet, zoals jij gedaan hebt, dan zijn beide antwoorden die je gevonden hebt een optie, alleen het eerste conservatiever dan het tweede. Sowieso zijn dit soort berekeningen vrij streng, aangezien we in het begin al geconcludeerd hadden dat een afwijking van 0.6 maar heel klein is.
door (13.7k punten)
...