Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Waarom verschilt een standaarddeviatie met het daadwerkelijke gemiddelde verschil tussen meetwaarden en het gemiddelde?

0 leuk 0 niet-leuks
Stel je hebt 3 getallen, 1,2 en 6. Het gemiddelde is dan 3. De gemiddelde afwijking van de getallen van het gemiddelde is ((3-1)+(3-2)+(6-3))/3=2.

Wanneer ik een standaarddeviatie bereken komt deze uit op een verschil van 2,65, hetgeen heel iets anders is. Waarom wordt dan toch een standaarddeviatie aangehouden als maatgevend voor het gemiddelde verschil tussen de waarden en het gemiddelde? Wat zegt dan eigenlijk een standaarddeviatie wanneer het werkelijke verschil iets anders is?
gevraagd 28 november 2017 in Inleiding Data Analyse (IDA) door 852042831 (490 punten)

1 Antwoord

2 leuk 0 niet-leuks
Het verschil wordt in dit specifieke geval speciaal vergroot doordat in de toegepaste formule voor de standaarddeviatie nog een correctie is uitgevoerd (gedeeld door N-1 in plaats van N).

Het belangrijkste verschil tussen het gemiddelde absolute verschil en de standaarddeviatie is hoe er wordt omgegaan met afstanden van het gemiddelde:

Bij het absolute gemiddelde verschil wordt iedere afstand als gelijk behandeld. Een afstand van 1 van het gemiddelde 'weegt' even zwaar als een afstand van 3. In een variantie (en in het verlengde dus de standaarddeviatie) worden grotere afstanden als informatiever gezien: door eerst te kwadrateren worden steeds grotere afstand steeds zwaarder wegend. Een verschil van 1 is dan niet zo ver van het centrum, maar een verschil van 2 wordt dan meer aangezet (bij variantie telt een 2 als 4, een 3 als 9, etc.). Doordat steeds groter wordende afstanden exponentieel uitvergroot worden zal hoe dan ook de standaarddeviatie altijd hoger uitvallen dan het gemiddelde absolute verschil (met uitzondering van een variatie van nul.)

De eigenschap om grotere afstanden meer informatief gewicht te geven is niet zonder controverse. Oorspronkelijk was een extra argument voor het berekenen van de standaarddeviatie dat het makkelijker voor computers was dan de absolute waarde berekenen. Nu dit 'gemak' geen argument van waarde meer is gegeven de staat van computers nu, zijn er steeds meer wiskundigen die ervoor pleiten om naar het absolute gemiddelde verschil over te stappen. Deze groep heeft nog geen kritieke massa bereikt
beantwoord 28 november 2017 door Ron Pat-El (41,340 punten)
Wow Ron, dat wist ik niet - wat interessant, dankjewel!

Om nog even in te gaan op Ron's melding in de eerste zin: die deling door $n-1$ gebruik je als je de standaarddeviatie berekent op basis van steekproefscores. Die liggen immers per definitie om het steekproefgemiddelde heen - dat is immers berekend op basis van die steekproefscores. Je spreiding in de steekproef is dus een kleine onderschatting van de spreiding in de populatie. Door te delen door $n-1$ in plaats van door $n$ corrigeer je hiervoor.
...