Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Een perfecte normaalverdeling zou een gemiddelde van 0 hebben en een standaarddeviatie van 0. Dit wordt in Andy Field zo zijdelings als feit geponeerd.. maar waarom is dit zo?
in Methodologie door (1.1k punten)
Zou je de exacte bladzijdenummers, en mogelijk een letterlijk citaat kunnen geven uit Field?
Op blz. 31 de 4e en 5e regel: 'Therefore, to avoid a brain meltdown we often use a normal distribution with a mean of 0 and a standard deviation of 1 as a standard.' Waarom per se zo'n normaal verdeling is mijn vraag? Waarom is die beter?

2 Antwoorden

1 leuk 0 niet-leuks
 
Beste antwoord
Hier worden eigenlijk twee dingen door elkaar gehaald. Een normaal verdeling heeft slechts twee parameters een gemiddelde (Mu) en een standaarddeviatie (sigma). Zoals Gjalt-Jorn zegt: dit zijn de 'kunstmatige' eigenschappen van de verdeling. Mu en sigma kunnen alles zijn: niet beperkt tot 0 en 1. Bijvoobeeld, wanneer IQ wordt uitgedrukt in normale verdelingen wordt gesproken van een populatiegemiddelde (Mu) van 100, met een populatie-standaarddeviatie van 15. Hieruit is af te leiden dat gemiddeld de populatie 100 scoort, de gemiddelde afwijking rond dat gemiddelde 15 IQ punten is, waardoor zo'n 64% van de populatie een IQ van 85-115 heeft.

Wat hier met de Mu=0 en de sigma=1 gecontamineerd wordt zijn de 'normale verdeling' en gestandaardiseerde waarden die de basis vormen voor de "standaard normale verdeling". Deze heeft inderdaad als eigenschap dat mu=0 en sigma=1, maar dit wordt kunstmatig verkregen op de volgende wijze (en om de volgende reden).

Gemiddelden zeggen ons niet zoveel; Ze zijn schaalafhankelijk. Als ik lukraak noem dat iets een gemiddelde van 1000 heeft en een sigma van 250, dan klinkt dat veel, maar als de schaal nanometers betreft valt dat 'veel' wel tegen. Schaalafhankelijke getallen communiceren heel lastig. Daarom houden we ervan om waarden te standaardiseren. Correlaties zijn bijvoorbeeld gestandaardiseerde covarianties: we weten dat ze altijd tussen de 0 en 1 liggen. Daarom weten we dat nul geen verband is en 1 een perfect verband. Bij normaal verdelingen is er een zelfde doel: weten of observaties veel of weinig afwijken van het gemiddelde. Allereerst centreren: gemiddelde kunstmatig op nul zetten door het gemiddelde van alle waarden af te trekken. Dan standaardiseren: dit bereiken we door kunstmatig alle waarden te delen door de standaarddeviatie. Dit zorgt ervoor dat we geen ruwe data meer hebben, maar dat we van ieder datapunt kunnen aflezen hoeveel standaarddeviaties het van nul afwijkt. Zo weten we dat 0.5 niet veel van het gemiddelde afwijkt (want 1 is een normale unit), maar dat iets dat 3 standaarddeviaties van het gemiddelde afwijkt bijzonder is.

Maw: gemiddelde 0 en standaarddeviatie 1 zijn geen natuurlijke, magische te onstane fenomenen; het wordt bereikt door met een wiskundige moker op de data te slaan zodat ieder gemiddelde en standaarddeviatie in een standaard-mal past.

EDIT: om hier aan toe te voegen: Field maakt dus een grote fout. Hij noemt een standard normal distribution foutief een normal distribution. Foei Andy Field.
door (63.5k punten)
bewerkt door
1 leuk 0 niet-leuks
Het is een conventie dat de standaard normaal verdeling een gemiddelde heeft van 0 en een standaarddeviatie van 1 (niet 0 - hierdoor was Ron in de war). Het is een definitiekwestie. Het standaardiseren van variabelen is de bekendste manier om variabelen naar dezelfde schaal te transformeren (na standaardisatie, i.e. het aftrekken van het gemiddelde van elke meting en het delen van elke meting door de standaard-deviatie, is het gemiddelde van elke variabele 0 en de standaard deviatie 1). Door deze als 'default' normaalverdeling te kiezen weet je altijd waar je het over hebt, en heb je een verdeling die makkelijk te vergelijken is met verdelingen in je steekproef, als je de betreffende variabele tenminste hebt gestandaardiseerd.
door (77.8k punten)
Wat ik niet snap is hoe kan een gemiddelde nou 0 zijn.. dan is de verdeling toch helemaal plat?
Het gemiddelde = 0 betekent niet dat dat de frequentie ervan nul is: slechts de waarde van het gemiddelde is nul, zodat alles onder het gemiddelde negatief is, en alles boven het gemiddelde positief. De piek (meest voorkomende waarden) zullen nog steeds rond het gemiddelde liggen. (zie mijn antwoord over de aard van de nul)
...