Hier worden eigenlijk twee dingen door elkaar gehaald. Een normaal verdeling heeft slechts twee parameters een gemiddelde (Mu) en een standaarddeviatie (sigma). Zoals Gjalt-Jorn zegt: dit zijn de 'kunstmatige' eigenschappen van de verdeling. Mu en sigma kunnen alles zijn: niet beperkt tot 0 en 1. Bijvoobeeld, wanneer IQ wordt uitgedrukt in normale verdelingen wordt gesproken van een populatiegemiddelde (Mu) van 100, met een populatie-standaarddeviatie van 15. Hieruit is af te leiden dat gemiddeld de populatie 100 scoort, de gemiddelde afwijking rond dat gemiddelde 15 IQ punten is, waardoor zo'n 64% van de populatie een IQ van 85-115 heeft.
Wat hier met de Mu=0 en de sigma=1 gecontamineerd wordt zijn de 'normale verdeling' en gestandaardiseerde waarden die de basis vormen voor de "standaard normale verdeling". Deze heeft inderdaad als eigenschap dat mu=0 en sigma=1, maar dit wordt kunstmatig verkregen op de volgende wijze (en om de volgende reden).
Gemiddelden zeggen ons niet zoveel; Ze zijn schaalafhankelijk. Als ik lukraak noem dat iets een gemiddelde van 1000 heeft en een sigma van 250, dan klinkt dat veel, maar als de schaal nanometers betreft valt dat 'veel' wel tegen. Schaalafhankelijke getallen communiceren heel lastig. Daarom houden we ervan om waarden te standaardiseren. Correlaties zijn bijvoorbeeld gestandaardiseerde covarianties: we weten dat ze altijd tussen de 0 en 1 liggen. Daarom weten we dat nul geen verband is en 1 een perfect verband. Bij normaal verdelingen is er een zelfde doel: weten of observaties veel of weinig afwijken van het gemiddelde. Allereerst centreren: gemiddelde kunstmatig op nul zetten door het gemiddelde van alle waarden af te trekken. Dan standaardiseren: dit bereiken we door kunstmatig alle waarden te delen door de standaarddeviatie. Dit zorgt ervoor dat we geen ruwe data meer hebben, maar dat we van ieder datapunt kunnen aflezen hoeveel standaarddeviaties het van nul afwijkt. Zo weten we dat 0.5 niet veel van het gemiddelde afwijkt (want 1 is een normale unit), maar dat iets dat 3 standaarddeviaties van het gemiddelde afwijkt bijzonder is.
Maw: gemiddelde 0 en standaarddeviatie 1 zijn geen natuurlijke, magische te onstane fenomenen; het wordt bereikt door met een wiskundige moker op de data te slaan zodat ieder gemiddelde en standaarddeviatie in een standaard-mal past.
EDIT: om hier aan toe te voegen: Field maakt dus een grote fout. Hij noemt een standard normal distribution foutief een normal distribution. Foei Andy Field.