Ter illustratie van mijn vraag, eerst het volgende citaat uit het digitale werkboek:
'Tabel 2.1.1: De afwijking van het gemiddelde voor elk datapunt.
fixatiebias |
mean |
differences |
151 |
44.3 |
106.7 |
-124 |
44.3 |
-168.3 |
78 |
44.3 |
33.7 |
1070 |
44.3 |
1026 |
-315 |
44.3 |
-359.3 |
46 |
44.3 |
1.7 |
-93 |
44.3 |
-137.3 |
-450 |
44.3 |
-494.3 |
-136 |
44.3 |
-180.3 |
216 |
44.3 |
171.7 |
Nu kunnen we die afwijkingen van het gemiddelde, oftewel die verschilscores, bij elkaar optellen:
106.7+−168.3+33.7+1025.7+−359.3+1.7+−137.3+−494.3+−180.3+171.7=0
Dit is logisch: het gemiddelde ligt immers, letterlijk per definitie, precies in het midden van alle datapunten. De positieve afwijkingen, van datapunten die boven het gemiddelde liggen, zijn samen dus precies evenveel als de negatieve afwijkingen, van datapunten die onder het gemiddelde liggen, en de optelsom van alle afwijkingen is dus altijd precies 0.'
Dat is een probleem: als we de afwijkingen van het gemiddelde niet bij elkaar kunnen optellen, hoe kunnen we dan een indruk krijgen van hoe ver alle punten in de datareeks van het gemiddelde afliggen?
Gelukkig is er een oplossing: we kunnen deze afwijkingen kwadrateren. Vermenigvuldiging van een negatief getal met zichzelf resulteert immers in een positief product!'
Mijn gedachtegang hierover is als volgt:
De laatste kolom 'differences' wordt gekwadrateerd. Dat is het aantal punten verschil met het gemiddelde. Hij wordt gekwadrateerd zodat het gemiddelde geen '0' meer is en ermee gerekend kan worden.
Nu mijn vraag: als het gaat om het aantal punten verschil met het gemiddelde en als we ermee mogen gaan rekenen, waarom kunnen we dat aantal punten verschil met het gemiddelde niet gewoon direct als positief getal nemen? Dus -168.3 wordt 168.3. Het heeft vast een goede reden dat we het eerst kwadrateren en dan weer wortel trekken, maar ik zie nu niet waarom.
Ik kan me voorstellen dat het antwoord hierop iets met verhoudingen en de berekening die tussen het kwadrateren en wortel trekken ligt te maken heeft, maar ik begrijp niet hoe dat werkt. Om goed inzicht te krijgen in hoe deze berekeningen werken en de getallen zich ten opzichte van elkaar verhouding, zou ik dit graag weten.