Ik reageer ook even puntsgewijs.
- Je gaat nergens de mist in; MS verklaard wordt zo genoemd, maar dat is dus eigenlijk een 'misnomer'. De ruis van de afzonderlijke datapunten zit er ook nog in. Dit zie je ook in die afbeelding 12.4 - want die ruis zit in de groepsgemiddelden. Dat zijn ook schattingen uit een steekproef, en dus ook onderhevig aan error. Dit zijn niet opeens de 'ware' gemiddelden.
- Wow, dat tweede punt is een goed punt - dat is een typo. Ik pas gelijk gelijk aan. Er zou 1 moeten staan, niet 0! Als je een getal door hetzelfde getal deelt is dat 1, niet 0!
- Dit kan verklaard worden doordat Field zich niet goed uitdrukt :-) Of hij definieert 'systematic' vs 'unsystematic' niet als "door groepsverschillen" vs "door error". Dat zou kunnen maar zou ook verwarrend zijn... Zoals Andy Field als eerste al bevestigen is hij ook maar een mens :-)
Wat msch helpt om te snappen waarom het niet logisch is dat tussen-groepen MS alleen de variantie door groepsverschillen is (dus zonder dat er ook error in zit): als dat wel zo zou zijn, waarom zou de error dan een logisch referentiepunt zijn? Waarom zou de ratio met de error dan de toetseenheid vormen?
Wat ook kan helpen is het zogenaamde anova-model nog eens te bestuderen:
$$y_{ij} = \overline{y} + y_j + e_i$$
Waar $y_{ij}$ de score van individu $i$ in groep $j$ is, $\overline{y}$ het algemene gemiddelde van $y$, $y_j$ het groepseffect van groep j (dus de afwijking van het groepsgemiddelde in groep j van het algemene gemiddelde), en $e_i$ de individuele afwijking van persoon $i$ (de error dus).
De variantie is de spreiding om $\overline{y}$ heen; die bestaat dus uit twee componenten; de verschillen tussen de groepen ($y_j$ voor alle groepen) en de individuele verschillen, de error ($e_i$ voor alle personen).
$MS_\text{within}$ kan alleen bestaan uit de som van $e_i$ voor alle personen, dus ten opzichte van hun groepsgemiddelde. $MS_\text{between}$ bestaat uit beide stukjes (dus $y_j + e_i$, want die groepsgemiddelden komen dus ook tot stand door error, want die worden berekend uit de scores van de personen in die groep, en daar zit ook error in - in de groepsgemiddelden heb je minder error, want het 'event out', maar je deelt ook maar door $k-1$, oftewel, het aantal groepen min 1), en als er geen groepseffecten zijn is $y_j$ nul, en dus zijn beide varianties aan elkaar gelijk.