Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Een 2x2 factorial anova heeft 2 hoofdeffecten, resulterend in vier verschillende groepen.

Als ik nu één hoofdeffect onderzoek dan vergelijk ik 2 groepen, en niet 4. Zijn de degrees of freedom dan (2 groepen minus 1, N minus 2)? Of toch (4 groepen minus 1, N minus 4)? (covariaten even niet meegerekend).

In de SPSS output staat in de kolom df bij rij ‘error’ en ‘corrected total’ een getal. Ik wil dus de gecorrigeerde df, maar wat staat bij corrected total lijkt me niet de juiste df. Ik denk dat ik die bij ‘error’ moet gebruiken, maar ik snap niet waarom het woord ‘error’ daar staat.

 

Dankjewel alvast, T
in Experimenteel Onderzoek (OEO, PB04x2) door (770 punten)

1 Antwoord

1 leuk 0 niet-leuks

Bij Anova gaat het voor de Df eigenlijk niet om het aantal groepen, maar het aantal groepen binnen een factor. Oftewel, het aantal niveau's van de betreffende variabele. Bij een 3x4 Anova heeft factor A drie niveau's (drie categorieen, drie groepen, drie mogelijke meetwaarden), en heeft dat hoofdeffect dus twee vrijheidsgraden voor de teller. Factor B heeft vier groepen (niveau's, categorieen, meetwaarden), en dus drie vrijheidsgraden voor de teller.

Voor de noemer wordt altijd de 'error' gebruikt, net als bij een t-toets. De F-test doet immers eigenlijk hetzelfde als de t-toets; er wordt een verhouding berekend tussen enerzijds een verschil of spreiding die je hebt gevonden tussen groepen, en anderzijds de spreiding die je sowieso al had verwacht op basis van toeval. Bij de t-toets is de spreiding die je had verwacht op basis van toeval de standard error (SE, standaardfout); bij de F-toets is de spreiding die je sowieso had verwacht op basis van toeval de spreiding binnen de cellen van je 3x4 tabel (bij een eenweg-anova is dat een 3x1 of een 4x1-tabel, dus gewoon 3 of 4 of meer groepen; en dan kun je dit de 'binnen-groepen-spreiding' noemen, omdat het wat minder ambigu is wat je dan bedoelt met een groep).

Bij een meerweg anova is die error dus de spreiding binnen elke cel. Je berekent dus voor elke cel in je 3x4 tabel (of in je 3x4x2x6 'tabel', etc) wat de variatie is om het gemiddelde in die cel heen (dus, $\Sigma(\bar{X}-X_i)$). Die variaties tel je vervolgens op voor alle cellen. Dat is je Error Sum of Squares. Alle variatie om gemiddelden in die cellen heen is immers meetfout of error: die variatie kan immers per definitie niet worden verklaard door factor A of factor B of de interactie tussen die twee, want binnen elke cel zijn zowel A als B onveranderlijk.

Vervolgens toets je elk hoofdeffect tegen die error, door de variantie (MS, dus de SS (Sum of Squares) gedeeld door de bijbehorende vrijheidsgraden, om de Mean sum of Squares te krijgen) van dat hoofdeffect te delen door de variantie die je op basis van toeval zou verwachten (de error Mean sum of Squares dus).

De redenering is dat als er een verschil is tussen de groepen/categorieen/meetwaarden van factor A, er meer variantie is tussen die categorieen dan binnen de categorieen. Daar komt immers de variantie als gevolg van de verschillende groepsgemiddelden nog bij. Als de groepen equivalent zijn, is de MS tussen die groepen hetzelfde als de MS binnen de cellen (de MS error): alle variantie tussen de groepen/categorieen/meetwaarden komt dan immers alleen door meetfout/verschillen tussen mensen/etc.

door (77.8k punten)
...