Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Is een anova toets noodzakelijk indien een verstorende variabel proportioneel verdeeld is over de twee groepen die je wilt vergelijken?

0 leuk 0 niet-leuks

(studiecentrum Den Haag)

Goedemorgen,


Onder verwijzing naar de bronnen Vergelijkbaarheid van groepen en Vergelijken van meer dan twee gemiddelden: ANOVA en de bijbehorende studietaken 3.2 en 3.3 hierbij de volgende vraag.

Is een anova toets noodzakelijk indien een verstorende variabel proportioneel verdeeld is over de twee groepen die je wilt vergelijken?

en een aan de hierboven gerelateerde deelvraag:

Wordt een anova toets vaker gebruikt om de homogeniteit van een onderzoeksgroep te toetsen of ook vaak bij drie of vier zelfstandige homogene groepen?

 

Prettige dag.

Met vriendelijke groet,

gevraagd 12 februari 2014 in Kwantitatieve Data Analyse (KDA) door ezra.niessink (510 punten)
bewerkt 12 februari 2014 door ezra.niessink

1 Antwoord

1 leuk 0 niet-leuks
Voordat ik antwoord geef, geef ik even wat achtegrond informatie zodat we 'on the same page' zitten.

De anova (analysis of variance, de variantieanalyse) wordt gebruikt om verhoudingen tussen varianties te vergelijken. Dit betekent dat je de anova kunt gebruiken om te kijken of twee varianties even groot zijn. Variantie (Mean of Squares, MS) is een maat voor spreiding van een variabele, die is gecorrigeerd voor aantal waarnemingen [1].

Je kunt Anova dus gebruiken om te kijken of de spreiding in twee of meer groepen gelijk is. Dit doet SPSS bijvoorbeeld als je een t-test bestelt.

Daarnaast kun je de Anova gebruiken om te kijken of de gemiddelden van twee of meer groepen verschillen. Hiervoor gebruik je een 'truukje' waarmee je de variantie binnen de groepen vergelijkt met de variantie tussen de groepen. Omdat de variantie binnen de groepen per definitie niet beinvloedt kan worden door een eventueel verschil tussen de groepen, geeft deze variantie een indruk van de spreiding die je puur op basis van toeval/meetfout zou verwachten. De variantie tussen de groepen bestaat uit diezelfde spreiding door toeval/meetfout, PLUS extra spreiding doordat de groepsgemiddelden verschillen. Als de spreiding tussen de groepen dus groter is dan binnen de groepen, dan moeten de groepsgemiddelden dus wel verschillen.

Deze laatste denkwijze is ook te generaliseren naar zogenaamde 'meerweg' anova en herhaalde metingen anova (deze komen aan bod in Psychologisch Experiment).

Een verstorende variabele, oftewel confounder, is een variabele die zowel met je onafhankelijke als met je afhankelijke variabele samenhangt. Als je een experiment uitvoert, en je proefpersonen randomiseert, zouden je groepen normaal gezien equivalent moeten zijn, dus dan heb je hier geen last van. Als je niet randomiseert, bijvoorbeeld met een quasi-experiment (waarbij je deelnemers indeelt in groepen op basis van bepaalde kenmerken, in plaats van random), kan er wel confounding optreden, wat zich uit in 1 of meer verstorende variabelen.

Zo'n verstorende variabele is dan verschillend verdeeld in de verschillende groepen. Als je twee groepen hebt, is de gemiddelde leeftijd bijvoorbeeld anders; of er zitten niet (ongeveer) evenveel mannen en vrouwen in de groepen.

Als zo'n mogelijk verstorende variabele proportioneel is verdeeld over de groepen (hiermee bedoel je neem ik aan dat er in beide groepen bijvoorbeeld 40% mannen zit), hangt deze variabele niet samen met je onafhankelijke variabele, en kan het dus geen verstorende variabele zijn. Als geslacht nu juist verschillend zou zijn in de verschillende groepen (bijvoorbeeld 30% versus 60% vrouwen), kan een eventueel verschil tussen de groepen op de afhankelijke variabele worden verklaard door geslacht, in plaats van door de onafhankelijke variabele die zich manifesteert in die twee groepen. In dat geval is Anove inderdaad een mogelijke analyse om hiervoor te proberen te corrigeren. Regressie-analyse is een andere mogelijkheid.

Je tweede (deel-)vraag is niet helemaal helder. Eenweg anova, de variant die je bij KDA tegenkomt, is simpelweg een analyse om een bivariaat verband te onderzoeken; eenweg anova kan je vertellen of twee variabelen samenhangen (onthoud: verschillende groepen zijn slechts een uiting/manifestatie van een onderliggende variabelen, zoals 'mannen' en 'vrouwen' een manifestatie zijn van de variabele 'geslacht'). Eenweg anova kun je dus gebruiken als je het verband wil weten tussen een nominale of ordinale variabele, die zich uit in twee of meer groepen, en een interval-variabele. Of de groepen op zich homogeen zijn is een andere kwestie; als ze maar niet geconfound zijn (i.e. als er maar geen andere variabele verschilt tussen de groepen, behalve de onafhankelijke variabele natuurlijk) is een eenweg anova een correcte analysemethode.

[1] Variatie, oftewel Sum of Squares, SS, is een spreidings-maat die nog niet is gecorrigeerd voor aantal waarnemingen, want die is nog niet gedeeld door de vrijheidsgraden, Degrees of freedom oftewel Df; en de standaard deviatie is een maat voor spreiding die is gecorrigeerd voor het aantal waarnemingen en bovendien is teruggerekend naar de schaal van de betreffende variabele; de standaard deviatie is de wortel van de variantie.
beantwoord 13 februari 2014 door gjp (69,620 punten)
Okay, dus bijvoorbeeld in de casus statistiekcursus, indien je van tevoren weet dat de odinale variabel gelijk verdeeld is(in beide groepen). En je niet perse de verschillen tussen de subgroepen van de ordinale variable wilt weten. Kan je anova achterwege laten?

mbt deelvraag; de link nominale/ordinale variable en afhankelijke variabel en homogeniteit is duidelijk, bedankt.
Ik was niet duidelijk genoeg denk ik. Of je een anova doet hangt er vanaf of je een bepaald verband wilt onderzoeken. Dit kan zijn omdat je naar een confounder wil kijken; of omdat je onafhankelijke variabele van interval-niveau is, en je afhankelijke variabele van nominaal of ordinaal niveau (of natuurlijk andersom); of omdat je wil kijken of de varianties in verschillende groepen gelijk zijn. Er is geen regel die altijd opgaat zoals jij lijkt te impliceren . . .
nee het was helder. Mijn vraag was onduidelijk denk ik :) maar het is helder nu bedankt!
...