Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe bereken ik de power voor een mediatie-analyse?

0 leuk 0 niet-leuks
Ik weet dat je G*Power 3 kunt gebruiken om de power te berekenen voor de meeste simpele analyses. Ik wil echter een mediatie-analyse doen, en ik weet niet hoe ik dan de power kan berekenen . . .
gevraagd 13 december 2012 in Steekproeven en steekproefomvang door gjp (66,080 punten)

1 Antwoord

1 leuk 0 niet-leuks

Als je een mediatie-analyse doet, bijvoorbeeld met de SPSS syntax van Hayes (met Preacher, zie http://www.afhayes.com/spss-sas-and-mplus-macros-and-code.html), zijn power berekeningen wat complexer dan voor simpelere analyses, waar je G*Power voor kunt gebruiken (zie http://oupsy.nl/help/30/hoe-weet-ik-hoeveel-proefpersonen-ik-nodig-heb). David Kenny bespreekt dit op zijn website (http://davidakenny.net/cm/mediate.htm#DI. De situatie is niet helemaal hetzelfde als wanneer je de Hayes syntax gebruikt, omdat die bootstrapping gebruikt, een iets andere methode dus. Desalniettemin is de power van de twee methoden vergelijkbaar.

Je kunt de redenering van Kenny als volgt samenvatten. Je doet een regressie-analyse met twee voorspellers, waarbij de voorspellers samenhangen. Deze samenhang verlaagt de lower van je regressie-analyse vanwege zogenaamde 'multicollinearity' (zie voor meer uitleg over multicollineariteit en de gevolgen deze vraag: http://oupsy.nl/help/35/wat-zijn-de-vif-en-tolerance-bij-regressie-analyse).

Door die samenhang van je voorspellers heb je in je regressie-analyse eigenlijk minder informatie dan als de voorspellers niet samen zouden hangen. Door multicollineariteit is je 'effectieve steekproefomvang' dus kleiner dan je daadwerkelijke steekproefomvang (elke proefpersoon levert immers minder informatie door die samenhang tussen je voorspellers).

De 'effectieve steekproefomvang' die je overhoudt, is N(1 - r²), waarbij r de correlatie tussen je twee voorspellers is. Stel je dus voor dat je in je mediatiemodel verwacht dat je mediator .6 correleert met je onafhankelijke variabele. Dan is de effectieve steekproefomvang dus (1 - .6²) kleiner, oftewel .64 kleiner. Als je 100 proefpersonen hebt, heb je dus maar de informatie die 64 proefpersonen leveren, vanwege die samengang in je voorspellers in het regressiemodel.

Deze formule kun je natuurlijk ook omdraaien: als je een power-analyse doet, en die vertelt je hoeveel proefpersonen je nodig hebt, kun je dat aantal delen door (1 - r²). Stel dat je in G*Power de power uitrekent die je nodig hebt om een significante regressie-coefficient te krijgen (kies "t-tests" en dan "Linear Multiple Regression: Fixed model, single regression coefficient"). Met een tweezijdige toets en een gemiddelde effect size (f = .15) heb je met een alpha van .05, een power van .95, en 2 voorspellers 89 mensen nodig. Als die voorspellers .6 correleren, heb je dus 89 / .64 = 139 mensen nodig.

Net zoals bij alle power-analyses heb je dus een schatting nodig van welke effect size je verwacht, en hoe groot de correlatie tussen je onafhankelijke variabele en je mediator is. Deze kun je halen uit eerder onderzoek. Als je echt geen idee hebt, kun je uitgaan van een 'worst case scenario' (bijvoorbeeld een grote correlatie van .5) of een correlatie die overeenkomt met een gemiddelde effect size (.3), afhankelijk van wat je plausibeler lijkt.

Houdt er trouwens verder rekening mee dat je bij mediatie-analyse het risico loopt dat je ten onrechte concludeert dat er volledige mediatie is, als je onvoldoende power hebt. Als je onafhankelijke variabele samenhangt met je mediator (wat natuurlijk zo is; anders hoef je niet eens mediatie-analyse te doen), en zowel je onafhankelijke variabele als de mediator samenhangen met de afhankelijke variabele (wat ook altijd zo is als er minimaal gedeeltelijke mediatie is), heeft de toets van het indirecte effect van de onafhankelijke variabele altijd minder power dan de toets van het directe effect. Het kan dus dat er sprake is van gedeeltelijke mediatie, maar dat je door een gebrek aan power ten onrechte concludeert dat er volledige mediatie is. Je concludeert dan dus dat het effect van de onafhankelijke variabele volledig verloopt via de mediator, terwijl de onafhankelijke variabele eigenlijk ook nog een direct effect heeft. Dit directe effect is alleen niet significant omdat je te weinig power hebt voor die toets, vanwege de multicollineariteit met de mediator.

Als laatste opmerking: houd er rekening mee dat je meerdere meetmomenten nodig hebt om mediatie-analyse te doen; zie voor een duidelijke uitleg http://www.ehps.net/ehp/index.php/contents/article/download/ehp.v14.i1.p4/31.

beantwoord 13 december 2012 door gjp (66,080 punten)
bewerkt 18 mei 2015 door gjp
...