Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe weet ik hoeveel proefpersonen (deelnemers) ik nodig heb?

0 leuk 0 niet-leuks
Naarmate een steekproef groter is, zijn toetsen eerder significant. Maar hoe weet ik van te voren hoeveel proefpersonen ik nodig heb zodat mijn uitkomsten significant zijn?
gevraagd 13 december 2012 in Steekproeven en steekproefomvang door gjp (64,270 punten)
bewerkt 12 mei 2014 door gjp

1 Antwoord

0 leuk 0 niet-leuks

Het soort analyse waarmee je kunt kijken hoeveel proefpersonen je nodig hebt, heet een power analyse. Deze moet je altijd uitvoeren voordat je data gaat verzamelen. Stel je immers voor dat je van te voren als kunt bepalen dat je 200 mensen nodig hebt, terwijl je in je planning maar 50 mensen gaat onderzoeken! Dan kun je de studie net zo goed niet doen - sterker nog, dan is het niet ethisch om de studie uit te voeren.

Als wetenschapper dien je je te houden aan de gedragsregels voor wetenschappelijke integriteit, en dit betekent onder andere dat je altijd power analyses uit moet voeren alvorens mensen te belasten door ze te vragen deel te nemen aan je studie.

Gelukkig zijn dergelijke poweranalyses erg eenvoudig met het gratis computerprogramma G*Power 3. Dit kun je downloaden op http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/download-and-register. Voor een aantal simpele analyses staat hier welke optie in G*Power je moet gebruiken om te berekenen hoeveel proefpersonen je nodig hebt:

  • T-toetsen staan in "t tests":
    • Onafhankelijke t-toets: "Means: Difference between two independent means (two groups)"
    • Afhankelijke t-toets: "Means: Difference between two dependent means (matched pairs)"
  • Anova's staan bij "F tests":
    • Eenweg Anova: "ANOVA: Fixed effects, omnibus, one-way"
    • Meerweg Anova (per effect): "ANOVA: Fixed effects, special, main effects and interactions"
    • Ancova (per effect): "ANCOVA: Fixed effects, main effects and interactions"
    • Repeated Measures Anova: "ANOVA: Repeated measures", en dan afhankelijk van waar je naar wil kijken (between, within, of de interactie).
  • Correlaties staan bij "Exact", namelijk "Correlation: Bivariate normal model"
  • Regressie-analyse (en moderatie-analyses) staan zowel bij "t tests" als bij "F tests", maar in principe ben je bijna altijd geinteresseerd in de significantie van een voorspeller, dus kijk je bij "t tests", bij "Linear multiple regression: Fixed model, single regression coefficient"

Denk er aan dat je altijd two-tailed toetst! One-tailed (eenzijdige) toetsen zijn in de praktijk erg zeldzaam en moeilijk te verkopen.

Het kan ook handig zijn om dit korte artikeltje van Cohen, een van de "Power Guru's", te lezen: http://www.bwgriffin.com/workshop/Sampling%20A%20Cohen%20tables.pdf

Niet alle mogelijke analyses staan in dit programma: als je een geavanceerdere analyse wil doen, kan het zijn dat G*Power niet volstaat. In dat geval zijn er soms geavanceerdere programma's beschikbaar die zijn gespecialiseerd in jouw analyse (zie bijvoorbeeld http://oupsy.nl/help/18/hoe-kun-je-power-berekenen-voor-een-multilevel-analyse en http://oupsy.nl/help/32/hoe-bereken-ik-de-power-voor-een-mediatie-analyse). Overleg in zo'n geval met je begeleider.

Vergeet overigens niet om G*Power ook te citeren als je het gebruikt! Op de pagina waar ik hierboven naar verwijs staan twee referenties die je kunt gebruiken. Het is verder goed om het power protocol dat G*Power 3 genereert (de tweede 'tab') op te nemen als appendix bij je onderzoeksvoorstel en in het uiteindelijke artikel.

In plaats van G*Power kun je ook R gebruiken (bij mij werkt G*Power bijvoorbeeld niet in Windows 8.1, om de een of andere reden). R werkt in bijna alle operating systems; zie http://oupsy.nl/help/24/wat-is-r-en-hoe-installeer-ik-het en http://oupsy.nl/help/28/hoe-krijg-ik-data-van-spss-in-r om te starten). In R doe je power analyses door eerst het package 'pwr' te laden. Dat kan met:

require('pwr');

Of, als het nog niet is geinstalleerd, moet je dat eerste doen met:

install.packages('pwr');

Vervolgens kun je power-analyses doen met deze commando's:

  • Onafhankelijke t-toets: pwr.t.test(d=.5, power=.80);
  • Afhankelijke t-toets: pwr.t.test(d=.5, power=.80, type="paired");
  • Correlatie: pwr.r.test(r=.3, power=.80);
  • Gebalanceerd eenweg anova design: pwr.anova.test(k=3, f=.25, power=.80);
  • Chi-kwadraat: pwr.chisq.test(w=.3, df=3, power=.80);

De effect sizes die hier zijn ingevuld zijn de medium effect sizes. Bij de anova zijn 3 groepen gespecificeerd; bij een chi-kwadraat toets 3 vrijheidsgraden, dus bijvoorbeeld een 4x2 tabel (want (4-1) * (2-1) = 3 * 1 = 3). Naast deze functies is er pwr.f2.test, waarmee je power-analyses uit kunt voeren voor het general linear model (eigenlijk alle anova en regressie). Deze is wat ingewikkelder, dus vraag hiervoor je begeleider om hulp. Verder kun je in R makkelijk uitrekenen hoeveel power je met een gegeven steekproefomvang hebt voor bijvoorbeeld een medium effect size. Dan specificeer je niet de power, maar de n. Bij de t-toets specificeer je het aantal mensen PER GROEP, dus bijvoorbeeld:

pwr.t.test(n=20, d=.5);

Hier komt dan .34 uit; met 20 mensen per groep heb je dus 34% kans om een middelgrote effect size te tonen, als die er is.

UPDATE: Daniel Lakens, een Nederlandse psycholoog van de Technische Universiteit in Eindhoven, heeft een heel interessante blog post geschreven over een uitstekende methode is om te vermijden dat je te weinig of te veel proefpersonen draait: http://daniellakens.blogspot.nl/2015/04/how-many-participants-should-you.html. Een aanrader voor iedereen die een serieuze studie aan het ontwerpen is!

beantwoord 13 december 2012 door gjp (64,270 punten)
bewerkt 13 oktober 2016 door gjp
...