Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

hoe spoor je confounders op?

0 leuk 0 niet-leuks
Ik weet dat je confounders als covariaten moet betrekken in je analyses. Maar hoe spoor je ze op? Hoe zie je bijvoorbeeld bij het gebruiken van een One Way Anova of een bepaalde variabele een confounder is?
gevraagd 18 december 2012 in Methode door 836304972 (130 punten)

1 Antwoord

2 leuk 0 niet-leuks
Goede vraag. Met, zoals alle goede vragen, geen eenvoudig antwoord :-)

Een confounder is gedefinieerd als een verstorende variabele. Een variabele die, als je er niet van op de hoogte bent, je de indruk kan geven dat er een verband bestaat tussen de variabelen die je onderzoekt - of het omgekeerde, een variabele die zorgt dat je een bestaand verband niet kunt detecteren. Een variabele kan een niet-bestaand verband simuleren of een bestaand verband maskeren als hij samenhangt met zowel je onafhankelijke variabele als je afhankelijke variabele.

Stel je voor dat je bijvoorbeeld een studie doet naar de effecten van sport op geluk. In de ene conditie doen proefpersonen niets; in de andere conditie sporten ze elke week drie keer. Na een half jaar meet je geluk bij je proefpersonen. Stel dat je proefpersonen zelf laat kiezen in welke conditie ze willen zitten. Als je dan na een half jaar vindt dat (bijvoorbeeld) de sportende proefpersonen gelukkiger zijn, is dat dan een reden om sport te promoten als methode om gelukkiger te worden?

Nee, want het is goed mogelijk dat de proefpersonen die ervoor kozen om in de sport-conditie te komen, sowieso al gelukkiger waren. Misschien zijn minder gelukkige mensen bijvoorbeeld ook minder geneigd om nieuwe initiatieven te ontplooien. Er zijn natuurlijk nog wel meer van dat soort mogelijke confounders te bedenken.

Jouw vraag is nu: hoe detecteer je confounders? Hoe weet je welke variabelen allemaal zo'n verborgen verstorend effect kunnen hebben? Jammer genoeg bestaat daar geen methode voor. Confounders zijn immers per definitie variabelen waarvan je niet op de hoogte bent. Op het moment dat je een variabele hebt gemeten, en dus de data hebt die je in staat stelt om te bepalen of het een mogelijke confounder is, moet je immers al een reden hebben gehad om die variabele te meten (waarschijnlijk een vermoeden dat het wel eens een confounder zou kunnen zijn).

Gelukkig is er wel een oplossing waarmee je kunt voorkomen dat confounders je conclusies kunnen versturen. Als je een experiment doet, waarbij je de onafhankelijke variabele manipuleert in twee of meer condities en je de proefpersonen randomiseert tussen die condities, sluit je daarmee uit dat er confounders zijn. Geen enkele variabele kan immers samenhangen met je onafhankelijke variabele: de groepen proefpersonen in elke conditie zijn equivalent. [1] Er kunnen natuurlijk nog steeds variabelen zijn die samenhangen met de afhankelijke variabele; maar dat is niet genoeg om je conclusies te kunnen verstoren.

Als je harde (causale) conclusies wilt trekken, moet je dus een experiment doen. Kan dat niet, en ben je beperkt tot een quasi-experiment, een survey, of een ander design? Duik dan goed in de literatuur, en denk goed na over mogelijke confounders. Meet ze, en kijk of ze samenhangen met je onafhankelijke variabele, en met je afhankelijke variabele. Zoja, neem ze dan mee als covariaat.

Om dit laatste nog even iets gedetailleerder te bespreken: als je een mogelijke confounder al hebt gemeten, en je wil weten of het een confounder is, dan kijk je dus eerst naar het verband met de onafhankelijke variabele, en dan naar het verband met de afhankelijke variabele. Dit doe je met de standaard bivariate toetsen, dus afhankelijke van de meetniveau's van je drie variabelen met een t-toets, een correlatie, een anova, of een non-parametrische toets. Als blijkt dat je potentiele confounder met zowel je onafhankelijke als je afhankelijke variabele samenhangt, dan neem je 'm mee als covariaat.

[1] Een voorwaarde is wel dat je groepen voldoende groot zijn! Als de groepen te klein zijn, is er alsnog een grote kans dat je met non-equivalente groepen eindigt.
beantwoord 18 december 2012 door gjp (63,260 punten)
Gjalt_jorn Peeters, als ik twee groepen heb: controle en experimentele in mijn experiment onderzoek, kan ik dan geen confounders hebben? Ik heb geslacht, leeftijd en inkomen onderzocht, kan ik dan besluiten dat indien ze niet correleren met mijn ONAFHANKELIJKE variabele (groep 0 of 1), dat ze dan wel confounder zijn? Aangezien ze niet samenhangen, dus ongelijk zijn verdeelt in de twee groepen? Geslacht en leeftijd correleert wel met AV?
Als mijn t-test een p-waarde heeft van <0,05 dan is er geen verband met de AV, of juist wel? Of hoe moet ik dit dan doen met een t-test?
Als de randomisatie voor je experiment goed werkte, en je experiment goed in elkaar zit, kun je geen confounders hebben. Als je relatief kleine groepen hebt, kan het zijn dat je randomisatie toevallig niet goed werkte. Dit kun je controleren door je twee groepen te vergelijken, inderdaad bijvoorbeeld op geslacht, leeftijd, en inkomen. Als blijkt dat ze geen van drieen samengangen met conditie, kun je deze variabelen uitsluiten als confounder. Als deze variabelen ongelijk verdeeld zijn in de twee groepen, hangen ze juist WEL samen met conditie, en kunnen het wel confounders zijn. Dit manifesteert zich als een p-waarde kleiner dan .05 voor de betreffende toets (bijvoorbeeld een t-toets voor leeftijd (als leeftijd op interval-niveau is gemeten) of een chi-square voor opleidingsniveau en geslacht). De p-waarde drukt immers de kans uit op een verband dat zo sterk is als wat je hebt gevonden, of nog sterker, als de nulhypothese waar zou zijn (puur op basis van toeval dus). Als een variabele samenhangt met je conditie, kan het een mogelijk confounder zijn; om te bepalen of dit het geval kan zijn, moet je vervolgens kijken of die variabele samenhangt met je afhankelijke variabele. Als dat het geval is, is het een confounder, en moet je die variabele meenemen in je analyse als covariaat.
Bedankt! Nog iets: ik merk dat dus inkomen samenhangt met de Afhankelijke variabele. Als ik een meervoudig regressie model opstel, zie ik dat inkomen niet significant is. Als ik inkomen indeel in twee groepen (nl laag en hoog, gewoon een middenweg genomen), zie ik dat er wel een significante bijdrage is door deze variabele. Mag ik zo op die manier overschakelen naar een groepsindeling van inkomen en wel conclusies gaan trekken op basis van het model met de twee groepen? Of gaat dat een vertekend beeld geven?

Als inkomen in bivariate analyses samenhangt met zowel je voorspeller als je afhankelijke variabele, moet je het inderdaad opnemen in je regressiemodel. Als inkomen dan niet significant is, is dat niet erg; het heeft zijn doel gediend door te corrigeren voor overlap met je voorspeller in de voorspelling van je afhankelijke variabele.

Je mag bijna nooit dichotomiseren, en zeker niet op de middengrens: zie http://oupsy.nl/help/222/mijn-schaal-dichotomiseren-wat-een-goede-cut-off-grenswaarde voor meer informatie. Bovendien gan je sowieso geen conclusies trekken op basis van inkomen als het goed is; je had hier immers geen onderzoeksvragen over. Door ad hoc naar verbanden te kijken vergroot je de kans op type-1 fouten aanzienlijk. Analyseer dus vooral je oorspronkelijke onderzoeksvragen.

...