Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Correlatie met dummy variabele

0 leuk 0 niet-leuks
Beste medestudenten,

In aanloop naar een regressieanalyse heb ik een correlatie analyse uitgevoerd om te controleren of de onafhankelijke variabelen met elkaar correleren. Dat is het geval.

Nu correleert er een variabele met een dummy variabele. Ik heb dit niet eerder meegemaakt en  twijfel over de interpretatie hiervan. Ik nijg te stellen dat indien de persoon in deze dummygroep valt, de waarde van de variabele met dit getal hoger uitvalt. Dus dat in feite het gemiddelde van de dummygroep voor deze variabele hoger is. Of zie ik dat te simpel?

Alvast dank voor het meedenken!
gevraagd 25 januari in Methodologie door rogierstudeert (150 punten)

1 Antwoord

0 leuk 0 niet-leuks
 
Beste antwoord
Een dummyvariabele is dichotoom: meestal 0/1. De correlatie is dus geen Pearson correlatie, maar een zogenaamde puntbiseriele correlatie. In plaats daarvan kun je beter Cohen's d uitrekenen: die drukt het verschil tussen de twee groepen (mensen met 0 op de dummyvariabele versus mensen met 1 op de dummyvariabele) uit.

Ovrigens moet je heel erg oppassen met regressie-analyse als je voorspellers psychologische constructen zijn. Deze zijn vaak zo gedefinieerd dat ze overlappende delen van de menselijke psychologie omvatten. De meetinstrumenten vragen dan ook deels dezelfde dingen uit (bijvoorbeeld: een vragenlijst voor stress en een vragenlijst voor positief en negatief affect meten deels hetzelfde).

Die overlap betekent dat de constructen deels hetzelfde stukje van de afhankelijke variabele kunnen verklaren. De software (de regressie-algoritmen) kunnen nooit bepalen aan welke variabele die overlappende verklaarde variantie moet worden toegewezen. Daarom wordt die overlappende variantie verwijderd uit het model (conform de zogenaamde Type-III Sums of Squares). Het gevolg is dat je maar een deel van de variantie van elke voorspeller overhoudt.

Als de conceptualisaties en meetinstrumenten helemaal onafhankelijk zijn, kun je zeggen dat je alleen de unieke bijdragen overhoudt.

Maar, als de constructen overlappen in hun definities (i.e. als ze logischerwijs deels overlappende delen van de menselijke psychologie betreffen), en dus de meetinstrumenten deels hetzelfde meten, dan maak je hiermee de meetinstrumenten invalide. Die meten niet langer het construct zoals het is gedefinieerd, maar een onbekend onderdeel van dat construct.

De regressie-coefficienten kunnen je dus niets meer vertellen over je doelconstruct, want ze gaan niet meer over dat construct, maar over een onbekend stukje van dat construct. Houd hier dus ook rekening mee als je regressie-analyse doet: dit kan alleen als je voorspellers niet overlappen in hun definities en meetinstrumenten!
beantwoord 25 januari door gjp (66,080 punten)
geselecteerd 26 januari door rogierstudeert
Dank voor je antwoord Gjalt-Jorn! Voor wat betreft jou laatste opmerkingen; voor uitvoering van de regressieanalyse zal ik ook rekening houden met de multicolineariteit.

Groeten Rogier
...