Een dummyvariabele is dichotoom: meestal 0/1. De correlatie is dus geen Pearson correlatie, maar een zogenaamde puntbiseriele correlatie. In plaats daarvan kun je beter Cohen's d uitrekenen: die drukt het verschil tussen de twee groepen (mensen met 0 op de dummyvariabele versus mensen met 1 op de dummyvariabele) uit.
Ovrigens moet je heel erg oppassen met regressie-analyse als je voorspellers psychologische constructen zijn. Deze zijn vaak zo gedefinieerd dat ze overlappende delen van de menselijke psychologie omvatten. De meetinstrumenten vragen dan ook deels dezelfde dingen uit (bijvoorbeeld: een vragenlijst voor stress en een vragenlijst voor positief en negatief affect meten deels hetzelfde).
Die overlap betekent dat de constructen deels hetzelfde stukje van de afhankelijke variabele kunnen verklaren. De software (de regressie-algoritmen) kunnen nooit bepalen aan welke variabele die overlappende verklaarde variantie moet worden toegewezen. Daarom wordt die overlappende variantie verwijderd uit het model (conform de zogenaamde Type-III Sums of Squares). Het gevolg is dat je maar een deel van de variantie van elke voorspeller overhoudt.
Als de conceptualisaties en meetinstrumenten helemaal onafhankelijk zijn, kun je zeggen dat je alleen de unieke bijdragen overhoudt.
Maar, als de constructen overlappen in hun definities (i.e. als ze logischerwijs deels overlappende delen van de menselijke psychologie betreffen), en dus de meetinstrumenten deels hetzelfde meten, dan maak je hiermee de meetinstrumenten invalide. Die meten niet langer het construct zoals het is gedefinieerd, maar een onbekend onderdeel van dat construct.
De regressie-coefficienten kunnen je dus niets meer vertellen over je doelconstruct, want ze gaan niet meer over dat construct, maar over een onbekend stukje van dat construct. Houd hier dus ook rekening mee als je regressie-analyse doet: dit kan alleen als je voorspellers niet overlappen in hun definities en meetinstrumenten!