Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

​​​​​​​5.3 Dichotome onafhankelijke variabelen

365 Datascience: The difference between correlation and regression

Bovenstaand filmpje wordt als extra verdieping aangeboden bij bovenstaande studietaak.

De video lijkt te stellen dat regressie (in tegenstelling tot correlatie) causaliteit weergeeft: 'Regression is based on causality. It shows no degree of connection but cause and effect.’.

Dit lijkt niet overeen te komen met wat er in de lesstof benadrukt wordt:

(Paragraaf 29.15 van Open Methodologie en Statistiek)

'In Figuur 29.11 staat het structurele model van enkelvoudige regressie-analyse weergegeven. De pijl die van de linker ellips met naar de rechter ellips met loopt drukt de asymmetrische aard van het regressiemodel uit.

Het is belangrijk om goed te onthouden dat deze pijl een statistisch effect uitdrukt. Dat is iets heel anders dan een causaal effect in de methodologische en theoretische betekenis. In de statistiek worden de termen ‘effect’, ‘voorspelling’, en ‘verklaring’ gebruikt om verklaarde variantie uit te drukken, niet om een verondersteld causaal effect te beschrijven. Onthoud dat welke term ook wordt gebruikt, of een verband, effect, voorspelling, of verklaring iets zegt over oorzaak en gevolg ligt besloten in het ontwerp van een studie, en kan nooit worden aangetoond door een statistische analyse alleen.'

Ligt het aan mijn interpretatie of klopt het dat de inhoud van de video niet strookt met de inhoud van de lesstof?

Alvast bedankt voor de hulp!

Met vriendelijke groeten

in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (120 punten)

1 Antwoord

0 leuk 0 niet-leuks

Dit stukje in de video is inderdaad verwarrend. Regressie is een analyse - en statistische analyses hangen niet per se samen met causaliteit of gebrek daaraan.

Stel je bijvoorbeeld voor dat je een studie doet waarin je deelnemers indeelt in een conditie waar ze 100, 200, 300, 400, 500, of 600 gram eten eten en vervolgens meet hoe vol ze zitten.

Met die data kun je prima een regressiemodel specificeren waarbij de afhankelijke variabele is hoeveel eten iemand eet, terwijl de voorspeller is hoe vol iemand zit. Een statistisch programma weet natuurlijk niets over de wereld en over wat logisch is, en zelfs niet wat causaliteit is.

Tegelijkertijd geldt dat als je regressie-analyse gebruikt om causale verbanden te onderzoeken, bijvoorbeeld 1) in een experiment waarbij je de voorspeller hebt gemanipuleerd, of 2) als je de causaliteit niet toetst/onderzoekt, maar voor gegeven aanneemt, je als wetenschapper die de analyses aanstuurt altijd de oorzaak als voorspeller opneemt en het gevolg als afhankelijke variabele.

Hier volgt dus uit dat als je regressie-coefficienten wil interpreteren als betrekking hebbende op causaliteit, die link naar causaliteit nooit uit de analyse kan komen, maar uit het ontwerp van je studie en/of uit andere aannames.

In het filmpje worden de situaties waarin regressie vaak wordt gebruikt verward met eigenschappen van regressie, en dat is fout. Regressie gaat niet over causaliteit; veruit de meeste statistische analyses gaan niet over causaliteit, maar helpen ons om iets te leren over mogelijke causaliteit.

door (77.5k punten)
...