Dit stukje in de video is inderdaad verwarrend. Regressie is een analyse - en statistische analyses hangen niet per se samen met causaliteit of gebrek daaraan.
Stel je bijvoorbeeld voor dat je een studie doet waarin je deelnemers indeelt in een conditie waar ze 100, 200, 300, 400, 500, of 600 gram eten eten en vervolgens meet hoe vol ze zitten.
Met die data kun je prima een regressiemodel specificeren waarbij de afhankelijke variabele is hoeveel eten iemand eet, terwijl de voorspeller is hoe vol iemand zit. Een statistisch programma weet natuurlijk niets over de wereld en over wat logisch is, en zelfs niet wat causaliteit is.
Tegelijkertijd geldt dat als je regressie-analyse gebruikt om causale verbanden te onderzoeken, bijvoorbeeld 1) in een experiment waarbij je de voorspeller hebt gemanipuleerd, of 2) als je de causaliteit niet toetst/onderzoekt, maar voor gegeven aanneemt, je als wetenschapper die de analyses aanstuurt altijd de oorzaak als voorspeller opneemt en het gevolg als afhankelijke variabele.
Hier volgt dus uit dat als je regressie-coefficienten wil interpreteren als betrekking hebbende op causaliteit, die link naar causaliteit nooit uit de analyse kan komen, maar uit het ontwerp van je studie en/of uit andere aannames.
In het filmpje worden de situaties waarin regressie vaak wordt gebruikt verward met eigenschappen van regressie, en dat is fout. Regressie gaat niet over causaliteit; veruit de meeste statistische analyses gaan niet over causaliteit, maar helpen ons om iets te leren over mogelijke causaliteit.