Bij dit soort kwesties is de statistiek eigenlijk bijna irrelevant.
Belangrijker is methodologie: wat is je design precies?
En nog belangrijker dan methodologie is theorie.
Welk theoretische kader hanteer je? Welke redenen zijn er om aan te nemen dat er schijnsamenhang is?
En: hoe definieer je schijnsamenhang precies, in dit geval?
Als jij twee variabelen meet, en ze correleren, dan is er samenhang. Dit is natuurlijk niet causaal - van alles verbanden die er tussen variabelen zijn (dus alle samenhang die je kunt observeren) is maar een fractie causaal. Als je samenhang vindt, dan weet je dus bijna zeker dat die niet causaal is.
Als je een experimenteel design hebt, is het natuurlijk een ander verhaal; dan kun je wel leren over causaliteit (en dan is het nog lastig; en zonder experiment kan het heel soms ook, maar dat is echt ontzettend complex, veel complexer dan in de bachelor behandeld kan worden).
Aangenomen dat dit geen experimentele studie betreft (want in een experiment kun je schijnsamenhang sowieso uitsluiten; je hebt immers zelf de onafhankelijke variabele gemanipuleerd) wordt de vraag dus: wat bedoel je met schijnsamenhang?
Want X en Y hangen samen. Dat lijkt niet alleen zo, dat is dan dus ook zo. En die samenhang is (hoogstwaarschijnlijk) niet causaal. Hij wordt dus verklaard door allerlei andere factoren.
Maar dat maakt de samenhang niet opeens iets dat slechts zo 'schijnt' te zijn...
Kortom, je moet een hoop dingen helder krijgen voordat de statistiek relevant wordt bij dit soort vragen.