Uiteindelijk is het belangrijkste dat voor de lezer duidelijk is wat de hypothese nu precies stelt. 'Verband' is een beetje vage taal, maar populair omdat het nooit 'fout' is, omdat het geen causaliteit impliceert, of omdat het op verschillende soorten toetsen van toepassing is (t-toetsen, correlaties, ANOVA's, regressies). Tevens is de hypothese dat iets een verband vertoond (waarbij je impliciet de nulhypothese hebt dat in de populatie geen verband is, dus r = 0), iets dat ook heel dicht ligt op wat je daadwerkelijk later gaat toetsen.
De formulering 'meer X zal Y doen afnemen' is tricky. Dit is een expliciete stelling dat veranderingen Y causaal toe te schrijven zijn aan X. Dat is een hardere claim dan dat stijgingen in X samengaan met dalingen in Y (negatief verband). Deze claim mag op zich in een hypothese, maar dan ook alleen wanneer het onderzoeksontwerp in staat is om causaliteit te toetsen.
Al je geen zuiver experiment gebruikt dan is een wat voorzichtere formulering essentieel. Een beknopte formulering heeft dan nog steeds de voorkeur. Als ik van plan ben om regressieanalyse te gebruiken dan stel ik bijvoorbeeld het liefst iets als: X is een negatieve voorspeller van Y. Deze simpele formulering bevat veel informatie:
- Er is een impliciete veronderstelling van een causale richting (let op: dat is iets subtiel, maar wezenlijk anders dan causaliteit stellen);
- De richting van de veronderstelde relatie, en zelfs ;
- Dat er een regressietechniek gaat worden gebruikt.
Als jetwee groepen vergelijkt kun je ook 'verband' gebruiken, maar ik vind 'verschil' dan duidelijker. Bijvoorbeeld X1 zal meer Y vertonen dan X2. Let er ook hier op dat dit anders is dan stellen: X1 leidt tot meer Y dan X2.
Dus: verband is stiekem nooit fout, maar het is wat lauwe taal. Een causaliteit stellen is bijna altijd onjuist, dus gebruik dat echt alleen wanneer je experimentele proefopzet ook tot doel heeft (en in staat is) om causaliteitsclaims te testen