Ik snap je denkwijze. Echter, als je binnen de groepen vergelijkt kun je alleen kijken wat er over tijd gebeurt. Er zijn dan drie scenario's denkbaar:
- Beide groepen lijken gelijk te blijven over tijd;
- Een groep lijkt gelijk te blijven over tijd, en de andere lijkt te veranderen;
- Beide groepen lijken te veranderen over tijd.
Ik neem aan dat jij dan zou concluderen dat de training werkt in het tweede scenario.
Echter, zoals een toepasselijk genoemd artikel uitlegt,
The Difference Between “Significant” and “Not Significant” is not Itself Statistically Significant
(zie http://www.stat.columbia.edu/~gelman/research/published/signif4.pdf)
Oftewel, als je concludeert dat een groep verandert en de andere niet, dan kun je niet concluderen dat er iets verschillends gebeurde met de beide groepen. Om daar wel iets over te zeggen moet je echt naar die verandering over tijd kijken, en die vergelijken tussen de twee groepen.
Dat doe je door de verschilscore te nemen en te kijken of die verschilscore hetzelfde is in beide groepen.