Verschillende condities in een experiment kunnen worden vergeleken op alle variabelen die zijn gemeten voordat verschillen tussen de condities zich manifesteren. In de praktijk betreft het verschil bijna altijd een manipulatie (en accurater, verschillende vormen van een manipulatie of zelfs verschillende manipulaties). Zolang alle condities dezelfde procedure volgen, zijn alle metingen bruikbaar om ze te vergelijken.
Je hoeft je dus niet te beperken tot demografische variabelen; juist voormetingen van je afhankelijke variabele of mogelijke mediatoren of covariaten zijn ook interessant om te bekijken. Elke variabele die samenhangt met conditie (i.e. met je onafhankelijke variabele(n)) is een mogelijke confounder. De volgende stap is dan om te kijken of die variabele ook samenhangt met je afhankelijke variabele. Zoja, dan is de variabele een confounder, en kan hij effecten verhullen of niet-bestaande effecten laten verschijnen.
De vergelijking doe je met een t-toets (als je twee condities hebt) of een eenweg anova (als je meerdere vormen/niveau's van dezelfde manipulatie hebt) of een factoriele anova (als je condities de manifestatie van meerdere onafhankelijke variabelen vormen). De afhankelijke variabele is dan steeds de mogelijke confounder. Als je mogelijke confounder niet het interval-niveau heeft, gebruik je chi-square, en Cramer's V als effect size measure.
Randomisatie garandeert dat de groepen equivalent zijn, maar is een random proces, en is bij kleine steekproeven dus niet betrouwbaar. Verificatie is dus altijd een goed idee, en kan sowieso geen kwaad. Zie voor meer achtergrondinformatie http://stats.stackexchange.com/questions/74350/is-randomization-reliable-with-small-samples