Uitstekende vraag!
Inderdaad worden de leerlingen niet willekeurig toebedeeld.
Maar, dat hoeft ook niet bij randomisatie: de onderzoekseenheid hoeft niet willekeurig te worden bepaald. Het gaat om onafhankelijkheid. Dit is best ingewikkeld, dus ik leg het even wat uitgebreider uit.
Ten eerste: echt technisch/formeel gezien randomiseer je geen onderzoekseenheden (bijvoorbeeld deelnemers). Randomisatie betekent dat je de onafhankelijke variabele random toewijst aan je onderzoekseenheden. Of nog iets accurater, het niveau van de onafhankelijke variabele (dus de categorie, of de conditie zoals die in een experiment meestal worden genoemd).
Je wijst de niveaus van de onafhankelijke variabele willekeurig toe aan de onderzoekseenheden (e.g. deelnemers, maar dat zou ook een schoolbestuur of een gezin kunnen zijn) omdat je zo onafhankelijkheid kunt bereiken. Onafhankelijkheid waarvan? Van alles.
Door de conditie waar een onderzoekseenheid in valt willekeurig te laten bepalen (i.e. random), weet je zeker dat er geen systematische samenhang kan zijn met andere variabelen.
Dit is de enige manier om zeker te weten dat een verband met een andere variabele wel door de conditie moet komen (i.e. door de verschillen tussen de condities, dus meestal de effecten van de manipulatie).
Je randomiseert dus je condities om te garanderen dat die condities niet samenhangen met andere (bijvoorbeeld psychologische) variabelen.
Deze zelfde redenering gaat natuurlijk nog op als je randomiseert op hogere niveau's, bijvoorbeeld op klas- of schoolniveau. Dan voorkom je ook systematische afwijking. Maar: dan moet je wel genoeg klassen of scholen hebben natuurlijk. Als je vier mensen randomiseert in twee groepen, is de kans dat de ene groep (van twee personen) hoger scoort op bijvoorbeeld extraversie of intelligentie dan de andere groep, vrij groot; er hoeft maar 1 uitzonderlijk hoog of laag scorend persoon onder die vier mensen te zijn, of de groepen verschillen al. Ditzelfde geldt natuurlijk voor clusters onderzoekseenheden.
Bovendien is een extra complicatie dat deelnemers in een klas meer op elkaar lijken dan op deelnemers in een willekeurige andere klas. Die zitten immers al maanden of soms zelfs jaren elke dag samen op school. Deze afhankelijkheid tussen leerlingen binnen een klas (net als de afhankelijkheid tussen meetmomenten binnen een deelnemers) betekent dat je geen reguliere analyse kunt gebruiken; in dit geval zul je waarschijnlijk multilevel analyse nodig hebben (hoewel het in theorie ook in een repeated measures anova model te formuleren is, maar dat is nog ingewikkelder dan een multilevel analyse). Die multilevel analyse komt aan bod in Onderzoekspracticum longitudinaal onderzoek.
Dus er spelen twee dingen:
- Als je randomiseert, mag dat best op hogere niveau's dan je onderzoekseenheden;
- Als je hogere niveau's hebt dan je onderzoekseenheden, betekent dat dat er afhankelijkheid bestaat tussen je onderzoekseenheden, en moet je daar rekening mee houden in je analyses.