Hier lopen twee verschillende doelen door elkaar: statistische conclusies kunnen trekken uit toetsen, en inhoudelijke conclusies kunnen trekken met voldoende externe validiteit.
Voor de externe validiteit (generaliseerbaarheid) is het belangrijk dat de steekproef van het onderzoek een eerlijke weergave is van de doelpopulatie.
Voor statistische toetsing doen we niet iets met onze steekproef perse. De centrale limietstelling is een belangrijk principe dat zich op de achtergrond afspeelt. Wanneer we willen toetsen of een observatie significant van een nulhypothese verschilt dan kunnen we dat doen omdat er een wiskundige wet op de achtergrond (de centrale limietstelling) ons de vraag helpt oplossen of we de vergelijking wel kunnen maken statistisch. Als de onderliggende populatieverdeling ons onbekend is dan missen we middelen om te besluiten of een waarde extreem is of niet. Wanneer we echter via een wiskundig-inzicht weten dat een steekproevenverdeling (dat is niet de populatieverdeling) zich normaal verdeeld gaat gedragen onder enkele voorwaarden, dan kunnen we bij veel toetsen daar op leunen.
Als we de populatieverdeling willen weten dan zijn er andere technieken die we daarvoor kunnen gebruiken. De centrale limietstelling is eigenlijk voor sociale wetenschappers slechts handig om te kennen in de context van snappen waarom ons gereedschap werkt.
De wiskunde achter de centrale limietstelling is niet makkelijk te begrijpen zonder een gedegen wiskundeachtergrond. Probeer zonder deze achtergrond dan ook niet teveel te begrijpen waarom de centrale limietstelling werkt. Belangrijkste is om te weten dat onze nulhypothese toetsing mogelijk is, omdat we misschien niet een normaal verdeelde steekproef hebben, of de populatieverdeling niet kennen, maar dat een steekproevenverdeling altijd (laten we het makkelijk houden) normaal verdeeld is.