Steekproeven (en populaties) hoeven niet normaal verdeeld te zijn - als de steekproevenverdeling van het gemiddelde maar normaal is verdeeld.
Populatieverdelingen hebben gewoon de verdeling die ze hebben: die van leeftijd is bijvoorbeeld nooit normaal (dat kan ook niet - als je weinig jonge mensen hebt kun je normaal niet opeens meer oudere mensen hebben).
De verdeling van steekproefscores benadert altijd de populatieverdeling (hoe groter de steekproef, hoe beter de benadering). Er is dus a priori ook nooit een reden om uit te gaan van een normale verdeling van steekproefscores, tenzij je toevallig weet dat de variabele die je meet normaal is verdeeld in de populatie waar je steekproef uit afkomstig is. Omdat niet alles normaal is verdeeld weet je dat meestal niet.
De steekproefscores hebben dus gewoon de verdeling die ze hebben: dat is niet goed of slecht (tenzij je aan die verdeling kunt zien dat er wellicht iets fout is gegaan, bijvoorbeeld met een meetinstrument, of met het werven van deelnemers, etc).
Het resultaat van deze steekproef is dus niet afwijkend, want een normale verdeling is niet de norm. Het is niet zo dat als een steekproef niet normaal is verdeeld, dat dat dan problematisch is. De verdelingsvormen zijn informatief over hoe een variabele is verdeeld in de populatie, en dat kan scheef zijn, of normaal, of uniform, et cetera.
Afwijkingen van normaliteit worden pas zorgwekkend als de steekproef klein is, of de afwijkingen heel groot. Bij een steekproef van 168 deelnemers moet de afwijken al heel extreem zijn wil de steekproevenverdeling van het gemiddelde niet normaal zijn.
Voor andere analyses gelden overigens andere principes: als een datareeks scheef is, en de andere normaal, dan is de maximaal haalbare correlatie tussen die twee datareeksen bijvoorbeeld lager dan 1. In dat geval moet je de correlaties dus anders interpreteren. Maar in de context van gemiddelden zijn afwijkingen van normaliteit in de steekproefscores dus geen probleem.