Normaliteit is geen aanname van de $t$-toets. Dit wordt uitgelegd in Onderzoekspracticum inleiding data-analyse (PB0202), maar zie ook
https://sciencer.eu/2017/02/on-the-obsession-with-being-normal/ en
http://oupsy.nl/help/112/wanneer-is-mijn-data-te-scheef-niet-normaal-verdeeld
Los hiervan is het wel altijd verstandig om je data goed te leren kennen en te beschrijven. Handige hulpmiddelen zijn hierbij histogrammen, Q-Q plots, en boxplots. Het is ook handig om scatterplots te gebruiken om verbanden tussen variabelen te bekijken. Deze visualisaties worden allemaal ook besproken in PB0202.
Nu Open Science de norm is, is het bovendien gebruikelijk om alles te rapporteren. Dit hoeft niet altijd in het artikel (of verslag) zelf, maar kan ook in een appendix, of in de 'supplemental materials' die dan bijvoorbeeld online worden gepost (e.g. op het Open Science Framework,
http://osf.io).
Of iets voldoende belangrijk is om in de hoofdtekst te plaatsen moet je zelf bepalen. Een interessante/afwijkende/onverwachte verdeling is dat eerder dan als al je variabelen normaal zijn verdeeld.
Maar hoewel vroeger mensen dingen zelf checkten zonder de lezers inzicht in dit proces te geven, is dat tegenwoordig 'not done'. We weten inmiddels dat mensen ook bij dat soort keuzes allerlei zogenaamde 'researcher degree of freedom' toepassen, oftewel subjectieve keuzes maken, die de uiteindelijke conclusies kunnen beinvloedden. Niet dat mensen per se dingen fout doen (al dan niet bewust), maar het is belangrijk om ons bewust te blijven van de intrinsieke subjectiviteit van het uitvoeren van statistische analyses. Bovendien is het belangrijk om die keuzes openbaar te maken, zodat het eerder opvalt als een conclusies wellicht afhankelijk is van een set van dergelijke 'voorbereidende keuzes'.