Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe rapporteer je dat je data niet normaal verdeeld is in het onderzoeksverslag?

1 leuk 0 niet-leuks
Bij de eindopdracht weet ik niet goed hoe te checken of rapporteren dat mijn data niet normaal verdeeld is.

Aangezien ik voor een t-toets gemiddelden gebruik, hebben boxplots dan geen zin? Of wel en kun je die als afbeelding opnemen of is dat te veel? Moet je de gemiddelde zscore van beide condities rapporteren? Of gewoon de zscore van de afhankelijke variabele, ongeacht conditie. Of alleen de zscores van de skewness en kurtosis van de afhankelijke variabele en dan van beide condities of beide tezamen? Of hebben zscores ook weinig zin aangezien er sprake is van een 'large sample', van meer dan 1000? Wat zegt de APA richtlijn hierover?

Of is het allemaal te veel informatie en check je het voor jezelf en rapporteer je alleen de toets, eventueel met de opmerking dat de data niet normaal verdeeld was..
gevraagd 13 oktober 2017 in Experimenteel Onderzoek (PB0402 en S05281) door Olivia Somsen (210 punten)

1 Antwoord

0 leuk 0 niet-leuks
Normaliteit is geen aanname van de $t$-toets. Dit wordt uitgelegd in Onderzoekspracticum inleiding data-analyse (PB0202), maar zie ook https://sciencer.eu/2017/02/on-the-obsession-with-being-normal/ en http://oupsy.nl/help/112/wanneer-is-mijn-data-te-scheef-niet-normaal-verdeeld

Los hiervan is het wel altijd verstandig om je data goed te leren kennen en te beschrijven. Handige hulpmiddelen zijn hierbij histogrammen, Q-Q plots, en boxplots. Het is ook handig om scatterplots te gebruiken om verbanden tussen variabelen te bekijken. Deze visualisaties worden allemaal ook besproken in PB0202.

Nu Open Science de norm is, is het bovendien gebruikelijk om alles te rapporteren. Dit hoeft niet altijd in het artikel (of verslag) zelf, maar kan ook in een appendix, of in de 'supplemental materials' die dan bijvoorbeeld online worden gepost (e.g. op het Open Science Framework, http://osf.io).

Of iets voldoende belangrijk is om in de hoofdtekst te plaatsen moet je zelf bepalen. Een interessante/afwijkende/onverwachte verdeling is dat eerder dan als al je variabelen normaal zijn verdeeld.

Maar hoewel vroeger mensen dingen zelf checkten zonder de lezers inzicht in dit proces te geven, is dat tegenwoordig 'not done'. We weten inmiddels dat mensen ook bij dat soort keuzes allerlei zogenaamde 'researcher degree of freedom' toepassen, oftewel subjectieve keuzes maken, die de uiteindelijke conclusies kunnen beinvloedden. Niet dat mensen per se dingen fout doen (al dan niet bewust), maar het is belangrijk om ons bewust te blijven van de intrinsieke subjectiviteit van het uitvoeren van statistische analyses. Bovendien is het belangrijk om die keuzes openbaar te maken, zodat het eerder opvalt als een conclusies wellicht afhankelijk is van een set van dergelijke 'voorbereidende keuzes'.
beantwoord 16 oktober 2017 door gjp (63,260 punten)
...