Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe test je normaliteit per groep als groepen bestaan uit meerdere factoren

0 leuk 0 niet-leuks

als ik het goed begrijp moet je bij de assumptie van normaliteit de afhankelijke variabele per groep moet bekijken? In de cursus gebeurt dit (volgens mij) niet, er wordt volgens mij vaak naar afhankelijke variabele gekeken in zijn totaliteit ongeacht de groepen/condities of de AV op de nameting? Er wordt echter wel in bijv. 2,4 vraag 9 gezegd `Als er boxplots per conditie zijn gedraaid, dan lijkt case 50 een uitbijter, maar deze is nog binnen de marge.' Er wordt echter niet bij verteld hoe je dit moet doen:

Bij een factorieel ontwerp (zoals bijvoorbeeld opdracht 2.4) ontstaan 4 groepen (ofwel 4 experimentele condities): rechteroor- rechtercommand, rechteroor-linkercommand, linkeroor-linkercommand, linkeroor-rechtercommand):
- hierbij is elke groep dus een een samenstelling van 2 condities van de 2 ov
- soms lees ik dus dat je per conditie moet kijken en soms per groep: hier raak ik een beetje in de war: 
- als er dus staat dat ik per groep moet checken, dan denk ik in bovenstaand voorbeeld dus dat ik moet kijken hoe normaal de de afhankelijke variabele verdeeld is per groep: in dit geval dus reactietijd (AV) op rechteroor-rechtercommand (groep 1), reactietijd op rechteroor-linkercommand (groep 2) etc.  
- als ik moet checken per condities, dan denk dat ik de AV per OV moet bekijken en die dan splitsen naar conditie: dus reactietijd op de conditie linkeroor, reactietijd op de conditie rechteroor, reactietijd op de conditie rechtercommand etc.
- Vraag 1: waar moet ik naar kijken, de groepen of de condities?  
(Nu bedenk ik me net dat het mss sowieso handig is om naar de condities te kijken en niet naar groepen; omdat deze groepen zijn samengesteld uit twee variabelen weet je bij eventuele bias nog niet welke conditie de veroorzaker van deze bias is?  Klopt dit of zit ik er helemaal naast.....?)
-Vraag 1a: als je wel je naar groepen bestaande uit meerdere OV moet kijken, hoe doe je dat in SPSS?
(via split file, based on groups. zag ik dat ik wel tegelijkertijd 2 OV in kan vullen en vervolgens plots, histogrammen e.d. op kan vragen waarop dan beide OV zijn gecombineerd: of dit echter een correcte weergave is?)

- Vraag 2: kan het ook nog afhangen van de gestelde hypothesen of je kijkt naar groepen/condities? Stel dat je twee hypothesen heb opgesteld over de hoofdeffecten: 1 m.b.t. variabele 1 (oor), en 1 m.b.t. variabele 2 (command) en een derde hypothese m.b.t. het interactie-effect tussen beide:
- In hypothese 1 kijk je naar het hoofdeffect van oor; omdat ov 2 hier buiten beschouwing blijft, kijk je voor deze hypothese hoe normaal de AV op de variabele oor, gesplitst naar conditie is verdeeld ?
  - in hypothese 3 kijk je naar het interactie-effect: hierbij worden de variabelen wel gecombineerd: je kijkt hierbij hoe normaal de AV verdeeld is op alle groepen i.p.v. de condities? 

- of heeft het uberhaupt geen toevoegde waarde om naar groepen te kijken als je weet welke conditie veroorzaker van eventuele bias is, omdat je dan verder kunt beredeneren welke groepen daardoor beïnvloed worden?

Vraag 3: Als een herhaalde meting (voor en nameting) zou worden toegevoegd aan bovenstaande factoriële ANOVA: check je dan zowel voor normaliteit op de voormeting en de nameting?

gevraagd 28 januari 2018 in Experimenteel Onderzoek (PB0402 en S05281) door 838794193 (370 punten)
gehercategoriseerd 28 januari 2018 door 838794193

1 Antwoord

1 leuk 0 niet-leuks
 
Beste antwoord

Het klopt dat er per conditie (in een factorieel ontwerp spreekt men soms van 'per cel') gekeken zou moeten worden naar normaliteit. Als alle condities normaal verdeeld zijn, en gemiddeld sterk afwijken, dan zou daar in een bijzonder geval een situatie kunnen ontstaan dat er meerdere pieken zijn over het geheel genomen, of dat de verdeling een beetje plat lijkt bij minder extreme verschillen tussen gemiddelden.

In het geval van meerdere (on-)afhankelijke variabelen, zoals bij herhaalde metingen-designs wordt het verhaal iets ingewikkelder. Dit heeft te maken met de assumptie van normaliteit: de eis is niet zozeer dat iedere afhankelijke variabele (op iedere groep) normaal verdeeld is, maar dat de residuen normaal verdeeld zijn. Dat betekent dat in het geval van meerdere predictoren en eventueel meerdere afhankelijke variabelen, eigenlijk naar de multivariate normaliteit zou moeten kijken. Dit gaat echter buiten het bereik van de cursus.

Dus als bottom-line: een globale check op de afhankelijke variabele is niet superfraai, maar vinden veel mensen in orde. Netjes is om (per afhankelijke variabele/herhaalde meting) per conditie de normaliteit te evalueren. Als je all-the-way wilt gaan kun je eens uitzoeken of je de multivariate normaliteit kunt toetsen, bijvoorbeeld door middel van Mardia's test (voor SPSS bijvoorbeeld via het macro: http://www.columbia.edu/~ld208/Mardia.sps ; of in R via: https://www.rdocumentation.org/packages/psych/versions/1.7.8/topics/mardia

beantwoord 30 januari 2018 door Ron Pat-El (41,740 punten)
geselecteerd 2 februari 2018 door 838794193
Bedankt! Dat macro voor Mardia’s  test ziet er voor nu nog te ingewikkeld uit, maar zal me er eens in gaan verdiepen als de tijd het toelaat!
...