Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Wat moet je doen als de assumptie 'normaal verdeelde errors' voor een regressieanalyse is geschonden?

0 leuk 0 niet-leuks
Ik wil een regressie analyse uitvoeren en heb de assumpties getoetst. Nu blijkt dat één onafhankelijke variabele niet normaal verdeeld is (kolmogorov-smirnov). Ook de errors zijn niet normaal verdeeld (te zien aan de normal probability plot). Ik heb al verschillende dingen geprobeerd om de variabele normaal verdeeld te maken (alle transformaties, outliers verwijderen etc.), maar niets werkt. Wat moet je doen als deze assumptie geschonden is?
gevraagd 12 november 2014 in Methodologie door Marloes (360 punten)

1 Antwoord

1 leuk 0 niet-leuks
 
Beste antwoord
De kolmogorov-smirnov toets is bijzonder streng. Deze zegt eigenlijk weinig als deze significant is. Het is dan weer wel informatief als deze niet significant is. Ik zou lichtere toetsing gebruiken voor een second opinion, zoals een p-p q-q plot, of de evaluatie van skewness en kurtosis wanneer N niet te groot (< 250).

Maar, wanneer je een KS-toets hebt uitgevoerd vraag ik me af of je de normaliteit van de residuen hebt bekeken, of de normaliteit van de variabelen zelf. Hoewel enige overlap verwacht kan worden is dit niet hetzelfde.

Hoe het ook zijn moge: een schending van normaliteitsassumpties schaadt vooral de power. Ik weet niet in hoeverre de variabele categorisch is of niet, want als geen enkele transformatie werkt dan is er meer aan de hand dan eenvoudige scheefheid. Misschien zijn er meerdere pieken, oid. Powerverlies betekent dat je kans op type-2 fout toeneemt, dus dat je kans groter is dat je een niet-significant resultaat rapporteert dat wel in de populatie aanwezig is.

Je kunt de analyse voortzetten met de kanttekening dat de assumptie geschonden is. Alternatieven worden helaas al heel snel zeer complex. Een voorbeeld is bijvoorbeeld het gebruiken van counts (frequenties). Deze variabelen zijn eigenlijk nooit normaal verdeeld, maar poisson verdeeld, en er zijn toetsen die hier rekening mee kunnen houden. Er zijn mogelijkheden in SPSS om afwijkingen van normale verdelingen te ondervangen, zelfs als de verdeling zelf niet bekend is, door gamma-verdelingen te fitten.... maar mijn advies is: begin daar niet aan tenzij je goed begrijpt wat je doet. Er zijn ook nonparametrische alternatieven (geen aannames over verdelingen), maar nonparametrische toetsen hebben per definitie minder power dan parametrische dus de winst kan soms ook tegenvallen, en niet alle nonparametrische alternatieven zijn makkelijk te begrijpen. Er is ook nog een alternatief waarbij je jouw steekproef herhaaldelijk opnieuw trekt met teruglegging om tot een steekproevenverdeling te komen (bootstrappen) die bij benadering normaal verdeeld is, ook al is geen enkele losse steekproef dat. SPSS heeft hier mogelijkheden toe in regressieanalyses.

Advies: (1) rapporteer dat er schendingen waren van assumpties; (2) probeer te achterhalen of die assumptieschending te begrijpen is; (3) accepteer powerverlies en neem dat mee in de voorzichtheid waarmee je conclusies trekt.
beantwoord 12 november 2014 door Ron Pat-El (39,900 punten)
geselecteerd 14 november 2014 door gjp
...