Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe corrigeer je outliers en normality problems?

0 leuk 0 niet-leuks
In Field staat in ieder hoofdstuk een handige figuur over welke stappen je moet nemen bij een analyse. Daar staat ook steeds in dat je outliers/normality problems moet corrigeren. Maar hoe doe je dat? Of wordt hiermee bedoeld dat je outliers en normality problems moet rapporteren, is dat wat hij bedoelt met 'corrigeren'?
gevraagd 30 maart 2017 in Experimenteel Onderzoek (PB0402 en S05281) door Ivonne Lipsch (2,210 punten)

1 Antwoord

0 leuk 0 niet-leuks
Er zijn methoden om met dataproblemen om te gaan. Een belangrijke disclaimer: gebruik deze methode enkel wanneer je goed begrip hebt van de voor- en nadelen en randvoorwaarden van de methoden,

Outliers kunnen bijvoorbeeld worden aangepast. De botste bijl (naast verwijderen) is om de variabele in meetniveau te reduceren. Door een intervalvariabele als ordinaal te behandelen verdwijnt de absolute afstand tussen observaties, en wordt enkel de rangorde bewaard. Zo verdwijnen de meeste outliers, maar ook veel informatie. Een minder botte bijl is een advies van Tabachnik & Fidell (2007) om de extreemste outlier aan te passen, zodat deze een 'unit' hoger is dan de hoogste waarde eronder. Een unit is een op het oog geschatte afstand die er over het algemeen tussen de observties in de data is. Zo is de outlier nog steeds de hoogste (of laagste) waarde, maar niet meer de analyse aan het domineren.

Vergelijkbaar zijn er methoden om met scheefheid om te gaan. Licht scheefheid (wanneer in de populatie een normaalverdeling verondersteld mag worden) kan opgelost worden door normaliteit te forceren door de wortel van de observaties te berekenen. Extreme scheefheid kan met het logaritme van de observaties opgelost worden (en is bijvoorbeeld zeer nuttig bij variabelen die exponentieel van aard zijn). Deze data-transformaties zijn, wanneer aan randvoorwaarden voldaan is, zeer acceptabel, maar maken de interpretatie van resultaten soms erg lastig.

Field bedoeld dus hoogstwaarschijnlijk echt 'corrigeren', maar in de context van deze cursus is het meer dan voldoende om slechts te 'rapporteren' en outliers desgewenst te verwijderen
beantwoord 30 maart 2017 door Ron Pat-El (40,810 punten)
Dankjewel voor je uitleg!
Beste,

Ik neem aan dat het hier gaat om enkele de extreme (asterisk) outliers te corrigeren naar 1 unit hoger dan de hoogste score van een outlier die als een bolletje is aangeduid.

Mvg Chrißt'll
Als dat bolletje toevallig de hoogste waarde eronder is, dan ja. In het algemeen kan het ieder datapunt zijn dat het opeennahoogste is na de extreemste outlier
...