Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Tentamencasus 'een theorie van emotie': Hoe kan je berekeningen maken wanneer de variabelen gemeten zijn op een vierpuntschaal?

In de examencasus staat dat we er vanuit moeten gaan dat alle variabelen het intervalniveau hebben. Dan zou je in principe ook van bijvoorbeeld 'zelfgerapporteerde hartkloppingen' een q-q plot en boxplot kunnen berekenen.

Dit lukt toch echter niet? Of begrijp ik iets niet helemaal?
in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (140 punten)

1 Antwoord

0 leuk 0 niet-leuks
Het aantal punten is niet informatief over of een schaal het intervalniveau heeft of niet. Neem bijvoorbeeld dichotome schalen, met twee mogelijke meetwaarden: hier is maar een interval tussen opeenvolgende meetwaarden, en dus hebben dichotome schalen per definitie het intervalniveau. Dit kan evenzeer gelden voor schalen met meer meetwaarden.

Dat je er mee kunt rekenen betekent niet altijd dat datavisualisatie ook automatisch soepel gaat. Hoe minder mogelijke meetwaarden er zijn, hoe vaker er sprake zal zijn over overplotting. Neem bijvoorbeeld een scatterplot met twee dichotome variabelen: dan zie je maar vier puntjes, want alle datapunten worden in een van die vier posities geplot.

Hier zijn oplossingen voor zoals 'jittering', waarbij er random ruis aan datapunten wordt toegevoegd (dit is niet erg, want elk datapunt representeert toch twee puntschattingen, en puntschattingen zijn sowieso onderhevig aan veel ruis, meetfout, steekproeftoeval, etc, dus de exacte waarde in een gegeven steekproef maakt niet uit) of het gebruik van het alpha kanaal (transparantie).

Bovendien wordt de interpretatie van sommige plotjes anders; voor Q-Q plots geldt bijvoorbeeld dat je interpretatiekader waarschijnlijk weinig bruikbaar is bij een schaal met vier mogelijke waarden. Tegelijkertijd geldt met maar vier waarden dat je geen last hebt van de moeilijke beslissing over 'binbreedte' die je normaal bij bij histogrammen moet maken: je hebt gewoon vier bins (i.e. je kunt net zo goed een 'bar chart' maken, die je normaal voor categorische variabelen gebruikt). Je kunt dus ook de verdelingsvorm bepalen op basis van het histogram.

Dat heeft sowieso voordelen, want je wil vaak de verdelingsvorm beoordelen; niet alleen of die toevallig normaal is of niet. Er zijn immers een hoop variabelen die niet normaal verdeeld zijn, of normaal verdeeld horen te zijn.
door (77.8k punten)
...