Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Als ik een variabele op wil delen in klassen, op basis waarvan die ik dan deze indeling? Als je bijvoorbeeld een verdeling hebt als deze, waarbij de tweede kolom de frequentie aangeeft van hoe vaak iets voorkomt:
 

1,00      14

1,25      2

1,36      26

1,46      4

1,50      4

1,56      12

1,63      4

1,56      30

1,76      14

1,75      2

2,66      2

1,78      2

1,84      16

1,88      4

2,05      4

2,16      4

2,28      2

2,54      4
 
Hoe bepaal ik dan waar ik de lijn(en) trek?
in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (120 punten)

1 Antwoord

0 leuk 0 niet-leuks

Uitstekende vraag, ik ben blij dat je die stelt, want dit onderwerp komt vaak terug!

Het korte antwoord is dat je een variabele eigenlijk bijna nooit mag opdelen in klassen. Deze variabele is nu een interval-variabele. Die moet je daarom als zodanig analyseren. Opdeling in klassen/categorieen heeft drie nadelen:

  1. Je verliest power, omdat je variantie kunstmatig verminderd. Het extreemste voorbeeld is dat je teruggaat naar 1 klasse: dan scoort iedereen hetzelfde. Als je teruggaat naar twee klassen, scoren opeens heel veel deelnemers hetzelfde die daarvoor verschilden. Een verband dat zich manifesteert in verschillen tussen die deelnemers kun je daarna dus niet meer detecteren.
  2. De analyses die je moet doen zijn complexer. Een multivariate analyse met een afhankelijke variabele met 3 of 4 groepen is veel moeilijker dan met een interval-variabele.
  3. Er bestaan meestal geen breekpunten die je kunt rechtvaardigen; interval-schalen betekenen immers dat personen die 1 scoren evenveel verschillen van personen die 1.5 scoren, als personen die 1.75 scoren verschillen van personen die 2.25 scoren (in beide gevallen .5). Als je 2 als breekpunt zou kiezen, zijn mensen die 1 scoren opeens hetzelfde als mensen die 1.99 scoren (een verschil van .99); terwijl mensen die 1.99 scoren, verschillen van mensen die 2.01 scoren (een verschil van 0.02). Dat is natuurlijk onlogisch en heel moeilijk te rechtvaardigen.

Er zijn twee verkeerde redenen waarom mensen vaak een interval-variabele in categorieen willen indelen:

  1. Omdat hun verdeling niet normaal is. Dit is een misverstand; er zijn heel weinig analyses die als aanname hebben dat je verdeling van steekproefscores of de populatieverdeling normaal is. Je steekproevenverdeling moet wel normaal zijn: zie voor meer uitleg http://oupsy.nl/help/112, http://oupsy.nl/help/666 en http://oupsy.nl/help/731.
  2. Omdat mensen het soms makkelijker vinden om in termen van categorieen/groepen te redeneren dan in termen van continue variabelen. Het spreekt vanzelf dat dit zeer zelden een acceptabele reden is om een variabele in categorieen in te delen.

Een terechte reden om een variabele in categorieen/klassen in te delen, is omdat deze catgorieen al bestaan. In onderzoek naar depressie kun je bijvoorbeeld geinteresseerd zijn in of deelnemers boven of onder de klinische grens van depressie vallen (voor sommige onderzoeksvragen; meestal niet natuurlijk, omdat je normaal geinteresseerd bent in een verband met mate van depressie, en dat verlies je als je categoriseert/dichotomiseert). In al deze gevallen bestaan de categorieen, en dus de bijbehorende grenswaarden, al. In dat geval hanteer je simpelweg die grenswaarden.

Een andere terechte reden is omdat je extreem scorende deelnemers wil vergelijken; voor sommige (maar niet heel veel) onderzoeksvragen kan dat interessant zijn. In dat geval kun je bijvoorbeeld de hoogst en laagst scorende 25% pakken. Je verliest dan wel de helft van je deelnemers, maar je vergelijkt tenminste twee groepen die daadwerkelijk verschillen, in tegenstelling tot wanneer je bijvoorbeeld met een 'median split' je groep in twee helften opdeelt.

In jouw geval hangt het exacte antwoord dus af van de reden dat je in categorieen in wil delen; kun je dat in een opmerking bij dit antwoord of bij je vraag vertellen?

door (77.8k punten)
...