Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Is er verschil als je indeelt in gelijke/ongelijke klassen wat betreft meetniveau (ordinaal/interval)?

1 leuk 0 niet-leuks
Wanneer je bijvoorbeeld leeftijd wordt ingedeeld in klassen, wordt er gesproken van een variabele op ordinaal niveau. Maakt het daarbij nog uit of die klassen even groot zijn of niet? Bijv. leeftijdsklassen van gelijke grote: 1) 1 tot 10 jaar / 2) 11 tot 20 jaar / 3) 21 tot 30 jaar dan kun je wel zeggen dat groep 3, 3x zo oud is als groep 1, ook de intervallen tussen de klassen zijn even groot. Is er dan ook sprake van ordinaal niveau of van interval/ratio niveau? Bij ongelijke klassen: 1) 0 tot 5 jaar, 2) 5 tot 15 jaar, 3) 15 jaar en ouder, zou dan sprake zijn van ordinaal niveau?
gevraagd 3 februari 2017 in Kwantitatieve Data Analyse (KDA) door 838794193 (370 punten)

1 Antwoord

1 leuk 0 niet-leuks

Dit is een hele goede vraag.

Je aanname klopt. Als je bijvoorbeeld deelnemers hebt van 0-29 jaar, en je zou ze indelen in groepen van 0-9, 10-19, en 20-29, dan maak je drie groepen die inderdaad even ver van elkaar liggen. Dit is dus een intervalvariabele.

De verdeling van die resulterende variabele is wel heel discontinu: de variabele kan niet normaal zijn verdeeld (want er zijn maar drie categorieen). Dit is vaak geen probleem: je vragen hoeven niet normaal verdeeld te zijn. Maar het kan soms wel onhandig zijn, en rekenen is vaak niet zo zinvol met een intervalvariabele die bijvoorbeeld slechts drie niveau's heeft: een gemiddelde leeftijd van 12.4 zou bijvoorbeeld niet accuraat zijn. Als je de variabelen niet had gecategoriseerd zou je wellicht ergens anders uitkomen, omdat je bijvoorbeeld misschien heel veel deelnemers van 3 en 11 had: het ware gemiddelde ligt dan lager dan als je doet alsof al die deelnemers van 3 eigenlijk 4.5 zijn, en al die deelnemers van 11 eigenlijk 14.5 zijn.

Tot slot gooi je waardevolle variatie weg.

Maar, je redenering klopt. Als je categoriseert naar 'interval-categorieen' heeft de gecategoriseerde variabele ook het interval-niveau.

En, als je categoriseert naar geordende categorieen, dan heeft de gecategoriseerde variabele het ordinale niveau.

Goed bedacht dus!

Tot slot, omdat het niet vaak genoeg gezegd kan worden: categoriseert nooit je variabelen (tenzij je echt moet). Je gooit informatie weg, je gooit power weg, en je introduceert mogelijk schijnverbanden.

beantwoord 6 februari 2017 door gjp (63,300 punten)
...