Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Hallo,

Heel stom…maar in elke zelfanalyse opdracht staat er steeds bij aanvang dat je moet aangeven wat het meetniveau is van een variabele. Zoals bijvoorbeeld bij opdracht 5.6.2 voor statken1. Hoe kan ik vinden/observeren in SPSS dat dit een interval variabele is? Ik zie vast iets heel simpels over het hoofd.

Alvast bedankt voor de reactie,

Emmy
in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (250 punten)

1 Antwoord

0 leuk 0 niet-leuks

Het meetniveau van een variabele wordt bepaald door je methodologie; het is geen statitisch ding zeg maar. Als je meetinstrument intervaldata levert, heeft de resulterende datareeks het intervalniveau. Als je meetinstrument categorische data levert, heeft de resulterende datareeks een categorisch meetniveau, dus ordinaal of nominaal.

Als je van een gegeven variabele niet weet op welk niveau hij is gemeten, dan kun je de volgende informatiebronnen bekijken:

  • Is de datareeks tot stand gekomen als aggregaat van andere datareeksen? Dit is bijvoorbeeld het geval als een datareeks het gemiddelde of de som is van andere datareeksen, oftewel, als een meetinstrument bestaat uit meerdere vragen en de antwoorden die deelnemers geven worden gemiddeld om de uiteindelijke score te bepalen. Als er wordt gerekend met die 'sub-datareeksen' om tot een gemiddelde of som te komen, moet de data noodzakelijkerwijs het intervalniveau hebben. Je kunt hier dus altijd uit afleiden dat de resulterende datareeks noodzakelijkerwijs ook het intervalniveau heeft.
  • Als de datareeks geen aggregaat is, kijk dan naar het aantal antwoordopties. Als er meer dan slechts een paar categorieen zijn die worden gerepresenteerd door getallen, dan is het meetinstrument vaak van intervalniveau.
  • Je kunt ook naar de antwoordopties zelf kijken. Als het meetinstrument bijvoorbeeld woonplaats meet, dan kun je aan de antwoordopties zien dat dit een nominale variabele is.

Als je van een gegeven variabele wil bepalen wat het meetniveau is, dan zijn hier geavanceerde analyses voor die je uit kunt voeren, zoals multidimensional scaling. Dit valt echter ver buiten dit curriculum.

Tot slot kun je in SPSS en R, als je eenmaal weet wat het meetniveau van je variabele is, ook aangeven wat dat meetniveau is. In SPSS kan dat door aan te geven of een variabele 'scale' niveau heeft of niet. Dit kan met het commando VARIABLE LEVEL:

VARIABLE LEVEL intervalVariable (SCALE).
VARIABLE LEVEL ordinalVariable (ORDINAL).
VARIABLE LEVEL nominalVariable (NOMINAL).

Als ik het me goed herinner staan variabelen in SPSS standaard op SCALE als ze niets zelf instelt. In SPSS maakt het niet veel uit hoe dit staat ingesteld, trouwens: SPSS checkt bijvoorbeeld niet of de factor in een variantieanalyse of de voorspeller in een t-toets wel echt een ordinale of nominale variabele is. Het is wel handig om dit in te stellen met het oog op het delen van data (om diezelfde reden is het belangrijk om altijd Engelstalige en 'seflexplanatory' variabelenamen te gebruiken).

In R staan variabelen ook standaard op intervalniveau (dit heet 'numeric' in R). Je kunt ze converteren naar nominale of ordinale variabelen met factor:

dat$nominalVariable <- factor(dat$intervalVariable);
dat$ordinalVariable <- factor(dat$intervalVariable, ordered=TRUE);

De parameter ordered=TRUE specificeert dat de niveau's (levels) van de factor geordend zijn.

Je kunt die niveau's (levels) ook instellen, en namen geven, bijvoorbeeld:

dat$ordinalVariable <- factor(dat$intervalVariable,
                              levels=c(1, 2, 3, 4),
                              labels=c('Lowest',
                                       'Low',

                                       'High',
                                       'Highest'),
                              ordered=TRUE);

Die levels moeten dan natuurlijk overeenkomen met de niveau's in je intervalvariabele.

Ditzelfde kan in SPSS ook met VALUE LABELS:

VALUE LABELS ordinalVariable 1 'Lowest'
                             2 'Low'
                             3 'High'

                             4 'Highest'.

Bij zowel R als SPSS geldt dat deze labels puur cosmetisch zijn. Erg handig, vooral als je grafieken maakt, maar ze hebben geen invloed op je analyses. Voor R geldt dat of een variabele een factor is of niet, wel invloed heeft op je analyses. Als je bijvoorbeeld een anova doet met oneway krijg je een waarschuwing als je voorspeller (factor) niet is ingesteld als factor. Sommige analyse werken helemaal niet als je de variabelen niet goed hebt gespecificeert (dus, categorische variabelen als factor en intervalvariabelen als numeric).

door (77.8k punten)
...