Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Wat is nu precies het verschil tussen een variabele, een operationalisatie, en een meetniveau?

11 leuk 2 niet-leuks
De basisconcepten in methodologie en statistiek kunnen soms verwarrend zijn. Wat is nu precies een variabele; hoe verhoudt die zich tot een operationalisatie; en welke rol spelen meetniveau's hierbij?
gevraagd 3 februari 2014 in Kwantitatieve Data Analyse (KDA) door gjp (64,270 punten)

1 Antwoord

7 leuk 5 niet-leuks

Een variabele is in de breedste definitie simpelweg iets dat kan varieren. Dit kan inderdaad ongeveer alles zijn, en dat helpt natuurlijk niet bij het begrijpen waar we het over hebben als we het over een variabele hebben. Daarom zal ik twee 'soorten' variabelen bespreken die we in de praktijk vaak tegenkomen.

De eerst is de psychologische variabele in een theorie of model. Dit is een concept, zoals 'intelligentie', het persoonlijkheidskenmerk 'openheid', of 'depressie'. Zo'n variabele kan op een hoger niveau staan zoals de voorbeelden die net zijn gegeven, maar je hebt ook variabelen op een veel lager niveau, zoals 'zelfvertrouwen met betrekking tot solliciteren' of 'dysfunctionele cognities over het eigen lichaam'; en daar tussenin zitten dan weer variabelen zoals 'risicoperceptie'. Deze variabelen worden vaak verbeeld in modellen met boxjes en pijltes, die hypothetische causale verbanden weergeven. Voor het gemak noem ik deze soort variabelen van nu af aan 'constructen', om het onderscheid met de tweede soort variabelen duidelijk te houden.

De tweede soort variabele is een variabele die is gemeten in bijvoorbeeld een vragenlijst. Deze variabele belandt in je datafile, en dit is wat je analyseert om een antwoord te geven op je onderzoeksvraag of hypothese*. Meestal wordt zo'n variabele berekend als gemiddelde van de antwoorden van deelnemers op een aantal vragen of items.

Deze vragen of items vertegenwoordigen samen dus een construct; ze vormen als het ware de 'praktische wereld-equivalent' van een theoretische variabele (een construct dus). Die constructen worden immers bedacht vanachter een bureau, zou je kunnen zeggen. Iemand denkt "aha - mijn theorie stelt dat variabele A invloed heeft op variabele B!" - en die persoon heeft dan in zijn/haar hoofd een bepaald idee bij variabele A en variabele B. Dat idee is de definitie van variabele A en variabele B; en die definitie wordt vervolgens gebruikt om te bepalen hoe variabele A en variabele B moeten worden gemeten. Concreet: als ik een theorie hebt die stelt dat mensen die meer dysfunctionele cognities over het eigen lichaam hebben, ook vaker depressief zijn, dan moet ik uitleggen wat ik bedoel met dysfunctionele cognities; en wat ik precies onder depressie versta.

Die definities vormen de basis voor het meetinstrument; en dat meetinstrument is de manier waarop de theoretische variabele (het construct dus) is geoperationaliseerd. Je kunt hetzelfde construct op verschillende manieren operationaliseren. Neem bijvoorbeeld de Big Five, de vijf klassieke persoonlijkheidstrekken. Hiervoor bestaan verschillende vragenlijsten, die onder andere verschillen in aantal items. Deze vragenlijsten bevatten dus allemaal net iets andere operationalisaties van het construct 'Openheid', bijvoorbeeld. Deze operationalisatie bepaalt wat er uiteindelijk in je datafile belandt. Als ik 'Openness' operationaliseer als de twee items uit de 'very brief measure of the Big Five' (zie http://homepage.psy.utexas.edu/HomePage/Faculty/Swann/docu/GOSL.PDF) meet ik iets anders dan wanneer ik de 12 items uit de Big Five Inventory gebruik (zie http://www.ocf.berkeley.edu/~johnlab/bfi.htm).

Dus, bij elk onderzoek is er per definitie sprake van twee of meer constructen (theoretische variabelen); een theorie, model of hypothese over hoe die zich tot elkaar verhouden; definities die uitleggen wat wel en niet onder de constructen wordt gerekend; en operationalisaties die de definities vertalen naar meetinstrumenten (vaak verzamelingen vragen oftewel items). Dataverzameling levert dan bijvoorbeeld ingevulde vragenlijsten op, die worden ingevoerd in een datafile. Vervolgens worden met behulp van analysescripts (deze heten 'syntax' in SPSS) uit de antwoorden de gemiddelden per construct of variabele berekend; dit resulteert in de variabelen waar je vervolgens analyses op uitvoert.

Om het makkelijker te maken heet elke kolom in je datafile in SPSS een variabele; de antwoorden per vraag/item varieren immers (zijn variabel). Hoewel antwoorden per vraag in de praktijk bijna nooit als variabele in je analyses worden opgenomen, heten ze in statistische software desonadanks ook variabelen. Deze definitie is dus een derde formele definitie van 'variabele'; een kolom in je datafile.

Dus, nog even kort samengevat: theoretische variabelen oftewel constructen worden via operationalisaties gemeten, en dit levert vervolgens 'analyseerbare' variabelen op in je datafile.

Nu, de meetniveau's bepaal je als je de operationalisatie bepaalt. In de psychologie zijn bijna alle constructren continue, oftewel interval; de aanname is dat mensen ergens hoog, laag, of gemiddeld op kunnen scoren, met van alles er tussenin. Psychologische variabelen zijn dus altijd schalen van een minimum naar een maximum. Dit is het zogenaamde 'interval' meetniveau. Sommige variabelen meten we echter vaak op een categorisch meetniveau; een bekend voorbeeld is geslacht. Dit wordt vaak dichotoom gemeten (met twee antwoordopties). Een ander voorbeeld is opleidingsniveau; dit wordt vaak ordinaal gemeten (met meerdere antwoordopties, die te rangschikkend ('ordenen') zijn, maar geen schaal vormen; er zijn een beperkt aantal categorieen waar iemand in kan vallen, en daar tussenin kun je niet scoren. Dan zijn er nog nominale variabelen zoals lievelingskleur; de antwoordopties zijn ook een beperkt aantal categorieen, maar ze zijn niet te ordenen van hoog naar laag.

Zoals ik zei bepaal je het meetniveau terwijl je je constructen operationaliseert. De theoretische variabele opleidingsniveau wordt soms geoperationaliseert als 'het aantal jaren dat iemand een opleiding heeft gevolgd' (interval meetniveau), en soms als 'schooltype' (ordinaal meetniveau). De theoretische variabele geslacht kan worden geoperationaliseerd als "man/vrouw', maar ook als een schaal van "Ik beschouw mezelf als volledig mannelijk" tot "ik beschouw mezelf als volledig vrouwelijk", waar allerlei scores tussenin mogelijk zijn. Welke operationalisatie je kiest zal enerzijds afhangen van je onderzoeksvraag (bij een onderzoek naar bijvoorbeeld stereotypen, stigmatisatie, of sexualiteit ligt de tweede operationalisatie meer voor de hand dan als geslacht geen variabele van belang is, maar uitsluitend wordt gemeten om de demografie van de deelnemers te kunnen beschrijven), en anderzijds van praktische overwegingen (als je deelnemers erg conservatief zijn, kan het onhandig zijn om ze te confronteren met de 'fluid' opvatting van geslacht). In principe wil je variabelen zoveel mogelijk op interval-niveau meten, omdat je dan de meeste power hebt, en omdat er vaak geen 'echte' categorieen bestaan voor psychologische variabelen, maar zulke operationalisaties zijn niet altijd te realiseren.

Dus, het complete plaatje: je theorie/model/hypothesen/onderzoekvragen betreffen twee of meer theoretische variabelen (constructen). Deze worden duidelijk gedefinieerd, wat het mogelijk maakt ze te operationaliseren op een gegeven meetniveau. Deze operationalisaties leiden de dataverzameling, waaruit uiteindelijk analyseerbare variabelen in een datafile rollen.

Ik hoop dat dit wat duidelijkheid schept, en niet meer verwarring zaait :-)

* Zo'n onderzoeksvraag of hypothese betreft altijd een verband tussen twee of meer variabelen; bijvoorbeeld "hangt openheid samen met risicoperceptie?" of "vrouwen hebben meer zelfvertrouwen met betrekking tot solliciteren".

Zie ook de vragen http://oupsy.nl/help/434/wat-is-het-verschil-tussen-hypothesen-en-voorspellingen en http://oupsy.nl/help/222/mijn-schaal-dichotomiseren-wat-een-goede-cut-off-grenswaarde

beantwoord 3 februari 2014 door gjp (64,270 punten)
...