Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Ik ben bezig met het analyseren van de resultaten van mijn vragenlijst. Ik loop vast bij de schaalanalyse. De schaalanalyse voor  de afhankelijke variabele Loopbaancompetenties is goed (is op schaal-niveau). De schaal-analyse voor de subschaal "loopbaansucces"  van   Onafhankelijke variabele loopbaanontwikkeling ook (is ook schaal). Maar ik loop vast bij de subschalen loopbaanverloop en loopbaan-planning (van onafhankelijke variabele loopbaanontwikkeling). Ik denk dat dit komt, omdat de data van deze items op ordinaal niveau zijn. Als ik deze invoer gooit spps in de output 190 van de 198 van de respondenten eruit. (Excluded). Weet iemand waar het mis gaat? 
 
in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (120 punten)

1 Antwoord

0 leuk 0 niet-leuks

Als er 190 deelnemers worden verwijderd, komt dit waarschijnlijk door missing values. Bekijk eens de frequencies van alle items in die analyse, om dat te achterhalen?

Overigens kunnen likert-schalen prima interval-niveau hebben (zie ook http://oupsy.nl/help/1178/wat-is-het-meetniveau-van-een-likert-schaal). Als je vragen verschillende antwoordschalen gebruiken (bijvoorbeeld 1-4, 1-6, en 1-3) wordt het lastig, maar meestal kun je gewoon Cronbach's alpha berekenen (maar zie voor wat meer achtergrondinformatie http://oupsy.nl/help/4/wanneer-is-cronbachs-alpha-hoog-genoeg).

door (77.8k punten)
Beste Gjalt-Jorn,

 

bedankt kt voor de reactie. Ik heb heel veel vragen met verschillende antwoordschalen, zoals 1-4 jaar, 5-8 jaar, maar ook 0-1 banen, en ook 0-2 maanden, etc. Daar zit volgens mij ook het probleem. En ook nog een aantal ja/nee - vragen en de respondenten slaan enkele vragen over als ze bepaalde vragen met nee beantwoorden.

Dat klinkt als een complexe variabele die je meet. Hoe had je van te voren gedacht deze vragen te combineren tot een meting? (ik neem voor het gemak even aan dat je je die vraag van te voren nog niet had gesteld :-))

Met betrekking tot conditionele vragen (vragen die alleen worden beantwoord als mensen een bepaald antwoord op een eerdere vraag gaven) zijn er twee mogelijkheden:

  • Als het belangrijke vragen zijn, geldt eigenlijk dat de vraag die ervoor werd gesteld, die bepaalde of mensen de belangrijke volgvraag wel of niet kregen, deelnemers 'uitscreende' voor wie die vraag niet van toepassing was. In dat geval verwijder je al die deelnemers. Deelnemers voor wie een belangrijke vraag niet van toepassing was, vallen immers per definitie buiten je doelgroep/populatie. Een voorbeeld, uit een onderzoek naar rekken en strekken onder sporters:
    1. Sport u wel eens?
    2. Hoe vaak rekt en strekt u voordat u gaat sporten?
    Hiervoor geldt dat vraag 2 alleen gesteld wordt aan mensen die bevestigend antwoorden op vraag 1. Mensen die ontkennend antwoorden op vraag 1 moeten uit het onderzoek worden verwijderd, want zij vallen niet binnen de doelgroep.
  • Als het vragen zijn die je overslaat uit 'gebruikersvriendelijkheid'/'gemak', omdat je het antwoord toch al weet omdat je dat kunt afleiden uit het antwoord op de eerdere vraag, dan kun je dat antwoord invullen. Een voorbeeld uit een onderzoek naar het gebruik van gewone versus 'light' mayonaise:
    1. Hoe vaak eet u mayonaise?
    2. Hoe vaak vervangt u deze mayonaise door light-mayonaise?
    Hier is duidelijk dat als mensen '0' antwoorden op vraag 1, ook '0' ingevuld kan worden bij vraag 2.

Met betrekking tot het combineren van de verschillende vraagtypes zijn er een aantal opties (ik noem er een paar):

  • Je kunt sommige items, bijvoorbeeld de dichotome items, als losse 1-item variabelen zien. Dan heb je dus meer variabelen in totaal. Op 1-item variabelen heb je wel veel meetfout natuurlijk; en helemaal als het dichotome variabelen zijn (waar je minder variantie kunt hebben; er zijn immers maar 2 opties die mensen kunnen kiezen) heb je dus relatief weinig power.
  • Je kunt een aantal items weglaten. Aan de andere kant, irrelevante aspecten van je construct had je waarschijnlijk van te voren al uit de vragenlijst gegooid.
  • Je kunt items standaardiseren en ze dan middelen: dat lost het probleem met verschillene aantallen antwoordopties op. Voor interval-variabelen kan dit sowieso; voor ordinale variabelen hangt het er vanaf in hoeverre ze 'ordinaal' zijn en in hoeverre ze 'interval' zijn. Als je categorieen allemaal even groot zijn (e.g. 1-4, 5-8, 9-12, etc) is dit waarschijnlijk geen probleem. Ik weet eigenlijk niet of dit voor dichotome variabelen ook een oplossing kan zijn; als ik er zo over nadenk, kan ik niet zo snel bedenken waarom het niet zou werken, maar ik heb niet het gevoel dat ik dit voldoende kan overzien. Ik zal collega's vragen dit te lezen en input te geven.

Als je klaar bent voor wat meer geavanceerde methoden: er bestaat een Cronbach's alpha voor ordinale variabelen. Hoe je deze kunt berekenen staat uitgebreid uitgelegd in het artikel op http://pareonline.net/pdf/v17n3.pdf. Dit gaat echter veel verder dan de stof in het curriculum!

Nog een opmerking m.b.t. de eindopdracht van Psychologisch Survey. Je moet het volgende doen:

  1. Zelf een likert-schaal ontwerpen en gebruiken om de afhankelijke variabele te meten;
  2. Cronbach's alpha berekenen en rapporteren voor elke likert-schaal.

Als je van deze variabele een 1-item maat maakt door 1 item te kiezen is het niet langer een likert-schaal, en kun/hoef je dus geen Cronbach's alpha te berekenen.

Tot slot nog een belangrijke aanbeveling: zorg dat je bij onderzoek van te voren precies doorhebt hoe je je vragen aggregeert in schalen!
Het is natuurlijk mogelijk dat je nog niet zeker weet of items bijvoorbeeld goed zullen schalen of niet; en het testen hiervan, en je plan om om te gaan met verschillende mogelijke uitkomsten, moet deel uitmaken van je onderzoeksplan. De situatie waar je nu in zit kun je op die manier ook voorkomen; je had je dan voor de dataverzameling gerealiseerd dat deze vragen misschien wel allemaal over hetzelfde onderwerp gaan, maar niet op een betekenisvolle manier te aggregeren zijn in één variabele. Een hulpmiddel hierbij kan de 'Study Structure' zijn die ik studenten altijd van te voren (bij bachelor- en masterthese) laat invullen: hiermee voorkom je dat je na dataverzameling dit soort problemen hebt. Je kunt de Study Structure downloaden of kopieren naar je eigen Google Docs op http://oupsy.nl/op/studystructure.

...