Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Wanneer is Cronbach's Alpha hoog genoeg?

1 leuk 0 niet-leuks
Er zijn verschillende richtlijnen over Cronbach's Alpha. Soms wordt gesteld dat die hoog genoeg is bij .7; soms bij .8; en soms wordt zelfs genoegen genomen met lagere waarden. Hoe zit dit nu?
gevraagd 30 november 2012 in Schaalconstructie door gjp (64,270 punten)
gehercategoriseerd 30 november 2012 door gjp

Hoi GjY,

Hoe geef ik de notatie weer van de omega en de glb?

Van een schaal heb ik gevonden: GLB 0.86  en omega 0.89.

Ik heb nu b.v. in mijn verslag staan:

De cronbach's alpha bij de schaal ... is α = .78. Verwijdering van een item uit de schaal leverde geen verhoging van de betrouwbaarheid op. 

Hoe vermeld ik de GLB en de omgea correct?

Grtjs Rebecca

Ik zou ten eerste in je methode sectie, bij 'analyse' aangeven dat je, vanwege de problemen met Cronbach's alpha, bovendien omega en de GLB uitrekent (daar kun je GLB dan voluit gebruiken en de afkoritng introduceren). Vervolgens zou ik het verder ongeveer rapporteren als:

De interne consistentie van de schaal was goed (omega = .89, GLB = .86, Cronbach's alpha = .78).

Ik zou alpha, gegeven de problemen, als laatste noemen; dus de 'beste' index het eerst. Je mag alpha ook weglaten, als je omega en/of de GLB toch al noemt.

Ik heb de functie scale.ic inmiddels verder verbeterd - zie http://oupsy.nl/help/26/hoe-bereken-ik-de-glb-en-omega voor informatie over hoe je de verbeterde versie kunt downloaden. Die nieuwe versie geeft je betrouwbaarheidsintervallen voor Omega en Cronbach's alpha, dus nog beter zijn dan de 'puntschattingen'. Natuurlijk is het al fantastisch als je de puntschatting voor omega gebruikt in plaats van Cronbach's alpha, dus voel je niet verplicht opnieuw dingen uit te rekenen :-)

1 Antwoord

2 leuk 0 niet-leuks

Er zijn inderdaad verschillende richtlijnen. Dit komt omdat het (natuurlijk :-)) wat complexer in elkaar zit dan een simpele drempelwaarde.

Ten eerste drukt Cronbach's alpha uit in welke mate alle items samenhangen (tenminste, dat probeert hij; zie hieronder voor een nuancering). Het idee is dat als alle items exact hetzelfde meten, Cronbach's alpha erg hoog is. Dit betekent dan dat je een hoge interne consistentie (wordt ook wel betrouwbaarheid genoemd) hebt. Echter, als je een psychologisch construct meet, bestaat dat vaak uit verschillende maar gerelateerde aspecten. Hoe breder het construct, hoe meer aspecten je moet meten. Of een vragenlijst al die aspecten goed afdekt is de validiteit van je vragenlijst. Je voelt hem al aankomen: twee items die verschillende aspecten van een construct meten, meten niet precies hetzelfde. Toch is het belangrijk dat je alle aspecten van je construct meet. Daarom hangt de maximaal haalbare hoogte van Cronbach's alpha af van hoe eng het construct is dat je meet.

Ten tweede zijn er niet altijd vragenlijsten voorhanden die zijn gevalideerd. Als een vragenlijst wordt gevalideerd, wordt deze idealiter grondig onder de loep genomen. De test-retest reliability wordt bekeken; hij wordt vergeleken met andere vragenlijsten en meetinstrumenten; en de items die niet goed werken (i.e. die zich niet gedragen zoals ze zich volgens de theorie moeten gedragen) worden verwijderd. Bij zo'n gevalideerde vragenlijst kun je dus een hogere Cronbach's alpha verwachten dan bij een vragenlijst die niet is gevalideerd; er is immers geen gelegenheid geweest om minder goed werkende items te verwijderen. Nu zou je kunnen zeggen: 'Ik verwijder gewoon de items die het laagst correleren met de rest, of de items waarbij Cronbach's alpha het meeste stijgt als ik ze verwijder.' Dit is echter geen goede aanpak, want zoals ik hierboven aangaf, is validiteit minstens zo belangrijk. Door de minder goed correlerende items te verwijderen, kun je de validiteit aantasten, waardoor je je construct niet goed meer meet, maar bijvoorbeeld alleen een aspect van je construct. Het validatietraject stelt je in staat om met behulp van factoranalyses en vergelijking met slim gekozen andere meetsinstrumenten te bepalen welke items welke aspecten meten, en zo een valide vragenlijst samen te stellen die bovendien een hoge Cronbach's alpha heeft. Als je een vragenlijst voor het eerst gebruikt, is het een stuk moeilijker in te schatten of bepaalde items nodig zijn om de validiteit te behouden, of dat ze veilig verwijderd kunnen worden.

Als je een vragenlijst hebt die verschillende aspecten van een construct meet, kun je de interne consistentie overigens ook per sub-schaal meten. Bij de beslissing of je verschillende sub-schalen wilt onderscheiden kan het handig zijn om exploratieve en/of confirmatoire factoranalyse uit te voeren. Het gaat dan vooral om de vraag of de items in je sub-schalen onderling voldoende sterk samenhangen, en bovendien voldoende sterk verschillen van de items in andere sub-schalen.

Tot slot nog een belangrijke opmerking over het nut van Cronbach's alpha. Cronbach's alpha is een slechte maat voor interne consistentie. Een van de redenen hiervoor is dat hij steeds hoger wordt naarmate het aantal items in een schaal toeneemt. Hij wordt nog door bijna iedereen gebruikt (vandaar dat hij in het curriculum zit), maar er zijn betere maten voorhanden. Deze heten Omegatotal en de Greater Lower Bound (GLB). Meer informatie over (zoals hij het zelf noemt) "het gebruik, misbruik, en de zeer beperkte bruikbaarheid van Cronbach's alpha" staat in een Open Access artikel van Klaas Sijtsma (zie http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2792363/), of het Nederlandse wat toegankelijker artikel in De Psycholoog (zie http://www.cs.uu.nl/wiki/pub/Toetsing/ToetsAdviesCommissie/MisverstandenRondCronbachAlpha.pdf). Een artikel dat reageert op Sijtsma's Engelstalige artikel, en waar Omegatotal wordt aangeraden, staat op http://personality-project.org/revelle/publications/revelle.zinbarg.08.pdf. Er staat er uitgelegd hoe je zelf de GLB en Omega kunt bereken op http://oupsy.nl/help/26/hoe-bereken-ik-de-glb-en-omega.

UPDATE: ik heb hier inmiddels zelf een artikel over geschreven, dat Engels is, maar erg toegankelijk (zonder formule's etc, maar met plaatjes :-)). Deze staat op http://ehps.net/ehp/index.php/contents/article/view/ehp.v16.i2.p56/1.

Dus, kort samengevat: hoe hoog Cronbach's alpha moet zijn hangt af van 1) hoeveel gelegenheid er is geweest om de vragenlijst te verbeteren 2) hoe breed het construct is dat wordt gemeten; en 3) hoeveel items de schaal heeft. Er zijn geen 'harde' richtlijnen te geven vrees ik; maar ik hoop dat je nu een beetje een indruk hebt van waar je op moet letten.

beantwoord 30 november 2012 door gjp (64,270 punten)
bewerkt 20 april 2015 door gjp
Het antwoord is helder, bruikbaar en het artikel (na een tweede lezing;-)) ook duidelijk en logisch beargumenteerd. Handig om mee te nemen naar toekomstig 'eigen' onderzoek. Maar... bij een literatuurstudie waarbij je andermans onderzoeksverslag kritisch moet beoordelen... hoe pak je dit dan aan als Cronbach's alpha haast door iedereen in het psychologische veld gebruikt wordt?
Bestaan er vorm- of etiquetteregels om adequaat te antwoorden op validiteitsvragen bij veelgebruikte en in het psychologische veld algemeen aanvaarde statistische toetsen die alsnog gecontesteerd worden?
Goed punt Monica! Er zijn twee antwoorden.

Binnen deze studie kun je Cronbach's alpha gewoon als acceptabel beschouwen. Dit omdat de betere maten (nog) niet in het curriculum zitten; we verwachten dus niet dat je die kent. Je hoort te weten dat Cronbach's alpha toeneemt naarmate het aantal items toeneemt, en dat dit een serieus gebrek van Cronbach's alpha is - maar dat is alles. Je kunt bij LS Cronbach's alpha dus gewoon beschouwen als maat voor interne consistentie; hoewel het natuurlijk altijd goed is om iets op te merken als "Maar Cronbach's alpha is eigenlijk een slechte maat; jammer genoeg zijn omega en de GLB niet gerapporteerd". Dit is het pragmatische antwoord :-)

Het 'puristische' antwoord verschilt er eigenlijk niet eens zo heel veel. Als je reviewer bent van een artikel voor een journal, kun je eisen dat ze fatsoenlijke maten voor interne consistentie uitrekenen (dus, omega en/of de GLB). Maar als een artikel al is gepubliceerd, kan dat natuurlijk niet meer. Dan moet je accepteren dat Cronbach's alpha de enige maat is die je hebt.

Ik weet niet helemaal zeker of dit je tweede vraag ook beantwoord; dus geef het alsjeblieft aan als dat niet zo is!
Jawel hoor! Bedankt!
Toch nog een vraag over deze Cronbach's alpha (ik kan het niet laten). Ik ben net het artikel 'Over misverstanden rond Cronbachs alfa en de wenselijkheid van alternatieven' van Klaas Sijtsma aan het lezen uit De Psycholoog. Daarin staat op p. 565 bijvoorbeeld dat de GLB voorlopig nog niet in SPSS zit (het artikel dateert uit 2009, misschien is dat probleem nu verholpen?) en dat de schattingen (die je dan wel berekenen kan met bijvoorbeeld EQS) wat hoog kunnen uitvallen bij tests die meer dan 10 items meten of als je een steekproef hebt die minder dan 1000 proefpersonen telt.
Als alternatief wordt verwezen naar Guttmans lambda2 en de mu-reeks.
Hoe moet ik dit anno 2012 met de nieuwe SPSS 20 interpreteren?
Voor zover ik weet, zit de GLB nog niet in SPSS (heb even gegoogled), maar ik nodig iedereen uit mij te corrigeren als ik er naast zit. Er is een reden dat ik ben overgestapt op R :-)

Het is in R relatief eenvoudig om omega en de GLB uit te rekenen; ik verwijs je weer naar de syntax op http://sciencerep.org/3/ (R kun je gratis downloaden op http://cran.r-project.org/bin/windows/base/). Als je dit in een situatie zit waar je deze uit wil rekenen, kun je altijd een nieuwe vraag stellen over hoe dat moet; dan kan ik je daar mee helpen. Met wat geluk ben ik er tegen die tijd zelfs aan toe gekomen er een bron over te schrijven waar het wordt uitgelegd :-)
En is GLB in R dan wel bruikbaar bij een steekproef die minder dan 1000 proefpersonen telt?
Ik zal misschien eerst maar eens R downloaden. Mijn vraag vervalt voorlopig ;-).
Ohja, goed punt - dat was ik nog vergeten. Dit probleem van de GLB is niet afhankelijk van welke software je gebruikt, volgens mij, en bestaat dus ook als je R gebruikt. Ik rapporteer daarom altijd zowel Omega als R. Ik heb het artikel van Revelle en Zinbarg, waar ik hierboven naar verwijs, net veen gescanned, maar volgens mij zeggen ze niets over problemen die kleine steekproeven vormen voor Omega. In R zijn de lambda's ook makkelijk te berekenen trouwens.
...