Er zijn inderdaad verschillende richtlijnen. Dit komt omdat het (natuurlijk :-)) wat complexer in elkaar zit dan een simpele drempelwaarde.
Ten eerste drukt Cronbach's alpha uit in welke mate alle items samenhangen (tenminste, dat probeert hij; zie hieronder voor een nuancering). Het idee is dat als alle items exact hetzelfde meten, Cronbach's alpha erg hoog is. Dit betekent dan dat je een hoge interne consistentie (wordt ook wel betrouwbaarheid genoemd) hebt. Echter, als je een psychologisch construct meet, bestaat dat vaak uit verschillende maar gerelateerde aspecten. Hoe breder het construct, hoe meer aspecten je moet meten. Of een vragenlijst al die aspecten goed afdekt is de validiteit van je vragenlijst. Je voelt hem al aankomen: twee items die verschillende aspecten van een construct meten, meten niet precies hetzelfde. Toch is het belangrijk dat je alle aspecten van je construct meet. Daarom hangt de maximaal haalbare hoogte van Cronbach's alpha af van hoe eng het construct is dat je meet.
Ten tweede zijn er niet altijd vragenlijsten voorhanden die zijn gevalideerd. Als een vragenlijst wordt gevalideerd, wordt deze idealiter grondig onder de loep genomen. De test-retest reliability wordt bekeken; hij wordt vergeleken met andere vragenlijsten en meetinstrumenten; en de items die niet goed werken (i.e. die zich niet gedragen zoals ze zich volgens de theorie moeten gedragen) worden verwijderd. Bij zo'n gevalideerde vragenlijst kun je dus een hogere Cronbach's alpha verwachten dan bij een vragenlijst die niet is gevalideerd; er is immers geen gelegenheid geweest om minder goed werkende items te verwijderen. Nu zou je kunnen zeggen: 'Ik verwijder gewoon de items die het laagst correleren met de rest, of de items waarbij Cronbach's alpha het meeste stijgt als ik ze verwijder.' Dit is echter geen goede aanpak, want zoals ik hierboven aangaf, is validiteit minstens zo belangrijk. Door de minder goed correlerende items te verwijderen, kun je de validiteit aantasten, waardoor je je construct niet goed meer meet, maar bijvoorbeeld alleen een aspect van je construct. Het validatietraject stelt je in staat om met behulp van factoranalyses en vergelijking met slim gekozen andere meetsinstrumenten te bepalen welke items welke aspecten meten, en zo een valide vragenlijst samen te stellen die bovendien een hoge Cronbach's alpha heeft. Als je een vragenlijst voor het eerst gebruikt, is het een stuk moeilijker in te schatten of bepaalde items nodig zijn om de validiteit te behouden, of dat ze veilig verwijderd kunnen worden.
Als je een vragenlijst hebt die verschillende aspecten van een construct meet, kun je de interne consistentie overigens ook per sub-schaal meten. Bij de beslissing of je verschillende sub-schalen wilt onderscheiden kan het handig zijn om exploratieve en/of confirmatoire factoranalyse uit te voeren. Het gaat dan vooral om de vraag of de items in je sub-schalen onderling voldoende sterk samenhangen, en bovendien voldoende sterk verschillen van de items in andere sub-schalen.
Tot slot nog een belangrijke opmerking over het nut van Cronbach's alpha. Cronbach's alpha is een slechte maat voor interne consistentie. Een van de redenen hiervoor is dat hij steeds hoger wordt naarmate het aantal items in een schaal toeneemt. Hij wordt nog door bijna iedereen gebruikt (vandaar dat hij in het curriculum zit), maar er zijn betere maten voorhanden. Deze heten Omegatotal en de Greater Lower Bound (GLB). Meer informatie over (zoals hij het zelf noemt) "het gebruik, misbruik, en de zeer beperkte bruikbaarheid van Cronbach's alpha" staat in een Open Access artikel van Klaas Sijtsma (zie http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2792363/), of het Nederlandse wat toegankelijker artikel in De Psycholoog (zie http://www.cs.uu.nl/wiki/pub/Toetsing/ToetsAdviesCommissie/MisverstandenRondCronbachAlpha.pdf). Een artikel dat reageert op Sijtsma's Engelstalige artikel, en waar Omegatotal wordt aangeraden, staat op http://personality-project.org/revelle/publications/revelle.zinbarg.08.pdf. Er staat er uitgelegd hoe je zelf de GLB en Omega kunt bereken op http://oupsy.nl/help/26/hoe-bereken-ik-de-glb-en-omega.
UPDATE: ik heb hier inmiddels zelf een artikel over geschreven, dat Engels is, maar erg toegankelijk (zonder formule's etc, maar met plaatjes :-)). Deze staat op http://ehps.net/ehp/index.php/contents/article/view/ehp.v16.i2.p56/1.
Dus, kort samengevat: hoe hoog Cronbach's alpha moet zijn hangt af van 1) hoeveel gelegenheid er is geweest om de vragenlijst te verbeteren 2) hoe breed het construct is dat wordt gemeten; en 3) hoeveel items de schaal heeft. Er zijn geen 'harde' richtlijnen te geven vrees ik; maar ik hoop dat je nu een beetje een indruk hebt van waar je op moet letten.