Een hele goede vraag!
Dit is ingewikkeld omdat de breedte van het interval afhangt van drie zaken. Om dit uit te leggen pak ik de formule van het betrouwbaarheidsinterval er even bij:
$$\text{Betrouwbaarheidsinterval} = \text{Steekproefwaarde} \pm \text{Breedte-index} \times \text{Standaardfout}$$
De eerste term in deze formule is het betrouwbaarheidsinterval zelf. Dit is de uitkomst van de formule; dit heeft een gegeven breedte, en bepaalt die breedte dus niet. De breedte van dit interval is nu net waar het om gaat. De tweede term is de betreffende steekproefwaarde, dus de puntschatting, zoals een gemiddelde, standaarddeviatie, of scheefheid. Dit bepaalt hoe hoog of laag het interval ligt op de schaal van de betreffende variabele, en heeft geen invloed op de breedte van het interval.
De breedte van het interval wordt bepaald door de laatste twee termen:
De breedte-index en de standaardfout. Deze twee termen bevatten de drie zaken die de breedte van het betrouwbaarheidsinterval bepalen.
De eerste term is de breedte-index. Deze hangt af van wat voor betrouwbaarheidsinterval je berekent. Als je een 95% betrouwbaarheidsinterval berekent, is dit een kleinere waarde dan als je een 99% betrouwbaarheidsinterval berekent. Meer algemeen kun je stellen dat hoe betrouwbaarder je het interval wil hebben, hoe groter de breedte-index is. Deze grotere breedte-index vertaalt zich naar een breder betrouwbaarheidsinterval (BI). Je interval wordt dus betrouwbaarder (e.g. bij een 99% BI ligt de populatiewaarde er in 99% van de steekproeven in; bij een 99.9% interval in 99.9% van de steekproeven; en bij een 95% interval in maar 95% van de steekproeven) maar minder nauwkeurig (het wordt breder). Het extreemste voorbeeld is een interval waarvan je absoluut zeker wil weten dat de populatiewaarde erin ligt. In dat geval bereken je een 100% betrouwbaarheidsinterval. De breedte-index is dan $\infty$ (oneindig), en je interval is dus oneindig breed (tenzij dat niet mogelijk is; in thema 4 kom je BI's voor correlaties tegen, en een 100% BI voor een correlatie is altijd [-1; 1], want een correlatie kan niet lager dan -1 of hoger dan 1 zijn). Dus, hoe betrouwbaarder, hoe breder het interval. Betrouwbaarheid is goed, dus je wil altijd een zo betrouwbaar mogelijk BI opstellen.
Je wil echter tegelijkertijd dat het interval zo accuraat (nauwkeurig, smal) mogelijk is. Dat is lastig, want hoe betrouwbaarder je het interval maakt, hoe breder het wordt. Hier komen we bij de laatste term in de formule voor het betrouwbaarheidsinterval: de standaardfout.
Die hangt meestal af van twee zaken. De standaardfout hangt altijd af van je steekproefomvang: hoe grote je steekproef is, hoe kleiner de standaardfout is. Bovendien hangt je standaardfout in bijna alle gevallen af van de spreiding in je datareeks. Hoe betrouwbaarder
je meetinstrumenten zijn, hoe kleiner je standaardfout is; en hoe minder spreiding er is in je populatie, hoe kleiner je standaardfout is. Als je heeeeel betrouwbare meetinstrumenten hebt (die hebt je meestal niet in de psychologie en onderwijswetenschappen) of als er heeeeel weinig spreiding is in je populatie (maar daar is meestal veel spreiding in de psychologie en onderwijswetenschappen) is de rol van toeval kleiner. Oftewel, als je je steekproef herhaalt, ga je veel minder variatie hebben in de verschillende waarden voor het gemiddelde, scheefheid, spitsheid, standaarddeviatie etc die je gaat vinden in die opeenvolgende steekproeven. Omdat die waarden van steekproef tot steekproef maar weinig wordt beinvloedt door toeval kun je ze accuraat schatter, wat zich uit in lage standaardfouten en dus smalle betrouwbaarheidsintervallen.
Echter, zoals ik aangaf zijn meetinstrumenten die op mensen worden toegepast meestal relatief onbetrouwbaar (in vergelijking met meetsinstrumenten die op temperaturen en gewichten worden toegepast), en bevatten de variabelen die we onderzoeken meestal veel spreiding in de populatie (want als iedereen bijna hetzelfde zou scoren in de populatie, dan zou de variabelen het onderzoeken amper waard zijn).
Dat betekent dat de enige manier om smallere betrouwbaarheidsintervallen te krijgen is door de steekproefomvang te vergroten. Dit is de sleutel: hiermee kun je accurate en betrouwbare betrouwbaarheidsintervallen krijgen. In thema 4 (studietaak 4.7) komt dit weer aan bod: je kunt uitrekenen hoeveel deelnemers je nodig hebt om een betrouwbaarheidsinterval met een gegeven betrouwbaarheid op een gegeven breedte ('smalte') te krijgen.
Dus, het verwarrende zit hem er in dat accurate (smalle) betrouwbaarheidsintervallen wenselijk zijn; maar dat betrouwbaarheidsintervallen met een hoge betrouwbaarheids ook wenselijk zijn; en dat die haaks op elkaar staan, tenzij je de steekproefomvang kunt verhogen.
Als je een interval hebt met een gegeven breedte (bijvoorbeeld van 3 tot 8 in een variabelen die van 1 tot 10 loopt) dan zijn er twee mogelijkheden:
- Of het is een BI met een hoge betrouwbaarheid (e.g. 99.9%). In dat geval weet je dat het betrouwbaarheidsinterval uit een relatief grote steekproef komt (of dat er uitzonderlijk precies is gemeten, dus met een zeer betrouwbaar meetinstrument - dit is ook verwarrend realiseer ik me nu - dit is een ander soort betrouwbaarheid, hoewel ze wel gerelateerd zijn. Maar het gaat te ver om hier nu ook nog op in te gaan).
- Of het is een BI met een lage betrouwbaarheid (e.g. 80% of 95%). In dat geval weet je dat het betrouwbaarheidsinterval uit een relatief kleine steekproef komt (of dat er geen onnauwkeurig is gemeten).
Dus:
- Betrouwbaarheid is goed: je hebt altijd liever een 99.99% BI dan een 95% BI.
- Smalle intervallen zijn goed: hoe smaller het interval, hoe accurater je kunt zeggen wat plausibele populatiewaarden is.
Omdat hogere betrouwbaarheid (wenselijk) zich manifesteert in breder intervallen (onwenselijk) kan dit verwarrend zijn. De oplossing is: grotere steekproeven, zodat je smalle intervallen kunt maken en dus accurate schattingen kunt doen (wenselijk) met hoge betrouwbaarheid (wenselijk).