In de genoemde redenering is het populatiegemiddelde van 40,76 niet uitgerekend maar eenvoudigweg aangenomen in de hoop dat (denk ik) de redenering erachter beter begrepen wordt. Deze redenering is dat indien het populatiegemiddelde 40,76 zou zijn de steekproevenverdeling van het gemiddelde bij een steekproef van 100 deelnemers en een standaardfout van 2,36 er als weergegeven in Fig. 2.4.1 zou uitzien.
Als je vervolgens zeg (voor het gemak) 1000 steekproeven van 100 deelnemers zou trekken en het gemiddelde zou uitrekenen, dan zou 95% daarvan (dus 950 van de 1000 berekende gemiddelden) in het 95% betrouwbaarheidsinterval om 40,76 heenliggen, ofwel in het gearceerde gebied van Fig. 2.4.2 vallen.
Zoals je terecht vermeldt, is het populatiegemiddelde onbekend en kan je in de praktijk de Fig. 2.4.1 en 2.4.2 niet maken. Maar Fig. 2.4.1 en 2.4.2 dienen alleen maar ter illustratie om de nu volgende stap te verduidelijken.
En die stap bestaat uit de omgekeerde gedachte dat indien ik zeg 1000 keer een steekproef van 100 deelnemers zou trekken en steeds (dus 1000 x) om het berekende steekproefgemiddelde het 95% betrouwbaarheidsinterval zou leggen (dat loopt van het berekende steekproefgemiddelde minus 2 x de standaardfout, tot aan het berekende steekproefgemiddelde plus 2 x de standaardfout) dat dan in 95% van de gevallen het populatiegemiddelde in de aldus bepaalde 1000 betrouwbaarheidsintervallen zou liggen, dus in 950 van de bepaalde betrouwbaarheidsintervallen.
Dit lijkt enigszins omslachtig uitgedrukt en in het normale spraakgebruik zou men wellicht zeggen, "dat betekent dat als ik een steekproefgemiddelde heb berekend en het 95% betrouwbaarheidsinterval daaromheen heb bepaald dat er dan 95% kans is dat het popluatiegemiddelde in het aldus bepaalde betrouwbaarheidsinterval ligt".
Maar die uitspraak is statistisch beschouwd niet juist, omdat het populatiegemiddelde niet een onbekende toekomstige gebeurtenis is, maar een vaststaand getal (dat alleen maar aan ons onbekend is). Omdat het populatiegemiddelde aldus vaststaat en niet onzeker is, zegt men in de statistiek dat de kans dat het populatiegemiddelde in het bepaalde betrouwbaarheidsinterval valt ofwel 1 is, als het erin ligt, ofwel 0 is, als het er buiten ligt.
En om die reden wordt (voor de niet-statisticus enigszins omslachtig) gezegd dat het 95% betrouwbaarheidsinterval (dat is bepaald op basis van het steekproefgemiddelde en de standaardfout) betekent dat als je n (zeg 1000) steekproeven zou nemen, en dus 1000 x het gemiddelde en het betrouwbaarheidsinterval zou bepalen, dat het populatiegemiddelde dan in 95% van de gevallen dus in 950 van de berekende betrouwbaarheidsintervallen zou liggen.
Dus als ik 1000 steekproeven van 100 deelnemers zou hebben en 1000 keer Fig. 2.4.3 zou maken op basis van het berekende steekproefgemiddelde en de standaardfout dan zou het populatiegemiddelde naar verwachting in 950 van de 1000 gevallen in het bijbehorende betrouwbaarheidsinterval liggen.