Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Bij figuur 2.4.1. Steekproefverdeling van de gemiddelde leeftijd (pag 53 van 252) staat: we kunnen net doen of we het populatiegemiddelde kennen, en dan volgt er een getal: 40,76. Maar dit getal weten we toch niet, omdat we het populatiegemiddelde niet kennen, hoe kom je dan bij dit getal? En hoe kan je dan figuur 2.4.3 uitleggen: of is dit puur theoretisch dat  wanneer een gegeven  steekproefgemiddelden in het 95% interval rondom het populatiegemiddelde valt, dat dan het populatiegemiddelde ook in het 95% interval rondom het steekproef gemiddelde valt (en moet ik me niet druk maken om de getallen/waardes)?
in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (140 punten)

1 Antwoord

0 leuk 0 niet-leuks
In de genoemde redenering is het populatiegemiddelde van 40,76 niet uitgerekend maar eenvoudigweg aangenomen in de hoop dat (denk ik) de redenering erachter beter begrepen wordt. Deze redenering is dat indien het populatiegemiddelde 40,76 zou zijn de steekproevenverdeling van het gemiddelde bij een steekproef van 100 deelnemers en een standaardfout van 2,36 er als weergegeven in Fig. 2.4.1 zou uitzien.

Als je vervolgens zeg (voor het gemak) 1000 steekproeven van 100 deelnemers zou trekken en het gemiddelde zou uitrekenen, dan zou 95% daarvan (dus 950 van de 1000 berekende gemiddelden) in het 95% betrouwbaarheidsinterval om 40,76 heenliggen, ofwel in het gearceerde gebied van Fig. 2.4.2 vallen.

Zoals je terecht vermeldt, is het populatiegemiddelde onbekend en kan je in de praktijk de Fig. 2.4.1 en 2.4.2 niet maken. Maar Fig. 2.4.1 en 2.4.2 dienen alleen maar ter illustratie om de nu volgende stap te verduidelijken.

En die stap bestaat uit de omgekeerde gedachte dat indien ik zeg 1000 keer een steekproef van 100 deelnemers zou trekken en steeds (dus 1000 x) om het berekende steekproefgemiddelde het 95% betrouwbaarheidsinterval zou leggen (dat loopt van het berekende steekproefgemiddelde minus 2 x de standaardfout, tot aan het berekende steekproefgemiddelde plus 2 x de standaardfout) dat dan in 95% van de gevallen het populatiegemiddelde in de aldus bepaalde 1000 betrouwbaarheidsintervallen zou liggen, dus in 950 van de bepaalde betrouwbaarheidsintervallen.

Dit lijkt enigszins omslachtig uitgedrukt en in het normale spraakgebruik zou men wellicht zeggen, "dat betekent dat als ik een steekproefgemiddelde heb berekend en het 95% betrouwbaarheidsinterval daaromheen heb bepaald dat er dan 95% kans is dat het popluatiegemiddelde in het aldus bepaalde betrouwbaarheidsinterval ligt".

Maar die uitspraak is statistisch beschouwd niet juist, omdat het populatiegemiddelde niet een onbekende toekomstige gebeurtenis is, maar een vaststaand getal (dat alleen maar aan ons onbekend is). Omdat het populatiegemiddelde aldus vaststaat en niet onzeker is, zegt men in de statistiek dat de kans dat het populatiegemiddelde in het bepaalde betrouwbaarheidsinterval valt ofwel 1 is, als het erin ligt, ofwel 0 is, als het er buiten ligt.

En om die reden wordt (voor de niet-statisticus enigszins omslachtig) gezegd dat het 95% betrouwbaarheidsinterval (dat is bepaald op basis van het steekproefgemiddelde en de standaardfout) betekent dat als je n (zeg 1000) steekproeven zou nemen, en dus 1000 x het gemiddelde en het betrouwbaarheidsinterval zou bepalen, dat het populatiegemiddelde dan in 95% van de gevallen dus in 950 van de berekende betrouwbaarheidsintervallen zou liggen.

Dus als ik 1000 steekproeven van 100 deelnemers zou hebben en 1000 keer Fig. 2.4.3 zou maken op basis van het berekende steekproefgemiddelde en de standaardfout dan zou het populatiegemiddelde naar verwachting in 950 van de 1000 gevallen in het bijbehorende betrouwbaarheidsinterval liggen.
door (810 punten)
Dank je, het wordt er duidelijker van :).
...