Een leerdoel van Thema 3 is: uitleggen waarom de steekproevenverdeling voor het gemiddelde bijna altijd normaal verdeeld is
--> ik vind dat lastig op basis van de tekst. Relevant is denk ik de tekst hieronder.
“De centrale limietstelling stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken. (...) Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven (enkele tientallen deelnemers).
Daaruit zou het antwoord te halen zijn dat ‘de steekproevenverdeling’ bijna (en dus niet altijd) normaal verdeeld is volgens de centrale limietstelling, namelijk niet voor heel kleine steekproeven.
Of gaat het erom, waarom ‘de steekproevenverdeling voor het gemiddelde’ bijna altijd normaal verdeeld is en dus niet bijna altijd ‘abnormaal’ en bijvoorbeeld scheef o.i.d.?
En in het laatste geval, wat is dan het antwoord? Dit is wat de centrale limietstelling stelt, maar dat is geen reden.
Ook verwarrend in dit stukje tekst is dat er gesproken wordt over ‘de steekproevenverdeling’ alsof er daar maar één van is, net als ‘de koningin’. Maar er staat ook ‘(…) naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken. (...) Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven (enkele tientallen deelnemers).
Gaat het hier bij het eerste gebruik van de woordcombi de steekproevenverdeling over een soort van praktische steekproevenverdeling die je kunt maken van bijvoorbeeld de gemiddelden van 15 steekproeven en dat het bij het tweede gebruik gaat over de theoretische, oneindige? En dus een oneindige steekproevenverdeling altijd normaal verdeeld is, maar een ‘praktische steekproevenverdeling niet persé?)
Dus: een steekproevenverdeling van de gemiddelden van 10 steekproeven lijkt minder op een normaalverdeling , dan een steekproevenverdeling van gemiddelden van 50 steekproeven. Dat is wat uit de tekst valt op te maken. Dus ze zijn niet bijna altijd normaal verdeeld: sterker nog, alleen een steekproefverdeling van het gemiddelde van alle mogelijke steekproefverdelingen is normaal verdeeld. Althans...zo begrijp ik de tekst. Toch heb ik het idee dat ik het niet goed heb.
Kan iemand dit toelichten?
Nog wat andere voorbeelden uit het boek waarin steekproevenverdeling soms lijkt te verwijzen naar theoretische, oneindige of naar een praktische:
"Om niet steeds de steekproevenverdeling voor een gegeven steekproefomvang en puntschatting op te hoeven stellen (PRAKTISCH DUS), moest een manier gevonden worden om toch conclusies te kunnen trekken over plausibele populatiewaarden."
Op basis van wat we eerder leerden, dacht ik dat dus juist de theoretische steekproevenverdeling als concept gebruik om iets te zeggen over de populatiewaarden. Klopt dus niet?