'de' steekproevenverdeling: welke?

Question

'de' steekproevenverdeling: welke?

Een leerdoel van Thema 3 is: uitleggen waarom de steekproevenverdeling voor het gemiddelde bijna altijd normaal verdeeld is
--> ik vind dat lastig op basis van de tekst. Relevant is denk ik de tekst hieronder.

“De centrale limietstelling stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken. (...) Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven (enkele tientallen deelnemers).

Daaruit zou het antwoord te halen zijn dat ‘de steekproevenverdeling’ bijna (en dus niet altijd) normaal verdeeld is volgens de centrale limietstelling, namelijk niet voor heel kleine steekproeven.

Of gaat het erom, waarom ‘de steekproevenverdeling voor het gemiddelde’ bijna altijd normaal verdeeld is en dus niet bijna altijd ‘abnormaal’ en bijvoorbeeld scheef o.i.d.?
En in het laatste geval, wat is dan het antwoord? Dit is wat de centrale limietstelling stelt, maar dat is geen reden.

Ook verwarrend in dit stukje tekst is dat er gesproken wordt over ‘de steekproevenverdeling’ alsof er daar maar één van is, net als ‘de koningin’. Maar er staat ook ‘(…) naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken. (...) Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven (enkele tientallen deelnemers).

Gaat het hier bij het eerste gebruik van de woordcombi de steekproevenverdeling over een soort van praktische steekproevenverdeling die je kunt maken van bijvoorbeeld de gemiddelden van 15 steekproeven en dat het bij het tweede gebruik gaat over de theoretische, oneindige? En dus een oneindige steekproevenverdeling altijd normaal verdeeld is, maar een ‘praktische steekproevenverdeling niet persé?)

Dus: een steekproevenverdeling van de gemiddelden van 10 steekproeven lijkt minder op een normaalverdeling , dan een steekproevenverdeling van gemiddelden van 50 steekproeven. Dat is wat uit de tekst valt op te maken. Dus ze zijn niet bijna altijd normaal verdeeld: sterker nog, alleen een steekproefverdeling van het gemiddelde van alle mogelijke steekproefverdelingen is normaal verdeeld. Althans...zo begrijp ik de tekst. Toch heb ik het idee dat ik het niet goed heb.
Kan iemand dit toelichten?

Nog wat andere voorbeelden uit het boek waarin steekproevenverdeling soms lijkt te verwijzen naar theoretische, oneindige of naar een praktische:
"Om niet steeds de steekproevenverdeling voor een gegeven steekproefomvang en puntschatting op te hoeven stellen (PRAKTISCH DUS), moest een manier gevonden worden om toch conclusies te kunnen trekken over plausibele populatiewaarden."
Op basis van wat we eerder leerden, dacht ik dat dus juist de theoretische steekproevenverdeling als concept gebruik om iets te zeggen over de populatiewaarden. Klopt dus niet?

gevraagd 10 november 2023 in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door levenslang leren (1.2k punten)
bewerkt 10 november 2023 door levenslang leren

1 Antwoord

Natascha de Hoog · Answer 1 · 2023-11-17T11:24:04+0000

De steekproevenverdeling is een theoretische verdeling van alle mogelijke steekproeven van een bepaalde statistische grootheid en een specfieke omvang. Dus er is niet zoiets als de steekproevenverdeling van het gemiddelde, maar wel de steekproevenverdeling van het gemiddelde bij een bepaalde n. Als er echter in de tekst gesproken wordt van de steekproevenverdeling dan wordt daar ove gesproken hetzelfde als je zou spreken over het gemiddelde of de modus. Er is er niet maar een, maar we hebben het over de specifieke steekproevenverdeling in dit voorbeeld.

De steekproevenverdeling van het gemiddelde is altijd normaal verdeeld. Dat kun je gewoon aannemen dat dat zo is. Waarom dat zo is komt door de centrale limietstelling. Of als je meer uitleg wilt, zoals in het hoofdstuk uitgebreid wordt besproken, omdat hoe meer steekproeven je toevoegd aan deze theoretische verdeling, hoe minder kans op extreme waarden, waardoor het steeds meer een normaalverdeling wordt.

Het feit dat gesteld wordt dat de uitzondering is "bij kleine steekproeven" betekent niet dat bovenstaande niet geldt, alleen dat er een uitzondering is (zoals bijna bij alles in onderzoek er wel een uitzondering is). Er wordt echter zelden onderzoek gedaan met zulke kleine steekproeven, dus meestal is het niet relevant.

Maar nog even voor de duidelijkheid er zijn niet verschillende soorten steekproevenverdelingen, een steekproevenverdeling gaat altijd over de theoretische verdeling van alle mogelijke steekproeven. Echter, hoe we daarbij komen wordt (iets te) uitgebreid uitgelegd in dat hoofdstuk en daarbij wordt verteld wat er gebeurt als je begint met het opstellen van zo'n verdeling net zolang tot je bij een volledige steekproevenverdeling komt. Dit doe je zelf als onderzoeker dus nooit, het zijn enkel theoretische verdelingen die ten grondslag liggen aan verschillende statistische toetsen.

Categorieën

'de' steekproevenverdeling: welke?

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.

Gerelateerde vragen

Categorieën

'de' steekproevenverdeling: welke?

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.