Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 1 niet-leuk

Een leerdoel van Thema 3 is: uitleggen waarom de steekproevenverdeling voor het gemiddelde bijna altijd normaal verdeeld is
--> ik vind dat lastig op basis van de tekst. Relevant is denk ik de tekst hieronder.

“De centrale limietstelling stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken. (...) Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven (enkele tientallen deelnemers).

Daaruit zou het antwoord te halen zijn dat ‘de steekproevenverdeling’ bijna (en dus niet altijd) normaal verdeeld is volgens de centrale limietstelling, namelijk niet voor heel kleine steekproeven.

Of gaat het erom, waarom ‘de steekproevenverdeling voor het gemiddelde’ bijna altijd normaal verdeeld is en dus niet bijna altijd ‘abnormaal’ en bijvoorbeeld scheef o.i.d.?
En in het laatste geval, wat is dan het antwoord? Dit is wat de centrale limietstelling stelt, maar dat is geen reden.

Ook verwarrend in dit stukje tekst is dat er gesproken wordt over ‘de steekproevenverdeling’ alsof er daar maar één van is, net als ‘de koningin’. Maar er staat ook ‘(…) naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken. (...) Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven (enkele tientallen deelnemers).

Gaat het hier bij het eerste gebruik van de woordcombi de steekproevenverdeling over een soort van praktische steekproevenverdeling die je kunt maken van bijvoorbeeld de gemiddelden van 15 steekproeven en dat het bij het tweede gebruik gaat over de theoretische, oneindige? En dus een oneindige steekproevenverdeling altijd normaal verdeeld is, maar een ‘praktische steekproevenverdeling niet persé?)

Dus: een steekproevenverdeling van de gemiddelden van 10 steekproeven lijkt minder op een normaalverdeling , dan een steekproevenverdeling van gemiddelden van 50 steekproeven. Dat is wat uit de tekst valt op te maken. Dus ze zijn niet bijna altijd normaal verdeeld: sterker nog, alleen een steekproefverdeling van het gemiddelde van alle mogelijke steekproefverdelingen is normaal verdeeld. Althans...zo begrijp ik de tekst. Toch heb ik het idee dat ik het niet goed heb. 
Kan iemand dit toelichten?

Nog wat andere voorbeelden uit het boek waarin steekproevenverdeling soms lijkt te verwijzen naar theoretische, oneindige of naar een praktische:

"Om niet steeds de steekproevenverdeling voor een gegeven steekproefomvang en puntschatting op te hoeven stellen (PRAKTISCH DUS), moest een manier gevonden worden om toch conclusies te kunnen trekken over plausibele populatiewaarden."
Op basis van wat we eerder leerden, dacht ik dat dus juist de theoretische steekproevenverdeling als concept gebruik om iets te zeggen over de populatiewaarden. Klopt dus niet?

in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (720 punten)
bewerkt door

1 Antwoord

0 leuk 0 niet-leuks

De steekproevenverdeling is een theoretische verdeling van alle mogelijke steekproeven van een bepaalde statistische grootheid en een specfieke omvang. Dus er is niet zoiets als de steekproevenverdeling van het gemiddelde, maar wel de steekproevenverdeling van het gemiddelde bij een bepaalde n. Als er echter in de tekst gesproken wordt van de steekproevenverdeling dan wordt daar ove gesproken hetzelfde als je zou spreken over het gemiddelde of de modus. Er is er niet maar een, maar we hebben het over de specifieke steekproevenverdeling in dit voorbeeld.

De steekproevenverdeling van het gemiddelde is altijd normaal verdeeld. Dat kun je gewoon aannemen dat dat zo is. Waarom dat zo is komt door de centrale limietstelling. Of als je meer uitleg wilt, zoals in het hoofdstuk uitgebreid wordt besproken, omdat hoe meer steekproeven je toevoegd aan deze theoretische verdeling, hoe minder kans op extreme waarden, waardoor het steeds meer een normaalverdeling wordt. 

Het feit dat gesteld wordt dat de uitzondering is "bij kleine steekproeven" betekent niet dat bovenstaande niet geldt, alleen dat er een uitzondering is (zoals bijna bij alles in onderzoek er wel een uitzondering is). Er wordt echter zelden onderzoek gedaan met zulke kleine steekproeven, dus meestal is het niet relevant.

Maar nog even voor de duidelijkheid er zijn niet verschillende soorten steekproevenverdelingen, een steekproevenverdeling gaat altijd over de theoretische verdeling van alle mogelijke steekproeven. Echter, hoe we daarbij komen wordt (iets te) uitgebreid uitgelegd in dat hoofdstuk en daarbij wordt verteld wat er gebeurt als je begint met het opstellen van zo'n verdeling net zolang tot je bij een volledige steekproevenverdeling komt. Dit doe je zelf als onderzoeker dus nooit, het zijn enkel theoretische verdelingen die ten grondslag liggen aan verschillende statistische toetsen. 

door (48.7k punten)
Ok, bedankt!

Ik zit het nog even terug te lezen. Mijn vraag ging o.a. over het leerdoel: uitleggen waarom de steekproevenverdeling voor het gemiddelde bijna altijd normaal verdeeld is.

Dat kan dus op twee manieren, haal ik uit je antwoord: ten eerste: door de centrale limietstelling. (Jouw tekst: "De steekproevenverdeling van het gemiddelde is altijd normaal verdeeld. Dat kun je gewoon aannemen dat dat zo is. Waarom dat zo is komt door de centrale limietstelling.)

Tweede manier om uit te leggen, meer uitgebreid: "Omdat hoe meer steekproeven je toevoegdt aan deze theoretische verdeling, hoe minder kans op extreme waarden, waardoor het steeds meer een normaalverdeling wordt."

Zoiets?

Precies. Aan die tweede uiteenzetting zou je nog kunnen toevoegen dat veel variabelen van nature normaal verdeeld zijn, dus als je alle mogelijke waarden zou verzamelen dan wordt dit altijd een normale verdeling. Denk bijvoorbeeld aan de lengte van volwassen Nederlanders.
...