Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Studiecentrum Den Haag

In relatie tot de bron: populatieverdeling, verdeling van steekproefscores en steekproefverdeling

http://oupsy.nl/files/populatieverdeling, verdeling van steekproefscores, en steekproevenverdeling.pdf

Beste Gjalt-Jorn,

U heeft mooi weergegeven dat de normale distributie een natuurlijk fenomeen is en dat de normale distributie een wetenschappelijke ontdekking is.

Au contraire, heeft u een voorbeeld van een populatie die niet normaal verdeeld is en waarvan de steekproefverdeling en de centrale limietstelling ook geen normale verdeling opleveren?

Met vriendelijke groet,

Ezra Niessink

 

in Methodologie door (510 punten)

2 Antwoorden

0 leuk 0 niet-leuks

De centrale limietstelling "levert" niets. De stelling "stelt" dat de steekproevenverdeling bij een toenemende grootte van de steekproef steeds meer op een normale verdeling lijkt (bij kleine steekproeven lijkt ze steeds meer op de 'echte' populatieverdeling). En je kunt dit wiskundig bewijzen. Wat je vraagt, is dus wiskundig uitgesloten! Je krijgt altijd een normale verdeling, en dat onafhankelijk van de populatieverdeling. Sterk he!

door (7.9k punten)
Dus...de cls is op elke soort distributie van toepassing? Onder elke omstandigheid? Ik las vandaag het volgende stukje "het is verleidelijk normale verdelingen te zien waar ze niet zijn. Bijvoorbeeld als de uitkomst wordt bepaald door één dominant effect." Wat bedoelt de auteur hiermee? Of haal ik 2 dingen door elkaar.
Ik vermoed dat de auteur spreekt over een populatieverdeling of over een verdeling in een steekproef.

Stel dat je een dobbelsteen hebt waarvan de zijden van de 3 en de 4 verzwaard zijn, zodat die 2x zo vaak gegooid worden als de andere vier cijfers. Je gooit 10 keer, en je noteert twee zaken. Ten eerste het aantal keer dat je 1, 2, 3, 4, 5 of 6 gooide. Ten tweede het gemiddelde van die 10 cijfers, afgerond op 1 cijfer na de komma. Dan gooi je weer 10 keer. Je telt de aantallen op bij de 6 tellers, en je berekent ook weer een nieuw gemiddelde.

Nadat je dit nu duizend keren gedaan hebt, bekijk je twee zaken. Ten eerste de verdeling van de 6 teller. Die zal er ongeveer uitzien als 1250 keer 1, 1250 keer 2, 2500 keer 3, 2500 keer 4, 1250 keer 5 en 1250 keer 6. Die ziet er een klein tikkeltje normaal uit: er is een bult in 't midden. Maar 'echt' normaal is het zeker niet, het is doodgewoon een heel goede benadering van de 'populatieverdeling'. Daarnaast bekijk je de verdeling van de gemiddeldes. Hocus pocus: je ziet een klokvorm, met een piek bij 3.5! De CLS zegt: als je het eindeloos vaak doet, dan is de klokvorm PERFECT normaal.

Op http://eduratio.be/OU/CLS.xls vind je een Excel sheet waarin ik dit even simuleerde. Telkens je op F9 drukt, worden er opnieuw 1000 stalen (van elk 10 worpen) getrokken en zie je het resultaat in de grafieken.
Ik snap het principe van de het CLS. Ik vraag me af of dit altijd, op elke soort distributie van toepassing is, want als dit het geval is lijkt het erop dat de voorwaarde van normale verdeling nooit geschonden kan worden.

Echter, bijvoorbeeld, in de reader van non-parametrische toetsen staat dat als de populatiegegevens niet normaal verdeeld zijn, dan mogen parametrische technieken niet gebruikt worden (p.35).

Even verderop (zelfde pagina) staat dat als blijkt uit statistische toetsen dat de variabelen niet normaal verdeeld waren, de parametrische toetsen niet gebruikt hadden mogen worden.

Hoe verhoudt dit zich met het CLS? Wanneer is de voorwaarde van normaal verdeling geschonden?
0 leuk 0 niet-leuks
Luc heeft gelijk: de CLS is een wiskundige noodzakelijkheid. Deze stelling in de bron van NPDA is inderdaad wat onzorgvuldig geformuleerd. De toetsen die in ons curriculum worden gebruikt doen geen van allen aannamen over de verdeling van de steekproefscores; de aannames betreffen allemaal de steekproevenverdeling.

Echter, als je een nominale of ordinale voorspeller hebt, kan deze niet normaal verdeeld zijn.

Je zou kunnen zeggen dat de CLS hier niet opgaat. Dit is ook logisch; de CLS 'werkt' door de dynamiek van het gemiddelde. Gemiddelden vereisen interval-schalen; omdat je bij ordinale en nominale variabelen geen gemiddelde kunt uitrekenen, kan de CLS daar dus ook niet opgaan. Maar dit is wel nogal een vergezochte redenering... Als je me e-mailt kan ik je een 'bron in wording' sturen waar dit ook wordt besproken.
door (77.8k punten)
...