Open Mens 13.5
We kunnen betrouwbaarheidsintervallen berekenen voor alle maten
die berekend kunnen worden op basis van een steekproef. Al deze maten komen namelijk uit een
steekproevenverdeling waarvan de verdelingsvorm, de normaalverdeling, en de standaardfout bekend zijn.
1. Is dit een fout in het boek?
De steekproevenverdeling voor de correlatie kan toch ook heel assymmetrisch zijn en dus géén normaalverdeling? Zie 20.5 'Er is ook een verschil tussen de steekproevenverdeling van de correlatie en de steekproevenverdelingen van de beschrijvingsmaten. (...). Daarom wordt de steekproevenverdeling asymmetrisch naarmate de populatiecorrelatie dichter in de buurt van −1 of 1 komt."
en later; 'Hoewel r2 een eigen steekproevenverdeling heeft' ....
2a. Even voor de duidelijkheid: met een normaalverdeling wordt toch een verdeling bedoeld waarvoor geldt dat het gemiddelde nul is en een bepaalde maat, bijvoorbeeld een gemiddelde, in 95% vd mogelijke steekproeven binnen ongeveer 1.96 sd van het gemiddelde ligt en dus niet persé de standaardnormale verdeling waarvoor dit precies geldt??
2b En toch wordt het BI voor het gemiddelde uitgerekend met behulp van de z-score die hoort bij 95%. Gaat het er bij de centrale limietstelling dan toch om dat de steekproevenverdeling van het gemiddeld verdeeld is volgens de standaardnormale verdeling? Er staat tenslotte ook ergens in de tekst na uitleg van de cl: nu is de vorm bekend en de spreiding en dat weet je eigenlijk alleen bij de standaardnormale verdeling toch?
3. Klopt dit volgende lijstje nu?
Steekproevenverdeling voor gemiddelden: z-verdeling, MITS is voldaan aan drie voorwaarden
a)
- n ≥ 30
- De steekproeven zijn onafhankelijke en identiek verdeelde willekeurige variabelen
- De verdeling van de populatie heeft een eindige variantie.
Steekproevenverdeling voor correlatie en determinatiecoëfficiënt en bij ANOVA: géén normale verdeling maar Pearson's R, de eigen verdeling voor r2, maar vaak wordt de f-verdeling gebruikt en bij ANOVA ook de f-verdeling.
Steekproevenverdelingen voor het verschil tussen gemiddelden
én steekproevenverdelingen voor het gemiddelde wanneer níet voldaan is aan de drie voorwaarden hebben de vorm van een t-verdeling, dus wel een normale verdeling, maar niet precies een standaardnormale verdeling, tenzij de groter zijn dan 100 n.