In het boek staat: voor het gemiddelde (en andere waarden waarvan de steekproevenverdeling normaal verdeeld is) geldt dat BI 1.96 = BI 95%.
1. Maar dat is toch niet altijd zo? De steekproevenverdeling voor bijvoorbeeld een regressiecoëfficiënt volgt een t-verdeling en de vorm daarvan is toch ook een normale verdeling, maar het BI ligt bij t>1.96 wanneer n<100.
2. Wat ik ook een beetje verwarrend vind is dit:
De t-verdeling gebruik je als de sd in de populatie niet bekend is. Maar tegelijkertijd staat er over de z-verdeling: "formeel is de standaardfout gelijk aan de standaarddeviatie van de populatie gedeeld door de wortel van de steekproefgrootte. Maar: die is nooit bekend, dus mag je uitgaan van sd in de steekproef."
Dus als de sd van de populatie nooit bekend is, wat vaak zo is, dan moet je toch eigenlijk altijd de t-verdeling gebruiken?
En dan geldt weer: het is niet 'realistisch' (staat in het boek) dat een n<100 is en bij n>100 komt de t-verdeling overeen met de z-verdeling, dus dat suggereert weer dat het eigenlijk niets uit maakt meestal of de waarde uit een stprverdeling die de vorm heeft van een z-verdeling of niet.
Begrijp ik nu goed wat er in het boek staat over de z- en de t-verdeling?
3. Ik vond een stroomdiagram om te beslissen welke verdeling je moet gebruiken op
https://statorials.org/nl/normale-verdeling-versus-t-verdeling/
Klopt die?
4. En hoe gaat software om met deze kwestie? Daarin wordt toch gewoon een BI gegeven, zonder dat gevraagd wordt of de sd in de pop. bekend is en dus of die is berekend op basis van de z-verdeling of de t-verdeling? Dat is wel relevant toch, want als je een z-verdeling hebt gebruikt, dan ben je minder conservatief in je schatting.
5. Zijn deze vragen nu enkel relevant als je moet uitleggen waar een BI vandaan komt en dus inzicht in het verhaal achter de cijfers gevraagd wordt? En heb je dat inzicht wel of niet altijd nodig als je onderzoek doet?
Ik vind het soms lastig dat ik vaak te horen krijg dat ik te diep nadenk, terwijl de uitgebreide uitleg van het boek de indruk geeft dat het wel degelijk de bedoeling en handig is dat ik weet waar bepaalde toetsen op gebaseerd zijn en dat lijkt me ook omdat ik anders toch nooit zelfstandig en kritisch kan beoordelen of ik via de juiste logische stappen keuzes maak bij de keuze voor technieken?