Ik snap dat data voor de gehele populatie niet beschikbaar zijn en dat het hier gaat om een voorbeeld. Ik snap ook dat het populatiegem. normaal niet beschikbaar.
Bij par 2.4, subpar 'accuraatheid van schattingen' worden bij fig. 2.4.1 een middelde en een se gebruikt. Het gemiddelde is echter berekend uit de 'populatie'=12 steekproeven/datasets (zie fig. 2.3.3 met toelichting). De se die gebruikt wordt is echter berekend uitsluitend op basis van de 1e steekproef/dataset (zie fig 2.3.1 met toelichting). Waarom wordt in beide gevallen niet gebruik gemaakt van de 'populatie'?
Vervolgens wordt bij fig 2.4.3 de data gecombineerd van de 'populatie' met de 1e steekproef. Maar beide maken gebruik van dezelfde se (zelfde dataset), maar verschillende gemiddelden (populatie en steekproef uit populatie). Kunt u een toelichting geven waarom in beide gevallen dezelfde se wordt gebruikt? Kortom ik begrijp niet waarom dat de breedte van het 95%-betrouwbaarheidsinterval van beide grafieken in fig. 2.4.3 hetzelfde is.
mvg, Ilse