Waarom worden er verschillende datasets gebruikt bij fig 2.4.1? (cursus IDA)

Question

Waarom worden er verschillende datasets gebruikt bij fig 2.4.1? (cursus IDA)

Ik snap dat data voor de gehele populatie niet beschikbaar zijn en dat het hier gaat om een voorbeeld. Ik snap ook dat het populatiegem. normaal niet beschikbaar.

Bij par 2.4, subpar 'accuraatheid van schattingen' worden bij fig. 2.4.1 een middelde en een se gebruikt. Het gemiddelde is echter berekend uit de 'populatie'=12 steekproeven/datasets (zie fig. 2.3.3 met toelichting). De se die gebruikt wordt is echter berekend uitsluitend op basis van de 1e steekproef/dataset (zie fig 2.3.1 met toelichting). Waarom wordt in beide gevallen niet gebruik gemaakt van de 'populatie'?

Vervolgens wordt bij fig 2.4.3 de data gecombineerd van de 'populatie' met de 1e steekproef. Maar beide maken gebruik van dezelfde se (zelfde dataset), maar verschillende gemiddelden (populatie en steekproef uit populatie). Kunt u een toelichting geven waarom in beide gevallen dezelfde se wordt gebruikt? Kortom ik begrijp niet waarom dat de breedte van het 95%-betrouwbaarheidsinterval van beide grafieken in fig. 2.4.3 hetzelfde is.

mvg, Ilse

gevraagd 20 juni 2019 in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door anoniem (320 punten)

Categorieën

Waarom worden er verschillende datasets gebruikt bij fig 2.4.1? (cursus IDA)

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

0 Antwoorden

Gerelateerde vragen

Categorieën

Waarom worden er verschillende datasets gebruikt bij fig 2.4.1? (cursus IDA)

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

0 Antwoorden