uit het boek:
Van elke steekproef die we trekken, kunnen we een gemiddelde berekenen. We krijgen dan meerdere gemiddelden, die steeds om het ‘ware’ gemiddelde van de populatie heen liggen.
35.58 41.08 41.37 41.08 42.05 34.68 40.77 38.09 35.77 41.91 40.93 38.86
De standaarddeviaties uit deze twaalf steekproeven zijn
21.1 21.86 23.88 22.67 22.54 23.56 24.04 21.94 23.57 22.56 22.38 23.02
Bovendien hebben we ook twaalf waarden voor, bijvoorbeeld, de spitsheid
-0.83 -0.97 -0.78 -1.1 -0.88 -0.95 -0.9 -1.12 -0.6 -0.88 -1.11 -0.78
Deze waarden liggen elke keer om de waarde uit de populatie heen. We hebben nu dus eigenlijk drie nieuwe datareeksen gecreëerd: een datareeks met gemiddelden, een datareeks met standaarddeviaties en een datareeks met spitsheidsmaten. En zoals bij elke datareeks hebben deze datareeksen ook weer gemiddelden en standaarddeviaties.
Het mooie is: als we nu steeds het gemiddelde van deze twaalf gemiddelden nemen, en het gemiddelde van deze twaalf standaarddeviaties en het gemiddelde van deze twaalf spitsheidsmaten, dan liggen dit ‘gemiddelde gemiddelde’, deze gemiddelde standaarddeviatie en deze gemiddelde spitsheid dichter bij de waarden in de populatie dan de schattingen uit een willekeurige enkele steekproef. Deze ‘algemene gemiddelden’ liggen op 39.35 voor de reeks van twaalf gemiddelden, op 22.82 voor de twaalf standaarddeviaties en op −0.94 voor de twaalf spitsheidmaten.
Ik kom op andere gemiddelden uit, wanneer ik ze door 12 (aantal steekproeven) deel.