Een goede vraag verdiend een derde antwoord ;). Ik wil graag toevoegen aan de uitstekende antwoorden van gjp en Natascha de Hoog, door een contrast te maken tussen een steekproevenverdeling en een kansverdeling. Wellicht zit hier de verwarring.
Een kansverdeling is een wiskundige beschrijving van een willekeurig proces. De kansverdeling is een overzicht van de kans op iedere gebeurtenis in een verzameling. Bijvoorbeeld: bij een dobbelsteenworp is de verzameling (populatie) van alle gebeurtenissen de ogen: $$\{1, 2, 3, 4, 5, 6\}$$. De verdeling van de kansen, ervan uitgaande dat de dobbelsteen 'eerlijk' is, is $$\{\frac{1}{6}, \frac{1}{6}, \frac{1}{6}, \frac{1}{6}, \frac{1}{6}, \frac{1}{6} \}$$. Omdat iedere gebeurtenis in de verzameling dezelfde kans heeft heet deze kansverdeling een uniforme verdeling.
Dan de essentiële brug naar de steekproevenverdeling. Iedere individuele steekproef wordt getrokken met de eigenschappen van de wiskundige kansverdeling. Simpel gezegd: als het gedrag in de populatie uniform verdeeld is, dan, als we maar een steekproef trekken die voldoende groot is, bijvoorbeeld een oneindig grote, zal de verdeling van alle gebeurtenissen (alle dobbelsteenworpen) een patroon vertonen overeenkomstig met de kansverdeling. Een plat histogram lopende van 1 t/m 6 (en ‘nul’ buiten deze waarden).
Maar, dat is het geval zolang je ‘1’ steekproef trekt. Er gebeurt echter iets bijzonders als je niet meer een enkele dobbelsteen gooit, maar nu een tweede dobbelsteen gaat gooien, en de uitkomsten van de twee worpen optelt. De som van de twee steekproeven is niet meer uniform verdeeld, ondanks dat iedere steekproef wel uniform verdeeld is. De uitkomstruimte is vergroot naar: $$\{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12\}$$, maar niet iedere uitkomst is even waarschijnlijk meer. Er is namelijk maar 1 manier om '2' te verkrijgen na twee steekproeven $\{1,1\}$, idem voor 12 $\{6,6\}$. Om bij twee steekproeven een opgetelde waarde van '2' te krijgen is de kans $\frac{1}{6}*\frac{1}{6} = \frac{1}{36} = .027$. Er zijn bijvoorbeeld 2 manieren om '3' te gooien: $\{1,2\}$ en $\{2,1\}$. Dus de kans op '3' is al twee keer zo groot als '2', $2*(\frac{1}{6}*\frac{1}{6}) = \frac{1}{18} = .056$.
De kansverdeling van deze twee steekproeven is dus niet gelijk aan de kansverdeling van de steekproef. Deze is nu namelijk:
$$\{ \frac{1}{36}, \frac{1}{18}, \frac{1}{12}, \frac{1}{9}, \frac{5}{36}, \frac{1}{6}, \frac{5}{36}, \frac{1}{9}, \frac{1}{12}, \frac{1}{18}, \frac{1}{36} \}$$
Merk op dat deze verdeling lijkt op de verdeling die je misschien al uit de cursus kent: de grootste kans is het centrum van de verdeling, 1/6, en wel voor het gooien van opgeteld ‘7’ in twee steekproeven. Dit komt omdat er meer manieren zijn om ‘7’ te gooien, namelijk, $\{1,6\}\{2,5\}\{3,4\}\{4,3\}\{5,2\}\{6,1\}$, dan er manieren zijn om een der andere opgetelde uitkomsten te gooien. De kans neemt ongelijkmatig af naarmate we verder van het centrum zijn. Omdat we hier spreken over een verzameling van telbare gebeurtenissen noemen we deze verdeling een binomiaal verdeling. Wanneer we een oneindig aantal dobbelstenen gooien, dus oneindig aantal steekproeven ‘trekken’ uit de uniforme verdeling, dan gedragen de opgetelde steekproeven zich vergelijkbaar met als hierboven beschreven, maar de ontelbare variant van de binomiale verdeling heet de normaal verdeling.
Het bovenstaande proces is een wiskundige wetmatigheid; ongeacht de steekproefverdeling, al dan niet uitgedrukt in een bekende (wiskundige) kansverdeling, zal de verdeling van de optelling van steekproeven naar een normaal verdeling neigen. Deze wiskundige wetmatigheid noemen we de Centrale Limietstelling. Er zijn vele voetnoten, mitsen, en maren, maar die zal ik gemakshalve niet behandelen in dit antwoord (*).
Dus: Een kansverdeling is een wiskundige beschrijving van het gedrag van één random variabele (de nadruk voorkomt hopelijk dat wiskundigen mij verwijten de joint probability distributions niet te kennen). Ieder individu in de steekproef wordt getrokken uit deze verdeling, dus kan een gebeurtenis vertonen met een bepaalde kans. De steekproefverdeling is een overzicht van het gedrag van vele individuen, ieder een gebeurtenis naar een kansverdeling. De verdeling van deze verzameling individuen is (in de meeste gevallen) ons onbekend en we hopen vaak dat de populatie waar wij een steekproef uit trekken zich gedraagt naar de wiskundige verdeling die wij in gedachten hadden. De optelling van meerdere steekproeven noemen wij de steekproevenverdeling en zolang iedere steekproef voldoende N heeft ($N > 30$), en de steekproefverdeling niet overdreven afwijkt van een normaal verdeling, dan zal de steekproevenverdeling normaal verdeeld zijn
*. Korte samenvatting van de mitsen en maren: een normaal verdeling is theoretisch niet alleen oneindig, maar loopt ook van min-oneindig tot plus-oneindig. populaties met harde onder- of bovengrenzen, of extreem scheve verdelingen, zullen geen normaal verdeling vertonen in een steekproevenverdeling.