Het missende inzicht is: frequenties kunnen zowel absoluut als relatief zijn. Absolute (ruwe) frequenties zijn gewoon de aantallen. Het huis-, tuin-, en keukenconcept dus. Een voorbeeld, met fruit (het is tenslotte griep-seizoen). Als je R hebt kun je zelf meeklooien:
> fruit <- c(rep('appels', 3), rep('peren', 5), rep("kiwi's", 2), rep('bananen', 4))
> freq(fruit)
Frequencies Perc.Total Perc.Valid Cumulative
appels 3 21.4 21.4 21.4
bananen 4 28.6 28.6 50.0
kiwi's 2 14.3 14.3 64.3
peren 5 35.7 35.7 100.0
Total valid 14 100.0 100.0
Als ik jou deze 14 stukken fruit zou geven, en ik vraag "hoeveel appels heb je?", dan vraag ik naar de absolute frequentie.
Als ik zou vragen "hoeveel procent van het fruit is appel?" (en dat soort vragen stel ik nogal eens, vanzelfsprekend :-)), dan is dat de relatieve frequentie. Jij zou dan (hoop ik) "21.4 procent" antwoorden.
Stel nu dat jij zelf toevallig al fruit in huis had gehad. Als ik je dan vraag "hoeveel procent van je totale hoeveelheid fruit is nu appel?" (ook geen vreemde vraag, zou je zeggen :-)), dan antwoord jij bijvoorbeeld "38.2 procent". Dan heb ik nog geen idee hoeveel appels je hebt, of hoeveel fruit je nu in totaal hebt. Ik weet alleen dat je minimaal 14 stuks fruit hebt (ok, en ik kan uitrekenen hoeveel appels je minimaal thuis gehad moet hebben om op 38.2% uit te komen; maar je zou zomaar veel meer appels + ander fruit kunnen hebben, dus ik weet eigenlijk niks). Die relatieve frequentie vertelt me dus niets over het totale aantal.
Als ik jou nu naar de absolute frequentie had gevraagd ("hoeveel appels heb je nu?"), dan had je bijvoorbeeld "13" gezegd. Dan had ik geweten dat je zelf al 10 appels had (dan had je die 3 van mij ook niet nodig kennelijk, die had ik dan beter zelf kunnen houden :-)). En als ik dan had geweten dat die 13 appels 38.2% van het totale aantal appels was, dan had ik geweten dat 100% gelijk is aan 34 stuks fruit ($13 / .382 = 34$).