Momenteel loop ik ook tegen dezelfde vraag aan. Gaat het toch wel over het meest rechter plaatje in figuur 2.2.10? Het is een histogram met 1 datapunt, X-as waarde 1. Toegevoegde density plot in die figuur lijkt op dat specifieke datapunt niet hoger te komen als 0.4 of 0.5 in de Y-as "count". Het totale bereik op de X-as loopt van -1 naar 3. 4 eenheden (in de tekst wordt bij het refereren aan het voorbeeld gesproken over 2 eenheden, wat ik ook niet kan plaatsen).
Het is me in ieder geval nog niet duidelijk hoe er nu precies op een dichtheid van 1.6 gekomen wordt bij die figuur. Met wat fantasie zou het er op kunnen lijken dat er gesproken wordt over het gedeelte onder de blauwe lijn, en dat de dichtheid/oppervlakte van dat gedeelte 1.6 is.
Volgens mijn interpretatie van de theorie in de reader, en verdere uitleg op internet, zou de oppervlakte van het volledige gedeelte onder de blauwe lijn echter altijd 1 moeten zijn. Als je het volledige gedeelte selecteert, kijk je immers ook naar het totaal aantal datapunten.
Ik vraag me dus toch af hoe er op een dichtheid van 1.6 gekomen wordt? Zou het iets moeten zijn wat zo af te lezen is uit de grafiek? Of is er een berekening die uitgevoerd moet worden?
Daarnaast is het me ook niet duidelijk hoe dichtheid zich verhoudt tot de oppervlakte. In een eerder antwoord wordt beschreven dat de oppervlakte altijd 1 is, maar dat er daarbij prima een dichtheid van 100 kan zijn. In de reader wordt echter het volgende geschreven over dichtheid:
"Bij een hele ‘brede’ variabele, zoals leeftijd (die immers van 00 tot 99 loopt), is de maximale dichtheid relatief laag; de totale dichtheid van 1 moet immers over een hoop getallen worden verdeeld."
Klopt het dan dat de dichtheid eigenlijk een soort percentage is van het totaal? En dat oppervlakte en dichtheid eigenlijk hetzelfde zijn?