Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

klopt het histogram van 2.2.5 wel

0 leuk 0 niet-leuks
Als het eerste balkje uit figuur 2.2.5 dan de range van 0-10 aangeeft, hoe kan het dan dat de count nauwelijks boven de 1000000 uitkomt? Ik zou zeggen (want ik moet deze figuur toch beschouwen als hetzelfde als figuur 2.2.4 maar dan met niet range 1 maar range 10?) dat die richting 1800.000 zou moeten lopen en ook niet zoveel zou moeten verschillen van het tweede blokje dat dan de count tussen 10-20 weergeeft. Een blokje dat er bovendien ook te hoog uitziet (zij het wel minder te hoog dan bij 1)

Lees ik het nu alsnog verkeerd?
gerelateerd aan een antwoord op: Hoe moet ik de histogrammen lezen
gevraagd 22 mei 2019 in Inleiding Data Analyse (IDA) door ellen davids (390 punten)

1 Antwoord

0 leuk 0 niet-leuks
Dit klopt wel toch?

De getallen bij de 'breaks' van de Y-as in 2.2.5 zijn tien keer zo groot als in 2.2.4. En de klassebreedte is tien keer zo groot. Dus er zitten tien keer zoveel mensen in elke klasse; dat klopt dus precies.

Die grafieken worden gegenereerd door een computer - ze kloppen dus sowieso, natuurlijk. Kleine verschillen zijn geen probleem, die komen vaak door kleine verschillen in algoritmen etc. Zoals we in deze cursus duidelijk proberen te maken is het een illusie dat je accuraat kunt schatten, dus kleine afwijkingen zijn nooit reden tot zorg. Als er grote afwijkingen zijn, is dat wel reden tot zorg. (En natuurlijk zijn dit soms handige indicaties dat je iets nog niet snapt, zoals nu.) Als je precies wil begrijpen wat er nu exact gebeurt, gooi dan R even open en ga klooien met histogrammen. Dan krijg je vanzelf grip op wat er precies gebeurt.
beantwoord 22 mei 2019 door gjp (69,380 punten)
(Nou ja. Niet vanzelf. Maar wel onherroepelijk na verloop van tijd, wat een soort van 'vanzelf' is :-))
Kunt u nog een keer naar die grafiek kijken want ik had al begrepen dat in fig 2.2.5 de klassebreedte 10 keer zo groot was en ook dat de y as tien keer zo groot is in vergelijking met 2.2.4. Dat doet niets af aan dat de grafiek niet klopt in mijn ogen. De eerste 10 leeftijden in figuur 2.2.4 komen alle tien ver boven de 150.000 uit  (ongeveer 180.000 zo op het zicht gemiddeld) en dus als je die samen neemt in fig 2.2.5 zou je op de y as ook een waarde moeten zien van 10 keer zoveel en dus ongeveer 1800000. nu staat daar iets meer dan 1000000. En dat klopt dan dus toch niet?

O excuus ik snap het eindelijk denk ik. Ik had uw antwoord op een eerdere vraag over dezelfde grafiek niet helemaal begrepen. Een leeftijd van - 5 bestaat niet vroeg ik en dat klopte gaf u aan. Die 0 was de onderste waarde van de range zei u en dus dacht ik dat van die andere getallen ook gold dat het de onderste waarde was en dat ik grafiek moest lezen als van 0 -10 /10 - 20/20/30 maar dan gewoon super raar danwel slordig opgetekend. Nu begrijp ik dat het anders is? Dat je dus dat ook al bestaat - 5 niet je wel een range mag maken van - 5 tot 5 en dat ik de volgende range dan moet lezen 6 - 16 en 17 - 27 enzovoort
...