Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Berekening interkwartielafstand

0 leuk 0 niet-leuks
Ik heb een vraag omtrent interkwartielafstand (IQR). Het eerste voorbeeld waar de leeftijden gesorteerd zijn van laag naar hoog klopt naar mijn inziens het antwoord 6 niet. De mediaan is volgens mij 24+24=45 /2=24. Aan beide zijden blijven dan 10 getallen over, dat betekent dat ik in het eerste deel om Q1 te berekenen vijfde en zesde getal heb genomen. Dit heb ik opgeteld en gedeeld door twee en dan kom ik op het antwoord 19.5. Q3 is 25. Volgens mij moet het antwoord dan 5.5 zijn. Ik heb deze berekening gemaakt aan de hand van de uitleg. Als ik deze berekening toepas op het tweede voorbeeld dan klopt mijn antwoord wel.

In afwachting van een reactie.   

Met vriendelijke groet,

Simone Sijben
gevraagd 22 november 2016 in Univariate (descriptieve) statistiek door Sanne Sijben (160 punten)

1 Antwoord

0 leuk 0 niet-leuks

Je hebt gelijk, dit stond fout in de stof. Ik heb dit gecorrigeerd. Dit komt omdat achter de schermen de IQR werd berekend met deze formule:

Q1 <- mediaan(x[x < mediaan(x)]);
Q3 <- mediaan(x[x > mediaan(x)]);
IQR <- Q3 - Q1;

Oftewel, de handmatige berekening werd letterlijk gevolgd: eerst pak je de mediaan van de datareeks (`x`). Dan pak je de 'mediaan' van de scores die lager zijn dan de echte mediaan (Q1) en de 'mediaan' van de scores die hoger zijn dan de echte mediaan (Q3). Het verschil is de IQR.

Dat is precies wat je met de hand doet, en lijkt op het eerste gezicht te werken.

Totdat de mediaan niet tussen twee getallen in ligt. In het geval van leeftijd was de mediaan inderdaad 24, want zowel het tiende als het elfde datapunt was 24 (en het twaalfde, trouwens). Dat betekent dat er minder dan 10 datapunten in de datareeks zitten die kleiner zijn dan de mediaan (alleen de eerste negen datapunten), en minder dan 10 datapunten die groter zijn dan de mediaan (alleen de laatste acht datapunten). Als je daar vervolgens de mediaan van neemt, is de kans dus groot dat je niet op Q1 en Q3 uitkomt. Dit is nu aangepast.

Bedankt voor de observatie dus, en excuses voor de fout!

beantwoord 23 november 2016 door gjp (66,040 punten)
...