Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

aanmaken van groepen voor een histogram

0 leuk 0 niet-leuks

Dank u wel : een zeer interessant antwoord. Maar er kunnen wel redenen zijn om toch te gaan indelen in groepen. Ik bekijk het dan even los van het testen van een hypothese maar bevoorbeeld vanuit de beschrijvende statistiek. Ik dacht aan een grillig histogram of een histogram met heel veel kolommen. Je zou kunnen tot doel  hebben om dit eenvoudiger voor te stellen door gebruik te maken van een gegroepeerde veranderlijke. Dan zou een eerste stap kunnen zijn om het verschil tussen de grootste waarde en de kleinste gelijkmatig in te delen in het gewenst aantal delen-blijkbaar typisch drie of vier- en dezen te gebruiken als groepen met als voorwaarde dat  de groepen niet abnormaal veel of abnormaal weinig tellingen bevatten. Dus de schaal te gebruiken. Lijkt je dit een logische manier om het te doen? Ik las  hier en daar waarschuwingen voor niet gelijkmatig ingedeelde groepen. Dan zou het gebruik maken van percentielen om indelingen te maken niet de methode zijn die op de eerste lijn staat.mvg Jan De Smet    

gevraagd 18 oktober 2013 in Kwantitatieve Data Analyse (KDA) door Jan DS (330 punten)

1 Antwoord

1 leuk 0 niet-leuks

Er zijn hier eigenlijk twee antwoorden op.

Het eerste is dat voor continue variabelen, je ook zogenaamde 'density plots' kunt bestellen. Dit zijn simpelweg lijnen die het aantal meetwaarden weergeven voor de verschillende waarden op de X-as. De normaalverdeling die je vaak tegenkomt is een voorbeeld van zo'n density plot. Omdat er bij interval-variabelen geen groepen zijn, kun je argumenteren dat indeling in balkjes, zoals bij een histogram gebeurt, niet correct is, en een density plot dus beter is dan een histogram.

Het tweede antwoord is dat programma's die histogrammen tekenen, al algoritmen bevatten om zgn te 'binnen'. 'Binnen' kun je ongeveer beschouwen als indeling in subgroepen bij een interval-variabele. Dit wordt vaak gedaan op basis van het aantal balkjes dat je wil hebben; en dan wordt de schaal verdeeld in even brede intervallen (dus niet op basis van de percentielen).

Wat ikzelf de beste oplossing vind is een histogram te plotten en daar een density-lijntje overheen te zetten. De manier van 'binning' wordt dan minder belangrijk, omdat je ook de density kunt zien. Ik moet toegeven dat ik dat nog nooit heb geprobeerd in SPSS, maar dat kan vast wel; in R is het in elk geval vrij eenvoudig, zie http://www.statmethods.net/graphs/density.html

beantwoord 21 oktober 2013 door gjp (63,910 punten)
...