Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Wat zijn density plots? In de woordenlijst staat dit niet vermeld. Wel staat plots vermeld. Is dat hetzelfde?

0 leuk 0 niet-leuks
gevraagd 29 november 2017 in Inleiding Data Analyse (IDA) door Demelza (180 punten)

1 Antwoord

0 leuk 0 niet-leuks
Plots zijn grafieken. Density plots is een bepaald soort grafiek, in het Nederlands dichtheidsfunctie. Density plots zijn grafieken, waarmee onder andere de kans kan worden berekend dat een variabele onder een bepaalde waarde ligt. De totale oppervlakte onder de density plot is altijd gelijk aan 1, ofwel 100%. De kans dat de variabele waarvan de density plot wordt weergegeven kleiner is dan een bepaalde waarde, zeg (abstract weergegeven met) W* (maar praktisch kun je bijvoorbeeld denken aan de kans dat de gemiddelde leeftijd lager is dan bijvoorbeeld 40 jaar), is dan gelijk aan de oppervlakte onder de density plot vanaf het linkeruiteinde van de plot tot aan die waarde W* (in het voorbeeld tot aan de leeftijd van 40 jaar).
Als een variabele is geschat op zeg 2,5 en je zou bijv. een nul hypothese significantie toets willen doen, dan wil je de kans berekenen dat die variabele in jouw steekproef van zeg 20 datapunten wordt geschat op 2,5 of hoger of -2,5 of lager, indien wordt aangenomen dat het populatiegemiddelde nul is.
Als je dan de density plot hebt, kun je de oppervlakte onder de density plot tot aan 2,5 uitrekenen. Die is bijvoorbeeld 97%, hetgeen betekent dat bij een populatiegemiddelde van nul er een kans van 97% is dat de schatter op basis van de steekproef met 20 datapunten kleiner dan 2,5 is. Omgekeerd betekent dat, dat de kans dat de schatter groter of gelijk aan 2,5 is, gelijk is aan 100% - 97% = 3%. Visueel is dat de oppervlakte onder de density plot vanaf 2,5 tot aan het rechteruiteinde. Omdat bij de nul hypothese significatie toets tweezijdig wordt getoetst en de vraag dus niet is hoe groot de kans is dat de schatter groter of gelijk aan 2,5 is, maar hoe groot de kans is dat de schatter zo extreem is dat die ofwel groter of gelijk aan 2,5 is, ofwel kleiner of gelijk aan -2,5, moet je ook de oppervlakte vanaf het linkeruiteinde tot aan -2,5 onder het density plot uitrekenen. Aannemende dat de density plot symmetrisch (gespiegeld) is om de waarde nul, zal de oppervlakte onder dat stukje van het linkeruiteinde tot aan -2,5 gelijk zijn aan de oppervlakte vanaf +2,5 tot het rechteruiteinde. De kans daarop is dan dus ook 3%. De totale kans om een zo extreme waarde als -2,5 of lager, of +2,5 of hoger te vinden indien het populatiegemiddelde daadwerkelijk nul is en je een steekproef van 20 hebt, is dan dus 3% + 3% is 6%. Meestal kiest men als alpha (ook kritieke p-waarde genoemd) een kans van 5% (0.05). Dat wil zeggen dat als de berekende kans op de waarde van de schatter onder de nulhypothese kleiner of gelijk aan 5% is, dat het dan wel heel toevallig zou zijn dat die kans zich juist bij jouw steekproef van 20 voor zal hebben gedaan. Omdat dat dan zo toevallig is, neemt men aan dat de aanname dat de schatter in de populatie de waarde nul heeft, wel niet zal kloppen en zegt men dat de schatter significant van nul afwijkt. Hier was de kans op -2,5 of lager, of +2,5 of hoger 6%, en dus niet zo enorm toevallig. En in het voorbeeld kan de nulhypothese, de hypothese dat de schatter in de populatie daadwerkelijk nul is niet worden verworpen.
beantwoord 3 december 2017 door 85186EMV! (810 punten)
...