Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Ik begrijp de p-waarden in figuur 5.4.2. niet

0 leuk 0 niet-leuks
Ik loop vast bij figuur 5.4.2. Hierin worden de verdelingen aangegeven van bèta, en dan worden er conclusies getrokken op basis van deze getekende rode (oranje) gebieden over de nulhypothese-verwerping.

Mijn vragen zijn:

Ik begrijp niet goed hoe die rode/oranje gebieden tot stand gekomen zijn in dit geval (ik begrijp wel wat een p-waarde is, maar niet hoe deze in dit geval wordt berekend).  Mis ik een denkstap?

En waarom zijn de gebieden zo verschillend in grootte, terwijl de verdelingen er zo hetzelfde uitzien op de x-as (of is dat een fout: in module 5.2 is de x-as van de "bèta pijnlijke gezichten" anders, daar ligt het maximum bij 0,4 - dat zou ook logischer zijn, dan begrijp ik ook dat de nulhypothese wordt verworpen).
gevraagd 2 januari in Inleiding Data Analyse (IDA) door Mariette Bliekendaal (130 punten)
bewerkt 2 januari door Mariette Bliekendaal

1 Antwoord

1 leuk 0 niet-leuks

Beste Mariette,

In figuur 5.2.3 staan de steekproevenverdelingen voor de twee regressiecoefficienten als deze coëfficiënten in de populatie dezelfde waarde zouden hebben als in de steekproef. De info onder figuur 5.2.3 is belangrijk hierbij:

"De ‘echte’ steekproevenverdeling waar de regressiecoëfficiënten uit komen kennen we niet. Die is gecentreerd rondom de populatie-waarden van de regressiecoëfficiënten, en die kennen we niet (als we de populatiewaarden zouden kennen, hadden we immers geen steekproef hoeven nemen). Daarom zijn deze steekproevenverdelingen gecentreerd op de puntschattingen uit onze steekproef. Net als bij andere steekproefwaarden helpt deze steekproevenverdeling ons echter wel om het betrouwbaarheidsinterval van een regressiecoëfficiënt te berekenen (...)."

Jouw vraag gaat over de steekproevenverdelingen uit figuur 5.4.2. Dit zijn nulverdelingen. Dat wil zeggen dat ze gecentreerd zijn om de waarde nul. Verder hebben ze idd dezelfde vorm (want die is t-verdeeld waarbij de specifieke vorm afhankelijk is van het aantal vrijheidsgraden dat wordt bepaald door de grootte vd steekproef). Deze steekproevenverdelingen die zijn gecentreerd om de nul gebruik je bij nulhypothesesignificantietoetsing (NHST) om te bepalen of de beta's statistisch significant zijn. Daarbij kijk je naar de p-waarde van een toetsingsgrootheid (hier: beta) die je vergelijkt met een vooraf bepaald criterium (significantieniveau, vaak wordt dit op .05 gezet). De p-waarde is de kans dat je de toetsingsgrootheid (hier: beta) gebaseerd op jouw steekproef of extremer vindt, gegeven dat de nulhypothese waar is; in andere woorden: gegeven dat in de populatie de beta 0 is). De p-waarde (die dus in je output van SPSS of R verschijnt) wordt afgeleid uit de nulverdeling. Deze p-waarde correspondeert namelijk met de oppervlakte onder de nulhypothese voor (in dit geval) een beta met de grootte zoals je die in de steekproef hebt gevonden of extremer. De rode/oranje gebieden zijn dus de gebieden die corresponderen met de p-waarde. Aangezien de bèta voor pijnlijke gezichten verschilt van die voor blije gezichten, verschillen de rode/oranje gebieden en daarmee de p-waarde die hoort bij de bèta's.

beantwoord 11 januari door Jenny van Beek (1,680 punten)
Ah, ik zie het verschil nu, het gaat om de nulhypothese-verdeling en niet in de beta gevonden in de steekproef. Dat was even goed lezen! Dank je wel.
...