Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Heb ik nu NHST, alpha en p-waarde eindelijk door?

0 leuk 0 niet-leuks

Dank voor je uitgebreide antwoord en de tip dit echt goed te moeten begrijpen. Hierbij dan nog een (vervolg)poging:

.1. NHST draait om de p-waarde : p-waarde is de kans dat het verband (r) in een steekproef minstens zo sterk is als het door de onderzoeker gevonden verband; en dit onder de aanname van de nulhypothese. 

.2. onder de aanname van de NHST neem je eerst dus aan dat de kans (een verband te vinden) daarop 0 is --> de NULhypothese.

.3. je wilt toetsen of dit klopt, de NHST.

.4. nodig : alpha=kritieke p-waarde

.5. de kritieke p-waarde staat vast: 5% = 0.05 (of wordt aangegeven door de onderzoeker)

.6. als de gevonden p-waarde kleiner of gelijk aan (dus minstens zo sterk) is als de alpha, mag de nulhypothese worden verworpen

gerelateerd aan een antwoord op: Vraag over NHST, 4.6
gevraagd 19 januari 2017 in Inleiding Data Analyse (IDA) door 851928612 (1,800 punten)
Over punt 1: de p-waarde kan voor vele maten gelden, niet alleen voor de correlatie.

Over punt 2: we gaan er niet vanuit dat de kans op een waarde 0 is, we gaan er vanuit dat de waarde zelf 0 is, resp. er bestaat geen verband of verschil. Hierna vind je een waarde voor dit verband of verschil, en middels de p-waarde kijk je hoe waarschijnlijk dit is onder aanname van de nul-hypothese. Als dit zo onwaarschijnlijk is (p < alpha), gaan we er vanuit dat de nul-hypothese niet waar is, en wordt deze verworpen.

1 Antwoord

0 leuk 0 niet-leuks

Bijna, heel goed!

Alleen "p-waarde is de kans dat het verband (r) in een steekproef minstens zo sterk is als het door de onderzoeker gevonden verband" klopt niet. Dit moet zijn:

De $p$-waarde is de kans dat een verband van minstens de omvang zoals dat is gevonden in de steekproef wordt gevonden, als de nulhypothese waar is.

Dat laatste ($H_0$ waar) betekent dat je er vanuit gaat dat het verband in de populatie afwezig is, dus bijvoorbeeld een $r=0$, een $d=0$, of een $F=1$. (De nulhypothese zegt dus niet altijd dat alles nul is! Hij zegt dat het verband afwezig is - maar bij de $F$-toets geldt bijvoorbeeld dat $F$ dan 1 is, niet 0.)

De kritieke $p$-waarde staat niet vast trouwens. Die bepaal je als onderzoeker zelf voordat je data gaat verzamelen. Maar: de meeste mensen gebruiken $.05$; en de meeste mensen realiseren zich niet dat dat een keuze is.

Heel belangrijk: blijf denken in termen van de steekproevenverdeling. Bij de correlatie, $r$, dus de effectgrootte voor het verband tussen twee intervalvariabelen, is dat dus bijvoorbeeld (met 20 deelnemers) 4.5.1:

De $r$ die je in je steekproef gaat vinden (of hebt gevonden) komt uit deze verdeling, als je steekproef tenminste 20 deelnemers heeft, en als de nulhypothese klopt, oftewel, als het verband (de $r$) in de correlatie inderdaad gelijk is aan 0.

Toeval bepaalt wat de waarde van je $r$ in je steekproef precies wordt. De kans dat je door toeval een hele hoge of lage $r$ vindt is natuurlijk laag: er bestaat in de populatie immers geen effect. Je zou dan dus toevallig allemaal mensen moeten vinden die puur door toeval op beide variabelen hoog of laag scoren, en die kans is niet groot (maar wel aanwezig).

Die kans is de $p$-waarde: de kans op jouw $r$ (in je steekproef), berekend op basis van de aanname dat deze steekproevenverdeling zoals hij hierboven staat, klopt. Als je dus een correlatie vindt van $.51$, dan is dit het deel van de verdeling dat hoort bij een correlatie van $.51$ of extremer (dus lager dan $-.51$ of hoger dan $.51$):

(dit is figuur 4.5.5)

Die oppervlakte is de $p$-waarde: de proportie van alle mogelijke $r$'s die je had kunnen vinden, aangenomen dat deze steekproevenverdeling klopt. Als er in de populatie wel een verband is, dus als de populatie-$r$ kleiner of groter is dan 0, dan klopt die steekproevenverdeling niet, en dan klopt de berekende $p$-waarde ook niet.

Daarom verwerp je de steekproevenverdeling als je een hele lage $p$-waarde vindt: je leidt dan af dat je die $p$-waarde waarschijnlijk verkeerd hebt berekend: oftewel, dat een van je aannames niet kloppen: en omdat we zeker weten dat de vorm en breedte van de steekproevenverdeling kloppen, is de meest waarschijnlijke aanname die niet klopt, de plek waar die steekproevenverdeling is geankerd op de X-as. Die is dus waarschijnlijk helemaal niet gecentreerd op 0, maar op een lagere (negatieve $r$) of hogere (positieve $r$) waarde.

beantwoord 20 januari 2017 door gjp (63,760 punten)
...