Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Beste,

Ik heb al een vermoeden naar het antwoord, maar toch zou ik graag meer zekerheid willen over hoe ik nou de P-waarde moet vinden omdat ik bang ben dat ik wellicht de manier om hier achter te komen fout geïnterpreteerd hebt.
Zelf denk ik nu dus dat de P-waarde gelijk staat aan de uitkomst van de T-toets (al moet dit nog vermenigvuldigd worden met 100 om een percentage te krijgen). Klopt dit?

Alvast heel erg bedankt.

Met vriendelijke groet,

L. Nowak
Studiecentrum Heerlen
in Bivariate statistiek door (500 punten)
bewerkt door

2 Antwoorden

1 leuk 0 niet-leuks
 
Beste antwoord

Een t-waarde (of een F-waarde, of een Chi-kwadraat-waarde, of een Pearson r-waarde) heeft een bepaalde kans om voor te komen als de eigenlijke t-waarde in de populatie eigenlijk 0 is (of de eigenlijke F-waarde 1 is, of de eigenlijke Chi-kwadraat waarde 1 is, of de eigenlijke Pearson r-waarde 0 is). Die kans is de p-waarde (p van probability).

Deze kun je uitrekenen met Excel, met de functie TDIST voor t-waarden, FDIST voor F-waarden, en CHIDIST voor chi-kwadraat waarden. Zoals Luc al aangeeft moet je dan ook de bijbehorende vrijheidsgraden ingeven. De Pearson r-verdeling zit niet in Excel; daarvoor moet je de correlatie eerst omrekenen naar de t-waarde met:

$$t = r\sqrt{\frac{n-2}{1 - r^2}}$$

In R kun je de functies pt, pf en pchisq gebruiken, waarbij je ook de vrijheidsgraden moet specificeren. R heeft de Pearson r verdeling wel, in package SuppDists.

Houd er met het gebruik van deze functies rekening mee dat je de oppervlakte onder de verdeling krijgt. Voor een t-waarde van 4 met 10 vrijheidsgraden krijg je dus een hele GROTE p-waarde, hoewel dit erg significant is. Je moet dan zelf bedenken dat dit, omdat het een positieve t-waarde is, 'verkeerd om' is. Een oplossing is om positieve t-waarden altijd negatief te maken voordat je de p-waarde erbij zoekt. Verder moet je deze p-waarden altijd verdubbelen, omdat je altijd tweezijdig toetst (zie de uitleg in andere vragen in dit systeem).

Stel dat je een t-waarde hebt van 4 met 10 vrijheidsgraden; dan kun je het volgende doen:

> pt(4, 10)
[1] 0.9987408

 

Dit is dus verkeerd om; we moeten de kans op een t groter dan 4 hebben, niet kleiner. Dus:

> 1-pt(4, 10)
[1] 0.001259166

 

Dat is al beter. Nu nog verdubbelen, omdat de p-waarde de kans is op een extremere t-waarde, niet alleen groter of kleiner; dus we moeten de kans op een t kleiner dan -4 hier bij optellen. Omdat de t-verdeling symmetrisch is, is de kans op een t kleiner dan -4 even groot als de kans op een t groter dan 4:

> 2*(1-pt(4, 10))
[1] 0.002518333

 

En there you go.

door (77.8k punten)
geselecteerd door
0 leuk 0 niet-leuks

De t-waarde moet je omzetten in een p-waarde. Die omzetting hangt naast de t-waarde af van het aantal vrijheidsgraden. Er bestaan omzettingstabellen, maar het eenvoudigst is om dit allemaal door een programma als SPSS te laten uitrekenen.

Luc

door (7.9k punten)
...