Volgens mij staat in de appendix van Field niet de verdeling van Pearson's $r$. Ik weet niet precies bij welke verdeling jij hebt gekeken?
Er zijn twee manieren om de kans op een gegeven correlatie te vinden. De eerste manier is om die verdeling van Pearson's $r$ te gebruiken. Doe hiervoor het volgende.
- Start R Studio op.
- Voer dit commando uit om het package 'SuppDists' te installeren:
install.packages('SuppDists');
- Voer dit commando uit om het package te laden:
require('SuppDists');
- En dan kun je de kans op een gegeven waarde van $r$ berekenen met:
pPearson(.3, N = 100, rho = 0, lower.tail=FALSE)
- Voor de help-pagina, type:
?pPearson
Bij die pPearson functie specificeer je de volgende drie parameters (argumenten):
- De correlatie waar je in geinteresseerd bent;
- De steekproefomvang (N);
- De correlatie in de populatie (rho; dus rho=0 als je nulhypothesetoetsing uitvoert, maar dit kan ook een andere waarde zijn als je met een andere hypothetische populatiecorrelatie wil werken)
- Of je de kans op een kleinere (lower.tail=TRUE) of grotere (lower.tail=FALSE) correlatie wil vinden
Hiermee kun je de exacte kans vinden dat je een gegeven correlatie vindt in een steekproef van een gegeven omvang, onder aanname dat er in de populatie een gegeven correlatie is:
> pPearson(.3, 100, lower.tail=FALSE);
[1] 0.00115782
De tweede manier maakt gebruik van de samenhang tussen de verdeling van Pearson's $r$ en die van Student's $t$:
$$t = r\sqrt{\frac{n-2}{1 - r^2}}$$
Die $t$-waarde is verdeeld volgens $n-2$ vrijheidsgraden. De kans op die $t$-waarde kun je vervolgens opzoeken met de tabel in Field, of in R met de pt functie, waarbij je de $t$-waarde, het aantal vrijheidsgraden (df), en weer lower.tail specificeert. Bijvoorbeeld:
$$t = r\sqrt{\frac{n-2}{1 - r^2}} = .3 \sqrt{\frac{100-2}{1 - .3^2}} = 3.11$$
> pt(3.11, 98, lower.tail=FALSE);
[1] 0.001225053
(Ik heb de $t$-waarde afgerond; bovendien worden er verschillende formules gebruikt, dus kleine verschillen kunnen voorkomen. Zie ook deze vraag.)