Kan ik de kans op een bepaalde correlatie (in een steekproevenverdeling van Pearson's r) zelf berekenen (IDA fig. 4.3.3)

Question

Kan ik de kans op een bepaalde correlatie (in een steekproevenverdeling van Pearson's r) zelf berekenen (IDA fig. 4.3.3)

Fig. 4.3.3: "De kans op een correlatie die zo klein is of kleiner dan die die wij hebben gevonden in onze steekproef (-.07) zou 13% zijn". Kan ik deze zelf berekenen en zo ja hoe? Ik heb in de appendix van Field gekeken, en heb bij een 'smaller portion' (-1.0 tot -.07) van .07078 een y waarde van .1354 (= 13%?) gevonden, en bij een 'smaller portion' van .06944 en y waarde gevonden van .1334 (ook rond 13%?). Is dit wel een kansberekening/de goede denkrichting of moet ik deze kans op een heel andere manier berekenen?

gerelateerd aan een antwoord op: bij 4.5 bij figuur 4.5.2 Wat betekent precies: de kans dat we een correlatie van -0,7 of lager vinden?

gevraagd 6 december 2017 in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door 851691638 (260 punten)

1 Antwoord

gjp · Answer 1 · 2017-12-07T07:53:20+0000

Volgens mij staat in de appendix van Field niet de verdeling van Pearson's $r$. Ik weet niet precies bij welke verdeling jij hebt gekeken?

Er zijn twee manieren om de kans op een gegeven correlatie te vinden. De eerste manier is om die verdeling van Pearson's $r$ te gebruiken. Doe hiervoor het volgende.

Start R Studio op.
Voer dit commando uit om het package 'SuppDists' te installeren:

install.packages('SuppDists');
Voer dit commando uit om het package te laden:

require('SuppDists');
En dan kun je de kans op een gegeven waarde van $r$ berekenen met:

pPearson(.3, N = 100, rho = 0, lower.tail=FALSE)
Voor de help-pagina, type:

?pPearson

Bij die pPearson functie specificeer je de volgende drie parameters (argumenten):

De correlatie waar je in geinteresseerd bent;
De steekproefomvang (N);
De correlatie in de populatie (rho; dus rho=0 als je nulhypothesetoetsing uitvoert, maar dit kan ook een andere waarde zijn als je met een andere hypothetische populatiecorrelatie wil werken)
Of je de kans op een kleinere (lower.tail=TRUE) of grotere (lower.tail=FALSE) correlatie wil vinden

Hiermee kun je de exacte kans vinden dat je een gegeven correlatie vindt in een steekproef van een gegeven omvang, onder aanname dat er in de populatie een gegeven correlatie is:

> pPearson(.3, 100, lower.tail=FALSE);
[1] 0.00115782

De tweede manier maakt gebruik van de samenhang tussen de verdeling van Pearson's $r$ en die van Student's $t$:

$$t = r\sqrt{\frac{n-2}{1 - r^2}}$$

Die $t$-waarde is verdeeld volgens $n-2$ vrijheidsgraden. De kans op die $t$-waarde kun je vervolgens opzoeken met de tabel in Field, of in R met de pt functie, waarbij je de $t$-waarde, het aantal vrijheidsgraden (df), en weer lower.tail specificeert. Bijvoorbeeld:

$$t = r\sqrt{\frac{n-2}{1 - r^2}} = .3 \sqrt{\frac{100-2}{1 - .3^2}} = 3.11$$

> pt(3.11, 98, lower.tail=FALSE);
[1] 0.001225053

(Ik heb de $t$-waarde afgerond; bovendien worden er verschillende formules gebruikt, dus kleine verschillen kunnen voorkomen. Zie ook deze vraag.)

Categorieën

Kan ik de kans op een bepaalde correlatie (in een steekproevenverdeling van Pearson's r) zelf berekenen (IDA fig. 4.3.3)

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.

Gerelateerde vragen

Categorieën

Kan ik de kans op een bepaalde correlatie (in een steekproevenverdeling van Pearson's r) zelf berekenen (IDA fig. 4.3.3)

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.