Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Kan ik de kans op een bepaalde correlatie (in een steekproevenverdeling van Pearson's r) zelf berekenen (IDA fig. 4.3.3)

0 leuk 0 niet-leuks
Fig. 4.3.3: "De kans op een correlatie die zo klein is of kleiner dan die die wij hebben gevonden in onze steekproef  (-.07) zou 13% zijn". Kan ik deze zelf berekenen en zo ja hoe? Ik heb in de appendix van Field gekeken, en heb bij een 'smaller portion' (-1.0 tot  -.07) van .07078 een         y waarde van .1354 (= 13%?) gevonden, en bij een 'smaller portion' van .06944 en y waarde gevonden van .1334 (ook rond 13%?). Is dit wel een kansberekening/de goede denkrichting of moet ik deze kans op een heel andere manier berekenen?
gevraagd 6 december 2017 in Inleiding Data Analyse (IDA) door 851691638 (240 punten)

1 Antwoord

0 leuk 0 niet-leuks

Volgens mij staat in de appendix van Field niet de verdeling van Pearson's $r$. Ik weet niet precies bij welke verdeling jij hebt gekeken?

Er zijn twee manieren om de kans op een gegeven correlatie te vinden. De eerste manier is om die verdeling van Pearson's $r$ te gebruiken. Doe hiervoor het volgende.

  1. Start R Studio op.
  2. Voer dit commando uit om het package 'SuppDists' te installeren:

    install.packages('SuppDists');
     
  3. Voer dit commando uit om het package te laden:

    require('SuppDists');
     
  4. En dan kun je de kans op een gegeven waarde van $r$ berekenen met:

    pPearson(.3, N = 100, rho = 0, lower.tail=FALSE)
     
  5. Voor de help-pagina, type:

    ?pPearson

Bij die pPearson functie specificeer je de volgende drie parameters (argumenten):

  1. De correlatie waar je in geinteresseerd bent;
  2. De steekproefomvang (N);
  3. De correlatie in de populatie (rho; dus rho=0 als je nulhypothesetoetsing uitvoert, maar dit kan ook een andere waarde zijn als je met een andere hypothetische populatiecorrelatie wil werken)
  4. Of je de kans op een kleinere (lower.tail=TRUE) of grotere (lower.tail=FALSE) correlatie wil vinden

Hiermee kun je de exacte kans vinden dat je een gegeven correlatie vindt in een steekproef van een gegeven omvang, onder aanname dat er in de populatie een gegeven correlatie is:

> pPearson(.3, 100, lower.tail=FALSE);
[1] 0.00115782

De tweede manier maakt gebruik van de samenhang tussen de verdeling van Pearson's $r$ en die van Student's $t$:

$$t = r\sqrt{\frac{n-2}{1 - r^2}}$$

Die $t$-waarde is verdeeld volgens $n-2$ vrijheidsgraden. De kans op die $t$-waarde kun je vervolgens opzoeken met de tabel in Field, of in R met de pt functie, waarbij je de $t$-waarde, het aantal vrijheidsgraden (df), en weer lower.tail specificeert. Bijvoorbeeld:

$$t = r\sqrt{\frac{n-2}{1 - r^2}} = .3 \sqrt{\frac{100-2}{1 - .3^2}} = 3.11$$

> pt(3.11, 98, lower.tail=FALSE);
[1] 0.001225053

(Ik heb de $t$-waarde afgerond; bovendien worden er verschillende formules gebruikt, dus kleine verschillen kunnen voorkomen. Zie ook deze vraag.)

beantwoord 7 december 2017 door gjp (63,300 punten)
...