Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Hi, ik heb een vraag over het volgende stukje uitleg bij genoemde opdracht:

 Bij een gebruikelijke alpha van .05.05 (en het is redelijk om aan te nemen dat deze is gebruikt) zou je door toeval twee significante uitkomsten verwachten wanneer je 40 correlaties berekent. Het is dus waarschijnlijk dat door steekproeftoeval of meetfout de twee superfoods met p<.05p<.05 correleren met welzijn en niet doordat er in de populatie een verband is.  

Bedoel je dat bij een alpha van .05 de kans 5 procent is dat er door toeval significante uitkomsten worden gevonden, en dat je dit vertaalt naar 5% van 40 - dus mogelijk twee uitkomsten onterecht significant zijn (door bijv meetfout)? Zo ja, dan snap ik dat niet; mijn redenatie zou zijn dat dit per variabele geldt, dus de kans dat de twee correlaties - zijnde broccoli->welzijn en chiazaad-> maar 5% kans hebben voort te komen uit een meetfout. En dat is juist laag zou ik zeggen.

Waar gaat mijn redenatie fout en wat is de juiste redenatie?

Groetjes, Jacqueline

in Inleiding Onderzoek (OIO, PB02x2; was Inleiding Data Analyse, IDA) door (1.1k punten)

1 Antwoord

0 leuk 0 niet-leuks
Dit gaat over multiple testing. Als je een correlatie berekend dat is er bij een alfa van .05 5% kans dat je een correlatie vindt terwijl er in de populatie geen verband is. Bij elke extra correlatie die je uitrekent vergroot de kans op een type-1 fout, omdat je steeds opnieuw een schatting doet. In dit voorbeeld zelfs 40 keer. Het gaat dus niet om de kans om iets te vinden bij een specifieke correlatie, maar de kans om uberhaubt iets te vinden bij een van de 40 correlaties die je berekend. Hoe je de kans hierop berekend kun je teruglezen in 19.6 multiple testing.
door (49.7k punten)
Dank voor je antwoord. Voor mij is nog niet helder hoe je komt tot 'zou je door toeval 2 significante uitkomsten verwachten.'

Als ik bereken wat de kans is dat we een type 1 fout maken kom ik op 87% uit. Hoe kom je van daar naar de genoemde 2?
De kans dat je minimaal een Type-1 fout maakt is niet hetzelfde als hoeveel significante resultaten je vindt als je X p-waarden berekent onder aanname dat de nulhypothese waar is.

Het laatste kun je beredeneren met behulpt van het gegeven dat p uniform is verdeeld onder de nulhypothese (i.e. de kans op elke p-waarde is precies even groot). Als je X onafhankelijke steekproeven neemt uit die uniforme verdeling, verwacht je dat X * .05 steekproeven een p-waarde onder de .05 hebben.

Dat is niet hetzelfde als de kans op minimaal 1 type-1 fout. Dat is het complement van de kans op 0 type-1 fouten, en die kans is:

$$ .95 \times .95 \times \dots \times .95$$

oftewel

0.95 ^ 40 = 0.13

Je berekening klopt dus, maar drukt iets anders uit.
...