Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

VO 4.4.1.:Waarom is het moeilijk voor te stellen dat deze beide schattingen uit dezelfde steekproevenverdeling komen?

0 leuk 0 niet-leuks
Beste,

Alvast hartelijk bedankt voor bovenstaande verduidelijking.
Ik begrijp hieruit duidelijker dat er een plausibele samenhang is.
De conclusie die ik echter nog niet volledig begrijp is volgende: "... dat het moeilijk te stellen is dat beide schattingen afkomstig zijn vanuit dezelfde steekproevenverdeling."

Gaat het hierbij niet om 2 verschillende steekproevenverdelingen? Eén steekproevenverdeling van de correlatie tussen boosheid en blijdschap en één steekproevenverdeling van de correlatie tussen boosheid en pijn? Waarbij beide steekproevenverdelingen van elke correlatie overlappen?

Alvast bedankt,

Eva Langenus
gevraagd 24 januari 2018 in Inleiding Data Analyse (IDA) door Eva Langenus (140 punten)

1 Antwoord

0 leuk 0 niet-leuks

Voordat ik op je vraag inga: wat bedoel je met een plausibele samenhang? De vraag over 4.4.1 betreft twee overlappende betrouwbaarheidsintervallen. Bij het eerste interval van −.49 tot .39 is het niet aannemelijk dat er in de populatie een verband is. Bij het tweede interval van .08 tot .78 is dit aannemelijker (maar de evidentie is niet erg overtuigend). Of de twee intervallen voor de correlaties overlappen, oftewel, of het aannemelijk is dat de twee correlaties in de populatie hetzelfde zijn of niet, gaat niet over samenhang. Een correlatie drukt samenhang uit. Een verschil tussen correlaties is iets anders: dit is een zogenaamde interactie. Dat is een complexer concept dat pas in de cursussen Cross-sectioneel Onderzoek en Experimenteel Onderzoek aan bod komt.

Nu, je vraag. De tekst die je citeert is volledig:

"Dit illustreert gelijk hoe misleidend puntschattingen kunnen zijn; gegeven dat correlaties maar van −1 tot 1 kunnen lopen, lijkt het verschil tussen −.07 en .51 dermate groot dat het moeilijk voor te stellen is dat beide schattingen afkomstig zijn uit dezelfde steekproevenverdeling."

Je vraag is of het nu over één steekproevenverdeling gaat, of om twee.

Hier is geen antwoord op. Als je in een steekproef twee correlaties berekent (of in twee steekproeven), dan weet je nooit of die twee correlaties afkomstig zijn uit eenzelfde steekproevenverdeling (en puur door toeval verschillende waarden hebben gekregen, zoals altijd gebeurt), of dat ze afkomstig zijn uit twee verschillende steekproevenverdelingen (die dus rondom twee verschillende populatiecorrelaties liggen).

In dit geval weet je dit dus ook niet zeker.

Wat dit compliceert is dat je de betrouwbaarheidsintervallen construeert op basis van de hypothetische steekproevenverdeling die zou bestaan als de correlatie die je in je steekproef vond, toevallig precies de waarde van de populatiecorrrelatie heeft. Of dat echt zo is weet je natuurlijk niet; maar deze hypothetische steekproevenverdeling heb je nodig om de grenswaarden van je betrouwbaarheidsinterval te berekenen.

Het kan dus makkelijk lijken alsof je er vanuitgaat dat elke correlatie uit zijn eigen steekproevenverdeling komt, maar dat is niet waar.

Sterker nog, vaak is je hoofdvraag als onderzoeker uit wat voor steekproevenverdeling een correlatie (of een gemiddelde, of een verschil tussen gemiddelden, etc) nu precies komt.

beantwoord 25 januari 2018 door gjp (67,020 punten)
...