Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Welke conclusies kunnen we trekken uit de 2 overlappende betrouwbaarheidsintervallen in figuur 4.4.1?

0 leuk 0 niet-leuks
Mijn vraag gaat over Thema 4, paragraaf 4.4 Het betrouwbaarheidsinterval van Persons r.

Bij verwerkingsopdracht 4.4.1 wordt ons gevraagd te kijken naar de 2 betrouwbaarheidsintervallen in figuur 4.4.1. en onze conclusies hierover weer te geven. Ook wordt gevraagd of beide verbanden even sterk zijn.

Mijn initiele antwoord was dat het betrouwbaarheidsinterval van Boosheid en Pijn smaller is dan die van Boosheid en Blijdschap. Hieruit zou ik op kunnen maken dat de samenhang tussen Boosheid en Pijn sterker is. (smallere verdeling en hogere concentratie rond het gemiddelde)

Het weergegeven antwoord gaat over de overlapping tussen beiden intervallen, maar ik begrijp niet wat ermee gezegd wordt.. Waarom is dit een ‘aanzienlijke’ overlap? Zo groot is het overlappende gedeelte niet, in mijn ogen. En waarom is het daardoor goed mogelijk dat de correlatiecoëfficiënten in de populatie gelijk zijn? En klopt er iets van mijn antwoord?
gevraagd 15 december 2016 in Inleiding Data Analyse (IDA) door annegeesink (160 punten)

1 Antwoord

0 leuk 0 niet-leuks

Goede vraag!

Het ene interval loopt van −.49 tot .39 (de puntschatting was −.07).

Het andere interval loopt van .08 tot .78 (de puntschatting was .51).

De overlap is dus van .08 tot .39.

Deze correlaties zijn dus plausibel voor beide verbanden op basis van deze steekproef.

Het is belangrijk om te onthouden dat de correlaties die je vindt van steekproef tot steekproef verschillen. Nu vonden we de puntschattingen -.07 en .51. Als we exact deze zelfde studie zouden herhalen, dan zouden we andere correlaties vinden.

Je kunt het betrouwbaarheidsinterval ongeveer beschouwen als 'kansrijke populatiewaarden', en het is goed mogelijk dat onze puntschattingen bij een volgende steekproef ergens anders in dat interval liggen. De eerste correlatie van -.07 zou dus zomaar hoger dan .08 kunnen zijn de volgende keer; en de tweede correlatie van .51 zou zomaar lager dan .38 kunnen zijn. De puntschattingen die we toevallig deze keer hebben gevonden zijn irrelevant: die verschillen immers toch van steekproef tot steekproef. Alleen de betrouwbaarheidsintervallen kunnen ons iets vertellen over het verband in de populatie. De puntschattingen, oftewel de steekproefwaarden voor de correlatie, kunnen ons alleen iets vertellen over deze ene steekproef, en die is niet interessant: deze steekproef (elke steekproef) is slechts een instrument om iets te kunnen zeggen over de populatie.

Kortom, op basis van deze steekproef is de kans aanzienlijk (of in elk geval, niet verwaarloosbaar) dat de populatiecorrelatie tussen de .08 tot .39 in ligt, voor beide verbanden, Die zou dus goed gelijk kunnen zijn.

Er is daarom niet voldoende evidentie om te veronderstellen dat de verbanden verschillen.

Hoeveel overlap er is, is natuurlijk subjectief. In principe geldt dat als er overlap is in de 95% betrouwbaarheidsintervallen, je geen sterke evidentie hebt dat de verbanden verschillen. Die conclusie (dat de verbanden verschillen) is dan dus niet gerechtvaardigd op basis van die dataset.

Sterker nog, als de intervallen net niet overlappen, is die conclusie ook niet gerechtvaardigd. Die intervallen zijn immers om de puntschattingen heen geconstrueerd, en die verschillen van steekproef tot steekproef. Het hele interval verschuift dus tussen steekproeven.

Je hebt dus grote steekproeven nodig om conclusies te mogen trekken. Pas als je relatief grote steekproeven hebt (honderden deelnemers; zie studietaak 4.7) worden de betrouwbaarheidsintervallen smal genoeg om zinnige uitspraken te kunnen doen.

Zolang er enige overlap is, weet je in elk geval zeker dat je onvoldoende evidentie hebt om te concluderen dat twee verbanden verschillen (of, breder gesteld, dat de waarden waar de betrouwbaarheidsintervallen voor zijn opgesteld verschillen in de populatie).

Als er net geen overlap is, kun je ook niet echt goede conclusies trekken. Pas als de intervallen behoorlijk bij elkaar uit de buurt liggen heb je voldoende informatie om te concluderen dat het onwaarschijnlijk is dat twee correlaties (of, breder gesteld, waarden) in de populatie gelijk zijn.

beantwoord 15 december 2016 door gjp (68,400 punten)
...