Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Overeenkomst en/of verschil steekproevenverdeling en populatieverdeling

0 leuk 0 niet-leuks
In vraag 16 van oefententamen 2 staat bij antwoord A
''De verdeling van de steekproefscores bevat alle mogelijke datapunten die in een steekproef gevonden kunnen worden'' en dit is fout, het juiste antwoord is volgens het antwoordmodel:

''B De populatieverdeling bevat alle waarden van alle onderzoekseenheden''

Mijn vraag is nu, ik dacht in H2 te lezen dat de steekproevenverdeling alle data van alle onderzoekseenheden bevatte. De populatieverdeling bevat ook alle waarden van alle onderzoekseenheden van de populatie. Betekent dit dat de populatieverdeling en de steekproevenverdeling gelijk aan elkaar zijn?

Ik begrijp dat de steekproevenverdeling bestaat uit de gemiddelden van alle steekproeven, maar indirect bestaat de steekproevenverdeling dan toch uit alle data?

En als dit waar is, waarom is antwoord A dan fout?

Bedankt! Groet, Claire
gevraagd 5 januari in Inleiding Data Analyse (IDA) door clairevdwal (510 punten)
bewerkt 14 januari door clairevdwal

1 Antwoord

1 leuk 0 niet-leuks

Populatieverdelingen bevatten alle mogelijke scores: dus alle waarden die je kunt vinden als je iets meet.

Steekproevenverdelingen bevatten alle mogelijke waarden die je kunt vinden op basis van berekeningen met een of meerdere scores. Steekproevenverdelingen bevatten dus geen meetwaarden, maar berekende waarden.

Dus, je hebt een populatie, die bestaat uit oneindig veel onderzoekseenheden. Daaruit kun je een willekeurige steekproef nemen. Als je een steekproef hebt genomen wordt het mogelijk om dingen te meten door een meetinstrument toe te passen (meetinstrumenten zijn, samen met manipulaties, mogelijke operationalisaties van constructen).

De toepassing van een meetinstrument resulteert in een of meerdere kwantificaties van stukjes realiteit, in dit geval, stukjes realiteit die betrekking hebben op de onderzoekseenheden in je steekproef. Die kwantificaties zijn getallenreeksen die elk bestaan uit een of meerdere scores.

Die scores voor een bepaalde variabele vormen samen de verdeling van steekproefscores voor die variabele voor die steekproef. Die steekproefscores zijn elk willekeurig gekozen uit de populatieverdeling, die alle mogelijke scores bevat.

Als je nu met een of meer van die getallenreeksen gaat rekenen, en je berekent bijvoorbeeld een gemiddelde, een scheefheid, een standaarddeviatie, of een correlatie, dan geldt dat dat getal uit een andere verdeling komt: uit de bijbehorende steekproevenverdeling. Die steekproevenverdeling bevat alle mogelijke gemiddelden, scheefheden, standaarddeviaties, of correlaties die je had kunnen vinden, gegeven je populatie en je steekproefomvang.

De steekproevenverdeling bevat dus geen losse datapunten, maar altijd de uitkomst van een berekening (bijvoorbeeld gemiddelden).

beantwoord 6 januari door gjp (69,180 punten)
Ah oke! Ik denk dat ik inderdaad een verkeerde voorstelling van een steekproevenverdeling had, misschien omdat ik alleen dacht aan het voorbeeld van het gemiddelde. Daarom dacht ik: wanneer een steekproevenverdeling alle gemiddelden bevat, bevat het dus alle gemiddelden uit een populatie, en indirect alle waarden. Maar conceptueel heb je natuurlijk ook een 'steekproevenverdeling van de correlatie' oid, waarbij alle mogelijke correlaties van de steekproeven erin zitten. Maar er bestaat geen populatieverdeling van de correlatie.

Dus de juiste zin zou zijn 'een steekproevenverdeling bevat alle waarden (als een correlatie) die in verschillende afzonderlijke steekproeven gevonden zouden kunnen worden'. Klopt dit?

Dan rest mij nog 1 vraag: het 95% BI over een steekproevenverdeling lijkt me dan logisch om te zeggen dat je dan kunt zeggen dat 95% van de steekproeven de daadwerkelijke populatiewaarde zouden bevatten. Maar klopt het dat een BI alleen over steekproevenverdelingen wordt berekend?

Bedankt!
Ja, de zin klopt! Generieker wordt het iets als "de steekproevenverdeling van een eenheid (zoals een correlatie, gemiddelde, of variantie) bevat alle waarden die in verschillende afzonderlijke steekproeven gevonden zouden kunnen worden."

En ja - betrouwbaarheidsintervallen kun je alleen berekenen als je de steekproevenverdeling kent (of 'valsspeelt' via een methode die bootstrapping heet), heel goed!!!
Heel erg bedankt!
...