Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

oefenopdracht 5.2

0 leuk 0 niet-leuks
Ik heb een vraag over de oefenopdracht, 5.2

Over vraag 1: waarom wordt er niet geaggregeerd en geen gemiddelden berekend? Ik heb dat gedaan en dan blijkt dat respondent 40 best veel extreme antwoorden te hebben gegeven. Moet je zo iemand dan in je dataset laten zitten?
En misschien een domme vraag, maar waarom zijn alleen de verdelingen van de afhankelijke variabelen van belang?

over vraag 4: ik heb gewoon syntax 7 uit 4.4 overgenomen en die omgebouwd en ik kwam uit op:

MIXED relationSatisfaction  BY condition WITH dayC
/PRINT=SOLUTION TESTCOV
/METHOD= REML
/FIXED= INTERCEPT condition dayC
/RANDOM=INTERCEPT | SUBJECT(subject)
/REPEATED=dayC | SUBJECT(subject) COVTYPE(AR1)

Daaruit komt dat dayC 0,049 p= 0.02 Dat betekent dan toch dat het moment van de meting een verband heeft met relationSatisfaction?

In de uitwerking worden 3 syntaxen gegeven, die een beetje op de mijne lijken maar toch niet helemaal hetzelfde zijn. En daaruit zou blijken dat er geen verband is tussen de dag van meten en de relatietevredenheid. Maar de output wordt niet stapsgewijs besproken (jammer genoeg), dus ik weet niet waar dat uit geconcludeerd wordt. Bij de eerste syntax zie ik wel dat de autoregressieve correlatie niet significant is (-.061, p=.368). Maar bij de tweede en derde syntax zie ik dan bij fixed effects weer .050, p = .024. Daar moet je toch naar kijken, naar die p? En die is lager dan 0.05 en dus significant toch?
gevraagd 10 oktober in Longitudinaal Onderzoek (PB1702) door EZuurman (360 punten)

1 Antwoord

0 leuk 0 niet-leuks

Beste student,

Ik geef antwoord tussen de regels.

MvG, Rolf

Ik heb een vraag over de oefenopdracht, 5.2

Over vraag 1: waarom wordt er niet geaggregeerd en geen gemiddelden berekend? Ik heb dat gedaan en dan blijkt dat respondent 40 best veel extreme antwoorden te hebben gegeven. Moet je zo iemand dan in je dataset laten zitten?
En misschien een domme vraag, maar waarom zijn alleen de verdelingen van de afhankelijke variabelen van belang?

RvG: Aggregeren doe je alleen als je een variabele op een Level-2 variabele wilt gaan gebruiken op Level-1 niveau, bijvoorbeeld gemiddelde wiskundeniveau van een klas om plezier in wiskunde te voorspellen van een leerling. Jij hebt gekeken naar extremen, maar benoemd niet om welke variabelen het dan gaat; in het algemen is het zinvol om te kijken naar extremen, en eventueel analyses te doen zonder extreme outliers.   


over vraag 4: ik heb gewoon syntax 7 uit 4.4 overgenomen en die omgebouwd en ik kwam uit op:

MIXED relationSatisfaction  BY condition WITH dayC
/PRINT=SOLUTION TESTCOV
/METHOD= REML
/FIXED= INTERCEPT condition dayC
/RANDOM=INTERCEPT | SUBJECT(subject)
/REPEATED=dayC | SUBJECT(subject) COVTYPE(AR1)

Daaruit komt dat dayC 0,049 p= 0.02 Dat betekent dan toch dat het moment van de meting een verband heeft met relationSatisfaction?

RvG: Ik zou niet zowel dayC opnenen in de REPEATED statement en ook bij /FIXED. Volgens mij is het inhoudellijk trouwens niet zo zinvol (essentieel) om bij /FIXED dayC op te nemen, want waarom zou je (in deze casus) willen weten dat er verandering optreedt in satisfactie. De kern van experiment is de relatie tussen condition en relationsatisfaction; als je daarnaast in je model extra rekening houdt met een random intercept en autocorrelatie (i.e., AR1), dan heb je een aardig model. De andere opties in de terugkoppeling zijn bedoeld om te attenderen op andere mogelijkheden, waarvan de lagged variabelen populair zijn bij sommige onderzoekers.  


In de uitwerking worden 3 syntaxen gegeven, die een beetje op de mijne lijken maar toch niet helemaal hetzelfde zijn. En daaruit zou blijken dat er geen verband is tussen de dag van meten en de relatietevredenheid. Maar de output wordt niet stapsgewijs besproken (jammer genoeg), dus ik weet niet waar dat uit geconcludeerd wordt. Bij de eerste syntax zie ik wel dat de autoregressieve correlatie niet significant is (-.061, p=.368). Maar bij de tweede en derde syntax zie ik dan bij fixed effects weer .050, p = .024. Daar moet je toch naar kijken, naar die p? En die is lager dan 0.05 en dus significant toch?

RvG: zie mijn vorige opmerking. De uitkomsten van een model kunnen inderdaad heel wat veschillen. Daarom zou het inderdaad beter zijn om stapsgewijs na te gaan welke onderdelen het model substantieel verbeteren.

beantwoord 10 oktober door Rolf van Geel (10,200 punten)
...