Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
We beschikken over een database van 30 kinderen, waarvan per kind één of twee ouders een vragenlijst hebben ingevuld (score van 1 tot 9). Zo hebben we bijvoorbeeld kindnummer 2 en 2 voor respectievelijk ouder 9001 en ouder 9002. Nu willen we per kind (dus uit een groepje van twee ouders) de hoogst scorende ouder selecteren om mee te nemen in onze analyse. Hoe doen we dit?
in Methodologie door (140 punten)

1 Antwoord

0 leuk 0 niet-leuks
De makkelijkste manier is om een nieuwe variabele te maken waarin de maximale score tussen de twee ouders is opgenomen. Dit kan in SPSS eenvoudig door het maximum op te vragen. In Compute variabele kan dit via de MAX() functie.

Als V1 de eerste variabele is, en V2 de tweede, dan is de syntax voor de nieuwe variabele VMax:

COMPUTE VMax=MAX(V1, V2).
EXECUTE.
 

Dit moet een nieuwe variabele opleveren waar enkel de hoogste waarde wordt gekozen tussen V1 en V2
door (63.5k punten)
Ik vermoed dat de vraag sloeg op een andere situatie. Er zijn twee kolommen: KINDNUMMER en OUDERSCORE (er is ook nog OUDERNUMMER maar dat speelt verder geen rol). Per ouder is er dus een RIJ, geen kolom (in dat geval zou COMPUTE MAX inderdaad een oplossing bieden). Voor sommige kinderen (bij wie twee ouders de lijst invulden) heeft men dus twee rijen. Men wil dan alleen de rij met de hoogste waarde in OUDERSCORE opnemen in de analyse (='selecteren') en de de rij van de laagste ouder (voor datzelfde kind) niet selecteren. Voor kinderen bij wie maar 1 ouder antwoordde, zou men alleen die ouder nemen.

Dit kan makkelijk opgelost worden in twee stappen. Eerst gebruik je Data, Aggregate. In "Break variables" geef je KINDNUMMER in, in "Summaries:" plaats je OUDERSCORE. Dan gebruik je de knop Function om de default functie (Mean) te vervangen door Maximum. Op OK drukken maakt een nieuwe variabele OUDERSCORE_max.

Dan Data, Select Cases, If condition is satisfied. Als conditie opgeven "OUDERSCORE=OUDERSCORE_max". Continue, OK.

Wat niet duidelijk is uit de vraag: wat moet er gebeuren indien beide ouders een identieke score hebben? Dan zal deze oplossing immers beide ouders selecteren. Als dit niet mag, dan zal de vraagsteller eerst eens moeten beslissen wie van de twee ouders in dat geval moet behouden worden. De eerste ouder in de dataset?
Klinkt helder, en het zou best kunnen dat dit antwoord beter past op de vraag dan de mijne. Ik zou het als een antwoord toevoegen, zodat het geupvote kan worden :)
...