Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Bij het importeren van het .sav bestand van de oefenopdracht thema 5 kreeg ik allerlei meldingen van missing data (NA). Nu blijkt dit te liggen, aan missende value labels. Het gaat om de volgende variabelen:

privegebruik1abc, privegebruik2abc, privegebruik3abc, sociale_norm, persoonlijke_norm, sanctie, RV1, RV2.

Moet ik hier zelf labels voor verzinnen? Is er eventueel een vaste set labels die ik kan toevoegen? De meeste gaan van "nee, nooit" tot "ja, heel vaak", of van "helemaal mee oneens" tot "helemaal mee eens". Is het überhaupt nodig deze variabelen te gebruiken?
in Experimenteel Onderzoek (OEO, PB04x2) door (7.5k punten)
Dezelfde vraag geldt ook voor de tentamencasus, dan alleen voor de variabele geloofwaardigheid.

1 Antwoord

0 leuk 0 niet-leuks
Ik heb net de link (Data_Thema 5.sav) getest in PB0402. Daarbij opende het bestand normaal zonder foutmelding (SPSS 22).

Van de genoemde variabelen zijn de categorieeen aan de extreme kant van de schaal 1 (nee, nooit) en 7 (ja, heel vaak) gelabeld. De andere categorieeen niet. Dit zou geen probleem moeten geven bij het inlezen.

Het wel of niet hebben van value labels is optioneel en zou nooit een fout mogen generen.
door (11.7k punten)
Ik begrijp nu dat het probleem met inlezen naar R te maken heeft en dat je hierover al met Gjalt-Jorn contact hebt. Wil je de "oplossing" hieronder toevoegen.

ps. Het weglaten van tussenliggende value labels is trouwens niet slordig, maar een bewuste keuze.

Sorry, ik ben inderdaad vergeten te vermelden dat het om het inlezen in R gaat. Van Gjalt-Jorn heb ik inderdaad een antwoord gekregen:


Ik zou overigens de labels sowieso niet mee inlezen. Meestal betreffen dit intervalvariabelen, waarbij de labels in de datafile dus niet belangrijk meer zijn omdat je gaat middelen.

Je kunt dus bijvoorbeeld "applyRioLabels = FALSE" gebruiken, en kijken wat er dan gebeurt.


Wat is de reden dat er alleen op de extremen wordt gelabeld?

...