hercoderen van string values naar numeric values in SPSS syntax

Question

hercoderen van string values naar numeric values in SPSS syntax

Ik probeer een aantal likertschalen in de syntax van SPSS te hercoderen. De likertschalen zijn gemaakt in Limesurvey. De variabele scores zijn "A1", "A2", "A3", "A4", "A5", "A6" en "A7". De respectievelijke value labels zijn "", "", "", "|", ">", ">>", ">>>". De likertschalen zijn van de variabelen V9 tot en met V53.

De volgende commando heb ik gebruikt in de syntax:

RECODE v9 to v53 ("A1" = 1) ("A2" = 2) ("A3" = 3) ("A4" = 4) ("A5" = 5) ("A6" = 6) ("A7" = 7).

Daarop krijg ik echter de melding dat een string value niet gehercodeerd kan worden naar een numeric value.

Deze handelingen zijn me wel gelukt met behulp van de menuknoppen in SPSS (Transform - Recode into different values).

Ik wil echter liever de variabelen rechtstreeks in de syntax wijzigen. Zeker omdat ik de originele scores (A1, ..., A7) toch nier meer zal gebruiken. Wanneer ik ga hercoderen in andere variabelen krijg ik ook een teveel aan variabelen met het gevolg dat de Data View te onoverzichtelijk wordt.

gevraagd 29 december 2016 in Anders door Mark (240 punten)

1 Antwoord

gjp · Answer 1 · 2016-12-31T14:40:38+0000

Ik zie dat je het antwoord zelf ook al hebt gevonden. De fout in de bovenste syntax is dat je het had moeten doen als:

RECODE v9 TO v53 ("A1" = 1) ("A2" = 2) ("A3" = 3) ("A4" = 4) ("A5" = 5) ("A6" = 6) ("A7" = 7) INTO numeric_v9 TO numeric_v53.

Want je moet inderdaad naar een nieuwe variabelenaam.

Je moet overigens altijd naar een nieuwe variabelenaam hercoderen. Dit omdat je niet het risico wil lopen dat je dezelfde syntax per ongeluk twee keer uitvoert. Bovendien is het handig als je kunt zien wat de waarden voor de hercodering is, zodat je, als je eventuele fouten op het spoor komt, die snel kunt identificeren.

Ik lees in je opmerking dat je je dataset bekijkt alsof het een soort spreadsheet is. Leer jezelf dit af. Mensen lijden aan teveel biases om te kunnen vertrouwen op wat je waarneemt door je data op die manier te bekijken. Je moet jezelf aanleren je data te bekijken door middel van frequentietabellen, histogrammen, descriptives, etc. Als je dat eenmaal kunt is het aantal variabelen in je dataset niet langer een probleem voor je: je kunt dan prima met honderden variabelen werken. En dat is handig, want vaak bestaan datasets uit zoveel variabelen. Zorg dus dat je variabelenamen 'self-explanatory' (en Engelstalig, in verband met het delen van je data) zijn, en werk aan de hand van een overzicht van je variabelenamen.

Verder is het verstandig om voordat je data gaan verzamelen, je onderzoek zelf een paar keer helemaal door te lopen, en de datafiles in je statistische programma te importeren en te inspecteren. Daarmee zie je dan dat je bijvoorbeeld de codes verkeerd hebt ingesteld: je ziet dan dat deze vragen A1, A2, etc als antwoordcodes hebben, en je kunt dit dan in je dataverzamelingssoftware (e.g. LimeSurvey) aanpassen, zodat je ruwe data al in het goede format zit. Daar heb je nu niets meer aan, maar wel handig om te weten voor de volgende keer :-)

Anyway: dus, zorg dat je altijd hercodeert naar nieuwe variabelenamen, als onderdeel van je dataverwerkings-hygiene. Als je vindt dat je dataset daardoor onoverzichtelijk wordt, is dat een symptoom dat je je dataset op de verkeerde manier benaderd, dus da's handig want dan kun je je die benadering gelijk afleren :-)

Categorieën

hercoderen van string values naar numeric values in SPSS syntax

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.

Gerelateerde vragen

Categorieën

hercoderen van string values naar numeric values in SPSS syntax

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.