Meetwaardes afkomstig van verschillende schalen mag je inderdaad niet zo maar van elkaar aftrekken. Een meetwaarde op een schaal die loopt van 1 tot 5 is immers niet rechtstreeks te vergelijken met een meetwaarde op een schaal die loopt van 10 tot 50. Wat je echter wel kunt doen, is de meetwaarden eerst standaardiseren. Daartoe bereken je voor elke schaal het gemiddelde (G) en de standaard deviatie (SD), en daarna vervang je elke waarde x door (x-G)/SD. Hierdoor vervang je eigenlijk elke waarde door haar zogenaamde z-score, dat is de “afstand tot het gemiddelde, uitgedrukt in standaard deviaties”.
Stel bijvoorbeeld dat je meetwaarden, gemeten met een eerste schaal die loopt van 1 tot 5, een gemiddelde waarde 3 hebben en een SD van 0.75. Dan zou je de meetwaarde 1 vervangen door (1-3)/0.75 = -2.67 en een meetwaarde 4 door (4-3)/0.75 = 1.33. Stel nu dat je meetwaarden op de tweede schaal, lopend van 10 tot 50, een gemiddelde hebben van 30 en een SD van 7.5. Dan zou je daar een meetwaarde 10 vervangen door (10-30)/7.5 = -2.67 en een meetwaarde 40 door (40-30) = 1.33. De oorspronkelijke meetwaardes (1 en 4 op de ene schaal en 10 en 40 op de andere) waren onvergelijkbaar, maar na standaardisatie waren ze dat wel: de z-scores bleken telkens precies even ‘uitzonderlijk’ (=even ver afwijkend van het gemiddelde) te zijn, als je ze van elkaar aftrekt zou je in beide gevallen 0 krijgen.
Standaardiseren kan SPSS voor je doen. Je gebruikt daartoe Analyze, Descriptive Statistics, Descriptives. Onderaan plaats je een vinkje bij “Save standardized values as variables”. SPSS zal dan per geselecteerde variabele een extra kolom maken met daarin de gestandaardiseerde waardes.
Zie ook bv. http://nl.wikipedia.org/wiki/Z-score of http://en.wikipedia.org/wiki/Standard_score
Het is niet altijd nodig om te standaardiseren, in sommige analyses gebeurt dat volautomatisch achter de schermen. Bij een ANOVA bijvoorbeeld wordt dit allemaal uitgevoerd zonder dat je het beseft (je ziet er indirect een kleine glimp van in Levenes test). Als je echter een regressie-analyse wil doen waarbij er een interactie komt kijken, of wanneer je gauw eens “op het zicht” twee variabelen met elkaar wil vergelijken, moet je wel standaardiseren, anders ben je inderdaad appelen met peren aan het vergelijken.
Ook wanneer je een gemiddelde moet maken van een aantal meetwaardes (bv. van verschillende ‘subschalen’) is het nodig om eerst te standaardiseren en dan het gemiddelde van de z-scores te nemen. Het is niet toegelaten om een gemiddelde te nemen van de ruwe scores op elke schaal (want elke schaal kan een ander bereik hebben maar ook een andere SD).
Luc