Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

wanneer centreren en standaardiseren

0 leuk 0 niet-leuks
Wanneer is het slim om te centreren voor bv. geslacht, leeftijd, cognitie (MMSE). Mag dit ook gewoon voor de zekerheid gedaan worden?

En kan ik vervolgens standaardiseren voor de multi-level regressie om zo makkelijker te interpreteren?
gevraagd 20 mei 2015 in Methodologie door Kenoek (200 punten)

2 Antwoorden

1 leuk 0 niet-leuks
 
Beste antwoord
Centreren en standaardiseren zijn niet hetzelfde. Bij centreren worden individuele scores van het gemiddelde afgetrokken. Bij standaardiseren ook, maar dan wordt er ook nog gedeeld door de standaarddeviatie. Hieraan merk je al: centreren is iets dat je doet op continue data (interval of hoger meetniveau). Categorische variabelen worden daarom nooit gecentreerd.

De belangrijkste reden om te centreren is om in een regressie-analyse met interacties de multicollineariteit op te lossen (de interactie is het product van de hoofdeffecten, dus die zullen altijd met elkaar correleren). Het is daarom niet noodzakelijk om te centreren in een regressiemodel zonder interactieeffecten. In de regel is het dan wel noodzakelijk om te centreren zodra je regressiemodellen toetst waar interacties tussen predictoren zijn toegevoegd.

Multilevel modellen volgen dezelfde lijn. Echter: aangezien multilevel modellen rekening houden met het groepsniveau zijn er verschillende manieren waarop men centreren correct acht. De meest gebruikte centratie-methode is om op het gemiddelde van de 'groep' te centreren, in plaats van op het algemene gemiddelde van de gehele variabele.
beantwoord 20 mei 2015 door Ron Pat-El (39,310 punten)
geselecteerd 22 mei 2015 door gjp
Beste Ron / andere lezers,

Ik heb een korte aanvullende vraag op jouw uitleg. Ik hoop dat het oké is als ik hem hier stel.

Ik heb binnen mijn regressiemodel onder andere een aantal percentages. Dit wil zeggen, bijvoorbeeld in 2016 was 13% van het nieuws positief geframed, ik hou dus 0,13 als waarde aan, 2015 21% =0,21, etc.. Deze variabele toets ik binnen een tijdsreeks met een continue afhankelijke variabele.  

Nu is mijn vraag: Ik heb een aantal van mijn variabelen gecentreerd. Mag ik een percentage welke ik als aandeel van het totaal (zoals hierboven beschreven) ook centreren (waarde - mean)?

Alvast hartelijk dank!
0 leuk 0 niet-leuks

Standaardiseren is handig als je in een gewone regressie-analyse interactie-termen op wil nemen. In andere situaties kan het soms ook handig zijn, maar een overzicht geven van alle mogelijke situaties is hier niet te doen. In elk geval mag je altijd standaardiseren; alleen veranderen de eenheden van de variabele natuurlijk, wat interpretatie lastig kan maken. Leeftijd is bijvoorbeeld ruw handiger; dan weet je wat een toename van 1 jaar betekent. Weten wat een toename van 1 standaarddeviatie in leeftijd betekent, is minder makkelijk te interpreteren. In het algemeen hangt of je wil standaardiseren erg af van je specifieke situatie. In het kader van welke cursus stel je de vraag?

beantwoord 20 mei 2015 door gjp (63,040 punten)
Je was me voor :). Zag je antwoord pas toen ik trots op de mooie blauwe knop drukte.
Wel, de jouwe is een stuk uitgebreider dan de mijne :-)

Ik heb ook moeite met wanneer je nu centreert en standaardiseert.

Allereerst lees ik volgende in het antwoord van Ron Pat-El: centreren is iets dat je doet op continue data (interval of hoger meetniveau). Categorische variabelen worden daarom nooit gecentreerd. --> Dit terwijl ik nu juist leer dat je bijvoorbeeld geslacht soms moet centreren (man: -0,5, vrouw: 0,5). Dus dat snap ik niet helemaal.

Verder lees ik in jouw antwoord dat je dus altijd mag standaardiseren, maar dat soms gewoonweg niet handig is qua interpretatie. Dat lees ik correct toch?

Ik begrijp wat centreren en standaardiseren is, maar herken niet de situaties waarin dit handig is. Zo krijgen we bij het vak Analyse van psychologische modellen (opdracht 1.1.3) de volgende tip: Voer nu zelf een analyse uit waarbij u de relatie tussen werkdruk en stress onderzoekt, waarbij het soort werk de moderator is (NB Het soort werk kan beter eerst worden gecentreerd). --> maar hoe kan ik hier zelf op komen? Als ik zelf onderzoek doe, krijg ik die tips natuurlijk niet

Dichotome variabelen zijn een apart geval :-)

Ze zijn namelijk als interval-variabelen te zien; het interval tussen elke opeenvolgende meetwaarde is immers steeds even groot.

Nog even een mini-recap:

1) Er zijn de nominale, ordinale, en kardinale meetniveau's:

2) Nominaal en ordinaal heten ook wel 'categorisch';

3) Kardinale meetniveau's heten ook wel continue meetniveau's en zijn het interval- en rationiveau;

4) Nominaal betekent dat je de verschillende meetwaarden niet ten opzichte van elkaar kunt ordenen (in 1 dimensie), zoals oogkleur of regio;

5) Ordinaal betekent dat je de meetwaarden wel kunt ordenen maar dat de afstand tussen opeenvolgende meetwaarden onbekend of ongelijk is, waardoor je er niet mee kunt rekenen;

6) Interval betekent dat de afstand tussen opeenvolgende meetwaarden (i.e. die intervallen) altijd even groot (en bekend) zijn;

7) ratio betekent dat er een nulpunt is; dit is complexer, en het onderscheid van intervalvariabelen is for all practical purposes in het kader van ons curriculum irrelevant;

8) dichotome variabelen kun je als nominaal, ordinaal, of interval zien; omdat er maar 1 interval tussen meetwaarden is (want dichotoom betekent dat er maar 2 meetwaarden zijn in totaal), zijn er geen verschillende intervallen.

Dus met dichotome variabelen kun je wel rekenen.

Als je een dichotome variabele dummy-codeert (i.e. als 0 vs 1, of -.5 vs .5, of 1 vs 2 representeert) kies je zelf welke getallen je gebruikt. Je kunt dus kiezen of je 0 vs 1 of -.5 vs .5 gebruikt.
Ow, en - hoe je zelf op dit soort dingen komt: onderzoek doen :-)

Na je bachelor ben je goed uitgerust om te leren hoe je echt onderzoek doet. Als je promoveert leer je dit zelfstandig te doen. Je kunt na je bachelor niet zelfstandig wetenschappelijk onderzoek uitvoeren; je zutl altijd begeleiding nodig hebben totdat je promoveert.

(En daarna is begeleiding/samenwerrking meestal ook nog verstandig, want wetenschappelijk onderzoek is per definitie een van de moeilijkste dingen die er is)
Oké, dus als ik het goed begrijp kun je dichotome, ordinale en ratio variabelen centreren. De afhankelijke variabele hoeft niet gecentreerd te worden, klopt dat?

Ik las dat je alleen hoefde te centreren als het 0-punt niets betekende/niet bestond (zoals bij IQ). Klopt dat? Zijn er ook nog andere aanwijzingen wanneer je moet kiezen voor centreren?

En hoe zit dat dan met standaardiseren?
...