Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Wanneer is het nuttig om een variabele als moderator te testen?

1 leuk 0 niet-leuks
Hallo.

Ik vroeg mij af wanneer het nuttig is om een variabele als mogelijk moderator te testen? Moeten er bepaalde voorwaarden aan verbonden zijn of mag je gewoon een variabele ( zoals bijvoorbeeld leeftijd) testen als mogelijke moderator? Ik kan dit antwoord nergens terug vinden, de meeste sites leggen gewoon uit hoe je het moet uitvoeren. En als ik het uitvoer, moet ik dan een onafhankelijke variabele ook centraliseren?

Mvg
gevraagd 10 april 2014 in Multivariate statistiek door seventh (240 punten)
gehercategoriseerd 18 april 2014 door gjp
Ik bedoel een dichotome onafhankelijke variabele centraliseren*

1 Antwoord

1 leuk 0 niet-leuks
 
Beste antwoord

Wanneer je vermoedt dat de relatie tussen je afhankelijke en onafhankelijke variabele zou kunnen beïnvloed worden door een derde variabele, is het nuttig om die laatste als moderatorvariabele te nemen. Je vermoedt dan namelijk een ‘interactie’ tussen de moderatorvariabele en de ‘echte’ onafhankelijke variabele.

Stel dat bijvoorbeeld als onafhankelijke variabele een dichotome (=variabele met 2 mogelijke waardes) variabele hebt: uitgewerkte oefeningen nalezen of zelf nieuwe oefeningen oplossen. Je afhankelijke variabele is de leeropbrengst. Uit de literatuur leer je dat uitgewerkte oefeningen betere opbrengsten geeft (dan zelf oefeningen maken) wanneer de leerlingen nog maar weinig afweten van de leerstof, terwijl dat bij leerlingen met veel voorkennis precies omgekeerd is. In zo’n geval zou je “hoeveelheid voorkennis” kunnen opnemen als bijkomende variabele in je model.

Belangrijke opmerking #1: cruciaal is dat je het vermoeden (dat die variabele een moderator is) onderbouwt! Dus niet “Oh, we hebben de leeftijd van de respondenten, laat ons even nagaan of dat een moderator is”. Dat is een “statistische hengelexpeditie”. De juiste volgorde is: verantwoorden waarom je een variabele als moderator opneemt, hypothese formuleren over de rol van de moderator, metingen en analyses uitvoeren, nagaan of je gegevens de hypothese ondersteunen.

Belangrijke opmerking #2: bij interacties moet je alle onafhankelijke variabelen (moderatoren zijn ook een vorm van onafhankelijke variabelen!) centraliseren (of standaardiseren, vaak nuttig om te resultaten te interpreteren). Dit gaat natuurlijk niet met nominale variabelen. Bij die laatste pas je liefst een andere strategie toe, om te bekomen dat hun ‘gemiddelde’ waarde 0 is, bijvoorbeeld bij dichotome variabelen neem je +0.5 en -0.5 als waarden (en niet 0 of 1). Zie http://eduratio.be/TMP/kraemer.pdf voor de achtergrond hiervan.

Ter informatie: het woord “moderator” heeft alleen een invloed in je MODEL. Het heeft geen invloed op de statistische analyse. Je mag “moderator” en “onafhankelijke variabele” omwisselen in analyses, dat geeft dezelfde resultaten. SPSS hoeft niet te “weten” wat de moderator is en wat de onafhankelijke variabele is.

Luc

beantwoord 10 april 2014 door Luc Kumps (7,960 punten)
geselecteerd 10 april 2014 door gjp
Bedankt. Ik kan inkomen theoretisch wel iets of wat onderbouwen uit de literatuur. Maar er is een randomisatie van de onafhankelijke variabele (groep 0 of groep 1), dus eigenlijk kan ik dan best geen moderator opnemen denk ik? ( aangezien er geen enkele variabele samenhangt met de onafhankelijke variabele). eigenlijk zijn er twee variabelen die samenhangen met mijn AFHANKELIJKE variabel, dus eigenlijk is mijn vraag meer, dien ik hier verder iets mee te ondernemen?

Je hebt dus twee groepen, willekeurig samengesteld. Ik neem aan dat je aan de ene groep een bepaalde "behandeling" gaf, en aan de andere een andere? Dan is je onafhankelijke variabele dus "Behandeling". Je wil kijken of de ene "behandeling" "beter" of "slechter" is dan de andere, vermoed ik, en die uitkomst heb je in de afhankelijke variabele "Beterschap"? Zoiets?

Het speelt geen rol hoe je de respondenten opsplitste in die twee groepen, random of niet. Als jij denkt dat "Inkomen" een invloed heeft op de relatie tussen Behandeling en Beterschap, dan moet je Inkomen als moderator opnemen in je model. Maar je moet er dan wel voor zorgen dat je twee groepen respondenten bevatten in alle inkomens, en dat de inkomens een beetje "gelijk" verdeeld zijn over de twee groepen.

Stel dat je vermoedt dat Behandeling A (die je gaf aan Groep 0) een beter resultaat geeft (in Beterschap) dan Behandeling B (die je gaf aan Groep 1) bij mensen die een laag inkomen hebben, terwijl het bij mensen met een hoog inkomen vermoedelijk andersom is (bij hen geeft behandeling B betere resultaten). Om de groepen in te delen, zou je dan eerst de respondenten kunnen rangschikken volgens hun inkomen en daarna zou je de twee met het laagste inkomen kunnen nemen, en eentje willekeurig aan de ene groep toewijzen, en de andere aan de andere. Dan neem je de volgende 2 in de lijst en wijs je weer willekeurig toe, enzovoort. Op die manier gaan beide groepen gegarandeerd mensen bevatten in alle inkomens. Als de twee groepen al gevormd waren (weliswaar random) voor jij ten tonele verscheen, dan kun je nog maar 1 ding doen als je Inkomen als moderator wil gebruiken: nagaan of in beide groepen "alle inkomens voorkomen". Je kunt bijvoorbeeld kijken of de gemiddelde inkomens van de twee groepen niet significant verschillen. Je kunt ook best nagaan of de inkomens min of meer normaal verdeeld zijn in de twee groepen (als bijna iedereen een 'hoog' inkomen heeft, en slechts enkelen een "laag", dan ga je niet veel kunnen afleiden uit je analyse).

Mocht je beslissen om Inkomen als moderator te gebruiken, dan ga je dus voor het uitvoeren van je regressieanalyse deze stappen moeten nemen:

1. Standaardiseren van Inkomen tot ZInkomen (vermoedelijk ook van je afhankelijke variabele)
2. De variabele groep de waarde 0.5 geven voor de eerste groep, en -0.5 voor de tweede
3. De interactievariabele berekenen als het product van ZInkomen en de Groep

4. Regressieanalyse uitvoeren met ZInkomen, Groep, Product als onafhankelijke variabelen.

Luc

Beste Luc,

 
Ik heb voor inkomen al een covariaat analyse gedaan, waaruit blijkt dat hij niet als covariaat dient opgenomen te worden en dus gelijk verdeelt is in beide groepen denk ik. Is dit hetzelfde als moderator? 
 
Mvg
Ik denk dat er bij een covariaat geen interactie (noch hoofdeffect van de covariaat) wordt geanalyseerd. Opname als covariaat gaat alleen het 'effect' wegfilteren van de covariate variabele, zodat je de relatie tussen onafhankelijke variabele en afhankelijke variabele 'zuiverder' kunt zien (niet 'bezoedeld' door de invloed van de covariaat). Maar nogmaals: opname van variabelen als covariaat of als moderator dient volgens mij vooraf te gebeuren, op basis van een onderbouwde argumentatie.

Als je noch een moderator noch een covariaat gebruikt, dan heb je in je model alleen nog Groep en Afhankelijke Variabele, denk ik? Dan is het eenvoudigste misschien om een t-test uit te voeren?

Disclaimer: ik ben maar een medestudent he, dus wat ik zeg, dien je niet te beschouwen als de Absolute Waarheid :)

Luc
Ik denk dat covariaten dienen voor als je groepen niet helemaal gelijk zijn, te kijken of een variabele een impact kan hebben. Maar ik heb inkomen als modererend variabele onderzocht, het blijkt helemaal geen impact te hebben. Ik moet inderdaad enkel een eenvoudige t-test uitvoeren voor mijn hypothesen te testen. Bedankt
Luc: niets aan toe te voegen. Ik had het niet beter kunnen zeggen. Er bestaat natuurlijk geen Absolute Waarheid, maar je zit wat mij betreft pretty much on target :-)
Maar toch ben ik nog niet helemaal mee:
wat is nu het verschil tussen moderator en covariaat?
Bij een covariaat analyse ga ik toch kijken of de covariaat een impact heeft op OV en AV, Luc jij haalt aan dat ik nog eens moet kijken of de variabele inkomen ( ook covariaat) gelijk verdeelt is, maar dit heb ik al eens gedaan in de covariaten analyse ( effect van covariaat inkomen op OV , groep 0 of 1). als er geen samenhang is, en ze zijn normaal verdeelt, dan is het zo dat inkomen als moderator kan onderzocht worden?
Ik kan niet goed meer volgen :) Misschien zou je best eerst even kort uitleggen wat het theoretisch model is en wat je hypotheses waren vanuit dat model. Daarna kunnen we vermoedelijk beter adviseren over de analyses die je best uitvoert om die hypotheses te toetsen.

Bekijk dit conceptuele model eens:

Stel dat onze onderzoeksvraag het verband tussen Variabele 3 en Variabele 5 betreft.

Stel verder dat we de volgende zaken uit de literatuur hebben begrepen:

1) Het verband tussen Var3 en Var5 hangt af van het niveau van Var4;
2) Variabele 1 hangt ook samen met Var5;
3) Variabele 2 hangt ook samen met Var5.

Dan weten we dus dat Var1 en Var2 elk wat variantie van Var5 verklaren. Omdat elke toetsing van een verband bestaat uit de vergelijking van een verband met de errorvarientie, is het belangrijk om de errorvariantie te verminderen. Alle variantie in Var5 die niet verklaard wordt door Var3 is in beginsel errorvariantie in die analyse. Die errorvariantie kunnen we verminderen door Var1 en Var2 ook in onze analyse op te nemen; er is dan minder onverklaarde variantie, waardoor het verband tussen Var3 en Var5 minder sterk hoeft te zijn om significant te zijn. Als we Var1 en Var2 dan in onze analyse opnemen, heten zij covariaten. Een andere reden om Var1 of Var2 op te nemen, zou kunnen zijn dat het mogelijke confounders zijn. Een confounder is een variabele die zowel met je onafhankelijke (IV) als je afhankelijke variabele (DV) samenhangt, en daardoor een verband tussen de IV en DV kan vertekenen (een bestaand verband wordt verhuld of onafhankelijkheid lijkt op een verband). In dat geval neem je de confounder ook op in je analyse. Deze variabele heet in de context van je analyse dan nog steeds een covariaat; een covariaat is gewoon een variabele in je analyse waar je niet in geinteresseerd bent, maar waar je voor corrigeert.

Verder weten we dat het verband tussen Var3 en Var5 afhangt van de waarde van Var4. Var4 verklaart in zichzelf msch geen variantie van Var5, maar het zou wel kunnen dat als Var4 laag is, er een negatief verband it tussen Var3 en Var5; en dat als Var4 hoog is, er een positief verband is tussen Var3 en Var5. Als je Var4 dan buiten beschouwing laat, zie je geen verband tussen Var3 en Var5; je 'middelt' immers een negatief verband (voor de mensen die laag scoren op Var4) en een positief verband (voor de mensen die hoog scoren op Var4), dus dat wordt een 'verband van nul' :-) Door Var4 als interactie-term op te nemen in je analyse (wat betekent dat je het hoofdeffect van Var4 ook op moet nemen, ook al verwacht je dat het niet significant is), kun je dit onderzoeken. Omdat de Var4 het verband tussen Var3 en Var5 verandert (modereert) heet Var4 een moderator.

Zoals Luc aangaf, weet SPSS dit allemaal niet: SPSS weet niet in welke voorspeller(s) je geinteresseerd bent (je IV(s)) en welke er alleen bij zitten als covariaat; en als je een interactie-term meeneemt om moderatie te onderzoeken, weet SPSS weet niet welke variabele je ervan verdenkt de moderator te zijn, en welke je onafhankelijke variabele is.

Dus: een confounder is een mogelijke storende variabele; die neem je dan het liefst op in je analyse. Die heet dan een covariaat. Een variabele die je meeneemt om de error-variantie te verminderen heet ook een covariaat. Covariaten hangen alleen lineair samen met de afhankelijke variabele, maar modereren niets; en hebben dus geen interactie-term. Moderatoren hebben een interactie-term, omdat je vermoed dat ze het effect van je IV beinvloeden.

Wel, mijn onderzoek gaat over reclame. Er is een theorie die noemt moral licensing: iets" goeds" in een voorafgaande context, leidt tot iets 'slechts' achteraf. Wel ja dat slecht kan ook zijn, de aankoop van een luxe product.
Mijn hypothese is eigenlijk, of een reclame advertentie met tekst ( die dan zogezegd je een goed gevoel geeft), kan leiden tot minder schuld t.o.v. een reclame advertentie zonder tekst. ( wel ja ingewikkeld onderwerp).

Dus ik heb een controle groep: zonder tekst, en een exp groep met tekst. Ik heb naar schuldgevoelens gevraagd, een 7 punten schaal ( samengesteld uit 3 vragen).

Wel nu, heb ik al een covariate analyse gedaan van geslacht, inkomen en leeftijd. Maar ik weet zelf niet meer goed waarom ik dit nu eigenlijk gedaan heb. Aan de andere kant moderator analyse lijkt me nuttig op inkomen, omdat je meer schuld zult hebben indien je minder verdient ( lees , luxe product = duur ).

Nu snap ik niet meer zo goed of het wel zo nuttig is geweest om 1 ) deze covariate analyse gedaan te hebben en 2) wat nu het verschil is met een moderator analyse, en of het wel nuttig is een moderator en covariaat analyse te doen over inkomen?
Gjalt-Jorn: wel ja inkomen hangt samen met de AV. Moet ik die nu als covariaat meenemen?
Leuk onderzoek!!!

Stap 1 bij de meeste onderzoeken moet zijn dat je een correlatietabel bestelt (of naar andere verbanden kijkt met niet-interval variabelen) om te begrijpen hoe je data er eigenlijk uitziet. Dan weet je of geslacht, inkomen, en leeftijd samenhangen met je onafhankelijke variabele (conditie - gerandomiseerd, dus als het goed is niet), en dus mogelijke confounders zijn; en of ze samenhangen met je afhankelijke variabele (mogelijke covariaten; confounders als ze ook samenhangen met je onafhankelijke variabele). Je neemt NOOIT covariaten op als je niet eerst naar bivariate verbanden hebt gekeken, tenzij je theoretische evidentie, of empirische evidentie uit de literatuur, hebt dat je een variabele als covariaat mee moet nemen.

In jouw geval heb je een theoretisch onderbouwde moderator: je stelt eigenlijk dat je manipulatie geen effect heeft voor rijke mensen. Als dat inderdaad je standpunt is, lijkt het zinvol dit te onderzoeken door inkomen mee te nemen. Bekijk daarvoor op je randomisatie op inkomen is gelukt; doe SPLIT FILE op conditie (zie evt Google, de studiematerialen, of evt Field) en bestel daarna een histogram van inkomen. Dit krijg je dan per conditie (en met een histogram krijg je ook altijd gemiddelde en SD). Als die verdeling gelijk is (en je weet al of de gemiddelden verschillen, dit heb je in stap 1 al bekeken) kun je inkomen als moderator meenemen (zie Lucs uitleg hierboven).
oké bedankt. ik zie dat enkel leeftijd eigenlijk een significantie heeft op de afhankelijke variabele.
Nog iets anders, ik heb inkomen in 8 gelijke klassen bevraagd, moeten deze dan als dummy worden omgezet? want ik heb die nu eigenlijk als 1 variabele in die correlatietabel gezet.
Ik vind het gek... in de correlatietabel hangt inkomen niet samen met de AV. Als ik een aparte anova test doe, hangt inkomen wel samen met de AV. Of is dit niet de bedoeling van die ANOVA?
Trouwens als geslacht geen continue waarde is, heeft het dan wel nut om die een correlatietabel te zetten?
Wat indien ik leeftijd als covariaat moet opnemen, moet ik dan een univariate regressie doen?
Ik zal even voor de duidelijkheid eens zeggen wat ik allemaal gedaan had eerst:

1) leeftijd: had ik een ancova test gedaan, waardoor ik ook al zag dat inkomen samenhing met de afhankelijke variabele.

2) inkomen: heb ik in 8 groepen gemeten: een interval niveau dus denk ik, ik denk dat deze dan niet in de correlatietabel moet komen hé? Enfin hier heb ik een F test gedaan om te kijken of die samenhing met AV, bleek van wel.
 

3) geslacht heb ik door een chikwadraad test gedaan , wat bleek dat die niet samenhing met noch AV als OV.

Ik vrees dat ik een beetje de draad kwijt ben... Je zegt dat je verschillende analyses deed (ancova, correlatie, chi kwadraat...) Het is me nu echter niet duidelijk waarom je deze analyses deed. Wilde je toetsen of de gegevens bepaalde hypotheses (welke?) ondersteunden? Wilde je nagaan of de variabelen aan de voorwaarden voldeden om andere (welke?) toetsen te mogen uitvoeren? Of nog iets anders?

Luc

 

Ik wilde nagaan of ze  moesten opgenomen worden als covariaat, daarom heb ik die chikwadraad test enzo gedaan. Maar een covariaat is enkel een continue waarde heb ik begrepen? dus kan eigenlijk inkomen en geslacht niet opnemen als evt covariaat denk ik?

De beginneling die ik ben, heeft de neiging om te zeggen: beslissen of je iets wel of niet opneemt als onafhankelijke variabele, covariaat, moderator, mediator... doe je voor je begint met je gevensverzameling, op basis van een model dat je kunt beargumenteren. Eenmaal een variabele in je model zit, dan zou ik die er niet meer uithalen (zelfs als zijn invloed "niet significant" is in jouw meetstaal, laat je die variabele rustig "zijn deel van de variante verklaren"). Daarnaast zou ik (achteraf) geen variabelen toevoegen die niet in je mode zitten, "omdat ze een significante voorspeller blijken te zijn" in jouw meetstaal". Als je tijdens je (exploratieve) analyses invloeden ontdekt die niet in je model zaten, dan kun je daar melding van maken (nuttig voor toekomstig onderzoek), maar om jouw hypotheses te toetsen in jouw model lijken zo'n "extra" variabelen (die je achteraf "ontdekte") me compleet uit den boze.

Kortom, "nagaan of iets moet opgenomen worden" doe je volgens mij op basis van de literatuur (vooraf), niet op basis van de analyse van je meetstaal (achteraf).

Nu even afwachten wat de Echte Specialisten zeggen, dan leren we weer wat bij!

Kan ik wel inkomen dat je niet zomaar variabelen mag op nemen als eventuele covariaat. Het zit eigenlijk zo: oorspronkelijk wou ik kijken of je een al dan niet meer schuld krijgt, als je een advertentie ziet zonder of met tekst van een luxe product. Het zou zogezegd een verband moeten geven en er zou ook een mediator variabele in moeten zitten, namelijk het moreel zelfbeeld dat verandert door de advertentie ( hier heb ik voldoende onderbouwing voor in de literatuur)
Leeftijd, inkomen en geslacht zijn maar enkele dingen die ik bevraagd heb, maar ik heb geen aanwijzingen in de literatuur of die wel effectief ook als afhankelijke of moderator variabele kunnen dienen (eigenlijk ook niet aan gedacht voor ik de data ging verzamelen). Ik heb gewoon enkele socio demo's opgenomen omdat iedereen het doet. Ik denk dus dat als ik jou verhaal zo hoor, Luc, deze best achterwegen laat en eenvoudige t-testen ga uitvoeren op de verbanden: adv -> schuld, adv -> moreel zelfbeeld en eventueel moreel zelfbeeld -> schuld. Ik wou eigenlijk de covariaten opnemen omdat voorafgaande thesissen die ik had gelezen, ook allemaal werkte met covariaten. Ik zie nu ook dat leeftijd maar een zwak verband heeft met mijn afhankelijke variabele <0.3. Maar ik denk echter wel dat ik telkens in de paper er bij zet, het verband met de onafhankelijke variabele ( mits een experiment is, dat een beetje ongelijk is verdeelt), om louter aan te tonen dat het experiment gewerkt heeft en er geen verschil bestaan in geslacht, leeftijd en inkomen tussen de groepen.
...