Hierarcische regressie icm controlevariabelen

Question

Hierarcische regressie icm controlevariabelen

Hoi allemaal,

Ik weet dat dit forum officieel niet voor mij (wel OU student, echter Managementwetenschappen) bestemd is, maar ik kan nergens heen met mijn vraag en ik hoop dat jullie het antwoord heel makkelijk hebben. Dit is de laatste stap in mijn scriptie dus ik hoop hierna niemand meer van last te zijn ;-)

Ik wil een hiërarchische regressie uitvoeren in 3 stappen
Stap 1: Controlevariabelen (leeftijd categorieën, geslacht, omvang dienstverband, opleidingsniveau etc).
Stap 2: Alle onafhankelijke variabelen toevoegen
Stap 3: interacties toevoegen (inmiddels dankzij dit forum bekend mee)

Nu heb ik voor de controlevariabelen allereerst nieuwe variabelen aangemaakt, waarmee ik in een eerder stadium correlaties heb uitgevoerd. Zo heeft bijv. leeftijd nu 5 categorieën van 1 t/m 5. (Vragen zijn ook gesteld in categorieën). Ik heb vervolgens dummy variabelen aangemaakt en daar multiple regressie mee uitgevoerd waarin de dummy's dus per blok zijn opgenomen. Op die manier kon ik dus het onderscheid in MBO of HBO zien tov mijn afhankelijke variabele.

Echter, in de hiërarcische regressie wil ik gewoon 'opleidingsniveau' los meenemen, en dus niet een hele lijst uitgesplitst, zowel om het overzichtelijk te houden maar ook omdat er geen significante effecten tussen zitten. Ik zie dat ook in veel andere scripties terug bij hiërarcische regressie tabellen.

Hoe doe ik nu die toetsing voor die controle variabelen? Kan ik dan die nieuw aangemaakte variabele (niet dummy, maar dus de ordinale met 1= MBO, 2 = HBO etc) gebruiken of gaat dit weer op een andere manier ?

Alvast heel erg bedankt voor de genomen moeite.

groet,
Kirsten

gevraagd 2 maart 2017 in Multivariate statistiek door kirstenvanharten (140 punten)

1 Antwoord

gjp · Answer 1 · 2017-03-03T09:38:15+0000

Wat je wil kan niet. Opleidingsniveau is ordinaal; de 'afstand' tussen MBO en HBO is niet gelijk aan de afstand tussen HBO en WO. Als anderen dit wel zo doen, dan doen ze het fout.

Bekijk alle bivariate verbanden (correlaties, t-toetsen, eenweg anova's). Alle controlevariabelen die niet samenhangen met je afhankelijke variabele hoef je verder niet meer mee te nemen; zij kunnen niet confounden.¹

In deze analyse zijn leeftijd en opleiding ordinaal, dus die toets je met een anova. Als je geluk hebt zijn ze niet significant en hoef je ze niet mee te nemen in je regressie-analyse.

Als leeftijd en/of opleidingsniveau wel samenhangt met je afhankelijk variabele, dan moet je die meenemen met dummy-codering (dus voor leeftijd heb je dan 4 variabelen).

Overigens: meet nooit met categorieen. De cut-offs die je gebruikt zijn bijna nooit te rechtvaardigen. En je verliest power, en maakt je analyses een stuk complexer. Bij opleidingsniveau is het onvermijdelijk, maar bij leeftijd kun je beter gewoon mensen hun leeftijd laten ingeven.

¹ Confounding betekent dat een verband wordt verstoord door een andere variabele. Hiervoor moet die andere variabele zowel met de voorspeller als je afhankelijke variabele samenhangen. Als hij niet met een van de twee samenhangt, dan kan het geen confounder zijn.

Categorieën

Hierarcische regressie icm controlevariabelen

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.

Gerelateerde vragen

Categorieën

Hierarcische regressie icm controlevariabelen

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.