Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

hoe moet een controlevariabel (leeftijd) met 10 categorieën worden opgenomen in regressieanalyse (stap 1)?

0 leuk 0 niet-leuks
Ik heb een correlatie gemaakt alvorens aan regressieanalyse te beginnen.(ivm controlevariabele) Hier komt uit dat leeftijd (10 categorieën) correleert met uitkomstmaat. Hoe moet ik deze bij stap 1 in de regressieanalyse inbrengen. Mag ik zelf de categorieën verminderen, of is dat arbitrair? Met 10 categorieën is het lastig werken bij de verdere regressieberekeningen....
gevraagd 11 oktober 2016 in Methodologie door admartens (270 punten)

1 Antwoord

1 leuk 0 niet-leuks
 
Beste antwoord
Het probleem begint eigenlijk al bij leeftijd in categorieen; dit is (als het ook echt categorieen zijn en niet gewoon 10 verschillende leeftijden omdat N = 10) ordinaal meetniveau. Pearson correlaties zijn dan eigenlijk niet zo geschikt.

Tien categorieen zijn opzichzelf al volkomen arbitrair, dus kan ik mij niet veel situaties voorstellen waar deze categorieen zinvol zijn. Leidend zal dan de theorie zijn: waarom waren deze 10 categorieen opgesteld? Was dit op basis van theorie vastgesteld? Zo ja: dan zou ik niet teveel van de theorie afwijken: per fase zou je een conclusie willen kunnen trekken, wat neer zou komen op een regressie met 9 dummie variabelen: 1 dummy per leeftijdscategorie, min 1 (de tiende is namelijk het intercept).

Als de categorieen arbitrair zijn gekozen, dan kan altijd nog besloten om de categorieen zinvol samen te nemen, zodat de verdeling van N per leeftijdscategorie krachtiger is. Als dit dan samen kan lopen met een indeling die ook theoretisch te verdelen is, des te sterker.

Helaas komt het wel eens voor dat bij data-afname een verkeerd besluit is genomen. Er is op een te laag meetniveau gemeten, er is een meetinstrument gebruikt dat achteraf niet valide was, etc. De enige manier om er mee om te gaan is accepteren dat het zo is, en transparant te blijven rapporteren. Wat je ook zult kiezen: wees je bewust van de impact van die keuze op conclusies, en zorg dat in de discussiesectie expliciet duidelijk is dat je de impact van die keuzes kunt herkennen.
beantwoord 13 oktober 2016 door Ron Pat-El (39,820 punten)
geselecteerd 13 oktober 2016 door gjp
...