Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Thema 6, opdracht 6.3.4: Wanneer kies je voorafgaand aan regressieanalyse voor Anova en wanneer voor correlatie?

0 leuk 0 niet-leuks
In opdracht 6.3.4 dienen diverse hypothesen getoetst te worden. Enkelen kunnen met de t-toets getoetst worden, maar de meeste met de regressie-analyse.

De hypothesen worden veelal gesteld in de vorm 'hoe hoger..... , hoe lager ....' en dergelijke. Echter in sommige gevallen wordt dan de correlatieanalyse gedaan en in sommige de Anova. Ik vind het verwarrend, want er wordt steeds naar een samenhang gevraagd. Soms in de hypothese letterlijk naar een positieve of negatieve samenhang en soms niet letterlijk. Wanneer kies je nou voor welke voorafgaand aan de regressieanalyse?
gevraagd 7 januari 2014 in Kwantitatieve Data Analyse (KDA) door Vita (290 punten)

1 Antwoord

1 leuk 0 niet-leuks
 
Beste antwoord

Er zijn drie soorten analyses. Univariaat, waarbij maar 1 variabele varieert (histogrammen, gemiddelden, standaard-deviaties); bivariaat, waarbij 2 variabelen varieren (correlaties, z-toetsen, t-toetsen, eenweg anova's, enkelvoudige regressie-analyses, chi-kwadraat toetsen), en multivariaat, waarbij 3 of meer variabelen varieren (multipele regressie-analyses en meerweg anova).

Voordat je regressie-analyses uitvoert, is het verstandig om de betreffende variabelen bivariaat te onderzoeken. Dat betekent dat je dus bijvoorbeeld correlaties, t-toetsen, of eenweg anova's gebruikt. Welke van deze analyses je gebruikt, hangt af van het meetniveau van je variabelen:

Ene variabele      Andere variabele  Analyse
dichotoom          interval/ratio    t-toets

nominaal/ordinaal  interval/ratio    eenweg anova
interval/ratio     interval/ratio    Pearson correlatie

(een dichotome variabele is een nominale of ordinale variabele die slechts 2 niveau's heeft; deze manifesteert zich dus als twee groepen, zoals Geslacht zich manifesteert als Mannen en Vrouwen. Een nominale of ordinale variabele van 3 of meer niveau's manifesteert zich als 3 of meer groepen, zoals Schoolniveau zich manifesteert als Laag-, Midden- en Hoog-opgeleid)

Welke analyse je gebruikt is uitsluitend afhankelijk van de meetniveau's van je variabelen - de formulering van je onderzoeksvragen is hiervoor irrelevant.

In principe zijn alle onderzoeksvragen en hypothesen identiek, ongeacht de formulering. Alle onderzoeksvragen en hypothesen betreffen een verband tussen twee (of meer) variabelen. Het verschil tussen een onderzoeksvraag en een hypothese is dat een hypothese een verwachting specificeert omtrent de richting van dat verband, terwijl een onderzoeksvraag meer 'open' is gesteld, dus zonder dat een richting wordt gespecificeerd. Neem de volgende voorbeelden:

  1. Is er een verband tussen geslacht en extraversie?
  2. Zijn mannen even extravert als vrouwen?
  3. Zijn mannen extraverter dan vrouwen?
  4. Mannen zijn extraverter dan vrouwen
  5. Scoren mannen hoger op extraversie dan vrouwen?
  6. Mannen scoren hoger op extraversie dan vrouwen.
  7. Hoe hoger iemand scoort op geslacht, hoe lager die persoon scoort op extraversie.

De eerste twee zijn onderzoeksvragen, en ze zijn identiek. De derde is een hypothese; het is gangbaarder om deze als stelling te formuleren, zoals bij de vierde. De vijfde is weer hetzelfde, maar weer anders geformleerd; en de zesde is de vijfde hergeformuleerd als stelling. De zevende is weer hetzelfde, tenminste, als geslacht zo gescoord is dat mannen als 0 gecodeerd zijn en vrouwen als 1. Deze laatste formulering kom je normaal niet tegen bij dichotome variabelen zoals geslacht (en zou ik zelfs fout rekenen, omdat een onderzoeksvraag/hypothese geen kennis van de codering in je databestand mag vereisen), maar wel als beide variabelen bijvoorbeeld interval-niveau hebben; dan wordt het iets als "hoe hoger iemand scoort op extraversie, hoe lager diegene scoort op optimisme". In dat geval is een betere formulering "er is een negatieve samenhang tussen optimisme en extraversie". Deze formulering is bovendien makkelijker te vertalen naar de analyse die je in dit geval zou doen (een correlatie, en die zou dan negatief moeten zijn).

beantwoord 7 januari 2014 door gjp (63,910 punten)
geselecteerd 7 januari 2014 door Vita
...