Er zijn drie soorten analyses. Univariaat, waarbij maar 1 variabele varieert (histogrammen, gemiddelden, standaard-deviaties); bivariaat, waarbij 2 variabelen varieren (correlaties, z-toetsen, t-toetsen, eenweg anova's, enkelvoudige regressie-analyses, chi-kwadraat toetsen), en multivariaat, waarbij 3 of meer variabelen varieren (multipele regressie-analyses en meerweg anova).
Voordat je regressie-analyses uitvoert, is het verstandig om de betreffende variabelen bivariaat te onderzoeken. Dat betekent dat je dus bijvoorbeeld correlaties, t-toetsen, of eenweg anova's gebruikt. Welke van deze analyses je gebruikt, hangt af van het meetniveau van je variabelen:
Ene variabele Andere variabele Analyse
dichotoom interval/ratio t-toets
nominaal/ordinaal interval/ratio eenweg anova
interval/ratio interval/ratio Pearson correlatie
(een dichotome variabele is een nominale of ordinale variabele die slechts 2 niveau's heeft; deze manifesteert zich dus als twee groepen, zoals Geslacht zich manifesteert als Mannen en Vrouwen. Een nominale of ordinale variabele van 3 of meer niveau's manifesteert zich als 3 of meer groepen, zoals Schoolniveau zich manifesteert als Laag-, Midden- en Hoog-opgeleid)
Welke analyse je gebruikt is uitsluitend afhankelijk van de meetniveau's van je variabelen - de formulering van je onderzoeksvragen is hiervoor irrelevant.
In principe zijn alle onderzoeksvragen en hypothesen identiek, ongeacht de formulering. Alle onderzoeksvragen en hypothesen betreffen een verband tussen twee (of meer) variabelen. Het verschil tussen een onderzoeksvraag en een hypothese is dat een hypothese een verwachting specificeert omtrent de richting van dat verband, terwijl een onderzoeksvraag meer 'open' is gesteld, dus zonder dat een richting wordt gespecificeerd. Neem de volgende voorbeelden:
-
Is er een verband tussen geslacht en extraversie?
-
Zijn mannen even extravert als vrouwen?
-
Zijn mannen extraverter dan vrouwen?
-
Mannen zijn extraverter dan vrouwen
-
Scoren mannen hoger op extraversie dan vrouwen?
-
Mannen scoren hoger op extraversie dan vrouwen.
-
Hoe hoger iemand scoort op geslacht, hoe lager die persoon scoort op extraversie.
De eerste twee zijn onderzoeksvragen, en ze zijn identiek. De derde is een hypothese; het is gangbaarder om deze als stelling te formuleren, zoals bij de vierde. De vijfde is weer hetzelfde, maar weer anders geformleerd; en de zesde is de vijfde hergeformuleerd als stelling. De zevende is weer hetzelfde, tenminste, als geslacht zo gescoord is dat mannen als 0 gecodeerd zijn en vrouwen als 1. Deze laatste formulering kom je normaal niet tegen bij dichotome variabelen zoals geslacht (en zou ik zelfs fout rekenen, omdat een onderzoeksvraag/hypothese geen kennis van de codering in je databestand mag vereisen), maar wel als beide variabelen bijvoorbeeld interval-niveau hebben; dan wordt het iets als "hoe hoger iemand scoort op extraversie, hoe lager diegene scoort op optimisme". In dat geval is een betere formulering "er is een negatieve samenhang tussen optimisme en extraversie". Deze formulering is bovendien makkelijker te vertalen naar de analyse die je in dit geval zou doen (een correlatie, en die zou dan negatief moeten zijn).