Ik hanteer een iets andere versie, die meer consistent is met het taalgebruik zoals dat in PB0202 (Inleiding Data-Analyse) wordt gehanteerd. Ik zal Ron's overzicht iets aanpassen.
In dit overzicht worden twee variabelen gebruikt, X en Y. Vaak is X de onafhankelijke variabele, en Y de afhankelijke variabele. Dit betekent dat in een experiment X is gemanipuleerd - je onderzoekt een effect van X op Y. Als je geen experiment doet (en dus geen variabele manipuleert) is X meestal de variabele die volgens je theoretisch model de causale antecedent is (de 'oorzaak'), maar je kunt dan met je analyse niets zeggen over of X invloed heeft op Y - alleen of ze samenhangen. Als je geen experimenteel design hebt, wordt samenhang die je vindt meestal verklaard door confounders (andere variabelen die zowel X als Y bepalen).
Ik zei net dat X en Y vaak respectievelijk de onafhankelijke en afhankelijke variabelen zijn, maar: bivariate analyses zijn symmetrisch. Je kunt X en Y dus altijd omdraaien: bivariate analyses kunnen alleen informatie geven over of er samenhang is tussen twee variabelen. En samenhang heeft geen richting: eventuele richting, zoals causaliteit, zit in je design (onderzoeksopzet), niet in je analyses.
Om die reden gebruik ik in plaats van X en Y de volgende letters:
- A = een kardinale variabele - dat is een variabele waarbij elke meetwaarde betekenisvol door een getal kan worden uitgedrukt. Dat geldt voor alle intervalvariabelen en alle ratiovariabelen.
- B = een dichotome variabele, dus een variabele die maar twee categorieen/meetwaarden heeft. Die categorieen/meetwaarden manifesteren zich meestal als groepen: de variabele 'geslacht' manifesteert zich bijvoorbeeld vaak als de groepen 'mannen' en 'vrouwen'.
- C = een categorische variabele met meer dan twee categorieen. Deze manifesteert zich ook vaak als verschillende groepen.
Nog een extra verduidelijking.
Univariaat betekent 'er varieert maar 1 ding'. Multivariaat betekent "er varieren meerdere dingen". Die termen kunnen op twee manieren worden gebruikt (en wordt jammer genoeg ook op twee manieren gebruikt).
Enerzijds is een univariate analyse een analyse met maar 1 variabele, bijvoorbeeld als je een gemiddelde (of het betrouwbaarheidsinterval voor een gemiddelde) uitrekent, of een histogram maakt.
In die lijn zijn bivariate analyses analyses waarbij je naar het verband tussen twee variabelen kijkt. In Inleiding Data-analyse (PB0202) werden alleen univariate en bivariate analyses behandeld.
Tot slot zijn multivariate analyses dan analyses met meer dan twee variabelen tegelijkertijd. Dit geldt voor regressie-analyse met meer dan een voorspeller en voor variantie-analyse met meerder factoren, of met een covariaat.
So far so good.
Maar :-)
Mensen die vooral multivariate analyses doen gebruiken de termen anders.
Zij noemen een analyse univariaat, niet als er maar 1 ding varieert, maar als er maar 1 voorspeller in zit. Een univariate analyse is dan dus een bivariate analyse (1 voorspeller en 1 afhankelijke variabele), en een multivariate analyse is een multivariate analyse (meerdere voorspellers en/of covariaten en 1 afhankelijke variabele).
Een univariate analyse in de context van multivariate analyses (zoals variantie-analyse, die meestal multivariaat wordt gebruikt, dus met meerdere factoren/voorspellers/covariaten) betekent dus meestal dat er dan maar voorspeller is. Mensen zijn niet consequent in of er een covariaat 'mag' zijn in die definitie.
Om het nog ingewikkelder te maken kun je ook variantieanalyse doen met meerdere afhankelijke variabelen. Dat wordt ook multivariate anova genoemd. 'Univariaat' en 'Multivariaat' kunnen dus slaan op:
- het totale aantal variabelen in de analyse;
- het aantal voorspellers/factoren in de analyse;
- het aantal afhankelijke variabelen in de analyse.
Geen van deze definities zijn goed of fout - ze zijn vooral onhandig :-)
Nu dan de toetsen.
- one-sample t-test: enkel een enkele A (je hebt een populatie waarin je een parameter schat, en je vergelijkt dit tegen een vaststaand getal. Voorbeelden van vragen zijn: is het gemiddelde IQ van Nederland nog steeds 100? Wijkt een correlatie af van nul?
- independent sample t-test: een B en een A (verschilt het IQ tussen mannen en vrouwen). Je vergelijkt puntschattingen tussen twee populaties
- paired sample t-test. een A die twee keer wordt gemeten, waarbij B het verschil tussen die metingen beschrijft. B is bijvoorbeeld vaak tijd: je hebt twee meetmomenten, en meet de kardinale variabele twee keer. Of B kan 'gezinsrol' zijn, als je A bij twee ouders, of steeds een ouder en een kind meet. Er is dus altijd afhankelijkheid tussen de twee metingen van A, en die afhankelijkheid zit besloten in de aard van B, bijvoorbeeld 'je meet dezelfde persoon twee keer', of 'je meet binnen hetzelfde gezin twee mensen'.
- one-way ANOVA: je hebt een A en een C: je kijkt of het gemiddelde van A gelijk is in elke groep/categorie/meetwaarde in C.
- univariate ANOVA: (univariate = 1 C en 1 A). Dat kan in SPSS dus een one-way, of meerweg ANOVA zijn, inclusief mogelijkheid tot covariaten, etc. Sky is de limit, zolang het maar een enkele A heeft)
- multivariate ANOVA (multivariate = meer C's of meer A's). Dus ofwel een ANOVA met meerdere voorspellers, ofwel een ANOVA met meerdere afhankelijke variabelen.
- Repeated measures ANOVA. Eigenlijk een speciaal geval van een multivariate ANOVA met meerdere A's; de wijze waarop de herhaalde metingen worden vergeleken wijkt af, waardoor bij een repeated measures ANOVA sphericiteit een issue kan zijn. Verder theoretisch identiek aan multivariate ANOVA met meerdere A's, maar met andere schermpjes en berekeningen onder de motorkap.
Sorry dat het zo'n zooitje is qua termen. Hebben wij ook niet bedacht :-)