Een contrastcoefficient is niet zozeer het resultaat van een berekening als wel van een beredenering. Contrasten maken het mogelijk om gemiddelden van de groepen in een variantieanalyse te vergelijken. Welke gemiddelden je wil vergelijken bepalen wat de contrastcoefficienten worden. In principe kies je zelf hoe groot je contrastcoefficienten worden, maar je moet rekening houden met deze drie regels:
-
De groepen met een positieve coefficient worden gecontrasteerd (i.e. vergeleken) met de groepen met een negatieve coefficient.
-
Het gemiddelde van elke groep telt even zwaar mee als de contrastcoefficient die je die groep geeft;
-
De optelsom van alle contrastcoefficienten moet 0 zijn;
Als je deze regels combineert met je specifieke hypothese (of desnoods onderzoeksvraag), stellen ze je in staat te beredeneren welke waarde de contrastcoefficienten voor elke groep moeten hebben. Ik zal even een voorbeeld geven. Stel dat je zes groepen hebt:
-
Mannen uit de randstad;
-
Mannen uit een provinciestad;
-
Mannen uit een dorp;
-
Vrouwen uit de randstad;
-
Vrouwen uit een provinciestad;
-
Vrouwen uit een dorp;
Stel je verder voor dat we XCT-gebruik hebben gemeten, en dat we vervolgens willen vergelijken of dat verschilt in die zes groepen.
We kunnen natuurlijk een Anova doen, en als die significant is, weten we dat minimaal 1 van de 6 gemiddelden verschilt van de rest. Daar hebben we niet veel aan. Vervolgens kunnen we post-hoc toetsen uitvoeren; in dit geval zou dat 15 t-toetsen betreffen. Omdat we onze alpha dan aan moeten passen om de kans op en Type 1 fout op 5% te houden, hebben we dan nog maar heel weinig power over (i.e. de kans op een Type 2 fout is groot). Dat is natuurlijk niet wenselijk. Gelukkig hebben we een specifieke hypothese; we vermoeden dat het niet uitmaakt of mensen in een provinciestad of op het platteland wonen, maar dat XTC-gebruik in de randstad hoger ligt. We willen dus groepen 1 en 4 vergelijken met 2, 3, 5 en 6.
Als we dan de contrast-regels hierboven erbij pakken, kunnen we op basis van regeltje 1 bedenken dat groepen 1 en 4 dus contrastcoefficienten moeten hebben met een ander teken (i.e. een + of een -) dan groepen 2, 3, 5 en 6. Als we alleen dat regeltje toepassen, zouden we 1 en 4 elke een -1 geven, en 2, 3, 5, en 6 elke een 1. Alleen, dan schenden we regeltje 3: de optelsom van alle contrastcoeffienten is 2. Omdat we aan de ene kant van de streep vier groepen hebben staan, maar aan de andere kant van de streep maar twee groepen, moeten de contrastcoefficienten aan de ene kant van de streep dus half zo klein zijn. Dit kunnen we oplossen door ofwel groepen 1 en 4 elk een contrastcoefficient te geven van -2; of juist door 2, 3, 5 en 6 elk een contrastcoefficient te geven van .5. Dan worden de nieuwe coefficienten, in de volgorde van de groepsnummers, dus: -2 1 1 -2 1 1, of in het tweede geval, -1 .5 .5 -1 .5 .5. Beide zijn acceptabel, want beiden voldoen aan de regels.
Wat statistische programma's zoals R en SPSS nu in de achtergrond doen, is het gemiddelde voor elke groep vermenigvuldigen met de betreffende contrast-coefficient, en de resultaten bij elkaar optellen. Vervolgens wordt een t-toets uitgevoerd om te kijken of die optelsom gelijk is aan 0. Dit kun je ook anders zien: je kunt ook stellen dat de gemiddelden van de groepen met een positieve coefficient worden opgeteld, en de gemiddelden van de groepen met een negatieve coefficient ook; en dat een t-toets wordt uitgevoerd om te kijken of die hetzelfde zijn. Hoe je het ook ziet, als die toets significant is, verschillen de gemiddelden met de positieve contrasten van de gemiddelden met de negatieve contrasten.
Een tweede voorbeeld. Stel dat we vermoeden dat er een ander verschil is voor mannen dan voor vrouwen (een interactie dus). Stel dat we vermoeden dat mannen in de randstad meer XTC gebruiken, maar vrouwen op het platteland. We willen mensen in provinciesteden buiten beschouwing laten. Dan willen we dus groepen 2 en 5 een contrastcoefficient van 0 geven, want dan doen ze niet mee. Vervolgens verwachten we hoger XTC-gebruik in groepen 1 en 6, en lager XTC-gebruik in groepen 3 en 4. Als onze hypothese klopt, is het gemiddelde van groepen 1 en 6 dus hoger dan het gemiddelde van groepen 3 en 4. We willen 1 en 6 dus contrasteren met 3 en 4; dus 1 en 6 krijgen een ander teken (i.e. - of +) dan 3 en 4. Dan kunnen we 1 en 6 bijvoorbeeld -1 geven, en 3 en 4 juist 1. De coefficienten worden dan, weer in de volgorde van de groepen, -1 0 1 1 0 -1. De gemiddelden van 1 en 6 worden dan vermenigvuldigd met -1 en opgeteld, en de gemiddelden van 3 en 4 worden vermenigvuldigd met 1 en opgeteld (en de gemiddelden van 2 en 5 worden vermenigvuldigd met 0 en verdwijnen dus). Vervolgens wordt getoetst of de optelsom van die twee resulterende gemiddelden gelijk is aan 0 (of, als je het liever anders bekijkt, of de twee resulterende gemiddelden gelijk zijn aan elkaar).
Contrastcoefficienten bepalen is dus niet zozeer een berekening als wel een beredenering. Denk goed na over welke groepen je wil vergelijken; dan weet je welke groepen hetzelfde teken krijgen (i.e. - en +) en welke groepen een contrastcoefficient van 0 krijgen. Kijk vervolgens naar hoeveel groepen je aan elke kant hebt, en bepaal hoe groot de coefficienten moeten worden om te zorgen dat de optelsom precies 0 is.
Als het nog niet helemaal helder is, gebruik gerust de comments om om meer duidelijkheid te vragen!