Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe bereken ik een contrast- coefficient? Uit de literatuur "survey" wordt me dat niet helemaal duidelijk.

0 leuk 0 niet-leuks
gevraagd 27 december 2012 in Psychologisch Survey (PS) door Leon Schaepkens (160 punten)

1 Antwoord

0 leuk 0 niet-leuks

Een contrastcoefficient is niet zozeer het resultaat van een berekening als wel van een beredenering. Contrasten maken het mogelijk om gemiddelden van de groepen in een variantieanalyse te vergelijken. Welke gemiddelden je wil vergelijken bepalen wat de contrastcoefficienten worden. In principe kies je zelf hoe groot je contrastcoefficienten worden, maar je moet rekening houden met deze drie regels:

  1. De groepen met een positieve coefficient worden gecontrasteerd (i.e. vergeleken) met de groepen met een negatieve coefficient.
  2. Het gemiddelde van elke groep telt even zwaar mee als de contrastcoefficient die je die groep geeft;
  3. De optelsom van alle contrastcoefficienten moet 0 zijn;

Als je deze regels combineert met je specifieke hypothese (of desnoods onderzoeksvraag), stellen ze je in staat te beredeneren welke waarde de contrastcoefficienten voor elke groep moeten hebben. Ik zal even een voorbeeld geven. Stel dat je zes groepen hebt:

  1. Mannen uit de randstad;
  2. Mannen uit een provinciestad;
  3. Mannen uit een dorp;
  4. Vrouwen uit de randstad;
  5. Vrouwen uit een provinciestad;
  6. Vrouwen uit een dorp;

Stel je verder voor dat we XCT-gebruik hebben gemeten, en dat we vervolgens willen vergelijken of dat verschilt in die zes groepen.

We kunnen natuurlijk een Anova doen, en als die significant is, weten we dat minimaal 1 van de 6 gemiddelden verschilt van de rest. Daar hebben we niet veel aan. Vervolgens kunnen we post-hoc toetsen uitvoeren; in dit geval zou dat 15 t-toetsen betreffen. Omdat we onze alpha dan aan moeten passen om de kans op en Type 1 fout op 5% te houden, hebben we dan nog maar heel weinig power over (i.e. de kans op een Type 2 fout is groot). Dat is natuurlijk niet wenselijk. Gelukkig hebben we een specifieke hypothese; we vermoeden dat het niet uitmaakt of mensen in een provinciestad of op het platteland wonen, maar dat XTC-gebruik in de randstad hoger ligt. We willen dus groepen 1 en 4 vergelijken met 2, 3, 5 en 6.

Als we dan de contrast-regels hierboven erbij pakken, kunnen we op basis van regeltje 1 bedenken dat groepen 1 en 4 dus contrastcoefficienten moeten hebben met een ander teken (i.e. een + of een -) dan groepen 2, 3, 5 en 6. Als we alleen dat regeltje toepassen, zouden we 1 en 4 elke een -1 geven, en 2, 3, 5, en 6 elke een 1. Alleen, dan schenden we regeltje 3: de optelsom van alle contrastcoeffienten is 2. Omdat we aan de ene kant van de streep vier groepen hebben staan, maar aan de andere kant van de streep maar twee groepen, moeten de contrastcoefficienten aan de ene kant van de streep dus half zo klein zijn. Dit kunnen we oplossen door ofwel groepen 1 en 4 elk een contrastcoefficient te geven van -2; of juist door 2, 3, 5 en 6 elk een contrastcoefficient te geven van .5. Dan worden de nieuwe coefficienten, in de volgorde van de groepsnummers, dus: -2 1 1 -2 1 1, of in het tweede geval, -1 .5 .5 -1 .5 .5. Beide zijn acceptabel, want beiden voldoen aan de regels.

Wat statistische programma's zoals R en SPSS nu in de achtergrond doen, is het gemiddelde voor elke groep vermenigvuldigen met de betreffende contrast-coefficient, en de resultaten bij elkaar optellen. Vervolgens wordt een t-toets uitgevoerd om te kijken of die optelsom gelijk is aan 0. Dit kun je ook anders zien: je kunt ook stellen dat de gemiddelden van de groepen met een positieve coefficient worden opgeteld, en de gemiddelden van de groepen met een negatieve coefficient ook; en dat een t-toets wordt uitgevoerd om te kijken of die hetzelfde zijn. Hoe je het ook ziet, als die toets significant is, verschillen de gemiddelden met de positieve contrasten van de gemiddelden met de negatieve contrasten.

Een tweede voorbeeld. Stel dat we vermoeden dat er een ander verschil is voor mannen dan voor vrouwen (een interactie dus). Stel dat we vermoeden dat mannen in de randstad meer XTC gebruiken, maar vrouwen op het platteland. We willen mensen in provinciesteden buiten beschouwing laten. Dan willen we dus groepen 2 en 5 een contrastcoefficient van 0 geven, want dan doen ze niet mee. Vervolgens verwachten we hoger XTC-gebruik in groepen 1 en 6, en lager XTC-gebruik in groepen 3 en 4. Als onze hypothese klopt, is het gemiddelde van groepen 1 en 6 dus hoger dan het gemiddelde van groepen 3 en 4. We willen 1 en 6 dus contrasteren met 3 en 4; dus 1 en 6 krijgen een ander teken (i.e. - of +) dan 3 en 4. Dan kunnen we 1 en 6 bijvoorbeeld -1 geven, en 3 en 4 juist 1. De coefficienten worden dan, weer in de volgorde van de groepen, -1 0 1 1 0 -1. De gemiddelden van 1 en 6 worden dan vermenigvuldigd met -1 en opgeteld, en de gemiddelden van 3 en 4 worden vermenigvuldigd met 1 en opgeteld (en de gemiddelden van 2 en 5 worden vermenigvuldigd met 0 en verdwijnen dus). Vervolgens wordt getoetst of de optelsom van die twee resulterende gemiddelden gelijk is aan 0 (of, als je het liever anders bekijkt, of de twee resulterende gemiddelden gelijk zijn aan elkaar).

Contrastcoefficienten bepalen is dus niet zozeer een berekening als wel een beredenering. Denk goed na over welke groepen je wil vergelijken; dan weet je welke groepen hetzelfde teken krijgen (i.e. - en +) en welke groepen een contrastcoefficient van 0 krijgen. Kijk vervolgens naar hoeveel groepen je aan elke kant hebt, en bepaal hoe groot de coefficienten moeten worden om te zorgen dat de optelsom precies 0 is.

Als het nog niet helemaal helder is, gebruik gerust de comments om om meer duidelijkheid te vragen!

beantwoord 30 december 2012 door gjp (63,300 punten)
bewerkt 2 januari 2013 door gjp
Bovenstaand verhaal is me dacht ik duidelijk, maar desondanks kom ik  niet uit de opdrachten A3.1.2 en A.3.1.3 en hoop dat
je me een stapje verder kunt/ mag/wil brengen.

In mijn eigen model had ik bij A.1.3 het volgende gesteld:
Kinderen die na het invullen van de AQ-C als onveilig (dus ambivalent of
vermijdend) gehecht te beschouwen zijn zullen hogere scores hebben op de
SCAS-subschaal voor paniekstoornis en agorafobie. De relatie tussen de
hogere score op paniekstoornis en agorafobie  ingeval van onveilige hechting
zal voor jongens en meisjes verschillend zijn.
Die hypothese van mij is dan toch te beschouwen als mijn zogenaamde model
zoals bedoeld in opdracht A.3.1.2???? Of ga ik daar al de fout in?

Vervolgens had ik dan bij A3.1.2. voor het interactiecontrast als hypothese
gesteld  :
Het verschil tussen vermijdend gehechte jongens en meisjes op PANAGO is
groter dan het verschil tussen veilig gehechte jongens en meisjes op PANAGO.
Kan ik aan de hand van een dergelijke hypothese  een interactiecontrast
laten berekenen door SPSS?
De variabele GROEP moet volgens de terugkoppeling van de opdracht
gedefinieerd worden als in de bron. Welke bron??? De syntax die terug te
vinden is in het studiemateriaal??

Zou blij zijn met wat hulp. Alvast bedankt!
De bron waar het in staat kun je vinden op pag 97-112. Die bron heet "Bron A: Moderatieanalyse met nominale predictoren". Bedenk dat een interactieconstrast gaat over "een verschil van verschillen". Jouw formulering kan dus scherper door dat erin te verwerken. Een voorbeeld van een interactiehypothese is hypothese 3 op pag 102 van het takenboek.
...