Welke variabelen je in je regressie-model opneemt bepaal je op basis van theorie.
Alle multivariate analyses moet je theorie-gestuurd gebruiken. Dit omdat door de correctie voor samenhang tussen variabelen (wat betekent dat variantie wordt verwijderd uit het model) de kans op statistische artefacten nog hoger is dan bij bivariate analyses.
Als je bijvoorbeeld 20 voorspellers hebt, mag je nooit deze 20, of die subset die bivariaat significant is, in een regressie-model gooien, en kijken welke voorspellers significant blijven. Je resultaten worden dan praktisch onmogelijk om te interpreteren, omdat je grote delen van de variantie in je afhankelijke en onafhankelijke variabelen uit het model hebt verwijderd.
In jouw geval lijkt het er op alsof je onderzoek doet naar gedragsverandering (of in elk geval gedragsverklaring, a la de Theory of Planned Behavior of de Reasoned Action Approach, het modernere jongere broertje of zusje). In dat geval doe je normaal het volgende:
-
Bereken bivariate correlaties tussen beliefs en determinanten;
-
Bereken bivariate correlaties tussen determinanten en intentie en/of gedrag
-
Draai een regressie-model waarin je per determinant de onderliggende significante beliefs als voorspeller opneemt;
-
Draai een regressie-analyse waarin je intentie of gedrag voorspelt met je determinanten
In die laatste twee regressie-modellen kijk je niet naar de regressie-coefficienten, maar naar de proportie verklaarde variantie ($R^2$), omdat je wil weten hoeveel je van een determinant begrijpt (of hoeveel van de variantie in intentie/gedrag je begrijpt).
De regressie-coefficienten zijn geen bruikbare schattingen omdat die conditionele verbanden tussen bijvoorbeeld de attitudinal beliefs en attitude weergeven. Echter, voor gedragsverandering wil je weten wat de onconditionele verbanden met de relevante determinanten zijn; je wil een interventie immers richten op alle beliefs dit een determinant voorspellen, niet alleen op de beliefs die net iets meer unieke variantie voorspellen. De gedeelde variantie in de afhankelijke variabele wil je immers ook voorspellen (en veranderen)! Zie voor wat meer achtergrond het eerste artikeltje op http://effectivebehaviorchange.com/ (op pagina 151 staat een stappenplan voor de analyse van determinanten en beliefs)
Buiten de context van gedragsverandering hangt je plan (wanneer je welke voorspellers in je model opneemt) af van je theoretisch kader. In alle gevallen moet je echter in je achterhoofd houden dat je bij multivariate analyses overlappende variantie tussen voorspellers uit het model verwijdert, en dat kan verregaande consequenties hebben voor de conclusies die je kunt trekken. Door variantie te verwijderen verander je immers de operationalisaties van je variabelen.
De bottom line is dus: bouw nooit een regressie-model op basis van de significanties van regressie-coefficienten, tenzij je heel goed begrijpt waar je mee bezig bent (maar mensen die dat zo goed begrijpen komen niet op deze vraag-antwoord site waarschijnlijk :-)). Multivariate modellen (e.g. regressie-modellen) moet je altijd bouwen op basis van je theorie.