Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Na uitvoeren van een multivariate regressie-analyse vindt ik geen significante verbanden, er zijn wel onderlinge correlaties.

0 leuk 0 niet-leuks
Na uitvoeren van een multipele regressie-analyse vindt ik noch een collectief verband tussen de onafhankelijke en afhankelijke variabelen, noch een afzonderlijk verband. Dwz dat de onafhankelijke variabelen de afhankelijke niet voorspellen.

Bij correlatie-analyses vind ik wel verbanden tussen afhankelijke en onafhankelijke variabelen. Ik zou daarom geneigd zijn om te stellen dat de onafhankelijke variabelen individueel wel samenhangen met de afhankelijke variabelen, maar deze in onderlinge samenhang collectief niet kunnen voorspellen. Klopt dit?
gevraagd 31 augustus 2013 in Methodologie door Lipkjen van Egmond (140 punten)

1 Antwoord

0 leuk 0 niet-leuks

Je voorgestelde conclusie klopt bijna. Er is een nuancering door de manier waarop regressie-analyse wordt uitgevoerd. Je concludeert terecht dat je voorspellers samenhangen met de afhankelijke variabele; de bivariate verbanden (de correlaties) tonen dit aan.

Het is echter mogelijk dat (een aantal van) deze verbanden eigenlijk manifestaties zijn van confounding; dat bijvoorbeeld twee van je voorspellers samenhangen, waardoor je de indruk hebt dat ze elk samenhangen met je afhankelijke variabele, terwijl er in werkelijkheid maar eentje samenhangt met je afhankelijke variabele. Stel je bijvoorbeeld voor dat je afhankelijke variabele extraversie is; en je probeert dit te voorspellen aan de hand van optimisme en waargenomen sociale steun. Nu doen we even net alsof we alwetend zijn, en weten dat optimisme en extraversie samenhangen, maar waargenomen sociale steun en extraversie niet. Er bestaat in de populatie ('in het echt') dus een correlatie tussen optimisme en extraversie, maar niet tussen sociale steun en extraversie. Stel je nu voor dat jij toevallig een steekproef hebt waarin optimistischer mensen ook meer sociale steun ervaren. Dan vindt je toch een correlatie tussen sociale steun en optimisme (hoewel die in de populatie, 'in het echt', niet bestaat). Door dit verband tussen sociale steun en optimisme, vindt je ook een correlatie tussen sociale steun en extraversie; immers, mensen die meer sociale steun ervaren, zijn optimistischer, en mensen die optimistischer zijn, zijn extraverter.

In deze situatie zou je dus bivariate correlaties vinden tussen alle drie je variabelen. Een deel van het voorspellende vermogen van optimisme wordt dus gedeeld met sociale steun. Dit heeft zogenaamde 'collineariteit' - een deel van de lineaire samenhang tussen je voorspellers is gedeeld.

Nu komt het: in een regressie-analyse wordt dergelijke gedeelde voorspelling uit het model gelaten. De samenhang tussen sociale steun en extraversie, die slechts via het verband met optimisme bestond, wordt dus verwijderd ('uitgepartialiseerd'). Hierdoor wordt het verband tussen sociale steun en extraversie zwakker, en dit is dus niet langer significant; sociale steun hing immers slechts met extraversie samen via optimisme. Maar: deze overlap in voorspelling wordt natuurlijk verwijderd bij optimisme, die daardoor ook weer zwakker samenhangt met extraversie. Hierdoor is het mogelijk dat optimisme ook niet langer significant is.

Daarnaast heeft collineariteit nog een nadeel: het is slecht voor je power. Dit betekent dat je meer proefpersonen nodig hebt om significante resultaten te vinden; zie hiervoor http://oupsy.nl/help/258/correlaties-tussen-tussen-predictoren-regressieanalyses. In dat antwoord staat ook een visuele uitleg van het verhaal over overlappende voorspellingen van net.

Het feit dat je in je steekproef vindt dat je onafhankelijke variabelen gezamenlijk geen significante voorspelling leveren kan dus liggen aan een power-probleem (te weinig proefpersonen gegeven de samenhang tussen je voorspellers ('collineariteit')) of aan confounding (voorspellers die zowel met elkaar als de afhankelijke variabele samenhangen, waardoor relevante voorspellende waarde van andere voorspellers wordt verwijderd uit het model).

Je kunt in SPSS de 'tolerantie' en 'VIF' per voorspellers bestellen (zie http://oupsy.nl/help/35/wat-zijn-de-vif-en-tolerance-bij-regressie-analyse). Deze kunnen je helpen te bepalen of er bepaalde voorspellers zijn die in het bijzonder veel verklaarde variantie 'opeten' door hun overlap met andere voorspellers. Door deze uit je model te laten kun je kijken of je met de overige voorspellers alsnog een bruikbaar model kunt bouwen.

beantwoord 2 september 2013 door gjp (63,260 punten)
...