Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Wat als de gemiddelde VIF waarde substantieel boven 1 uitkomt?

0 leuk 0 niet-leuks

Goedemiddag,

Volgens Field mag de gemiddelde VIF-waarde niet substantieel afwijken van 1. Wat kan ik het beste doen als deze wel substantieel afwijkt en heeft dit grote gevolgen voor mijn uitkomsten? 

 

Collinearity Statistics
Tolerance VIF
   
,387 2,585
,320 3,127
,661 1,513
,483 2,071
,652 1,534
,748 1,336
,766 1,305
,913 1,095
,740 1,352
,863 1,159
,677 1,476
,631 1,586
,659 1,517
,786 1,272

Wat verder opvalt in mijn output onder collinearity diagnostics, is dat enkele predictors niet op slechts één waarde hoog laden, maar wat halfhoog op meerdere factoren binnen dezelfde, of rij. Wat is de samenhang hiervan met VIF en hoe kan ik dit interpreteren? En vooral: is dit problematisch en moet ik hier iets mee, of valt dit nog binnen het acceptabele?

Collinearity Diagnostics
Model Dimen sion Eigen value Condition Index Variance Proportions
(Constant) 2 3 4 5 6 7 8 9 10 11 12 13 14 15
4 1 3,670 1,000 ,00 ,02 ,02 ,02 ,02 ,02 ,01 ,02 ,00 ,00 ,00 ,00 ,01 ,00 ,00
2 1,679 1,478 ,00 ,00 ,00 ,01 ,00 ,00 ,03 ,00 ,00 ,10 ,02 ,01 ,01 ,15 ,11
3 1,495 1,567 ,00 ,00 ,00 ,00 ,01 ,00 ,00 ,00 ,01 ,00 ,00 ,22 ,17 ,01 ,00
4 1,168 1,773 ,00 ,00 ,00 ,00 ,00 ,00 ,00 ,05 ,07 ,11 ,35 ,00 ,00 ,02 ,08
5 1,018 1,899 ,41 ,01 ,00 ,01 ,00 ,01 ,00 ,04 ,34 ,02 ,00 ,01 ,00 ,00 ,04
6 ,989 1,926 ,58 ,00 ,00 ,02 ,00 ,00 ,00 ,03 ,26 ,02 ,00 ,01 ,00 ,00 ,02
7 ,872 2,051 ,01 ,00 ,01 ,09 ,05 ,01 ,44 ,01 ,00 ,00 ,02 ,01 ,01 ,03 ,13
8 ,823 2,111 ,00 ,01 ,00 ,03 ,00 ,00 ,09 ,01 ,12 ,18 ,35 ,00 ,00 ,03 ,14
9 ,666 2,348 ,00 ,03 ,02 ,03 ,02 ,06 ,00 ,68 ,04 ,04 ,01 ,02 ,00 ,00 ,13
10 ,655 2,367 ,00 ,11 ,00 ,06 ,08 ,50 ,02 ,02 ,04 ,02 ,00 ,01 ,03 ,02 ,00
11 ,593 2,487 ,00 ,02 ,01 ,52 ,00 ,20 ,10 ,13 ,01 ,00 ,04 ,01 ,03 ,03 ,04
12 ,414 2,978 ,00 ,03 ,00 ,00 ,02 ,02 ,12 ,01 ,00 ,44 ,13 ,05 ,07 ,61 ,17
13 ,399 3,031 ,00 ,00 ,00 ,00 ,08 ,06 ,03 ,00 ,07 ,05 ,00 ,62 ,62 ,06 ,04
14 ,342 3,278 ,00 ,14 ,16 ,15 ,68 ,03 ,12 ,00 ,02 ,01 ,05 ,03 ,03 ,03 ,01
15 ,216 4,119 ,00 ,64 ,79 ,05 ,03 ,08 ,02 ,00 ,01 ,01 ,02 ,00 ,02 ,01 ,09

Ik ben erg benieuwd.

Groeten,

Astrid

gevraagd 5 juni 2015 in Multivariate statistiek door Astrid (160 punten)
bewerkt 5 juni 2015 door Astrid

1 Antwoord

1 leuk 0 niet-leuks
Hoge VIF-waarden betekenen dat je voorspellers relatief sterk met elkaar samenhangen, wat zich uit in verlaagde power (grotere standaardfouten van je voorspellers) en onbetrouwbare (instabiele) waarden van de schattingen van je regressie-coefficienten.

In jouw geval lijken je VIF-waarden echter heel erg mee te vallen? De hoogste is 3.1, en de meesten zijn amper hoger dan 1?

De factorladingen in de tweede tabel kunnen je helpen om, in het geval van multicollineariteit, te bepalen welke voorspellers sterk samenhangen. Echter, in dit geval is er geen sprake van multicollineariteit. Neem in de onderste regel bijvoorbeeld de eerste twee items; deze twee laden wat sterker op dezelfde factor. Echter, hun onderlinge samenhangt is nog steeds relatief laag; de tolerance van deze items ligt rond de .35, dus elk item is voor maximaal 65% te verklaren uit andere items. Dit had je liever lager gehad, maar het is niet zo hoog dat het problematisch is.

Als je steekproefomvang niet aan de lage kant is (100 deelnemers is bijvoorbeeld erg weinig met zoveel voorspellers) hoef je je niet zoveel zorgen te maken.
beantwoord 8 juni 2015 door gjp (63,300 punten)
...