Een 'factor' is een 'lineaire transformatie van je variabelen'. De algoritmes die achter de schermen worden uitgevoerd bij een factoranalyse proberen nieuwe variabelen te creeeren (factoren of componenten) die op zo'n manier varieren dat je met zo weinig mogelijk factoren/componenten zoveel mogelijk variantie in je variabelen kunt verklaren.
Stel je voor dat je drie items hebt die allemaal hetzelfde meten. Je meet bijvoorbeeld de intentie om op zaterdagmiddag te gaan studeren voor Onderzoekspracticum psychologisch survey (Onderzoekspracticum cross-sectioneel onderzoek). De items zijn bijvoorbeeld (dit zijn slechte items, maar wel lekker kort, en het gaat om het idee :-)):
- Ik ben van plan om zaterdagmiddag te gaan studeren.
- Ik wil zaterdagmiddag gaan studeren.
- Ik zal zaterdagmiddag gaan studeren.
Theoretisch is deze operationalisatie ontworpen om maar 1 variabele te meten. Toch zijn het drie verschillende items, en ze meten dus niet exact hetzelfde: ze hebben wat gedeelde variantie en wat unieke variantie. Die unieke variantie is eigenlijk niet interessant - dat is te beschouwen als item-specifieke meetfout. Wij zijn juist geinteresseerd in de overlap tussen de items: de variantie die ze alle drie delen.
Als we deze items nu in een factoranalyse gooien, is de factor die eruitkomt een variabele die alleen die gedeelde variantie representeert.
Het mooie van factoranalyse is dat je dit ook kunt doen als er eigenlijk twee variabelen worden gemeten. Dus stel dat ik deze vier items heb:
- Zaterdagmiddag studeren is verstandig.
- Zaterdagmiddag studeren is goed.
- Zaterdagmiddag studeren is leuk.
- Zaterdagmiddag studeren is prettig.
Deze vier meten alle vier de psychologische variabelen 'attitude'. Echter, in een factoranalyse kan blijken dat er niet een maar twee onderliggende factoren zijn. De eerste twee items laden op de eerste factor (instrumentele attitude), en de laatste twee op de tweede factor (experientiele attitude). Dit zijn twee typen attitude: twee onderliggende variabelen, in plaats van een.
Met een factoranalyse kun je dus bepalen hoeveel verschillende onderliggende variabelen er wellicht in een dataset zitten.
Als je een meetinstrument hebt dat uit meerdere items bevat, moet je ook altijd starten met een factoranalyse om de validiteit te verifieren; om te checken of alle items wel op dezelfde factor laden. Als er een structuur uitkomt met meerdere factoren, weet je dat het meetinstrument het in jouw steekproef niet goed doet. Je weet dan niet precies wat er is gebeurd en wat je nu eigenlijk hebt gemeten. Als er wel de structuur uitkomst die je verwacht (alle items laden bijvoorbeeld op 1 factor), dan kun je vervolgens naar betrouwbaarheidscoefficienten gaan kijken.
Zie voor wat meer informatie bijvoorbeeld http://www.tandfonline.com/doi/full/10.1080/17437199.2015.1124240