Een principale componenten analyse geeft je een indruk van de mate waarin variabelen (meestal items van een vragenlijst) één construct meten, of meerdere constructen. Als je bijvoorbeeld een persoonlijkheidsvragenlijst afneemt, en je voert een principale componenten analyse uit, dan verwacht je vijf onderliggende factoren te vinden (de big five). Als je een vragenlijst afneemt die maar één variabele hoort te meten, verwacht je slechts één onderliggende factor te vinden.
Een principale componenten analyse doe je dus in principe altijd voordat je gemiddelden uitrekent.
Bij een zelfgemaakte vragenlijst moet je even kijken of de structuur is zoals je die had bedoeld; het kan immers zijn dat je inschatting niet klopt en dan de vragenlijst meer of minder verschillende schalen bevat. In dat geval kun je items laten vallen, of de schalen anders samenstellen. Als de uitkomst van de factoranalyse is zoals je had verwacht hoef je niets aan te passen natuurlijk.
Bij een al bestaande vragenlijst moet je kijken of deze werkt zoals hij zou moeten werken; het kan immers zijn dat de factor-structuur in jouw geval anders is. Als je een andere structuur vindt dan de vragenlijst zou moeten hebben, kan dat drie oorzaken hebben. Ten eerste zou het puur toeval kunnen zijn; ten tweede kan het zijn dat je een vreemde steekproef hebt, die niet vergelijkbaar is met de populatie waarin de vragenlijst is gevalideerd; en ten derde zou het kunnen dat de validatie niet klopt (validatie is immers ook slechts onderzoek, en niet zaligmakend).
In zo'n geval moet je beslissen hoe je hiermee omgaat. Je rapporteert dan sowieso dat je een andere structuur hebt (en je kunt eventueel de tabel met geroteerde factorladingen als bijlage bij je artikel stoppen). Vervolgens heb je een aantal opties:
-
Je kunt deze andere structuur negeren; het voordeel daarvan is dat het meetinstrument hetzelfde blijft, en de normeringstabellen etc nog van toepassing blijven (behalve dus als je steekproef niet vergelijkbaar is met de populatie waarin de vragenlijst is gestandaardiseerd), maar het nadeel is dat je de aannamen van middeling van je items schendt (zie hieronder);
-
Je kunt deze andere structuur gebruiken om de gemiddelden te berekenen door bijvoorbeeld items te laten vallen of bij andere (sub-)schalen in te delen; het voordeel daarvan is dat de aannamen van het meetrinstrument nog kloppen (elke (sub-)schaal bestaat uit een middeling van items die hetzelfde construct meten), maar het nadeel is dat je niet precies hetzelfde meetinstrument gebruikt als andere studies die die vragenlijst gebruikten.
-
Je kunt 1 en 2 combineren, door je analyses te herhalen met beide structuren. Dit is de netste oplossing. Als er hetzelfde uitkomt; mooi zo, dan kun je de uitkomsten van één van de twee analyses rapporteren, en in een voetnoot aangeven dat de uitkomsten van de andere analyse hetzelfde waren. Als er iets anders uitkomt, moet je gaan kijken naar de verschillen, en hoe die het gevolg kunnen zijn van die verschillende factorstructuur.
Als je de factoranalyse (principale componenten analyse) hebt uitgevoerd, kun je daarna per factor ((sub-)schaal) kijken hoe de interne consistentie is. Dit kan met Cronbach's alpha, maar beter is het om de GLB of Omega te gebruiken; zie voor meer informatie, en links naar pagina's met uitleg over hoe je die uitrekent, http://oupsy.nl/help/4/wanneer-is-cronbachs-alpha-hoog-genoeg