Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Hoe doe ik een factor-analyse in R

In http://oupsy.nl/files/standaard%20syntax%20file.sps wordt beschreven hoe dit gedaan wordt in SPSS. Hetzelfde wil ik doen in R
in Methodologie door (240 punten)

2 Antwoorden

0 leuk 0 niet-leuks
Een voorbeeld wordt toegelicht voor Principal Axis Factor Analysis wordt halverwege gegeven op http://www.statmethods.net/advstats/factor.html

Let erop dat in het voorbeeld een orthogonale rotatie (varimax) wordt getoond, terwijl in de praktijk psychologisch onderzoek eigenlijk standaard van oblique rotatie (zoals oblimin, etc.) uitgaat.
door (63.5k punten)
0 leuk 0 niet-leuks

Als toevoeging: ik gebruik zelf altijd de functie fa uit het package psych. Dit is een superhandig package voor o.a. psychometrie.

Package userfriendlyscience combineert een aantal van die functies in de functie fullFact (zie ?fullFact).

Wat ook heel handig kan zijn is de functie factorLoadingDiamondCIplot: die visualiseert de betrouwbaarheidsintervallen voor de factorladingen, bijvoorbeeld:

Dit is handig omdat besluiten over factorladingen op basis van puntschattingen (net als alle besluiten op basis van puntschattingen) geen goed idee zijn. Die puntschattingen verschillen namelijk van steekproef tot steekproef, en kunnen de volgende keer volslagen anders zijn. Als je steekproef groot genoeg is, kunnen ze van steekproef tot steekproef natuurlijk minder verschillen.

Hoeveel kunnen die puntschattingen van steekproef tot steekproef verschillen? Daarover heeft het betrouwbaarheidsinterval meer informatie.

De puntschatting is alleen geldig in je steekproef. Maar, je bent meestal niet geinteresseerd in je steekproef: die is alleen maar een middel om iets te zeggen over je populatie. Je betrouwbaarheidsinterval kun je gebruiken om een idee te krijgen van van wat plausibele waarden in de populatie zijn. Hoe groter de betrouwbaarheid, hoe plausibeler het is dat de populatiewaarde (bijvoorbeeld de populatie factorlading) in het betrouwbaarheidsinterval uit een gegeven steekproef ligt.

Dus: als je bijvoorbeeld 95% betrouwbaarheidsintervallen gebruikt (de 'default'), dan geldt dat als de betrouwbaarheidsintervallen van factorladingen overlappen, het niet vanzelfsprekend is om te concluderen dat die factorladingen in de populatie verschillen. Zoals je ziet geldt dat hier voor de meeste factorladingen: de evidentie dat die factorladingen verschillen is dus niet sterk.

Deze dataset ('Thurstone.33', een standaard dataset in R, zie het voorbeeld van deze functie) betreft dan ook maar 9 regels.

Dus, ik zou vooral de combinatie van fa en factorLoadingDiamondCIplot gebruiken, zoals in dit voorbeeld:

factorLoadingDiamondCIplot(fa(Thurstone.33, 2,
                              n.iter=100, n.obs=100),
                           alpha = .5);
door (77.8k punten)
...