Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Voor mijn masterscriptie wil ik een CFA op een vragenlijst zelfregulatie uitvoeren (van Alonso-Tapia: emsrQ). De vragenlijst bestaat uit twee schalen, wat ik probeer te verifiëren (daarom CFA ipv EFA).

Op basis van de bron "Confirmatorische factoranalyse met lavaan" van Rolf van Geel, 2012, heb ik in R een code ingevoerd om de analyse te doen (zie verderop).

Echter, ik krijg in console de foutmelding: 

Error in lav_samplestats_icov(COV = cov[[g]], ridge = 1e-05, x.idx = x.idx[[g]],  :  lavaan ERROR: sample covariance matrix is not positive-definite

Omdat ik een echte beginner ben ik R, weet ik niet goed wat ik moet doen om dit probleem op te lossen. Kunnen jullie me verder helpen?

in Modeleren (SEM en Multilevel Analysis (mixed methods, HLM)) door (400 punten)

Bij deze de code. 

1 Antwoord

0 leuk 0 niet-leuks
Hier is niet noodzakelijkerwijs iets tegen te doen. Het is meestal een teken van te hoge correlaties tussen observed of latent variables, maar niet altijd.

Controleer voor de zekerheid of je niet per ongeluk niet ergens twee keer hetzelfde item in een latente variabele hebt gestopt
door (59.6k punten)
Duidt dat dan op 'fouten' in de data? Kan ik dat inspecteren met bijvoorbeeld correlatiematrices? Hoe kan ik de eventuele fouten op het spoor komen?
Of kan ik dan gebruik maken van een andere analyse?
de fit zal er waarschijnlijk niet door opgelost worden, maar waarom de eerste factorlading constrainen naar 1? Dat is al de default behavior van lavaan.

Het zal kunnen liggen aan de data als er perfecte correlaties zijn tussen variabelen, of items. Maar zelden is het de data. Het is vrijwel altijd het model zelf. Je kunt kijken of er zogenaamde 'Heywood cases' zijn, dus negatieve variantieschattingen in je model: https://journals.sagepub.com/doi/10.1177/0049124112442138 . Variantie moet altijd een positief getal zijn, dus de aanwezigheid van Heywood cases kan helpen om modelmispecificatie te identificeren.

Het kan ook zijn dat je model complexer is dan je steekproefgrootte aankan. Dan moet je denken aan steekproeven die ongeveer even groot zijn als het aantal parameters dat je wilt schatten.

Het kan ook zijn dat je model niet convergeert. Dus dat je meer iteraties nodig hebt om een 'uitgerekend' algoritme te bereiken.
...