Er zijn geen echt zinvolle vuistregels over dit soort missings helaas. Er zijn verschillende 'dingen die men doet', maar waarom men dat doet is vooral traditie (https://www.youtube.com/watch?v=sWSoYCetG6A)
Ik zou eerst bepalen: uit hoeveel items bestaat de schaal? Als het een grote schaal is, dan kun je meestal wel de vuistregel gebruiken: de helft plus 1 items moet ingevuld zijn voordat er een gemiddelde berekend wordt.
Als de schaal klein is, dan zou ik een strenger criterium gebruiken, bijvoorbeeld een criterium dat garandeert dat er niet minder dan vier items gebruikt worden bij het berekenen van een gemiddelde.
Ik zou nog niet op item-niveau aan missing value imputation doen. Als de schaal uit 13 items bestaat, dan is slechts 2 missings accepteren streng, maar niet ongewoon. Mijn stappenplan zou zijn:
- missing patronen bekijken:
- zijn er items die vooral vatbaar blijken voor 'missings'. Zo ja, dan is er waarschijnlijk structureel iets mis met die items. Als die items inderdaad 'vreemd' zijn (onduidelijk verwoord, controversieel, etc.) dan kunnen beter die items verwijderd worden.
- Zijn de missings vrijwel allen aan het einde van de vragenlijst/schaal? Wellicht dat mensen structurele problemen hadden met het meetinstrument (te lang, te saai, te onduidelijk, te veel moeite) en er de brui aan gegeven hebben. In dat geval moet de hele vragenlijst nog eens heel grondig bekeken worden, en is er geen simpele oplossing meer
- Zijn missings random (bijv. < 5%? Dan volgende stappen
- Met hoeveel vragen is voor je gevoel het construct goed gedekt? Als alle vragen inwisselbaar zijn, omdat het bijna perfecte synoniemen zijn, dan kun je best wat vragen missen zonder informatieverlies. Als iedere vraag een apart facet van een construct betreft, dan kun je weinig items missen, omdat ieder item veel informatieverlies betekent.
- Weinig infoverlies: houd ongeveer de helft + 1 aan, dus bij 13 items 8 items ingevulde items minimaal nodig.
- Veel infoverlies; 80% tot 100% ingevuld, afhankelijk van de mate van infoverlies, en de steekproefgrootte
- Eventueel een missing value analyse op de schaalgemiddelden. Eventueel gevolgd door een imputatietechniek, zoals EM (Expectation Maximisation), zie bijvoorbeeld:
Musil, C. M., Warner, C. B., Yobas, P. K., & Jones, S. L. (2002). A comparison of imputation techniques for handling missing data. Western Journal of Nursing Research, 24(7), 815–829. doi: 10.1177/019394502762477004