Ik denk dat de sterkste richtlijnen gegeven worden in het boek van Tabachnik en Fidell (2013, 6th edition), waar in hoofdstuk 4 zeer uitgebreid en goed onderbouwd allerlei stappen in het dataopschoningsproces besproken worden.
Maar als je hele specifieke vragen hebt dan is het vaak krachtiger om zelf op zoek te gaan naar artikelen over het onderwerp. Veel van het algemene advies geldt vaak ook alleen maar voor algemene scenario's. Er zijn telbare factoren die in een beslissing kunnen meewegen. Het helpt om te onthouden dat zodra data zich niet perfect naar assumpties gedraagt eigenlijk alles vanaf dat moment weinig meer is dan damage control. Er is enkel nog een bak met suboptimale oplossingen.
Dus als je wilt weten wat de recentste inzichten zijn over het aantal missings in een schaal, dan kun je het beste zoeken naar methodologische artikelen hierover.
Ook kan het zinvol zijn om eens te kijken naar de literatuur over imputatietechnieken (invullen van missende waarden). Een aardig startpunt is:
Musil, C. M., Warner, C. B., Yobas, P. K., & Jones, S. L. (2002). A Comparison of Imputation Techniques for Handling Missing Data. Western Journal of Nursing Research, 24(7), 815–829.
https://doi.org/10.1177/019394502762477004