Goede vraag - en zoals altijd bij goede vragen is er niet echt een antwoord :-) Er zijn veel discussies in de literatuur over wat het beste is om te doen met missing values. Daarom geef ik voor nu mijn 'persoonlijke voorkeur' door, en zal ik de vraag doorgeven aan mijn collega's (dus bij Methodologie & Statistiek) zodat zij hun visie kunnen geven.
Voor de duidelijkheid; ik veronderstel dat je met een schaalvariabele een gemiddelde (of opgetelde) variabele bedoelt, die dus het gevolg is van de middeling of optelling van meerdere items.
Als je items middelt, en iemand heeft bijvoorbeeld een of twee missing values, dan imputeer je automatisch het gemiddelde van die persoon voor die missing values in de resulterende gemiddelde (schaal) variabele. Als iemand na die middeling dus dus nog steeds een missing value heeft, is er niets bekend over hoe hoog zo'n persoon scoort.
Als je door het weglaten van dergelijke personen teveel inboet aan power, kun je inderdaad bijvoorbeeld het groepsgemiddelde gebruiken. Nog iets beter is het om het gemiddelde van vergelijkbare personen in diezelfde groep te gebruiken, dus bijvoorbeeld personen van hetzelfde geslacht die ongeveer even oud zijn. En nog beter is het om met regressie-analyse te voorspellen wat de score van deze persoon geweest zou zijn op basis van een hele serie andere variabelen.
Wat je ook doet, het is heel belangrijk dat je 1) dit vermeldt in je artikel (of bachelorthese) en 2) de analyses tweemaal uitvoert; eenmaal zonder alle personen waarbij je imputeerde, en eenmaal met. Als hier verschillen in zitten, betekent dat dat je imputatie die heeft veroorzaakt, en dan heb je natuurlijk een probleem. Als je dan bijvoorbeeld verkeerd hebt geimputeert, kan het zijn dat je daardoor je analyses hebt gesaboteerd, waardoor je verbanden vindt die er niet zijn, of verbanden die er wel zijn niet vindt.
Hoe je ook imputeert, onthoudt: het is heel belangrijk om duidelijk te vermelden wat je doet, en wat de consequenties zijn. Hierdoor kan de lezer een indruk vormen van de stabiliteit van je analyses.