Als je een gemiddelde berekent, kun je specificeren hoeveel van de variabelen die je middelt een geldige (i.e. non-missing) waarde moeten hebben om een gemiddelde te kunnen berekenen. Als je tien variabelen middelt, vind je het misschien acceptabel als er twee of drie missende waarden zijn. Als je vier variabelen middelt, wil je wellicht dat er minimaal twee of drie geldige waarden zijn. Als er te veel missings zijn, wil je liever dat het gemiddelde ook missing is.
In SPSS kun je dit doen door MEAN.2, MEAN.3, MEAN.5 etc te gebruiken, om het gemiddelde alleen te berekenen voor rijen in je dataset met respectievelijk 2, 3, of 5 geldige waarden, dus bijvoorbeeld:
DATASET ACTIVATE dat.
COMPUTE gemiddelde = MEAN.2(var1,
var2,
var3).
In R kun je dit doen door validMeans te gebruiken, bijvoorbeeld:
dat\$gemiddelde <- validMeans(dat\$var1,
dat\$var2,
dat\$var3,
requiredValidValues=2);
(Waarbij je dan dus kunt instellen hoeveel valid values je vereist met requiredValidValues.)
Naast schaal-lengte (i.e. aantal variabelen/items) kunnen er natuurlijk ook andere redenen zijn om meer valide waarden te eisen, bijvoorbeeld omdat je uit eerder onderzoek weet dat een hoog percentage van de vragen belangrijk is om een bepaald construct goed te meten.