In een vragenlijst wordt vrijwel zelden een construct met een enkele vraag gemeten. Er zijn wel single-item-scales (zie bijvoorbeeld: de SISE), maar de meeste vragenlijsten behandelen constructen die te complex zijn om met een enkele vraag te vangen.
Dat betekent dat in vragenlijsten meerdere items (vragen) worden gesteld, waarbij de onderzoeker eigenlijk niet geinteresseerd is in de antwoorden op iedere vraag op zichzelf. Alle items zijn facetten van een construct (bijvoorbeeld, zie als contrast de 10-item Rosenberg Self-Esteem Scale; RSE), en alleen al deze puzzelstukjes bij elkaar geven het complete plaatje weer.
Dus, met COMPUTE heb je de puzzelstukjes bij elkaar gelegd. Het duurt te lang om in te gaan op de klassieke testtheoretische aannames die bij dit gebruik van de COMPUTE procedure horen, maar simpel gezegd: als ieder item een even zwaarwegend facet is in de vragenlijst, dan kun je met de somscore, of het gemiddelde van al die items een indruk krijgen van iemands geschatte 'werkelijke' score op dat construct. Het 'werkelijke' in de vorige zin verwijst naar een wiskundig construct (True Score) en wordt dieper uitgelegd in de cursus Test- en Toetstheorie.
Dus, simpel gezegd: met COMPUTE heb je de vragenlijstantwoorden samengevat tot een enkel getal dat een 'waarheid ligt in het midden' beeld zou moeten geven van iemands score op het construct in kwestie.
NB: merk op dat in de cursus bij Factoranalyse een andere testtheoretische benadering wordt geintroduceerd. Met de factoranalyse wordt duidelijk dat items in een vragenlijst zelden een precies evenzware relatie hebben met het doelconstruct. In de praktijk lijkt het weinig op te leveren om in een COMPUTE opdracht de schaalscore te wegen naar de factorladingen per item; de correlatie tussen factorscores en gemiddelde- of somscores ligt vrijwel altijd tussen de .[98 en de 1.00>