Het hangt allemaal af van de originele bedoeling van de vragenlijst. Als de schaal bestaat uit meerdere items, dan is de schaal waarschijnlijk bedoeld om over alle items een gemiddelde of somscore te berekenen (maakt eigenlijk niet uit welke je kiest; het gemiddelde is robuster in het geval van missing data).
Hoewel ieder individueel item in de schaal een ordinaal meetniveau heeft, is het meetniveau van de somscore of het gemiddelde iets tussen ordinaal en interval in (quasi-interval). Een nonparametrische toets hierop gebruiken levert in de basis onnodig veel powerverlies op. Omdat in de meeste gevallen de samengestelde Likert-schalen zich voldoende continue gedragen kun je beter eerst toetsen of de samengestelde schaal zich bijvoorbeeld voldoende normaal verdeeld gedraagt. Zo ja, dan heeft een parametrische toets (linear model in dit geval) meer power.
Non-parametrische toetsen hebben hun voordelen, maar doordat er voor het gedrag van de data geen onderliggende verdeling wordt gebruikt, is een non-parametrische toets minder 'scherp' dan een parametrische toets. Het kiezen voor een nonparametrisch alternatief moet dus altijd gezien worden als een trade-off; een kosten-baten analyse. Hoeveel power 'red' ik wanneer ik nonparametrisch ga?
In het geval van het gemiddelde of de som van Likert-schalen zou ik zeker niet beginnen met nonparametrische middelen. Toets eerst of je met een goed geweten de parametrische opties kunt kiezen, zoals t-toets, anova, of regressie. Maar dat hangt ook van het aantal items af. Als je schaal maar uit twee of drie items bestaat (en stel dat je dan ook nog geen 5-punts, maar een 2 of 3-puntsschaal zou hebben), dan zou ik wel eerder naar het nonparametrische zoeken.