Lastig te zeggen; ik zou nooit van harde regels uitgaan. Over het algemeen wordt een conservatieve schatting gezet op .10 ICC om multilevel als noodzakelijk te beschouwen. Zie bijvoorbeeld:
Irimata, K. M., & Wilson, J. R. (2018). Identifying intraclass correlations necessitating hierarchical modeling. Journal of Applied Statistics, 45(4), 626-641.
Echter, er zijn ook studies die aannemelijk maken dat een ICC van .05 al een type-1 fout kan opleveren. Mijn advies is om een sensitiviteitsanalyse te doen; run bij een ICC kleiner dan .10 de analyse met en zonder multilevel-component. Als de resultaten niet wezenlijk veranderen kies dan voor het zuinigere model (zonder multilevel). Als resultaten wel wezenlijk verschillen dan is het zinvol om breed te kijken naar de oorzaak hiervan: misschien een outlier in een een groep, of overfitting (te weinig N voor het aantal geschatte parameters), etc.
Bottom-line: gebruik cutoffs, e.d. als een hulpmiddel, en niet als een automatisch besluitvormingssysteem