Ik veronderstel in deze uitleg dat je met een 'veranderlijke' een 'variabele' bedoelt.
Er zijn zeer zelden goede argumenten om een interval-variabele in groepen in te delen.
De belangrijkste reden is dat er bijna nooit redenen zijn om het te doen; een andere belangrijke reden is dat je power verliest, dus dus meer proefpersonen nodig hebt, wat middelen (tijd en geld) kost en minder ethisch is omdat je beslag legt op de tijd en energie van meer proefpersonen; en tot slot is een goede reden om variabelen niet in te delen in categorieen dat er zelden betekenisvolle categorieen bestaan.
Dit laatste punt raakt al aan je vraag; er is geen regel voor hoe je een interval-variabele in categorieen in kunt delen. Met percentielen kun je bijvoorbeeld drie ongeveer even grote groepen maken; percentiel 0-33, 34-66, en 67-100. Het probleem hiervan is, dat mensen in het 33ste percentiel opeens als heel anders worden beschouwd dan mensen in het 34ste percentiel; maar diezelfde mensen in het 33ste percentiel worden als identiek beschouwd aan de mensen in het 1ste percentiel.
Dit probleem kan worden opgelost door meer categorieen te kiezen (vier, of vijf, of zes, of ...) met als meest adequate oplossing evenveel categorieen te kiezen als er waarnemingen zijn (het equivalent van uberhaupt niet hercoderen in categorieen, dus).
Het aantal categorieen dat je kiest heeft direct invloed op de power. Een dichotome variabele (twee categorieen) heeft het minste power; met drie categorieen heb je al iets meer power; en een interval-variabele heeft het meeste power.
Als je dus een verband onderzoekt tussen leeftijd als onafhankelijke variabele, en een andere interval-variabele zoals extraversie als afhankelijke variabele, ga je leeftijd niet in categorieen indelen om een anova te kunnen doen. Je berekent simpelweg een correlatie-coefficient (Pearson's r).
Je kunt dit zelf uitproberen door een dataset te pakken, Pearson's r te berekenen, daarna een interval-variabele in categorieen in te delen, en een eenweg variantieanalyse te doen. Je zult zien dat de p-waarde lager is (tenzij je toevallig aparte categorieen hebt gekozen, maar dat wordt te ingewikkeld om nu op in te gaan).
PS: heel soms bestaan er overigens wel zinvolle grenswaarden om een interval-variabele in subcategorieen in te delen. Hoewel depressie in principe op een schaal wordt gemeten, is er pas wanneer mensen boven een bepaalde waarde scoren sprake van de diagnose 'depressie'. Hiermee kunnen proefpersonen dus wel zinvol worden ingedeeld. In de meeste gevallen bestaan er echter geen zinvolle grenswaarden. Een alternatieve aanpak die meer te verdedigen is, is proefpersonen selecteren die erg hoog en erg laag scoren; bijvoorbeeld in het eerste versus het derde tertiel (dus percentielen 0-33 versus 66-100). In dat geval is er nog steeds power-verlies natuurlijk, des te meer omdat de middelste groep wordt verwijderd, maar de groepen verschillen tenminste wezenlijk van elkaar.