Er zijn methoden om met dataproblemen om te gaan. Een belangrijke disclaimer: gebruik deze methode enkel wanneer je goed begrip hebt van de voor- en nadelen en randvoorwaarden van de methoden,
Outliers kunnen bijvoorbeeld worden aangepast. De botste bijl (naast verwijderen) is om de variabele in meetniveau te reduceren. Door een intervalvariabele als ordinaal te behandelen verdwijnt de absolute afstand tussen observaties, en wordt enkel de rangorde bewaard. Zo verdwijnen de meeste outliers, maar ook veel informatie. Een minder botte bijl is een advies van Tabachnik & Fidell (2007) om de extreemste outlier aan te passen, zodat deze een 'unit' hoger is dan de hoogste waarde eronder. Een unit is een op het oog geschatte afstand die er over het algemeen tussen de observties in de data is. Zo is de outlier nog steeds de hoogste (of laagste) waarde, maar niet meer de analyse aan het domineren.
Vergelijkbaar zijn er methoden om met scheefheid om te gaan. Licht scheefheid (wanneer in de populatie een normaalverdeling verondersteld mag worden) kan opgelost worden door normaliteit te forceren door de wortel van de observaties te berekenen. Extreme scheefheid kan met het logaritme van de observaties opgelost worden (en is bijvoorbeeld zeer nuttig bij variabelen die exponentieel van aard zijn). Deze data-transformaties zijn, wanneer aan randvoorwaarden voldaan is, zeer acceptabel, maar maken de interpretatie van resultaten soms erg lastig.
Field bedoeld dus hoogstwaarschijnlijk echt 'corrigeren', maar in de context van deze cursus is het meer dan voldoende om slechts te 'rapporteren' en outliers desgewenst te verwijderen