Ik heb een dataset met een twee criteriumvariabelen en verschillende predictoren (allemaal van interval niveau). Mijn steekproef is te klein (voldoet niet aan de vooraf bepaalde power), en de N voor elke variabele verschilt. Met andere woorden, er is sprake van missing data.
- Criteriumvariabele 1: N = 110
- Criteriumvariable 2: N = 148
- Predictor 1: N = 161
- Predictor 2: N = 161
- Predictor 3: N = 159
- predictor 4: N = 110
- predictor 5: N = 161
- Predictor 6: N = 161
Als ik alleen cases wil meenemen die geen enkele missende waarde hebben, dan heb ik N = 97 cases over.
Ik wil enkelvoudige en een meervoudige regressies uitvoeren. De afweging die ik maak is om gebruik te maken van pairwise deletie voor de missing values, in plaats van listwise, om zoveel mogelijk data te behouden.
Als ik de literatuur bekijk kom ik er niet echt uit of dit een juiste beredenering is. Ik kom namelijk ook literatuur tegen die stelt dat pairwise altijd afgeraden wordt, omdat het voor bias zorgt in de resultaten.
Dus mijn vraag: is het in dit geval verantwoord om te kiezen voor pairwise in plaats van listwise om met missing data om te gaan?