Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe verwijder in in R deelnemers die missing values (NA) hebben op een gegeven variabele?

0 leuk 0 niet-leuks
Je mag nooit direct in je dataset werken. Ik wil echter deelnemers verwijderen die de vragenlijst grotendeels niet hebben ingevuld. Hoe doe ik dat?
gevraagd 18 december 2016 in Anders door gjp (63,260 punten)

1 Antwoord

0 leuk 0 niet-leuks

Dit kan met is.na() (zie ?is.na), bijvoorbeeld:

require('userfriendlyscience');
dat.raw <- getData();
dat.clean <- dat.raw[!is.na(dat.raw$dieEneVariabele), ];

Het uitroepteken betekent 'not', en draait een logische vector om: TRUE wordt FALSE en FALSE wordt TRUE. is.na() kijkt of een variabele missing (NA) is of niet, en geeft TRUE terug voor missing values, en FALSE voor niet-missing-values. Met dit commando selecteer je dus uit dataset dat.raw de regels die geen missing value hebben voor dat.raw$dieEneVariabele.

beantwoord 18 december 2016 door gjp (63,260 punten)
...