Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Waarom verkrijg ik geen correcte output wanneer ik via R oef. 4 van de oefencasus maak?

0 leuk 0 niet-leuks

Hieronder het commando dat ik intypte en de verkregen output.

Vermits het om een onafhankelijke t-toets gaat, verwachtte ik het gemiddelde van de totale agressie voor jongens en het gemiddelde van de totale agressie voor meisjes te verkrijgen. Nu krijg ik het gemiddelde van de totale agressie voor alle proefpersonen en het gemiddelde van het geslacht (wat zelfs compleet zinloos is).

Zou de oorzaak misschien kunnen zijn dat de variabele 'sex' bij de 'variable view' omschreven staat als 'scale' i.p.v. 'nominal' en het programma R de variabele 'sex' dus niet herkent als een dichotome variabele?

> meanDiff(dat\$aggression_total, dat\$sex);
Input variables:

  sex
  aggression_total
  Mean 1 (aggression_total) = 81.93, sd = 26.32, n = 384
  Mean 2 (sex)= 1.5, sd = 0.5, n = 384

Independent samples t-test (tested for equal variances, p < .001, so unequal variances)
  (standard deviation used of largest sample, 0.5)

95% confidence intervals:
  Absolute mean difference: [77.79, 83.07] (Absolute mean difference: 80.43)
  Cohen's d for difference: [152.61, 168.68] (Cohen's d point estimate: 160.65)
  Hedges g for difference:  [152.46, 168.52] (Hedges g point estimate:  160.49)

Achieved power for d=160.65: 1 (for small: 0.7904; medium: 1; large: 1)

(secondary information (NHST): t[383.28] = 59.88, p < .001)

gevraagd 15 december 2016 in Inleiding Data Analyse (IDA) door tinekevanherck (410 punten)

1 Antwoord

1 leuk 0 niet-leuks

[EDIT: de nieuwste versie van het userfriendlyscience package, 0.5-2, kijkt nu naar het aantal waarden in beide variabelen die je aanbied. Ook als je een variabele niet als factor meegeeft, wordt hij nu goed verwerkt. Je kunt deze versie installeren met install.packages('userfriendlyscience');]

Goede interpretatie van wat er fout gaat! Je ziet correct dat R beide variabelen als intervalniveau ziet. Dat komt omdat ze zijn ingesteld als zogenaamde 'numeric vectors', in plaats van als 'factors. Je kunt hier op verschillende manieren mee omgaan.

De 'beste manier' is om sex correct in je dataset op te slaan. Dat kan op de volgende manier:

dat\$sex <- factor(dat\$sex);

Je kunt ook aangeven welke niveaus sex heeft:

dat\$sex <- factor(dat\$sex, levels=c(1,2), labels=c('female', 'male'));

Je kunt dit echter ook doen terwijl je meanDiff aanroept:

meanDiff(dat\$aggression_total, factor(dat\$sex));

Dat werkt ook. Normaal is het handig om van alle variabelen de meetniveaus correct in te stellen in je dataset (dus alle categorische variabelen als factor, de rest als numeric).

Je had dit dus al bijna zelf ge-'troubleshoot', heel goed!!!

beantwoord 16 december 2016 door gjp (63,910 punten)
bewerkt 16 december 2016 door gjp
...