Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Waar kan ik vinden hoe je statistische toetsing rapporeert? In opdracht 2.2.2 moet de F-ratio gerapporteerd worden daar worden als df 4,140 gegeven.. waar komen deze getallen vandaan? Er zitten 145 cases in het bestand.. verderop moeten t- waarden worden gerapporteerd daar staan 140 vrijheidsgraden.. waar  vind ik de regels omtrent deze rapportage getallen van vrijheidsgraden.. handboek manual publication en andy field kan ik er geen duidelijke richtlijnen over vinden.
in Cross-sectioneel Onderzoek (OCO, PB08x2) door (1.1k punten)

1 Antwoord

1 leuk 0 niet-leuks

Dit betreffen de vrijheidsgraden van de teller en noemer van de berekening van F:

$$F = \frac{ MS_\text{error + effect} }{ MS_\text{error} } = \frac{ MS_\text{tussen groepen} }{ MS_\text{binnen groepen} }$$

(de eerste is de algemene vorm van de formule; de tweede is de versimpelde situatie die je hebt als je een eenweg anova doet)

MS staat voor variantie; dit is de SS (sum of squares, dus de gekwadrateerde afwijkingen van het gemiddelde) gedeeld door de bijbehorende Df (degrees of freedom, dus de vrijheidsgraden; het aantal mensen of groepen waarvan die afwijkingen van het gemiddelde zijn opgeteld in de SS, minus 1).

Dus:

$$MS = \frac{SS}{Df}$$

In de anova tabel in je uitvoer staan al deze getallen. De 'oneway' functie in het 'userfriendlyscience' package voor R geeft bijvoorbeeld deze tabel, die bijna precies hetzelfde is als die van SPSS:

> oneway(dat$pesten, dat$sekse);
### Oneway Anova for y=pesten and x=sekse (groups: vrouw, man)

Eta Squared: 95% CI = [0; 0.06], point estimate = 0.01

                                  SS Df   MS    F    p
Between groups (error + effect) 0.04  1 0.04 0.38 .541
Within groups (error only)      7.18 73  0.1

 

door (77.8k punten)
Maar die F-ratio is anders als F van een ANOVA?

En waarom is 140 de df bij de t-statistiek in de meervoudige regressieanalyse? Die df staat niet aangegeven in de tabel 'coefficients'

Anders dan :-)

En nee, dat is precies hetzelfde! F is altijd een ratio.

Bij een regressie-analyse is het aantal vrijheidsgraden van de standaardfout van een regressie-coefficient, het aantal vrijheidsgraden van de t-toets die je uitvoert om te toetsen of de regressie-coefficient gelijk is aan 0, gelijk aan de vrijheidsgraden van de error in de anova van het hele model. Die tabel staat bovenaan in SPSS. Als je met r bijvoorbeeld een regressie-analyse uitvoert met de 'regr' functie in het 'userfriendlyscience package, krijg je dit:

> regr(dat$avoidance ~ dat$socialsupport);
Regression analysis for formula: avoidance ~ socialsupport

Significance test of the entire model (all predictors together):
  Multiple R-squared: [-0.01, 0.01] (point estimate = 0, adjusted = -0.01)
  Test for significance: F[1, 99] = 0.06, p = .81

Raw regression coefficients (unstandardized beta values, called 'B' in SPSS):

              95% conf. int. estimate   se     t     p
(Intercept)     [1.75; 2.36]     2.06 0.15 13.47 <.001
socialsupport  [-0.14; 0.11]    -0.02 0.06 -0.24   .81

Scaled regression coefficients (standardized beta values, called 'Beta' in SPSS):

              95% conf. int. estimate  se     t    p
(Intercept)      [-0.2; 0.2]     0.00 0.1  0.00 1.00
socialsupport  [-0.22; 0.18]    -0.02 0.1 -0.24  .81


De t-toets van die regressie-coefficient heeft dan 99 vrijheidsgraden. Je kunt dit ook controleren in R:

> (pt(-.24, df=99))*2
[1] 0.8108265

Zoals je ziet is deze p-waarde precies de p-waarde in de tabel.

ik snap niet hoe in de uitwerking van opdracht 2.2.2 bij de notering van de t-waarden aan die (140) gekomen is. Dit is een voorbeeldje:

t(140)= ‐0.197;p=.844

Ik gebruik geen r. ik vind het ook heel lastig dat er ineens met syntaxes wordt gewerkt en r tussendoor in de bronnen. Andy Field werkt vrijwel alleen via de menustructuur.. het is als student erg lastig mee te komen merk ik.. r of spps? menu of syntax? ik heb het gevoel van alles een beetje mee te krijgen en dat dat een ten koste gaat van de coherentie in de modules en het echt vaardig worden met spss. Alles van de vorige modules is ook weggezakt.. en ff andy field doorwerken is ook niet echt een optie qua tijd.
In die terugkoppeling staan de gegevens van de anova waarmee het model wordt getoetst: "Vervolgens kijken we naar de ANOVA tabel en zien daar de volgende gegevens: F(4,140) = 83.847; p < .001. Hieruit mogen we concluderen dat het model statistisch significant is, hetgeen niet veel meer betekent dan dat er meer dan 0% variantie wordt verklaard van de angstdimensie."

Die 140 is dus het aantal vrijheidsgraden van de error in je model, en dat zijn de vrijheidsgraden van de t-toetsen waarmee wordt getoetst of de coefficienten gelijk zijn aan 0.

Met betrekking tot R vs SPSS en menu's vs syntax het volgende.

R is een open source alternatief voor SPSS. R is een stuk krachtiger, en, als je eenmaal gewend bent, sneller en gebruikersvriendelijker dan SPSS. Tegelijkertijd wordt SPSS (nog) het meeste gebruikt, en daarom zit dat in het curriculum (maar als je de bronnen in de M&T community op Studienet bekijkt, zul je R ook tegenkomen). Een verschil tussen SPSS en R is dat R normaal alleen met scripts/functies (wat in SPSS de 'syntax' heet), werkt. Je kunt een menu installeren, maar de meeste mensen doen dat niet, omdat het onhandiger is dan commando's gebruiken. Je hoeft dus sowieso geen R te gebruiken; voor de cursussen in het curriculum volstaat SPSS. De output van de anova en regressie-analyse functies die ik hier liet zijn is praktisch hetzelfde voor SPSS en R (en ik gebruik R omdat het, wel, beter is :-)).

Met betrekking tot de menu's versus de syntax geldt dat je als wetenschapper de menu's eigenlijk bijna niet gebruikt. Dat wil zeggen, wel om commando's in je syntax te 'Paste'-n, maar je werkt altijd sowieso met de syntax. Dat is nodig omdat onderzoek 'repliceerbaar' moet zijn: je moet een volledig logboek van je analyses hebben, zodat je zelf later terug kunt zoeken wat je hebt gedaan, en zodat anderen kunnen kijken wat je hebt gedaan.

Het idee van de menu's is dat het onderwijs daarmee start omdat het voor veel mensen wat herkenbaarder is. Op die manier zijn er niet te veel nieuwe dingen tegelijk.  Omdat je als wetenschapper de syntax wel degelijk dient te beheersen wordt de hoeveelheid syntax langzaam 'opgeschroeft'. Bovendien zijn er dingen die alleen met de syntax kunnen, dus het is voor het onderwijs sowieso nodig.

Dus, mijn advies zou zijn om vanaf nu vooral met de syntax te werken. Het is efficienter, en je zult die steeds vaker gaan gebruiken. Met betrekking tot SPSS vs R zou ik als ik jou was SPSS blijven gebruiken, hoewel je R ernaast alvast kunt verkennen als je wil. Het voordeel van R is namelijk dat het gratis is, dus dat kun je blijven gebruiken, ook als je OU licentie voor SPSS verloopt.
Bedankt dat is duidelijk :)
...