Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Bij de terugkoppeling van opdracht 3.2.2 staat een syntax die de gewenste SPSS output genereert. Ik probeer Field te volgen en via de menustructuur dezelfde output te verkrijgen. De Classification Table bij step 0 (baseline) krijg ik wel. Echter, ik krijg in de Classification Table bij step 1 een andere uitkomst: met de twee predictoren krijg ik een percentage van 76.9% dat juist is geclassificeerd.

Wat doe ik fout?

Dit is de syntax die ik krijg via de menustructuur:

LOGISTIC REGRESSION VARIABLES @ALCOHOL_DICHOTOOM
  /METHOD=ENTER @CONTROLE_Lamborn @STRIKTE_CONTROLE_Lamborn
  /METHOD=ENTER @CONTROLE_Lamborn @STRIKTE_CONTROLE_Lamborn
  /CONTRAST (@CONTROLE_Lamborn)=Indicator
  /CONTRAST (@STRIKTE_CONTROLE_Lamborn)=Indicator
  /CRITERIA=PIN(.05) POUT(.10) ITERATE(20) CUT(.5).
in Cross-sectioneel Onderzoek (OCO, PB08x2) door (660 punten)
Is de CUT(.5) hetzelfde als de syntax in 3.2.2.? Het veranderen van de baseline cutoff kan een impact hebben op de classificatietabel
Bij de terugkoppeling van opdracht 3.2.2 staat deze syntax:

LOGISTIC REGRESSION VARIABLES @ALCOHOL_DICHOTOOM /METHOD=ENTER @CONTROLE_Lamborn @STRIKTE_CONTROLE_Lamborn /PRINT=ITER(1).

Onderaan de Classification Tables in de terugkoppeling staat dat als cut value .500 is gehanteerd. Lijkt dus overeen te komen.
De terugkoppeling lijkt slecht eenmaal een iteratie te draaien (/PRINT=ITER(1) ), terwijl je in jouw syntax 20 iteraties draait (ITERATE(20). Wat gebeurt er als je handmatig via de menu's het aantal iteraties ook op 1 zet?
het percentage in block 1 zakt iets: 76.5%, maar dat komt nog steeds niet overeen met de 75.2% die in de terugkoppeling wordt genoemd. Ook de cijfers in de andere tabellen zijn overigens afwijkend t.o.v. de terugkoppeling.
Even een check: als je de syntax uit het werkboek gebruikt, krijg je dan wel exact dezelfde uitkomst, of zijn er dan ook verschillen?

(misschien wordt er ergens 'randomheid' gebruikt in de algoritmen, waardoor kleine afwijkingen normaal zijn)
Ja, dan krijg ik wel de juiste output. Ik dacht dat het wellicht te maken had met de contrasten die ik heb ingevoerd. Als ik die weghaal wordt de syntax als volgt als ik de menustructuur probeer te volgen:

LOGISTIC REGRESSION VARIABLES @ALCOHOL_DICHOTOOM
  /METHOD=ENTER @CONTROLE_Lamborn @STRIKTE_CONTROLE_Lamborn
  /CRITERIA=PIN(0.05) POUT(0.10) ITERATE(1) CUT(0.5).

Deze syntax levert nog steeds een andere uitkomst uit dan in de terugkoppeling van opdracht 3.2.2.

1 Antwoord

0 leuk 0 niet-leuks
Hmm, vreemd. Ik vermoed dat het te maken heeft met default instellingen van SPSS. Kennelijk is het gedrag van de functie anders afhankelijk van wat je specificeert. Die default instellingen en het bijbehorende gedrag kun je nazoeken in de handleiding, als je er echt in wil duiken.

Maar ik zou als take-home message gewoon onthouden: gebruik (en documenteer) altijd de syntax, en bewaar je analysescripts (met uitleg in de comments). Op die manier zijn je analyses altijd reproduceerbaar.
door (77.8k punten)
...