Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
  1. Wat je vraag is;
    Voor de cursus IDA ben ik ter oefening spreidingsmaten en beschrijvingsmaten aan het uitdraaien van bestand Statistiek_Angst in SPSS. Als ik het commando Examine draai komt er soms een andere (verkeerde) standaard deviatie uit als ik extra variabelen toevoeg.

    Hoe komt dit? In wat voor situaties kan dit voorkomen en hoe kan ik voorkomen dat dit bij latere analyses gebeurd en ik dus met de verkeerde maten ga werken zonder dit te weten?
     
  2. Wat je precies hebt gedaan;
    Na openen en hernoemen van bestand Statistiek_Angst naar dat:

    dataset activate dat.
    Examine Variables =Age.

    Versus

    dataset activate dat.
    Examine Variables =Age Education.
     
  3. Welke uitkomst, output of foutmelding (e.g. van SPSS) je kreeg;

    Voor het 1e Examine commando was de standaard deviatie voor Age 6.03
    Voor het 2e Examine commando was de standaard deviatie voor Age 6.01
     
  4. Wat je interpretatie daarvan is
    Volgens mij is de standaard deviatie voor Age 6.03, dat is wat ik via het normale 'descriptives' commando ook krijg. Daarom is 6.01 volgens mij incorrect. Opeens afrondingsfouten krijgen door het toevoegen van variabelen lijkt mij niet plausibel.
     
  5. En wat je eigenlijk had willen hebben.
    Een betrouwbare standaard deviatie die altijd hetzelfde is, onafhankelijk van de andere variabelen die ik tegelijkertijd bekijk
in SPSS door (290 punten)
Supergoede vraag, en heel goed gesteld volgens de richtlijnen, dank daarvoor!!!

Ik weet dit niet zeker, vandaar dit antwoord als 'opmerkingen' en niet als antwoord, dat laat ik aan de examinator over, maar: de meest logische verklaring lijkt mij dat er missende waarden in ''education" zitten, waardoor er minder mensen meedoen bij de berekening van de SD als je "education" ook toevoegt. Dat zou het verschil verklaren, en dan zou alles bovendien kloppen :-)

Overigens is de standaarddeviatie die je in een steekproef berekent altijd onderhevig aan toeval. Als die steekproef wordt herhaald, dan is de SD msch 5 of 7 (en die SD heeft een betrouwbaarheidsinterval die aangeeft hoe accuraat deze schatting is in deze steekproef, en hoe realistisch het dus is om aan te nemen dat hij de volgende keer 2 of 8 kan zijn, of dat zelfs een SD van 5 al heel uitzonderlijk zou zijn).

Dus ik snap de onzekerheid mbt kleine afwijkingen, maar als geruststelling: alle schattingen zijn zo 'ruizig' dat kleine afwijkingen nooit echt uitmaken :-)

1 Antwoord

1 leuk 0 niet-leuks
Het gaat inderdaad om missing values. Omdat er bij Education 8 ontbrekende waardes zijn, wordt in dat geval ook voor Age alles berekend voor 160 respondenten i.p.v. 168.
door (15.0k punten)

Beiden bedankt voor de antwoorden.

Ik had gekeken naar 'missing' maar zag dat er bij zowel education en age 8 missing waren. https://onderzoeksvragen.ou.nl/?qa=blob&qa_blobid=822453146823328423

Ik begrijp dan ook dat de 'case processing summary' voor 'missing' ook het hoogste aantal gebruikt wat beschikbaar is voor alle variabelen en als ik dus wil weten voor welke variabelen er missing data is ik niet dit overzicht moet gebruiken.

gjp, goed punt over de kleine afwijkingen, maar ik wil dan inderdaad wel snappen waarom het zo is, en of ik niet iets fout doe, want voor je het weet heb je opeens ergens een heel groot verschil. Nu ik het snap ben ik weer helemaal gerustgesteld ;)

...