Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Ik krijg Output bij het opvragen van Q-Qplots vergeleken met lesmateriaal

0 leuk 0 niet-leuks

Ik begrijp dat er soms verschillen in output te zien zijn, maar in dit geval vind ik het verschil zo groot dat er wellicht ook een andere conclusie getrokken kan worden. Dat kan niet de bedoeling zijn.

Volgende commando heb ik gegeven voor ophalen van Q-Qplot in SPSS

​ (ik heb de dataset maandag genoemd)

De volgende boxplots krijg ik en die zijn wb plaats van datapunten zeer verschillend

​Hoe komt dit en vooral wat moet ik anders doen?

Bij de output valt ook op dat in het lesmateriaal de waarden op de x as zijn weergegeven zijn als 0,1,2,3 etc. In mijn output worden daar de leeftijden weergegeven. Kan ik hier ergens bewust een keuze voor maken?

gevraagd 16 januari 2017 in Inleiding Data Analyse (IDA) door MMF (280 punten)

1 Antwoord

0 leuk 0 niet-leuks

Eigenlijk zijn de figuren bijna hetzelfde. Er zijn kleine verschillen tussen beide programma's, maar de patronen zijn hetzelfde. De verschillen zijn:

  • In SPSS zijn de X- en Y-as omgedraaid. In SPSS staan op de X-as de geobserveerde waarden, en in R staan op de X-as de verwachte waarden.
  • In R worden de waarden gestandaardiseerd, in SPSS niet. Dit verklaart je tweede punt.

Neem bijvoorbeeld de laatste variabele, Statken1. Kijk naar het histogram: deze verdeling is wat linksscheef, met de meeste mensen aan de rechterkant van de verdeling. Je ziet verder dat er wat personen zijn die relatief laag scoren (het eilandje aan de linkerkant, rond de 40, in het histogram). In de Q-Q plot in R staan de geobserveerde waarden op de Y-as, dus het eilandje van 5 scores staat linksonder, en de mensen in de 'bulk' aan de rechterkant staan rechtsboven. Daar zie je ook dat de punten het verst van de diagonaal afliggen. In SPSS (jouw laatste plotje) staan de geobserveerde waarden op de X-as, dus dat eilandje wordt gerepresenteerd door de punt links onderin in het SPSS plotje. De waarden die rechts staan in de histogram staan hier ook aan de rechterkant.

De plotjes zijn dus hetzelfde, maar zien er wat verschillend uit in de andere softwarepakketten. Zie ook http://oupsy.nl/help/2915/

Dus: als je steekproefscores niet normaal zijn verdeeld, is dat niet erg. De beschrijvingsmaten en visualisaties van je verdelingen van je datareeksen zijn hulpmiddelen om je data-integriteit te verifieren. Oftewel, als je meetinstrumenten niet valide zijn, kun je daar soms aanwijzingen voor vinden in die verdelingsvormen. En als er meetfouten zijn gemaakt, ook. En als de populatieverdeling heel anders is dan je op basis van theorie zou verwachten (bijvoorbeeld heel scheef waar je normaliteit zou verwachten - of juist normaal verdeeld waar je een scheve verdeling had verwacht) dan kunnen de beschrijvingsmaten en visualisaties van verdelingsvormen helpen. Dit is hoe je dit moet benaderen - je probeert dus niet te bepalen of de verdelingen normaal zijn. En kleine verschillen zijn niet indicatief genoeg om informatie te leveren. Om die reden is het dus niet erg dat er kleine verschillen in de visualisaties van verschillende programma's zitten.

beantwoord 17 januari 2017 door gjp (68,750 punten)
...