Eigenlijk zijn de figuren bijna hetzelfde. Er zijn kleine verschillen tussen beide programma's, maar de patronen zijn hetzelfde. De verschillen zijn:
- In SPSS zijn de X- en Y-as omgedraaid. In SPSS staan op de X-as de geobserveerde waarden, en in R staan op de X-as de verwachte waarden.
- In R worden de waarden gestandaardiseerd, in SPSS niet. Dit verklaart je tweede punt.
Neem bijvoorbeeld de laatste variabele, Statken1. Kijk naar het histogram: deze verdeling is wat linksscheef, met de meeste mensen aan de rechterkant van de verdeling. Je ziet verder dat er wat personen zijn die relatief laag scoren (het eilandje aan de linkerkant, rond de 40, in het histogram). In de Q-Q plot in R staan de geobserveerde waarden op de Y-as, dus het eilandje van 5 scores staat linksonder, en de mensen in de 'bulk' aan de rechterkant staan rechtsboven. Daar zie je ook dat de punten het verst van de diagonaal afliggen. In SPSS (jouw laatste plotje) staan de geobserveerde waarden op de X-as, dus dat eilandje wordt gerepresenteerd door de punt links onderin in het SPSS plotje. De waarden die rechts staan in de histogram staan hier ook aan de rechterkant.
De plotjes zijn dus hetzelfde, maar zien er wat verschillend uit in de andere softwarepakketten. Zie ook http://oupsy.nl/help/2915/
Dus: als je steekproefscores niet normaal zijn verdeeld, is dat niet erg. De beschrijvingsmaten en visualisaties van je verdelingen van je datareeksen zijn hulpmiddelen om je data-integriteit te verifieren. Oftewel, als je meetinstrumenten niet valide zijn, kun je daar soms aanwijzingen voor vinden in die verdelingsvormen. En als er meetfouten zijn gemaakt, ook. En als de populatieverdeling heel anders is dan je op basis van theorie zou verwachten (bijvoorbeeld heel scheef waar je normaliteit zou verwachten - of juist normaal verdeeld waar je een scheve verdeling had verwacht) dan kunnen de beschrijvingsmaten en visualisaties van verdelingsvormen helpen. Dit is hoe je dit moet benaderen - je probeert dus niet te bepalen of de verdelingen normaal zijn. En kleine verschillen zijn niet indicatief genoeg om informatie te leveren. Om die reden is het dus niet erg dat er kleine verschillen in de visualisaties van verschillende programma's zitten.