Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Kan iets meer toegelicht worden waarom bij 5.2.5 gekozen wordt voor de aantallen 8 (bij charismatische leiderschapsstijl) en de andere stijlen 4 cijfers voor het berekenen van de gemiddelden van de schalen? Waar is op dit gebaseerd? Ik ben nu zelf op zoek gegaan naar de missing values in de data, wat ik niemand kan aanraden :-), maar dat is dus niet de bedoeling (overigens zag ik bij de datascreening bij missing values none staan, maar dat klopt dan dus niet). Dan kom je bijv. bij charismatisch op 5 uitvallers uit, maar bij autocratisch op 0 uitvallers. Je sluit met fictieve aantallen toch ook niet meer aan bij de dataset?
in Cross-sectioneel Onderzoek (OCO, PB08x2) door (240 punten)

1 Antwoord

0 leuk 0 niet-leuks
Dit heeft te maken met het aantal items per schaal. De schaal voor charismatisch leiderschap heeft in totaal 11 items, terwijl de overige schalen 5 tot 6 items hebben. (Overigens zie ik nog kleine inconsistenties tussen deze schalen / softwarepakketten staan, in hoe er met deze missing values wordt omgegaan; deze zullen eerdaags worden geupdated.)
door (3.0k punten)
Dank je wel, dat het aantal items verschilt, had ik ook gezien. Maar zijn er dan richtlijnen voor, dat je bijv. bij 10 tot 12 items kiest voor 8 en bij 6 items voor 4? Ik vroeg me af hoe ik dit zelf had kunnen ontdekken of had ik ook andere aantallen kunnen gebruiken?
Goede vraag, nee daar zijn niet echt richtlijnen voor. Als je alle items vereist voor het meten van het schaalgemiddelde, dan krijg je misschien te veel missing values. Aan de andere kant, als je je weer té soepel opstelt, kan het zo zijn dat je te veel belangrijke vragen mist die af zouden kunnen wijken van de rest van de items (waardoor je uiteindelijk schaalgemiddelde gebiased wordt). Hoe deze balans uitpakt hangt er ook vanaf hoeveel missende waarden er überhaupt zijn, en bijvoorbeeld de inhoud van de vragen, als er heel persoonlijke of gevoelige vragen tussenzitten of niet (want die zouden andere responspatronen kunnen genereren: vaker tot missing values leiden en mogelijk een afwijkende onderliggende waarde hebben dan de rest van de items; met andere woorden: hier wil je er niet te veel van missen).

Wat ik heb gedaan is het volgende: kijken naar het totale aantal items op een schaal, besluiten hoeveel items er eventueel zouden mogen ontbreken, en dan per schaal berekenen (in het geval van SPSS) wat dan het minimale aantal items is om het schaalgemiddelde op te baseren.

Overigens: als het aantal missende waardes beperkt is, zal de impact van dit soort beslissingen ook beperkt zijn. Het is pas echt van belang als er veel vragen niet zijn ingevuld.
...