Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Tegenstrijdigheid materiaal S13131 en par 9.3.2 van Andy Field mbt t-test formule gelijke en ongelijke varianties

0 leuk 0 niet-leuks
Ik heb tentamen gedaan in vak S13131 Inleiding data-analyse. Daarvoor waren bronnen van de OU het studiemateriaal. In de bron 'Vergelijken van twee gemiddelden: de t-toets' wordt op pag. 5 en 6 gesteld, dat de formule met de gepoolde variantie dient te worden gebruikt als de variantie van twee onafhankelijke groepen gelijk zijn. Als die niet gelijk zijn, zou de andere variant gebruikt dienen te worden (dus zonder gepoolde variantie en volgens de variance sum law).

Maar nu doe ik vak   PB0402 Onderzoekspracticum Experimenteel onderzoek en daarvoor gebruiken we het boek van Andy Field (Discovering Statistics using IBM SPSS Statistics). Daarin staat in par 9.3.2 precies het omgekeerde van wat er in de OU-bron stond. Namelijk dat (pag 367 onderaan): "The equation (en dan wordt gewezen op die van de ongepoolde sum) is true only when the sample sizes are equal (...) When we want to compare two groups that contain different numbers of participants, equation 9.5 is not appropriate. Instead the pooled variance estimate t-test is used which takes account of the difference in sample sizes by weighting the variance of each sample"

Andy Field kan ik volgen. Maar zie ik een relatie over het hoofd? Of staat het eenvoudig niet juist in de OU-bron die ik noemde uit S13131?
gevraagd 1 maart 2017 in (Digitale) werkboeken door 851926260 (200 punten)

1 Antwoord

1 leuk 0 niet-leuks

Voordat ik inga op je vraag: je bedoelt s13131 Kwantitatieve data-analyse, toch? Want Inleiding data-analyse is PB0202, de grondig gereviseerde cursus.

Aangenomen dat dit klopt: je hebt gelijk (en Field ook).

Het is eigenlijk nog iets complexer.

Als de varianties in beide groepen gelijk zijn, dan maken de groepsgroottes niet uit; je neemt dan aan dat beide varianties zuivere schatters zijn van dezelfde populatievariantie.

Als de varianties niet gelijk zijn, is er geen correcte formule. Wat de correcte formule is, hangt dan af van je situatie. Veronderstel je dat de variantie in een van de twee groepen geen goede schatting is van de populatievariantie (door toeval te groot of te klein is)? Dan kun je beter de variantie uit de andere groep gebruiken om de standaardfout van de $t$-verdeling te schatten. Veronderstel je dat beide datareeksen uberhaupt uit verschillende populaties komen? Dan is de $t$-toets sowieso eigenlijk niet de goede toets, want die veronderstelt die gelijke varianties. Veronderstel je dat beide varianties goede schattingen zijn, maar dat ze toevallig beiden afwijken van de populatievariantie? Als je dan aanneemt dat de grotere steekproef een betere schatting levert, dan wil je wegen op steekproefomvang. Als je dat niet aanneemt, dan niet.

Overigens onderwijzen we in PB0202 (de gereviseerde versie van s13131) dat je sowieso altijd de t-toets voor ongelijke varianties moet gebruiken. Dit lost het dilemma sowieso op. Als de varianties gelijk zijn, komt die t-toets op hetzelfde neer als de 'gewone' t-toets.

beantwoord 1 maart 2017 door gjp (63,910 punten)
...