Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe heb je de T-test verdelingen p151 gegenereerd?

0 leuk 0 niet-leuks

Zijn de afbeeldingen van de verdelingen op p151 "schetsen", of precieze generaties van de bijbehorende t-verdeling?

Je zegt namelijk "Deze kennis kunnen we nu gebruiken om de steekproevenverdelingen te genereren die deze regressiecoëfficiënten zouden hebben als ze in de populatie dezelfde waarde zouden hebben als in onze steekproef."

Ik denk te begrijpen/zien dat

  • de standaarddeviaties in de linker figuur 0,18 breed zijn;
  • dat 0 op y-as geraakt wordt t.h.v. -0.4 en 1,2 op de x-as;
  • waardoor er 8.89 sd's in de grafiek passen;

en dat klopt vast niet.

Kortom, hoe letterlijk moet ik de grafiek nemen? En als ik ze letterlijk moet nemen, hoe heb je de T-test verdelingen op p151 gegenereerd?

gevraagd 24 januari 2018 in Inleiding Data Analyse (IDA) door 852006245 (610 punten)
bewerkt 27 januari 2018 door 852006245

1 Antwoord

0 leuk 0 niet-leuks

Dit zijn precieze generaties.

Laat me starten met twee correcties in je vraag.

Ten eerste is het handig om over standaarfouten te spreken als we het over steekproevenverdelingen hebben. Je hebt gelijk als je zegt "Ja, maar standaardfout is gewoon de naam voor de standaarddeviatie van een steekproevenverdeling", maar dat is dus wel de naam :-)

Ten tweede raken densityplots van steekproevenverdelingen van $t$ nooit de $y$-as. $t$-verdelingen zijn oneindig breed. In theorie is elke mogelijke waarde van $t$, wel, mogelijk.

De verdelingen zijn dus ook oneindig breed.

Natuurlijk is de hoogte nihiel voor het grootste deel van die oneindige breedte, behalve rondom de populatiewaarde van $t$.

Voor de $t$-verdeling geldt dat het stuk binnen ongeveer vier standaardfouten rondom het gemiddelde ongeveer 95% van de observaties bevat. En met ongeveer zes standaardfouten rondom het gemiddelde (dus drie naar elke kant) heb je ongeveer 99.7% van de waarnemingen.

Binnen acht standaardfouten rondom het gemiddelde (dus ongeveer vier standaardfouten naar elke kant) heb je ongeveer 99.99% van alle mogelijke $t$-waarden te pakken.

Deze verdelingen heb ik gemaakt met de functie dt in R. Net zoals dat pt je de p-waarde geeft voor een gegeven waarde van $t$, en qt je de $t$-waarde geeft voor een gegeven $p$-waarde, geeft dt je de density van de curve voor een gegeven $t$-waarde.

beantwoord 29 januari 2018 door gjp (63,420 punten)
...