1 Slide in hc 2 stelt
Hoe groter de steekproef hoe kleiner de p-waarde.
Maar die p-waarde komt toch voort uit je steekproefwaarde, niet uit je steekproefomvang? Of bedoelen jullie: dezelfde steekproefwaarde uit een kleine steekproef heeft een grotere p-waarde dan die steekproefwaarde uit een grote steekproef?
En leg ik dat dan zo goed uit: dat komt omdat in een grote steekproef een spitsere vorm is en de range kleiner is dan in een kleine, dus er zijn minder waarden in totaal, dus de oppervlakte onder de (spitse) boog en de x-as is kleiner dan in een verdeling van een kleine steekproef en die oppervlakte zegt iets/correspondeert met het aantal steekproeven dat je zou trekken uit de nulhypotheseverdeling als de nulhypothese waar zou zijn. Die oppervlakte is veel kleiner in een spitse verdeling die hoort bij een grote steekproefomvang dan in een plattere verdeling bij een kleine steekproefomvang.
Klopt dit?
En hieraan gerelateerd: ik begrijp in Open Mens H 15 een aantal dingen niet die hierover gaan.
'Een steekproefomvang van n=500 maakt het dus mogelijk om de kans op een type 1-fout te beperken tot 1%, terwijl de kans op een type 2-fout ook beperkt blijft.
Hoezo geldt dat je de kans op type 1 fout beperkt tot 1%? Die is toch gerelateerd aan je alpha en ook bij een grote steekproef kun je toch zeggen: ik verwerp het bij p<0.05 en dan is dus de kans dat je hem onterecht verwerpt (type 1 fout) 1 op 20, 5%? Ik begrijp niet waarom deze kans in een grote steekproef ineens 'verdwenen' zou zijn? Is toch een keuze van de onderzoeker?
(...) Sterker nog, door de steekproefomvang te vergroten is de kans dat we een relatief lage correlatie in onze steekproef vinden kleiner geworden, als de populatiecorrelatie inderdaad r=.40 is.
De steekproevenverdeling waar onze steekproefcorrelatie eigenlijk uitkomt is met n=500 namelijk ook een stuk smaller.
Maar hoe kun je die kans aflezen uit je nulhypothesetesting, daarin kijk je toch niet naar de populatiecorrelatie, want die heb je niet?
Tot slot begrijp ik niet waar de percentage vandaan komen in de tekst die daarna volgt. Ik heb het idee dat mijn vragen er niet duidelijk op worden als ik probeer uit te leggen wat ik er niet aan snap...Het gaat om dit stukje tekst:
'Een aanzienlijk deel van de steekproevenverdeling voor r=.40 is groen! Om precies te zijn is het 83.54%.' Hoe weten jullie dat percentage op basis van het plaatje en op basis van logica?
Sorry voor mijn warrige vragen, ik weet niet zo goed hoe ze duidelijker te verwoorden en daarbij ook aan te geven waarom ik er niet uitkom..