Hoe berekenen hoe vaak chi-kwadraat 1 of lager is, tussen 5 en 10 ligt of boven 17.9?

Question

Hoe berekenen hoe vaak chi-kwadraat 1 of lager is, tussen 5 en 10 ligt of boven 17.9?

Op blz. 6 bovenaan van de bron non-parametrische data-analyse, staat 'net als bij de bekende verdelingen kunnen we nu ook uitrekenen hoe vaak onze optelsom (chi-kwadraat dus) 1 of lager is (68% van de tijd), hoe vaak de optelsom tussen de 5 en 10 in ligt (2,3% van de tijd), en hoe vaak hij boven de 17.9 ligt (0.0023 procent van de tijd).

In de tekst wordt mijns inziens niet uitgelegd hoe je dit kunt doen. Kunt u, iemand mij dit uitleggen? Ook wat betreft de andere steekproevenverdelingen, zoals t- en F- verdeling en Pearson's r?

De 68% doet mij denken aan de vuistregels van de normaalverdeling (68% vd waarnemingen ligt + of - 1 standaardafwijking, etc., maar hoe de 5 en de 10 en 17,9 in dit plaatje passen zie ik niet meteen.

Alvast bedankt voor uw/ jullie reactie,

Vriendelijke groet,

Mariska

gevraagd 7 augustus 2016 in Kwalitatief Onderzoek (OKO, PB16x2) door Mariska (150 punten)

1 Antwoord

gjp · Answer 1 · 2016-08-09T08:03:02+0000

Dit wordt hier inderdaad niet uitgelegd; dit gaat ver buiten de examenstof. Het betreft een wat intimiderende formule (zie https://en.wikipedia.org/wiki/Chi-squared_distribution#Probability_density_function).

In de praktijk wordt dit natuurlijk gedaan met statistische programma's; deze aanpak wordt uitgelegd in http://oupsy.nl/help/517/hoe-moet-je-de-t-tabel-en-f-tabel-precies-lezen/. Het kan ook met spreadsheet programma's zoals Microsoft Excel of het gratis uitstekende LibreOffice Calc (zie https://help.libreoffice.org/Calc/Statistical_Functions_Part_One#CHIDIST).

Normaal worden deze berekeningen achter de schermen uitgevoerd door je statistische software (e.g. R of SPSS).

In R is het bovendien mogelijk om eenvoudig rechtstreeks deze kansen uit te rekenen:

Verdeling	Functie in R	Aanroep	Voorbeeld	Uitkomst
z (normaal)	pnorm	pnorm(q)	pnorm(-1.96);	0.0249979
t (Student)	pt	pt(q, df)	pt(-1.96, 99);	0.02640356
F (Anova)	pf	pf(q, df1, df2)	pf(2, 98, 2);	0.6080694
$\chi^2$	pchisq	pchisq(q, df)	pchisq(6, 2);	0.9502129

Houd er rekening mee dat je standaard de proportie van de oppervlakte aan de linkerkant of 'onderkant' van 'q' krijgt. Als je bijvoorbeeld een positieve z of t-waarde hebt, of als je de F- of de $\chi^2$-verdeling gebruikt, moet je argument 'lower.tail=FALSE' gebruiken. Bijvoorbeeld:

> pchisq(17.9, 1, lower.tail=FALSE);
[1] 2.328211e-05

Die 'e-05' betekent dat het decimaalteken 5 posities naar links moet. Dan wordt dit dus .0000238211, oftewel .00238211 procent.

(Je ziet hier een verschil door afronding. Dit is geen reden tot zorg om twee redenen. Ten eerste zijn er verschillende geaccepteerde manieren om af te ronden, waar niet altijd hetzelfde uitkomt. Afronding is geen wiskundige regel, het is een subjectieve keuze (zie deze Wikipedia pagina en deze illustratie). Ten tweede zijn statistische uitkomsten altijd onderhevig aan dermate veel meetfout en steekproeftoeval, dat ze weinig nauwkeurig zijn. Kleine verschillen maken dus niet uit.)

Categorieën

Hoe berekenen hoe vaak chi-kwadraat 1 of lager is, tussen 5 en 10 ligt of boven 17.9?

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.

Gerelateerde vragen

Categorieën

Hoe berekenen hoe vaak chi-kwadraat 1 of lager is, tussen 5 en 10 ligt of boven 17.9?

Aub. inloggen or registreren om een opmerking te plaatsen.

Aub. inloggen or registreren om deze vraag te beantwoorden.

1 Antwoord

Aub. inloggen or registreren om een opmerking te plaatsen.