Deze formule staat in de bron 'vergelijken van twee gemiddelden'. Ik zal hem hier even herhalen in een vorm die hem misschien iets intuitiever maakt. Dit is de waarde van t voor het verschil tussen twee gemiddelden als de spreiding rondom de twee gemiddelden ongeveer gelijk is:
$$t=\frac{\bar{x_1} - \bar{x_2}}{se_\text{pooled}}$$
Die gepoolde standaardfout wordt berekend op basis van de gepoolde standaard deviatie. De formule voor de standaardfout zoals die in het algemeen geldt, wordt vaak geschreven als
$$se=\frac{sd}{\sqrt{n}}$$
Deze formule kun je ook schrijven als:
$$se=sd\sqrt{\frac{1}{n}}$$
In ons geval hebben we echter twee n's. Hiervoor kunnen we de formule op deze manier uitbreiden:
$$se_\text{pooled}=sd_\text{pooled}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$$
De gepoolde standaarddeviatie berekenen we door de twee standaarddeviatie weer om te rekenen naar variaties (som van de gekwadrateerde afwijkingen, sum of squares, SS) en die bij elkaar op te tellen. Dat kan omdat de variaties immers niets meer zijn dan optelsommen van de afwijkingen van de respectieve gemiddelden in elke groep. Die totale variatie rekenen we dan weer terug naar een standaarddeviatie: de gepoolde standaard deviatie. Het verschil tussen de variatie (de som van de gekwadrateerde afwijkingen, oftewel de Sum of Squares, oftewel SS), en de variantie (het gemiddelde van de gekwadrateerde afwijkingen, oftewel de Mean of Squares, oftewel MS) is dat de variantie is gecorrigeerd voor het aantal waarnemingen, n (of eigenlijk voor de vrijheidsgraden van het aantal waarnemingen, de Degrees of Freedom, oftewel n-1). De standaarddeviatie is hier vervolgens gewoon de wortel van om weer terug te komen op de gewone, niet-gekwadrateerde, schaal. Dus:
$$sd = \sqrt{MS} \text{ en } MS = \frac{SS}{n-1}$$
Dit gaan we nu omdraaien, omdat we de standaarddeviaties terug moeten rekenen naar de SS voordat we ze op mogen tellen:
$$SS=MS (n-1) \text{ en } MS=sd^2$$
Dus, in één formule wordt dat:
$$SS_\text{pooled}=(n_1-1)sd_1^2+(n_2-1)sd_2^2$$
Vervolgens moeten we die weer delen door de bijbehorende vrijheidsgraden en er de wortel van trekken:
$$sd_\text{pooled}=\sqrt{\frac{(n_1-1)sd_1^2+(n_2-1)sd_2^2}{(n_1-1)+(n_2-1)}}$$
Die gepoolde standaarddeviatie kunnen we dan eindelijk gebruiken in de formule om de gepoolde standaardfout uit te rekenen:
$$se_\text{pooled}=sd_\text{pooled}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$$