Mijn brein sukkelt een beetje met het verschil tussen student's t en cohen's d omdat hun wiskundige formulles zoveel op elkaar lijken en louter op sd en se van elkaar verschillen. Tegelijkertijd heb ik het gevoel dat het toch 2 verschillende dingen zijn die voor hele andere dingen gebruikt worden.
Daarom even dubbelchecken of de logica die mijn brein er nu van gemaakt heeft, ook klopt. Versta ik het goed als volgt ivm de t-toets:
1) we kiezen voor het statistische model van de "t-toets" om te kijken naar de relatie tussen x en y omdat x categorisch (met 2 opties) is en y continu
Louter uit de beschrijvingsmaten van x en y kunnen we de 2 groepen bepalen, hun gemiddelden bepalen en daarmee ook het verschil in hun gemiddelden berekenen.
2) vervolgens voeren we de t-toets uit en krijgen we een t-waarde (student's t)
3) dankzij deze t-waarde kunnen we een p-waarde bepalen (met tabellen of software dankzij de t-verdeling)
4) dankzij de p-waarde (van de student's t) krijgen we zicht op
- de mate waarin ons model passend was voor wat we onderzoeken. (is dat zo?)
- de kans dat ons gevonden "verschil" ook in de populatie gevonden kan worden (en we dus de H0 dat er geen verschil in de populatie was kunnen weerleggen)
5) eens we dit weten kunnen we deze t-waarde weer loslaten en opnieuw meer naar de "data" kijken
6) dankzij het CI rondom het berekende verschil in gemiddelden, weten we binnen welke range dat verschil vermoedelijk in de populatie ligt
en kunnen we niet alleen H0 weerleggen, maar ook een "richting" van het verband weten
7) vervolgens willen we kijken hoe sterk dit gevonden effect/verband is en hievoor gaan we vervolgens de effect size (cohen's d) bepalen.
(De sterkte van dit effect zegt helemaal niks over causaliteit (invloed van x op y), maar enkel iets over het verband tussen x en y)
Klopt dit ?