Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Welke denkfout maak ik mbt de z-score en de betrouwbaarheidsinterval?

0 leuk 0 niet-leuks

Ik heb om te oefenen een datareeks aangemaakt en ben tot hier:

N=1-2-5-3-4-5-1-6-9

SS = 64

MS = 8

SD = 2,83

Daarna heb ik de z-scores berekend.  In de tabel hieronder zijn alleen de uitkomsten te zien, de formules niet maar dat is nu ook niet zo belangrijk. Het gaat om mijn denfout.

Maar dan. Ik redeneer als volgt:

Z-score = datapunt in een z-verdeling of normaalverdeling

  • Bij een normaalverdeling/z-verdeling is het gemiddelde=0 en de sd=1.
  • Let op: de z-score geeft aan hoeveel sd’s het datapunt van het gemiddelde verwijderd ligt. Op zich betekent dit niet dat ze in een z-verdeling/normaalverdeling liggen.
  • De z-score bereken je per datapunt en is dus geen ‘reeksen' berekening.

 

.. stap 1

Bereken het gemiddelde en de sd (dan weet je dus ook het gemiddelde al) Hier :  4  en sd= 2,8

DATAPUNT

.. stap 2

Trek van ieder datapunt het gemiddelde af

.. stap 2

Trek van ieder datapunt het gemiddelde af

.. stap 3

Deel deze uitkomst door de sd

.. stap4

uitkomst

1

-1.07

2

-0.71

5

   

0.36

3

-0.36

4

0

5

0.36

1

-1.07

6

0.71

9

1.79

Hier maak ik volgens mij een denkfout die ik niet kan ontdekken.

Want er zijn nu zoveel z-scores, maar ik heb er één nodig om verder te kunnen met de steekproevenverdeling en de betrouwbaarheidsinterval. Wat doe ik niet goed?

Want de betrouwbaarheidsinterval wordt berekend aan de hand de breedte-index en die gaat uit van 1* of 2*  'de'  z-waarde (= neem ik aan hetzelfde als z-score) van een gemiddelde.

Waar denk ik nu toch krom? Of welke stap mis ik?

gevraagd 8 januari 2017 in Inleiding Data Analyse (IDA) door 851928612 (1,800 punten)
heropend 18 januari 2017 door gjp
Kun je als antwoord de uitleg van je denkfout toevoegen? Dit heeft twee voordelen: ten eerste hebben anderen er dan ook wat aan als ze bij jouw vraag uitkomen, en ten tweede kan ik het zien als je toch nog een denkfout maakt in je oplossing (en die corrigeren :-)).

Jazeker. Ik dacht dat ik de breedte-index uit één van de zelf uitgerekende z-waardes moest halen en snapt niet hoe, en niet hoe dat theoretisch zou kunnen omdat de z-waarde over één datapunt gaat en niet over een datareeks. TOT ik me herinnerde dat er gegeven waardes zijn behorende bij 50% (0.67), 95% (1.96) en 99% (2.58). En met deze waarden (die ook z-waarden zijn) bereken je de betrouwbaarheidsinterval.

Overigens klopte mijn berekening uit mijn vraag niet, rekenfoutje... ik geef het er maar bij mocht iemand dit als oefening willen gebruiken. En mocht iemand toch nog een fout ontdekken dan hoor ik het graag hoor.

N= 1 -  2  -  5  -  3  -  4  -  5  -  1  -  6  -  9

SS = 54

MS = 6.75

SD = 2.6

Se = 0.86

DATAPUNT

.. stap 2

Trek van ieder datapunt het gemiddelde af

.. stap 2

Trek van ieder datapunt het gemiddelde af

.. stap 3

Deel deze uitkomst door de sd

.. stap4

uitkomst

1

-1.15

2

-0.77

5

   

0.38

3

-0.38

4

0

5

0.38

1

-1.15

6

0.77

9

1.92

BI gemiddelde : steekproefwaarde  breedte-index * se

50%=   4 – 0.67 * 0.86 = 4 – 0.58 = 3.42

             4 + 0.67 * 0.86= 4 + 0.58  = 4.458 à [3.42;4.58]

95% =  4 – 1.96 * 0.86 = 4 – 1.69 = 2.31

             4 + 1.96 * 0.86 = 4 + 1.69 = 5.59 à [2.31;5.59]

99% =  4  - 2.58 * 0.86 = 4 – 2.22 = 1.78

             4 + 2.58 * 0.86 = 4 + 2.22 = 5.78 à [1.78;5.78]

BI sd; sd = 2.6

95% = 2.6 – 1.96 * 0.86 = 2.83 – 1.69 = 1.14

            2.6 + 1.96 * 0.86 = 2.83 + 1.69 = 4.52 à[1.14;4.52]

99% = 2.6 – 2.58 * 0.86 = 2.83 – 2.22 = 0.61

            2.6 + 2.58 * 0.86 = 2.83 + 2.21 = 5.05 à [0.61;5.05]

Ben benieuwd of de denkfout er inderdaad uit is!

1 Antwoord

0 leuk 0 niet-leuks
Heel goed! Enige foutje: de standaardfout van de standaarddeviatie is niet de standaardfout van het gemiddelde!

De standaardfout is de naam voor de standaarddeviatie van een bijbehorende steekproevenverdeling. Die van het gemiddelde is:

$$se_\text{gemiddelde} = \frac{sd}{\sqrt{n}}$$

Die bereken je dus met behulp van de standaarddeviatie uit je steekproef, die zelf weer een schatter is van de standaarddeviatie uit de populatie. Die standaarddeviatie uit je steekproef heeft zelf dus ook weer een steekproevenverdeling.

En die steekproevenverdeling van je standaarddeviatie heeft zelf ook weer een standaarddeviatie: de standaardfout van de standaarddeviatie.

Als je steekproefomvang groot genoeg is, is de standaardfout van de standaarddeviatie ongeveer:

$$se_\text{standaarddeviatie} = .71 \frac{sd}{\sqrt{n}} $$

Behalve dit detail klopt het verder, goed gedaan!
beantwoord 18 januari 2017 door gjp (63,910 punten)
...