Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Hoe moet je bootstrappen bij regressie?

0 leuk 0 niet-leuks
Beste Gjalt-Jorn

Tot op heden lukt SPSS en raakt de boodschap van de cursus langzaam ontrafeld. Toch liep ik eerder vast bij de volgende code (bij correlatie):

DATASET ACTIVATE dat.
BOOTSTRAP /VARIABLES INPUT = thisIsTheNewVariableName thisIsAnotherVariableName
CORRELATIONS /VARIABLES = thisIsTheNewVariableName thisIsAnotherVariableName.

Toen ik deze code op deze manier ingaf met de correcte variabelen (i.p.v. thisIsTheNewVariableName thisIsAnotherVariableName), kreeg ik een foutmelding. Zou het kunnen dat er na de tweede regel een punt moet? Deze staat niet in de cursus bij Zelf analyseren in de praktijk.  Met het punt erbij lukte het wel.

Mijn eigenlijke vraag betreft deze bootstrapping. Bij het lezen van Field (4th edition) op pagina 316-317 gaat het over bootstrapping maar dan bij de regressie. Hij werkt er echter met het menu en ik wil enkel de syntax toepassen (advies cursus) dus focus ik me ook hierop. Mag ik bij de regressie ook gewoon dit ingeven:

DATASET ACTIVATE dat.
BOOTSTRAP /VARIABLES INPUT = sales adverts.
CORRELATIONS /VARIABLES = sales adverts.

of bega ik dan een fout? Volgens mij kan het hier maar misschien ga ik hier wat te snel door de bocht.

Ik heb ook even geprobeerd om het woord correlations te vervangen door regression maar dat aanvaardt SPSS niet.

In welke gevallen mag ik bootstrappen? Eender wanneer ik denk dat het nodig is (vb. voor de confidence intervallen)? Ik begrijp bootstrapping als een opnieuw een reeks steekproeven (met evenveel n) nemen van de bestaande data, zoveel in aantal dat je de populatie benadert. Of moet ik toch oppassen met gebruik?

Alvast dank!

Met vriendelijke groeten

Kristien
gevraagd 27 december 2016 in Inleiding Data Analyse (IDA) door Kristien Bynens (1,170 punten)
bewerkt 29 december 2016 door Kristien Bynens

1 Antwoord

0 leuk 0 niet-leuks

Goed gevonden - er ontbrak inderdaad een punt (de zogenaamde 'command terminator' in SPSS: in R wordt een puntkomma gebruikt. De command terminator geeft aan de software aan dat het commando is afgelopen en verwerkt kan worden).

Als je wil weten wat de syntax voor een gegeven commando is, kun je altijd de menu's gebruiken om die syntax eruit te laten rollen. In dit geval kun je het BOOTSTRAP commando invoegen voor het regressie-commando, bijvoorbeeld:

BOOTSTRAP /VARIABLES INPUT = sales adverts.
REGRESSION
  /STATISTICS COEFF OUTS CI(95) R ANOVA
  /DEPENDENT sales 
  /METHOD=ENTER adverts.

Zie hier voor een lijst commando's die bootstrapping ondersteunen: http://www.sussex.ac.uk/its/pdfs/SPSS_Bootstrapping_22.pdf

Je mag altijd bootstrappen. Bootstrapping is een handige manier om betrouwbaarheidsintervallen te genereren. Die betrouwbaarheidsintervallen kunnen afwijken: ze zijn bijvoorbeeld vaak iets te nauw, omdat de spreiding in de populatie wordt inderschat (bootstrapping gaat er immers vanuit dat je steekproef net zoveel spreiding heeft als je populatie, maar vooral kleine steekproeven kunnen minder spreiding hebben). Echter, soms kun je alleen met bootstrapping betrouwbaarheidsintervallen genereren, en bovendien geldt altijd dat betrouwbaarheidsintervallen niet supernauwkeurig zijn. Je moet dus nooit conclusies trekken die maar net wel of juist net niet ondersteund worden door de data. In die gevallen heb je te weinig data om iets te concluderen.

beantwoord 2 januari 2017 door gjp (64,700 punten)
...