Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

Dataset in OneDrive map

0 leuk 0 niet-leuks

Beste Gjalt-Jorn,

Ik probeer de syntax commando's al meer te gebruiken en bij opdracht 4.8 ging dat eigenlijk wel naar tevredenheid :-) Alle opdrachten zijn ook goed gelukt. Leuk om te merken hoe enkele functies in SPSS al vertrouwd raken. 

Alleen het openen van een bestand vanuit de syntax code uit het studiemateriaal krijg ik niet voor elkaar. Nu staan mijn data bestanden in een OneDrive file. Zou dat wat uitmaken? Ik heb het pad echt helemaal correct ingevoerd, driedubbel gecheckt, maar het kan zijn dat SPSS hier niet mee uit de voeten kan. Is dat zo?

  • En maakt het wat uit hoeveel afstand er tussen syntax codes zit? Selecteer je een in te typen code na verschijnen in de snellijst met TAB of liever een andere toets?
  • Kunnen variabelen altijd direct na elkaar worden getypt, behalve bij de scatterplot uiteraard.
  • Kan je nog wat uitleg geven over wat bootstrapping inhoudt?
Dank je wel! Groeten, Judith
gevraagd 6 december 2016 in Inleiding Data Analyse (IDA) door judithvanholland (160 punten)

1 Antwoord

0 leuk 0 niet-leuks
Beste Judith,

Wat is je volledige pad? Start het met een driveletter (e.g. "C:")?

Of iets in OneDrive (of Dropbox, of Sync, of Google Drive, etc) staat, maakt trouwens niet uit. Die cloud diensten zijn uiteindelijk allemaal gewoon een directory op je harde schijf.

Verder: hoe je lijsten variabelen specificeert verschilt per commando. Ik denk dat je ze bij de commando's in deze cursus bijna altijd achter elkaar kunt zetten, maar dit kan verschillen per commando. Kun je natuurlijk makkelijk uittesten door verschillende manieren uit te proberen en te kijken wanneer je foutmeldingen krijgt :-)

Bootstrapping is een oplossing voor het probleem dat je eigenlijk niets over de populatie weet. Bij bootstrapping zeg je eigenlijk: "het enige dat we over de populatie weten, is wat we hebben gemeten in de steekproef". Als je doorredeneert zou je kunnen zeggen: als je wil weten hoe een volgende steekproef eruit zou zijn, zou je evenveel datapunten kunnen 'trekken' uit een datareeks in je bestaande steekproef (met teruglegging). Als je niet weet wat wordt bedoeld met 'trekken met teruglegging', dan moet je je eigenlijk eerst wat verdiepen in kansrekening voordat ik dit kan uitleggen. Als je dat wel weet: je trekt dus met teruglegging een nieuwe steekproef uit je oude steekproef (je doet dus net alsof die oude steekproef 'de populatie' is).

Stel je voor dat je dat heeeeel vaak doet, bijvoorbeeld $10 000$ keer. Dan kun je bijvoorbeeld kijken wat van die $10 000$ de laagste 2.5% en de hoogste 2.5% is (dus, je ordent alle gemiddelden van laag tot hoog, en kiest dan het 250ste en het 9750ste gemiddelde. De waarden van die twee gemiddelden zijn dan als het goed is ongeveer de grenzen van het 95% betrouwbaarheidsinterval van je gemiddelde.

Je kunt dit ook met correlaties doen: je kunt uit een set van twee datareeksen ook willekeurige steeds twee punten kiezen, en dat $10 000$ keer (of $100 000$ keer, etc) herhalen, en dan steeds de correlatie berekenen, en die ordenen van laag naar hoog, en dan de waarde van de 250ste en 9750ste correlatie nemen, en dan heb je het 95% betrouwbaarheidsinterval van de correlatiecoefficient.

Je kunt dat betrouwbaarheidsinterval ook berekenen met behulp van de steekproevenverdeling van de correlatiecoefficient, maar als je die niet beschikbaar hebt (die zit bijvoorbeeld niet in SPSS geloof ik), dan kun je met bootstrapping toch een betrouwbaarheidsinterval genereren.

Overigens zijn er mensen die vinden dat je statistiek uit zou moeten leggen aan de hand van bootstrapping. De methode werkt namelijk in bijna alle situaties. Je hoeft studenten dus maar 1 ding te leren, en dat kun je vervolgens overal toepassen; bootstrapping zit, als methode, dus ook erg dicht tegen het concept van de steekproevenverdeling aan (sterker nog, door te bootstrappen simuleer je eigenlijk de steekproevenverdeling).
beantwoord 6 december 2016 door gjp (68,750 punten)
Hallo,

Zo had ik het ingevuld vanuit de syntax:

GET FILE = 'OneDrive:/1-Judith/A-Open Universiteit/PB0202/SPSS data/StatistiekAngst.sav'.
DATASET NAME dat.

Ik heb mn man (software programmeur) nog even gevraagd om mee te kijken en hij zegt: Natuurlijk kan het zo niet.... en vervolgens mij even op weg geholpen, dus ik denk dat het nu moet lukken :-). Ook met de variabelen zal ik wat gaan uitproberen.

Bedankt voor de info over bootstrapping. Ik heb enkel wiskunde B gedaan dus weet nog niet zoveel over statistiek, anders dan wat ik tot 4.8 nu heb geleerd. Ik zal me nog wat verdiepen in teruglegging, want zoals ik het nu lees denk ik: om je steekproef als populatie te zien en daar steeds opnieuw steekproeven uit te nemen, dan is de steekproef toch wat te klein?

Mag je trouwens je Output opschonen door alle fouten te deleten? En mag ik voorlopig de Detrended QQ-plot negeren?

Groet, Judith
Dat kon inderdaad niet :-) Bestudeer de appendix over computergebruik nog eens (of laat je man het nog eens uitleggen :-)).

Of je steekproef wat aan de kleine kant is hangt af van hoe groot je steekproef is :-) Meestal is een steekproef van minder dan 100 deelnemers moeilijk te verdedigen; en vaak heb je er al fors meer nodig. Als je eenmaal zoveel deelnemers lijkt je verdeling van steekproefscores al behoorlijk op je populatieverdeling.

Je slaat je output normaal niet op, hoogstens op het einde als .PDF file om mee te publiceren met een artikel in het kader van Full Disclosure.

Je slaat alleen je analysescript (in SPSS dus je syntax) op, en je ruwe data natuurlijk, die je met het eerste commando in je syntax inlaadt. Door die syntax uit te voeren kun je dan altijd je output opnieuw genereren. In je syntax verwijder je natuurlijk commando's die niet werken. En die belanden dan dus ook niet in je output.
...