Beste Judith,
Wat is je volledige pad? Start het met een driveletter (e.g. "C:")?
Of iets in OneDrive (of Dropbox, of Sync, of Google Drive, etc) staat, maakt trouwens niet uit. Die cloud diensten zijn uiteindelijk allemaal gewoon een directory op je harde schijf.
Verder: hoe je lijsten variabelen specificeert verschilt per commando. Ik denk dat je ze bij de commando's in deze cursus bijna altijd achter elkaar kunt zetten, maar dit kan verschillen per commando. Kun je natuurlijk makkelijk uittesten door verschillende manieren uit te proberen en te kijken wanneer je foutmeldingen krijgt :-)
Bootstrapping is een oplossing voor het probleem dat je eigenlijk niets over de populatie weet. Bij bootstrapping zeg je eigenlijk: "het enige dat we over de populatie weten, is wat we hebben gemeten in de steekproef". Als je doorredeneert zou je kunnen zeggen: als je wil weten hoe een volgende steekproef eruit zou zijn, zou je evenveel datapunten kunnen 'trekken' uit een datareeks in je bestaande steekproef (met teruglegging). Als je niet weet wat wordt bedoeld met 'trekken met teruglegging', dan moet je je eigenlijk eerst wat verdiepen in kansrekening voordat ik dit kan uitleggen. Als je dat wel weet: je trekt dus met teruglegging een nieuwe steekproef uit je oude steekproef (je doet dus net alsof die oude steekproef 'de populatie' is).
Stel je voor dat je dat heeeeel vaak doet, bijvoorbeeld $10 000$ keer. Dan kun je bijvoorbeeld kijken wat van die $10 000$ de laagste 2.5% en de hoogste 2.5% is (dus, je ordent alle gemiddelden van laag tot hoog, en kiest dan het 250ste en het 9750ste gemiddelde. De waarden van die twee gemiddelden zijn dan als het goed is ongeveer de grenzen van het 95% betrouwbaarheidsinterval van je gemiddelde.
Je kunt dit ook met correlaties doen: je kunt uit een set van twee datareeksen ook willekeurige steeds twee punten kiezen, en dat $10 000$ keer (of $100 000$ keer, etc) herhalen, en dan steeds de correlatie berekenen, en die ordenen van laag naar hoog, en dan de waarde van de 250ste en 9750ste correlatie nemen, en dan heb je het 95% betrouwbaarheidsinterval van de correlatiecoefficient.
Je kunt dat betrouwbaarheidsinterval ook berekenen met behulp van de steekproevenverdeling van de correlatiecoefficient, maar als je die niet beschikbaar hebt (die zit bijvoorbeeld niet in SPSS geloof ik), dan kun je met bootstrapping toch een betrouwbaarheidsinterval genereren.
Overigens zijn er mensen die vinden dat je statistiek uit zou moeten leggen aan de hand van bootstrapping. De methode werkt namelijk in bijna alle situaties. Je hoeft studenten dus maar 1 ding te leren, en dat kun je vervolgens overal toepassen; bootstrapping zit, als methode, dus ook erg dicht tegen het concept van de steekproevenverdeling aan (sterker nog, door te bootstrappen simuleer je eigenlijk de steekproevenverdeling).