Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks
Ik heb een vraagje over de cursus Inleiding in de data analyse. Ik ben vol enthousiasme aan de slag gegaan. Er was, zeker in het begin, een duidelijke uitleg en een 'geruststelling' dat we dit zouden moeten kunnen. Maar nu ben ik bij studietaak 2.6 en daar is het ineens totaal anders. Ik moet ineens van alles kunnen in het programma en er ook iets in zien enz. Ik had wel verwacht dat we eerst een gedegen uitleg kregen over hoe het programma spss werkt. Ik heb de 'handleiding' wel geprint, maar het lukt me al niet om een naam te veranderen, terwijl ik doe wat er staat! Mijn vraag is dus.... moet ik al die dingen die er gevraagd worden ineens zomaar kunnen en snappen? Of begrijp ik de opdracht niet goed en moet ik gewoon op het antwoord klikken en doen wat er staat. Want zonder dat wordt het niets, bij mij. Jullie vragen namelijk ook gelijk een Q-Q, BOXPLOT en HiSTOGRAM te laten zien van meerdere variabelen, terwijl je die niet in een keer kunt opvragen (In de handleiding staat alleen hoe je een plot, histogram en boxplot tegelijk kunt opvragen). De stappen zijn hier mijns inziens extreem groot. Leer ons eerst hoe we een boxplot kunnen vinden van 1 variabele en hoe je dat evt. kunt combineren. Hoe je die q-q, boxplot en histogram zo mooi naast elkaar krijgt in plaats van alles onder elkaar in een steeds groter wordende 'sheet'. Zoals je merkt, raak ik enigzins in paniek. Als het nu al zo moeilijk  is, waar gaat het dan nog heen?

Ik hoop dat er ergens nog een duidelijke uitleg komt en dat de stappen misschien kleiner gemaakt kunnen worden, want dit zijn echt te grote stappen voor iemand die nog nooit met SPSS gewerkt heeft en geen statistiek heeft gehad.

Ik hoop dat je me enigszins gerust kunt stellen?!
in Methodologie door (390 punten)

1 Antwoord

0 leuk 0 niet-leuks

Het is de bedoeling dat je de handleiding "Zelf analyseren in de praktijk" gebruikt bij 2.6 (en de andere Zelf Analyseren studietaken). In die handleiding staan alle commando's die je nodig hebt. Bovendien is het handig om eerst de appendix "Wetenschappelijk onderzoek in de 21ste eeuw: basale computervaardigheden" te bestuderen, al is het maar om je ervan te vergewissen dat je dat allemaal al weet.

Ik heb de expliciete instructie om 'Zelf analyseren in de praktijk' erbij te pakken nu toegevoegd in studietaak 2.6, dus hopelijk is dit voor andere studenten duidelijker. Bedankt dus!

Met betrekking tot je vraag over de grafieken is het antwoord eigenlijk dat je denkt dat het moeilijker is dan het is. Het gaat hier ook om boxplots (en Q-Q plots, en histogrammen) die je per variabele besteld. Dat herhaal je dan voor alle variabelen. Je hoeft ze dus niet voor alle variabelen tegelijk te bestellen. Als je weet hoe je een histogram kunt bestellen, hoe je een Q-Q plot kunt bestellen, en hoe je een boxplot kunt bestellen, kun je dit deze opdracht dus maken.

Overigens kan R die alle drie tegelijk naast elkaar genereren. SPSS kan dit niet. En hier zit misschien de essentie van je tweede vraag. De resultaten van de verschillende statistische programma's die je kunt gebruiken zijn anders. Sterker nog, over verschillende versies van dezelfde software kunnen die resultaten er ook anders uitzien. De inhoud is natuurlijk wel hetzelfde. Omdat het idee is dat je leert om met statistische software in het algemeen te werken, en niet alleen met een specifieke versie van een specifiek softwarepakket, is de output zoals je die in de antwoorden van de verwerkingsopdrachten zien ook vaak aangepast. Er worden tabellen samengevat, of grafieke gecombineerd. Het gaat er dus niet om dat je resultaten er exact hetzelfde uitzien als in het antwoord; het gaat erom dat de inhoud hetzelfde is: dat je bijvoorbeeld (behoudens verschillen in afronding) dezelfde gemiddelden vindt. En dat een histogram niet linksscheef is bij jou, terwijl hij in het standaard antwoord rechtsscheef is. De bedoeling is dus dat je op een generieker niveau leert omgaan met statistische software en uitkomsten. Op die manier voorkom je dat je nu leert werken met een pakket (e.g. SPSS) dat anders werkt, of andere output levert, tegen de tijd dat je afstudeert of het voor je werk nodig hebt.

Deze instructie heb ik nu ook expliciet toegevoegd in studietaak 2.6, zodat studenten niet hoeven zoeken naar exact dezelfde output.

Dus, de stapjes zijn al heel klein. Je kunt gewoon de software gebruiken volgens de instructies in de 'Zelf analysesen in de praktijk' handleiding - er ontbreekt geen informatie. Als een commando per variabele werkt, en je moet het voor drie variabelen doen, dan doe je het dus gewoon drie keer.

Dan rest er nog een concrete vraag: je liep kennelijk tegen problemen aan bij het hernoemen van variabelen. Kun je die vraag als nieuwe (andere) vraag stellen? Dan kan ik je daarmee helpen in die vraag. vergeet daarbij niet de instructies te volgen:

  • Geef het letterlijke commando zoals je dat gebruikte;
  • Geef de foutmelding die je krijgt;
  • Geef jouw interpretatie van die foutmelding;
  • En leg eventuele stappen uit die je al hebt genomen om die foutmelding op te lossen.

Zoals in de appendix 'Wetenschappelijk onderzoek in de 21ste eeuw' wordt uitgelegd is het idee dat je tijdens je studie een soort zelfstandigheid aanleert met betrekking tot computers, waarbij je foutmeldingen goed bestudeert, analyseert, en stappen leert ondernemen om die foutmeldingen op te lossen (dit is natuurlijk niet beperkt tot statistische software: je zult met meerdere programma's leren werken tijdens je studie, en allemaal zullen ze van tijd tot tijd foutmeldingen geven die je dan op moet lossen). Om die reden is het belangrijk om de stappen die je zelf al zet even in je vraag te zetten, zodat we daar ook op kunnen reageren als er 'leermogelijkheden' liggen.

Het belangrijkste puntje is misschien: denk niet te moeilijk. Als er om een Q-Q plot wordt gevraagd, en je tovert er een Q-Q plot uit die lijkt op die in het standaard antwoord, dan ben je klaar. Er zijn geen addertjes ofzo: het is zo simpel.

Als je er geen Q-Q plot uit krijgt, is het natuurlijk niet zo simpel :-) Dus stel dan een vraag in dit systeem, en met wat geluk kun je het antwoord gelijk vinden. Anders reageren wij binnen enkele dagen, soms uren :-)

Nog een toevoeging, op basis van het herlezen van je vraag. Ik lees in je vraag het idee dat je er vanuit gaat dat er een soort 'modeloutput' bestaat, en dat het de bedoeling is dat je die genereert. Dat is niet zo! De meeste opdrachten kunnen op meerdere manieren worden uitgevoerd. In de 'Zelf analyseren in de praktijk' handleiding staat steeds minstens één, maar soms meerdere manieren. Maar als je het op een andere manier doet, is het ook goed. Daarom is het dus prima om meerdere losse grafieken te bestellen.

Neem het commando FREQ (SPSS en PSPP) of freq (R). Hiermee bestel je een frequentietabel. Of je dit nu drie keer herhaalt om drie frequentietabellen te bestellen, of dat je met 1 commando (FREQ in SPSS/PSPP, frequencies in R) meerdere tabellen tegelijk bestelt maakt niet uit. Je krijgt in beide gevallen de frequentietabellen. Er is geen 'betere manier'. Statistiek is een middel, geen doel.

Als je straks verslagen gaat schrijven, zul je ook leren dat je sowieso nooit rechtstreeks tabellen en grafieken uit SPSS in je verslagen en artikelen op mag nemen. Die moet je altijd eerst aanpassen naar een mooier, netter, en vaak informatiever formaat (in je tekstverwerker, e.g. LibreOffice of Word). Grafieken uit R kunnen overigens wel goed genoeg gemaakt worden voor publicatie, maar er wordt in deze cursus niet ingegaan op hoe je dat kunt doen.

[EDIT] Om nog even op je vraag terug te komen: ja, studietaak 2.6 klopt qua moeilijkheid :-)

door (77.8k punten)
bewerkt door
Beste Gjalt-Jorn,

Ik heb deze vraag en je antwoord even doorgenomen omdat ik tegen soortgelijke punten aanloop in het studiemateriaal o.a. Zelf analyseren in de praktijk. Ik heb alle opdrachten van 2.6 nu gemaakt en veelal door gebruik te maken van YouTube filmpjes met uitleg over SPSS. De codes die in het studiemateriaal geschreven staan voor de Syntax krijg ik ook niet altijd werkend. Het is dan veel handiger om de functies uit het programma gewoon te gebruiken. Daarmee heb ik toch redelijk vlot de gevraagde handelingen nu aan mijn repertoire toegevoegd :-)

Maar als het de bedoeling is dat we puur leren werken vanuit de syntax (nu 'paste' ik alles er eerst in vanuit de functie) dan zou ik daar ook nog wel meer informatie over willen krijgen. Ik kan een klein beetje programmeren, dus begrijp wel redelijk hoe het in elkaar zit. Maar als ik de syntax codes vanuit de handleiding overtyp met wat aanpassingen dan verkleuren lang niet alle codes en werkt het idd ook niet altijd. Vanuit de functies in SPSS zelf lukt het wel vrij eenvoudig. Ik vergelijk de syntax dan weer met de handleiding en probeer een en ander zo te doorgronden.

Is het voor deze module niet veel handiger om gewoon met de pakket-functies te werken? Dat zal voor veel studenten denk ik een stuk schelen. Wellicht rond studietaak 4 eens wat dieper ingaan op gebruik van de syntax? Het is maar een idee, maar je vroeg ergens nog om feedback, dus hierbij.

Ik vond trouwens bij opdracht 2.6.5 de feedback na de tabel met centrummaten niet passend. Deze uitleg vond ik eerder verwarrend en meer passend bij 2.6.7 of 2.6.8.

Verder ga ik nu optimistisch verder naar onderdeel 3!

Groet,

Judith van Holland
...