Het is de bedoeling dat je de handleiding "Zelf analyseren in de praktijk" gebruikt bij 2.6 (en de andere Zelf Analyseren studietaken). In die handleiding staan alle commando's die je nodig hebt. Bovendien is het handig om eerst de appendix "Wetenschappelijk onderzoek in de 21ste eeuw: basale computervaardigheden" te bestuderen, al is het maar om je ervan te vergewissen dat je dat allemaal al weet.
Ik heb de expliciete instructie om 'Zelf analyseren in de praktijk' erbij te pakken nu toegevoegd in studietaak 2.6, dus hopelijk is dit voor andere studenten duidelijker. Bedankt dus!
Met betrekking tot je vraag over de grafieken is het antwoord eigenlijk dat je denkt dat het moeilijker is dan het is. Het gaat hier ook om boxplots (en Q-Q plots, en histogrammen) die je per variabele besteld. Dat herhaal je dan voor alle variabelen. Je hoeft ze dus niet voor alle variabelen tegelijk te bestellen. Als je weet hoe je een histogram kunt bestellen, hoe je een Q-Q plot kunt bestellen, en hoe je een boxplot kunt bestellen, kun je dit deze opdracht dus maken.
Overigens kan R die alle drie tegelijk naast elkaar genereren. SPSS kan dit niet. En hier zit misschien de essentie van je tweede vraag. De resultaten van de verschillende statistische programma's die je kunt gebruiken zijn anders. Sterker nog, over verschillende versies van dezelfde software kunnen die resultaten er ook anders uitzien. De inhoud is natuurlijk wel hetzelfde. Omdat het idee is dat je leert om met statistische software in het algemeen te werken, en niet alleen met een specifieke versie van een specifiek softwarepakket, is de output zoals je die in de antwoorden van de verwerkingsopdrachten zien ook vaak aangepast. Er worden tabellen samengevat, of grafieke gecombineerd. Het gaat er dus niet om dat je resultaten er exact hetzelfde uitzien als in het antwoord; het gaat erom dat de inhoud hetzelfde is: dat je bijvoorbeeld (behoudens verschillen in afronding) dezelfde gemiddelden vindt. En dat een histogram niet linksscheef is bij jou, terwijl hij in het standaard antwoord rechtsscheef is. De bedoeling is dus dat je op een generieker niveau leert omgaan met statistische software en uitkomsten. Op die manier voorkom je dat je nu leert werken met een pakket (e.g. SPSS) dat anders werkt, of andere output levert, tegen de tijd dat je afstudeert of het voor je werk nodig hebt.
Deze instructie heb ik nu ook expliciet toegevoegd in studietaak 2.6, zodat studenten niet hoeven zoeken naar exact dezelfde output.
Dus, de stapjes zijn al heel klein. Je kunt gewoon de software gebruiken volgens de instructies in de 'Zelf analysesen in de praktijk' handleiding - er ontbreekt geen informatie. Als een commando per variabele werkt, en je moet het voor drie variabelen doen, dan doe je het dus gewoon drie keer.
Dan rest er nog een concrete vraag: je liep kennelijk tegen problemen aan bij het hernoemen van variabelen. Kun je die vraag als nieuwe (andere) vraag stellen? Dan kan ik je daarmee helpen in die vraag. vergeet daarbij niet de instructies te volgen:
- Geef het letterlijke commando zoals je dat gebruikte;
- Geef de foutmelding die je krijgt;
- Geef jouw interpretatie van die foutmelding;
- En leg eventuele stappen uit die je al hebt genomen om die foutmelding op te lossen.
Zoals in de appendix 'Wetenschappelijk onderzoek in de 21ste eeuw' wordt uitgelegd is het idee dat je tijdens je studie een soort zelfstandigheid aanleert met betrekking tot computers, waarbij je foutmeldingen goed bestudeert, analyseert, en stappen leert ondernemen om die foutmeldingen op te lossen (dit is natuurlijk niet beperkt tot statistische software: je zult met meerdere programma's leren werken tijdens je studie, en allemaal zullen ze van tijd tot tijd foutmeldingen geven die je dan op moet lossen). Om die reden is het belangrijk om de stappen die je zelf al zet even in je vraag te zetten, zodat we daar ook op kunnen reageren als er 'leermogelijkheden' liggen.
Het belangrijkste puntje is misschien: denk niet te moeilijk. Als er om een Q-Q plot wordt gevraagd, en je tovert er een Q-Q plot uit die lijkt op die in het standaard antwoord, dan ben je klaar. Er zijn geen addertjes ofzo: het is zo simpel.
Als je er geen Q-Q plot uit krijgt, is het natuurlijk niet zo simpel :-) Dus stel dan een vraag in dit systeem, en met wat geluk kun je het antwoord gelijk vinden. Anders reageren wij binnen enkele dagen, soms uren :-)
Nog een toevoeging, op basis van het herlezen van je vraag. Ik lees in je vraag het idee dat je er vanuit gaat dat er een soort 'modeloutput' bestaat, en dat het de bedoeling is dat je die genereert. Dat is niet zo! De meeste opdrachten kunnen op meerdere manieren worden uitgevoerd. In de 'Zelf analyseren in de praktijk' handleiding staat steeds minstens één, maar soms meerdere manieren. Maar als je het op een andere manier doet, is het ook goed. Daarom is het dus prima om meerdere losse grafieken te bestellen.
Neem het commando FREQ (SPSS en PSPP) of freq (R). Hiermee bestel je een frequentietabel. Of je dit nu drie keer herhaalt om drie frequentietabellen te bestellen, of dat je met 1 commando (FREQ in SPSS/PSPP, frequencies in R) meerdere tabellen tegelijk bestelt maakt niet uit. Je krijgt in beide gevallen de frequentietabellen. Er is geen 'betere manier'. Statistiek is een middel, geen doel.
Als je straks verslagen gaat schrijven, zul je ook leren dat je sowieso nooit rechtstreeks tabellen en grafieken uit SPSS in je verslagen en artikelen op mag nemen. Die moet je altijd eerst aanpassen naar een mooier, netter, en vaak informatiever formaat (in je tekstverwerker, e.g. LibreOffice of Word). Grafieken uit R kunnen overigens wel goed genoeg gemaakt worden voor publicatie, maar er wordt in deze cursus niet ingegaan op hoe je dat kunt doen.
[EDIT] Om nog even op je vraag terug te komen: ja, studietaak 2.6 klopt qua moeilijkheid :-)