Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

0 leuk 0 niet-leuks

Is er een manier om een non-parametrische multivariate analyse te doen in SPSS? Ik heb 4 onafhankelijke groepen (nominaal) en meerdere afhankelijke variabelen (scale). De afhankelijke variabelen zijn niet normaal verdeeld en ik heb kleine groepen ( n= 3 tot 6). Ik kom uit op de ANOSIM, maar die kan ik niet in SPSS-26 doen. Het schijnt wel in R te kunnen, maar ik heb nooit met R gewerkt. En R schijnt erg lastig te zijn.  Mijn vraag is : Is er manier om de analyse toch in SPSS te doen? Bijvoorbeeld: een kruskal-Wallis test met correctie voor de alpha, dus een kleinere alpha gebruiken a/k? of een andere (gratis/goedkoop) software die gebruiksvriendelijker is dan R, waarin deze analyse gedaan kan worden?

in SPSS door (120 punten)

Dag Ron, nogmaals bedankt. Zonder jou zou ik niet weten hoe ik verder kan met mijn masterthesis.

Ik heb 'vegan' geinstaleerd en geload, samen met een het pakket 'pacman'. Het schijnt dat 'pacman' vele aantal basis packages heeft die nodig zijn voor installatie van vele andere packages. Rtools wil niet geinstaleerd worden, maar het schijnt dat dit niet hoeft als ik de windows versie van R heb.

Ik kan nu anosim draaien.

Ik heb de volgende command geschrijven in Rstudio:

#open file
prompting_and_SSMR <- read_sav("master onderwijswetenschappen/statistics/prompting and SSMR.sav")

#load vegan
require(vegan)

#voer anosim uit

anosim(x= prompting_and_SSMR$PRproportion + prompting_and_SSMR$SGproportion, grouping = prompting_and_SSMR$group,permutations = 999, distance = "bray", strata = NULL, parallel = 1)

result <- anosim(x= prompting_and_SSMR$PRproportion + prompting_and_SSMR$SGproportion, grouping = prompting_and_SSMR$group,permutations = 999, distance = "bray", strata = NULL, parallel = 1)

summary(result)
plot(result)

Ik ben onzeker of ik de permutation, distance, strata en parallel goed heb. Ik kan nergens duidelijk informatie vinden hierover. Ik ben de uitleg van Andy Field gewend. De uitleg die R geeft, begrijp ik niet. Ook niet als ik wikipedia erbij raadpleeg of reseachgate.

Ik heb 4 groepen (genummerd 1 t/m 4 ) en 2 variabelen gemeten (PRpropotion en SGpropotion).

Ik krijg het volgende als output:

ANOSIM statistic R: 0.3143
      Significance: 0.008

Permutation: free
Number of permutations: 999

Het lijkt dat er wel significant verschil is tussen de groepen, want R is positief en p is onder 0.05. Al heb ik nergens alpha ingesteld! Ik weet niet of dat standaard is in vegan.

onder summary krijg ik de volgende output:

ANOSIM statistic R: 0.3143
      Significance: 0.005

Permutation: free
Number of permutations: 999

Upper quantiles of permutations (null model):
  90%   95% 97.5%   99%
0.139 0.179 0.209 0.251

Dissimilarity ranks between and within classes:
        0%  25%  50%    75% 100%   N
Between  1 51.5 95.5 132.25  171 132
1       29 45.5 61.0  80.25  104   6
2        2 26.5 51.0  52.50   54   3
3        8 34.0 65.0  91.50  137  15
4        3 15.5 57.0 141.50  160  15

Hieruit begrijp ik dat de distance between the groups groter is dan de distances within the groups. Daarom is er significant verschil tussen de groepen. 
Dit is ook zichtbaar op de plot, die kan ik helaas niet kopieren en plakken hier. 
Verder zie ik dat p ineens anders is!!!

mijn vraag is : klopt deze analyse en interpretatie? en kan ik een soort step-down analyse doen in R, om te zien welke groep significant verschilt van de andere (zoals bij kruskal-Wallis analyse) ? 

alvast bedankt, Sabrine

Ik zit eerlijk gezegd een beetje te kijken naar je originele reden om naar anosim over te gaan en de hoeveel N die je gebruikt om de dissimilarity matrix op te stellen en ik vraag me dan af of het middel niet erger wordt dan de kwaal.

Sowieso is een n = 3 best laag, dat een andere groep n = 6 heeft maakt het dan niet veel beter. Waarom was de MANOVA nodig in de eerste plaats? Ik weet niet hoeveel afhankelijke variabelen er precies zijn, maar als vier groepen vergeleken worden op een grote hoeveelheid afhankelijke variabelen dan zie ik zeker de meerwaarde van ANOSIM, want dan is het in wezen een ANOVA op een dimensionele reductie (dus een vermindering van afhankelijke variabelen door slim samenclusteren). Als het om maar 2 of 3 afhankelijke variabelen gaat zou je misschien beter afzijn voor de interpretereerbaarheid van je resultaat om de normale MANOVA te doen, ondanks de schending van normaliteit op basis van de data (wat niet zegt dat het in de populatie niet normaal verdeeld is).

Maar als je bij de ANOSIM blijft: De dichter R bij '1' zit de meer mensen binnen een groep op elkaar lijken, en de minder leden van de groepen lijken op leden van een andere groep.

Het deel 'upper quartiles of permutation' moet je lezen als een histogram voor hoe de p-waarde berekend is. Omdat dit een non-parametrische techniek is wordt de p-waarde niet berekend uit een theoretische kansverdeling (zoals bij t, F, e.d.). Om hier tot een p-waarde te komen is er een permutatietest gedaan. Dit is een duur woord voor: heel vaak schudden we alle data door elkaar, en negeren we in welke groep iemand echt zit, en iedere keer kijken we hoe de scores verdeeld zijn. Vervolgens wordt geturft hoe vaak de scores onder de 'officiele' groepsindeling, hoger scoort dan de scores onder de random scoreverdeling.

In dit geval zie je dan ook de verhouding tussen p-waarden en percentielen; bij random shuffelen van data is jouw echte data in meer dan 20% van de gevallen extremer (bij 97,5%). Dat is best vaak, dus vandaar een p-waarde van .005

Belangrijker dan de significantie is eigenlijk de waarde van R. .20 is net als bij correlaties erg klein als effect, dus .30 is ook geen groot effect.

De dissimalarity matrix geeft per level van je factor de dissimularity binnen de groep en tussen groepen aan. 0% is de laagste waarde, 100% is de hoogste waarde. Hier zie je een bevestiging van het beeld van de R; binnen groepen is de dissimilarity hoog, terwijl tussen groepen per niveau van de factor, de dissimilarity laag is. Dus hoewel de groepen bij elkaar genomen significant verschillen, is het totaalbeeld dat de vier groepen toch nog erg veel gelijkend zijn in verhouding tot de individuele variatie binnen de groepen.

Dag Ron,

Ik heb twee onderzoeksvragen. Een vraag met 2 en een met 5 variabelen. Ik probeer nu de eerste te doen.

Als ik naar de data in het algemeen kijk, zie ik dit beeld:

setting prompts dependent variable mean n
online prompts pr 0.51 4
control sg 0.50 3
prompts pr 0.46 4
control sg 0.46 3
face-to-face prompts pr 0.33 6
control sg 0.29 6
prompts pr 0.68 6
control sg 0.72 6

Ik zie in de online setting geen verschillen, maar in de face-to-face setting zie ik verschillen tussen pr en sg. Mijn vraag is is dit verschil significant? Ik hoopte dat ik met een soort step-down analyse na ANOSIM dit kan beantwoorden. Anders zou ik misschien een kruskal-Wallis analyse kunnen doen voor elke afhankelijke variabele apart, met een Bonferroni correctie voor alpha. Ik heb de MANOVA analyse gedaan voor deze dataset, maar ik krijg geen duidelijk antwoord op mijn vraag, aangezien het werkt met discriminant functions. Ik kan hiermee mijn vraag niet beantwoorden.

ter controle: ANOSIM werkt dus anders dan MANOVA, die geeft alle data een soort rangnummer en sorteert de data vervolgens in de 4 groepen en rekent met de afstanden tussen de rangnummer verder. ANOSIM zeg nu dus, er is significant verschil maar die is erg klein. Dat zie op de plot heel duidelijk, de rank dissimilarities van de groepen overlappen bijna met de de rank dissimilarity between de groepen. Maar het zegt natuurlijk niks specifieks zoals een kruskal-wallis analyse met een step-down analyse.

Vraag:

1-Mag ik in dit geval een kruskal-wallis analyse + een step-down analyse uitvoeren voor elke afhankelijke variabele apart met een correctie voor alpha?

2-Voor mijn tweede onderzoeksvraag, heb ik voor dezelfde groepen 5 afhankelijke variabelen. Daar zo ik dus in iedere geval een ANOSIM moeten doen. klopt dat?

groet, Sabrine

Voor mijn helderheid: ik zie twee between subjects variabelen 2x setting [online; face-to-face] en 2x prompts [control; prompts], met twee afhankelijke variabelen: Y1 = pr; Y2 = sg. Klopt dat?
ja dat klopt.

Aub. inloggen or registreren om deze vraag te beantwoorden.

...