Dit is een site voor studenten van de Open Universiteit. Voordat je een vraag kunt stellen moet je even een account aanmaken (dit systeem is niet gekoppeld aan je OU studentnummer en wachtwoord).

Welkom bij het vraag- en antwoord systeem van de onderzoeks-practica van de studie psychologie bij de Open Universiteit.

Houd er, als je een vraag stelt, rekening mee dat je de richtlijnen volgt!

niet significante b

0 leuk 0 niet-leuks
hey iedereen,

 

Stel je voor dat ik een regressieanalyse uitvoer en de constante a, heeft een t-waarde van 4 maar een p-waarde van .461.

Is de regressievergelijking da teniet gedaan? Ik begrijp dat ik deze a dan niet mag gebruiken, maar wat met de rest van de analyse? Mag je dan nog zeggen dat er een samenhang is of niet?
gevraagd 22 maart 2014 in Methodologie door winnie_vervloet (500 punten)

1 Antwoord

0 leuk 0 niet-leuks

Dit is niet mogelijk. Ik heb even in R gekeken, en, dan komen er de volgende p-waarden uit voor een t-waarde van 4 met 20, 10 en 1 vrijheidsgraden:

> 2 * (1 - pt(4, 20))
[1] 0.0007035233
> 2 * (1 - pt(4, 10))
[1] 0.002518333
> 2 * (1 - pt(4, 1))
[1] 0.1559583


(pt geeft de oppervlakte onder de t-verdeling voor een t lager dan de eerste parameter (4), voor de t-verdeling met het aantal vrijheidsgraden in de tweede parameter (20, 10, en 1). Dit moeten we van 1 aftrekken omdat we de kans willen weten op een t-waarde die GROTER is, in plaats van kleiner; en het resultaat moeten we met twee vermenigvuldigen omdat beta's altijd tweezijdig worden getoetst)

Met andere woorden, zelfs als je maar 1 vrijheidsgraad zou hebben, zou de p-waarden voor een t-waarde van 4 nog steeds .16 zijn. Het intercept kan dus geen t-waarde van 4 hebben en een p-waarde van .4. Ben je niet in de war met iets anders (i.e. dat het intercept zelf 4 is, ipv de t-waarde)?

Verder betekent een niet-significante coefficient (voor het intercept of een van de voorspellers) niet dat de regressievergelijking teniet is gedaan. Het betekent gewoon dat die coefficient nul is. In jouw geval, met een niet-significant intercept, betekent dat dat als alle voorspellers de waarde nul hebben, de beste voorspelling voor de afhankelijke variabele ook nul is.

beantwoord 25 maart 2014 door gjp (67,020 punten)
goedemorgen Gjalt-Jorn,

 

Het kan inderdaad zijn dat ik ergens de verkeerde getallen heb gekozen(mijn excuses). Ik had een enkelvoudige regressieanalyse gemaakt waarvan de R² significant was, alsook de F, maar bij 'b'-regressiecoëfficiënt gaf hij bij de t-waarde aan dat de p-waarde >.05.

Nu als ik het goed heb begrepen, mag ik de R² dan nog steeds gebruiken, maar is mijn regressievergelijking niet in te vullen?

Sorry al ik onduidelijk was,

 

groetjes,

Winnie
Als je model niet significant is (de F-waarde van de model anova is niet significant), verklaren je voorspellers niet van de afhankelijke variabele. Tenminste, het is plausibel dat geen van de voorspellers met de afhankelijke variabele samenhangt.

Het simpelste model (y = mean, oftewel, iedereen's score is het gemiddelde van Y) werkt dus precies even goed als je regressiemodel. Het is in die situatie niet wetenschappelijk verantwoord om een complexer model te hanteren.

Als je een enkelvoudige regressie doet, is het onmogelijk dat de F-toets significant is, maar de regressie-coefficient van je enige voorspeller niet. Dan heb je dus verkeerd gekeken.

Ik zou zeggen, bestudeer je uitkomsten nog even grondig, en meld hier nog even welke getallen (F, df, p van de model test, en beta, se, t, df, en p van je voorspeller(s)) er uit kwamen.
goedemiddag,

 

ik heb ondertussen mijn analyses allemaal nog eens nagekeken (vanwaar ik de vorige cijfers heb gehaald, geen idee) maar ik heb er wel eentje gevonden waar hetzelfde probleem is. Ik heb een lineaire regressie gedaan: R² = .357, F= 40.508, bijhorende p =.000

en dan bij a is de waarde: .270, de bijhorende t = .741 en de p = .461

b= 1.454, de bijhorende t = 6.365 en de p =.000

mag ik de regressievergelijking dan invullen of niet?

(van de b waar ik een niet significante waarde had gevonden, was inderdaad zoals u zei, de F waarde ook niet significant)

groetjes,

Winnie
oh en sorry de df bij F (1,73) even vergeten bij te voegen
Je model is significant: dit betekent dat je model als geheel beter dan kansniveau kan voorspellen wat iemand op de afhankelijke variabele scoort. De regressie-coefficient van het intercept verschilt niet significant van 0; de regressie-coefficient van je voorspeller is ongeveer 1.5. De proportie verklaarde variantie is .36, wat betekent dat de correlatie van je voorspeller met de afhankelijke variabele gelijk is aan de wortel daarvan oftewel .60. Dat is een grote effect size.

In je rapportage moet je voor elke variabele die je onderzocht de correlatie en bijbehorende p-waarde rapporteren. Vervolgens kun je voor de variabelen met een significantie correlatie de regressie-coefficient rapporteren. Hier kun je dan bij melden dat er geen aanwijzingen zijn dat het intercept in de populatie een andere waarde heeft dan 0, waardoor je model simpelweg bestaat uit:
$$\hat{Y}_i = 1.454 X_i$$
(uitgebreider is dit
$$\hat{Y}_i = 0 + 1.454 X_i \text{ want } \hat{Y}_i = \beta_0 + \beta_1 X_i$$
maar het intercept kun je dus net zo goed weglaten. Ik gebruik hier de 'genummerde beta notatie', die wat gangbaarder is dan de 'a en b'-notatie - maar deze zijn in principe gewoon inwisselbaar.)

Kun je hier wat mee?
absoluut, héél vriendelijk bedankt voor het antwoord, nu begrijp ik het!
...