Académique Documents
Professionnel Documents
Culture Documents
MOSLIH Amina
14/02/2020
QUESTION 1)
Les hypothèses d’un modèle de regression linéaire multiple:
H1-le modèle est linéaire
H2-la matrice X’X est inversible
H3-l’esperance de l’erreur est nulle
H4-l’homoscidasticité et absence d’autocorrélation
H5-l’erreur est indépendane de la variable exlicative
H6-la normalité des erreur
Question 2)
on peut résumer notre diagnostic en 4 graphes avec la commande plot(reg)
sinon il y a d’autres tests
Pour tester la normalité des erreurs
-shapiro==>shapiro.test(resid(lm))
-Jarque.bera.test(resid(lm)) require(tesries)
Pour tester la linéarité
-raintest(lm) require lm(test)
Pour tester l’homogénéité
-gqtest(lm)
Pour tester la non autocorrélation des erreurs
-Box.test(resid(lm))
-dwtest(reg)
Pour tester la colinéarité des variables explicatives
-vif(lm) require(car)
Pour la selection du bon modèle
-step(lm)
Question 1)
le meilleur code qui permet d’explorer l’objet EU c’est str(data)
str(EU)
Question 1)
life.reg1=lm( Life.Exp~Income,data=EU)
life.reg1
##
## Call:
## lm(formula = Life.Exp ~ Income, data = EU)
##
## Coefficients:
## (Intercept) Income
## 6.758e+01 7.433e-04
summary(life.reg1)
##
## Call:
## lm(formula = Life.Exp ~ Income, data = EU)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.96547 -0.76381 -0.03428 0.92876 2.32951
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.758e+01 1.328e+00 50.906 <2e-16 ***
## Income 7.433e-04 2.965e-04 2.507 0.0156 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.275 on 48 degrees of freedom
## Multiple R-squared: 0.1158, Adjusted R-squared: 0.09735
## F-statistic: 6.285 on 1 and 48 DF, p-value: 0.01562
Interprétation: quand le revenu par individu agmente d’une unité l’esperance de vie
augmente de 𝛼̂1 = 0.007433
Question 2)
-Le nuage de pionts
plot(EU$Life.Exp~EU$ Income )
La droite de regression
require(ggplot2)
ggplot(EU,aes(y=Life.Exp,x=Income))+geom_point()+geom_smooth(method="lm")
-L’intervalle de confiance:
ICconf <- predict(life.reg1, interval = "confidence", level = 0.95)
require(HH)
##
## Attaching package: 'latticeExtra'
ci.plot(life.reg1)
Question2)
summary(life.reg2)
##
## Call:
## lm(formula = Life.Exp ~ ., data = EU)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.48895 -0.51232 -0.02747 0.57002 1.49447
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.094e+01 1.748e+00 40.586 < 2e-16 ***
## Population 5.180e-05 2.919e-05 1.775 0.0832 .
## Income -2.180e-05 2.444e-04 -0.089 0.9293
## Illiteracy 3.382e-02 3.663e-01 0.092 0.9269
## Murder -3.011e-01 4.662e-02 -6.459 8.68e-08 ***
## HS.Grad 4.893e-02 2.332e-02 2.098 0.0420 *
## Frost -5.735e-03 3.143e-03 -1.825 0.0752 .
## Area -7.383e-08 1.668e-06 -0.044 0.9649
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.7448 on 42 degrees of freedom
## Multiple R-squared: 0.7362, Adjusted R-squared: 0.6922
## F-statistic: 16.74 on 7 and 42 DF, p-value: 2.534e-10
## Start: AIC=-22.18
## Life.Exp ~ Population + Income + Illiteracy + Murder + HS.Grad +
## Frost + Area
##
## Df Sum of Sq RSS AIC
## - Area 1 0.0011 23.298 -24.182
## - Income 1 0.0044 23.302 -24.175
## - Illiteracy 1 0.0047 23.302 -24.174
## <none> 23.297 -22.185
## - Population 1 1.7472 25.044 -20.569
## - Frost 1 1.8466 25.144 -20.371
## - HS.Grad 1 2.4413 25.738 -19.202
## - Murder 1 23.1411 46.438 10.305
##
## Step: AIC=-24.18
## Life.Exp ~ Population + Income + Illiteracy + Murder + HS.Grad +
## Frost
##
## Df Sum of Sq RSS AIC
## - Illiteracy 1 0.0038 23.302 -26.174
## - Income 1 0.0059 23.304 -26.170
## <none> 23.298 -24.182
## - Population 1 1.7599 25.058 -22.541
## - Frost 1 2.0488 25.347 -21.968
## - HS.Grad 1 2.9804 26.279 -20.163
## - Murder 1 26.2721 49.570 11.569
##
## Step: AIC=-26.17
## Life.Exp ~ Population + Income + Murder + HS.Grad + Frost
##
## Df Sum of Sq RSS AIC
## - Income 1 0.006 23.308 -28.161
## <none> 23.302 -26.174
## - Population 1 1.887 25.189 -24.280
## - Frost 1 3.037 26.339 -22.048
## - HS.Grad 1 3.495 26.797 -21.187
## - Murder 1 34.739 58.041 17.456
##
## Step: AIC=-28.16
## Life.Exp ~ Population + Murder + HS.Grad + Frost
##
## Df Sum of Sq RSS AIC
## <none> 23.308 -28.161
## - Population 1 2.064 25.372 -25.920
## - Frost 1 3.122 26.430 -23.877
## - HS.Grad 1 5.112 28.420 -20.246
## - Murder 1 34.816 58.124 15.528
##
## Call:
## lm(formula = Life.Exp ~ Population + Murder + HS.Grad + Frost,
## data = EU)
##
## Coefficients:
## (Intercept) Population Murder HS.Grad Frost
## 7.103e+01 5.014e-05 -3.001e-01 4.658e-02 -5.943e-03
Question 2)
la comparaison de l’espérance de vie estimée avec ce modèle3 avec l’espérance de vie
observée
BD=data.frame(Murder=8,Population=4250,HS.Grad=75,Frost =80)
predict(modele3,newdata=BD)
## 1
## 71.85724
##
## Attaching package: 'car'
linearHypothesis(modele3,c("Murder","HS.Grad","Frost") , c(0,1,0))
jarque.bera.test(resid(modele3))
##
## Jarque Bera Test
##
## data: resid(modele3)
## X-squared = 1.4262, df = 2, p-value = 0.4901
on’a la p-value supérieur à 5% donc on ne peut pas rejetter H0 donc les erruers suivent une
loi normale
##Test de linéarité
require(lmtest)
##
## Attaching package: 'zoo'
raintest(modele3)
##
## Rainbow test
##
## data: modele3
## Rain = 1.1324, df1 = 25, df2 = 20, p-value = 0.3924
on’a la p-value superier à 5% donc on ne peut pas rejetter H0, donc le modele est linéaire
##Test d'homoginété
gqtest(modele3)
##
## Goldfeld-Quandt test
##
## data: modele3
## GQ = 0.71805, df1 = 20, df2 = 20, p-value = 0.7672
## alternative hypothesis: variance increases from segment 1 to 2
##
## Box-Pierce test
##
## data: resid(modele3)
## X-squared = 0.041106, df = 1, p-value = 0.8393
on’a la p-value superieur à 5% donc NRH0 alors il n ya pas l’autocorrélation des erreurs
Question2)
##la colinéarité des variables exlicative
require(car)
vif(modele3)
Puisque le vif des variables explicatives sont inférieures à 10 alors il n’y a pas de corrélation
entre eux.