Vous êtes sur la page 1sur 10

COMPT RENDU TD 3

EX 1:
1) le hsperc est determiner de manier le plus petite il est, le plus le niveau de l'élève au lycée
est mauvais et le plus son moyenne générale d’attendue l'université est faible.
2) pour hsperc=20 et sat=1,050
colgpa_chapeau = 1,392 - 0,0135*20 + 0,000148*1,050 = 2,676
3)

y_A = 1,392 - 0,0135*c + 0,000148*(i+140)


y_B = 1,392 - 0,0135*c + 0,000148*(i)
y_A - y_B = 0,000148 * 140 =0.0207
Donc la différence prévue entre les deux étudiants A et B est 0.0207. la différence n'est pas
importante.

4)
y_A = 1,392 - 0,0135*c + 0,000148*(i+x)
y_B = 1,392 - 0,0135*c + 0,000148*(i)
y_A - y_B = 0,000148 * x =0.5

différence en sat score :x = 338


5)
###################################codeR######################################
#############################################################################

> reg<-lm(gpa2$colgpa~gpa2$hsperc+gpa2$sat)
> reg
Call:
lm(formula = gpa2$colgpa ~ gpa2$hsperc + gpa2$sat)

Coefficients:
(Intercept) gpa2$hsperc gpa2$sat
1.391757 -0.013519 0.001476

colgpa = 1.39 - 0.0135*hsperc + 0.00148*sat

> reg$residual

> sum(reg$residuals)
[1] 5.579738e-14
> VR<-sum(reg$residuals^2)
> VT<-sum((gpa2$colgpa-mean(gpa2$colgpa))^2)

> VE<-VT-VR
> R_deux<-VE/VT
> n<-nrow(gpa2)
>n

[1] 4137
> k<-2
> n-k-1
[1] 4134
> F_obs<-(VE/k)/(VR/(n-k-1))
> F_critique <-3
> F_obs>F_critique
[1] TRUE
> ## on refuse alors H0

> summary(reg)
Call:
lm(formula = gpa2$colgpa ~ gpa2$hsperc + gpa2$sat)
Residuals:
Min 1Q Median 3Q Max
-2.6007 -0.3581 0.0329 0.3963 1.7599
Coefficients:

Estimate Std. Error t value Pr(>|t|)


(Intercept) 1.392e+00 7.154e-02 19.45 <2e-16 ***
gpa2$hsperc -1.352e-02 5.495e-04 -24.60 <2e-16 ***
gpa2$sat 1.476e-03 6.531e-05 22.60 <2e-16 ***

---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5615 on 4134 degrees of freedom


Multiple R-squared: 0.2734, Adjusted R-squared: 0.2731

F-statistic: 777.9 on 2 and 4134 DF, p-value: < 2.2e-16


##############################################################################
##############################################################################
EX 2:
1)le faminc dois étre positif car un revenu plus élevé augmente l'accès aux soins prénataux,ce
qui augmentent le poids à la naissance.
2) cigs et le faminc peut être corrélés négativement.
3) estimation avec faminc:
#################################code R######################################
> reg<-lm(bwght$bwght~bwght$cigs+bwght$faminc)
> reg
Call:
lm(formula = bwght$bwght ~ bwght$cigs + bwght$faminc)

Coefficients:
(Intercept) bwght$cigs bwght$faminc
116.97413 -0.46341 0.09276
> reg$residuals
> VR<-sum(reg$residuals^2)
> VT<-sum((bwght$bwght-mean(bwght$bwght))^2)

> VE<-VT-VR
> R_deux<-VE/VT
> n<-nrow(bwght)
>n

[1] 1388
> k<-2
> n-k-1
[1] 1385

> F_obs<-(VE/k)/(VR/(n-k-1))
> F_obs
[1] 21.27392
> F_obs>F_critique
[1] TRUE

> summary(reg)
Call:
lm(formula = bwght$bwght ~ bwght$cigs + bwght$faminc)
Residuals:
Min 1Q Median 3Q Max
-96.061 -11.543 0.638 13.126 150.083
Coefficients:
Estimate Std. Error t value Pr(>|t|)

(Intercept) 116.97413 1.04898 111.512 < 2e-16 ***


bwght$cigs -0.46341 0.09158 -5.060 4.75e-07 ***
bwght$faminc 0.09276 0.02919 3.178 0.00151 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 20.06 on 1385 degrees of freedom

Multiple R-squared: 0.0298, Adjusted R-squared: 0.0284


F-statistic: 21.27 on 2 and 1385 DF, p-value: 7.942e-10
p-value: 7.942e-10 <0.05 donc on réfuse l'hypothése H0
############################################################################

estimation sans faminc :


bwdght = 116,97 - 0,46*cigs + 0,09 faminc
N = 1,388 R_squared = 0,03
estimation sans faminc :

bwdght = 119,77 - 0,51*cigs


N = 1,388 R_squared = 0,02
l'ajout de la faminc a rendre l'effet de cigs plus negative sur le bwght.
##############################################################################
##############################################################################
EX 3:
1) > summary (discrim)

> summary (discrim$income)


Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
15919 37883 46272 47054 54981 136529 1
> summary (discrim$prpblck)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's

0.00000 0.01165 0.04144 0.11349 0.12106 0.98166 1


2)

psoda = 0,95 + 0,11 *prpblck + 0,00 income


N = 401 R_squared = 0,064

Le coecient de prpblck est de 0,1149882: il n'a pas de grand effet economique.par example:
lorsque prpblck augmente par 1, le prix d'un soda augmente de 11 cents.
3)

l'effet de discrimination est plus faible lorsque le revenu est exclu.


4)
prpblck est déjà une proportion (puisque elle est la seul variable sans log) si prpblck augmente
de 0,20, on peut prévoir que le prix du soda augmentera de 0,12*0,20 = 0,024 = 2,4%.
5)

Le coeficient de prpblck passe de 0,12 à 0,08 lorsque prppov est inclus.

6)
7) ce n'est pas toujours vrai Ils peuvent figurer dans la même régression. car Leur inclusion
simultanée rend plus difficile l'identification des effets indépendants de chacun sur le prix des
sodas.

##############################################################################
##############################################################################
EX 4:
1) Min: 6, Max: 20, Range = 14

2)

La variation de l'éducation de la mère et du père : R_deux =0.249

Le coefficient de la motheduc signifie que por tout augmentation de motheduc , l'educ sera
augmenté par 0,304 année.
3)
variable abile aide à expliquer les variations de l'éducation.
4)

Vous aimerez peut-être aussi