Académique Documents
Professionnel Documents
Culture Documents
Appliquée
Devoir prépare par Fara Marie Josie NOEL et présenté au professeur Septimus Pierre dans le cadre du
cours d’économétrie des variables qualitatives.
a. Calculer les moyennes des revenus par secteur à partir de cette estimation. Comparer avec
les données fournies. Que constatez-vous ?
Dans cet exercice, la variable à expliquer est une variable quantitative: « Revenu moyen» Et la
variable explicative une variable qualitative : « Le secteur d’activité » qui a 4 modalités : Industrie,
Services, Transport, Autres. Avec la relation suivante : REVENUi= BO+ B1SECTi +Ei i=1,2,…N
REVENUi : le revenu moyen par secteur i, on le notera Yi
SECTi : Variable codée comme suit :
Résolution
Calculons Le revenu moyen perçu: par secteur d’activité en utilisant l’équation de
régression
Soit xi la variable indicatrice du secteur :
xi=1 Si services ; xi=2 si transport ; xi=3 si industrie ; xi==4 si autres
En utilisant la commande : « =17.46+1.53*xi » sur Excel,
On remarque que les valeurs obtenues à partir de l’équation de régression estimée sont différentes
de ceux qu’on a eu dans le tableau. Ceci est dû au fait que la méthode utilisée pour calculer les
moyennes estimées n’est pas correcte. Pour des variables qualitatives multinomiales, une
indicatrice codée 0 et 1 doit être créée pour chaque modalité.
b. Quelle régression l’analyste aurait dû réaliser ? Quelle serait alors la valeur estimée des
paramètres de l’équation de régression ?
On a la matrice XX’ :
XX'
XX’= 3304 582 333 1165
582 582 0 0
333 0 333 0
1165 0 0 1165
Exercice 2
1.4) Calculer la probabilité qu'un ménage de 2 adultes avec un revenu total égal à 10 000
roubles achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre.
Donc, la probabilite qu'un ménage de 2 adultes avec un revenu total égal à 10 000 roubles
achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre est de 21.31%.
Exercice 3
1 si Zi*=Xi𝜆 + ui ≥ 0
yi =
0 si Zi*=Xi𝜆 + ui ˂ 0
Caractéristiques de la base de données
• Population : Ménages
• Variables :
o portable : 1= ménage est équipé d'un climatiseur mobile, 0 sinon.
o revenu : revenu annuel du ménage exprimé en logarithme.
o nbfoyer : nombre de personnes du ménage.
o taille : surface de l'habitation.
o maison : 1= ménage réside en logement individuel, 0 sinon.
Les résultats ont été obtenus en estimant un modèle Logit.
Alors l’estimation donne le résultat suivant:
yi = -12.0471 - 0.0645*nbfoyer + 0.0011*taille + 1.1587*revenu - 0.4941*maison -1.8064*portable
3)- Calculer la probabilité qu'un ménage de 3 personnes en maison individuelle de revenu 10, de taille
d'habitation 1360 et ne possédant pas de climatiseur portable installe une climatisation. Commenter.
̂ ŷi = -12.0471- 0.065(3) + 0.0011(1360) + 1.1587(10) – 0.4941(1) – 1.8064(0)
ŷi = xi𝛽
ŷi = 0.348
Alors, la probabilité d’installer un climatiseur est de :
1
⋀(0.35) = = 0.5861
1+ 𝑒 −0.348
Commentaires
Laprobabilite Pour un ménage composé de 3 personnes, de revenu 10, vivant en maison individuelle de
surface d’habitation de 1360 et ne possédant pas de climatiseur portable d’installer une climatisation
est de 58.61%.
4)- Calculer l'effet marginal associé à la variable REVENU, au point moyen de l'échantillon, à partir de
l'estimation Logit. Utilise pour cela les moyennes des variables explicatives dans le tableau de
statistiques descriptives. Commenter.
̂ = -12.0471- 0.065(3.1752) + 0.0011(1367.6788) + 1.1587(9.3176) – 0.4941(0.8467) –
On a : xi𝛽
1.8064(0.3942)
xi𝛽̂ = -1.0819
̂ revenu∗ 𝜆(𝑥𝑖𝛽̂ )
Alors, EMrevenu = 𝛽
𝑒 −1.0819
EMrevenu = 1.1587 * ( )= 0,2192
(1+𝑒 −1.0819 )2
Commentaires
Pour un ménage moyen, la probabilité d’installer un climatiseur va augmenter de 21.91points de
pourcentage suite à une augmentation du revenu moyen d’une unité (passe de 9.3176 à 10.3176).
5)-Calculer l'effet marginal associé à la variable PORTABLE, au point moyen de l'échantillon. Que pouvez-
vous dire de la substitution entre l'installation d'une climatisation et la climatisation portable ?
EMportable = ⋀(𝑐𝑒𝑛𝑡𝑟𝑎𝑙 = 1|𝑝𝑜𝑟𝑡𝑎𝑏𝑙𝑒 = 1, 𝑎𝑢𝑡𝑟𝑒𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑓𝑖𝑥𝑒 𝑎 𝑙𝑎 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 ) - ⋀(𝑐𝑒𝑛𝑡𝑟𝑎𝑙 =
1|𝑝𝑜𝑟𝑡𝑎𝑏𝑙𝑒 = 0, 𝑎𝑢𝑡𝑟𝑒𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑓𝑖𝑥𝑒 𝑎 𝑙𝑎 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 )
DEUXIEME PARTIE
Le logiciel utilise est R :
> summary(devqual)
sexe age abo sitfam soc
Femme:124 Min. :18.00 Min. :0.000 Min. :1.00 Cadre :32
Homme: 76 1st Qu.:35.00 1st Qu.:0.000 1st Qu.:1.00 Employe:88
Median :44.00 Median :1.000 Median :1.00 Ouvrier:80
Mean :42.52 Mean :0.545 Mean :1.63
3rd Qu.:49.00 3rd Qu.:1.000 3rd Qu.:2.00
Max. :59.00 Max. :1.000 Max. :3.00
zau sal
Min. :1.00 Min. : 3678
1st Qu.:2.00 1st Qu.:13789
Median :2.00 Median :17038
Mean :3.03 Mean :18615
3rd Qu.:4.00 3rd Qu.:22523
Max. :7.00 Max. :35972
> table(sexe)
sexe
Femme Homme
124 76
> length(sexe)
[1] 200
> prop.table(table(sexe))*100
sexe
Femme Homme
62 38
> table(abo)
abo
> addmargins(prop.table(addmargins(Tab,2),2),1)*100
abo
sexe 0 1 Sum
Femme 73.62637 52.29358 62.00000
Homme 26.37363 47.70642 38.00000
Sum 100.00000 100.00000 100.00000
> genre<-ifelse(sexe=="Homme",1,0)
> cor.test(genre,abo)
Nous en deduisons que 47,70% des hommes sont prêts a s’abonner contre
52,29% de femmes.
> abon<-ifelse(abo=="0",1,0)
> fem<-ifelse(sexe=="Femme",1,0)
> hom<-ifelse(sexe=="Homme",1,0)
> marie<-ifelse(sitfam=="1",1,0)
> celib<-ifelse(sitfam=="2",1,0)
> divor<-ifelse(sitfam=="3",1,0)
> cadre<-ifelse(soc=="Cadre",1,0)
> empl<-ifelse(soc=="Employe",1,0)
> ouv<-ifelse(soc=="Ouvrier",1,0)
>
> urbain<-ifelse(zau<="3",1,0)
> Femu<-ifelse(sexe=="Femme" & urbain=="1",1,0)
> Femr<-ifelse(sexe=="Femme" & urbain=="0",1,0)
> Homu<-ifelse(sexe=="Homme" & urbain=="1",1,0)
> Homr<-ifelse(sexe=="Homme" & urbain=="0",1,0)
1
200
> table(fem + hom)
1
200
> table(marie + celib + divor)
1
200
> table(cadre + ouv + empl)
1
200
> cbind(zau, urbain)
zau urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0
[11,] 4 0
[12,] 4 0
[13,] 4 0
[14,] 2 1
[15,] 2 1
[16,] 2 1
[17,] 1 1
[18,] 1 1
[19,] 1 1
[20,] 1 1
[21,] 1 1
VENDREDI 11 SEPTEMBRE 2020
[22,] 1 1
[23,] 1 1
[24,] 1 1
[25,] 2 1
[26,] 2 1
[27,] 2 1
[28,] 2 1
[29,] 2 1
[30,] 2 1
[31,] 2 1
[32,] 2 1
[33,] 2 1
[34,] 2 1
[35,] 2 1
[36,] 2 1
[37,] 2 1
[38,] 2 1
[39,] 2 1
[40,] 2 1
[41,] 2 1
[42,] 2 1
[43,] 2 1
[44,] 2 1
[45,] 2 1
[46,] 2 1
[47,] 2 1
[48,] 5 0
[49,] 5 0
[50,] 5 0
[51,] 5 0
[52,] 2 1
[53,] 2 1
[54,] 2 1
[55,] 2 1
[56,] 2 1
[57,] 2 1
[58,] 2 1
[59,] 2 1
[60,] 2 1
[61,] 2 1
[62,] 2 1
[63,] 2 1
[64,] 2 1
[65,] 2 1
[66,] 2 1
[67,] 2 1
[68,] 2 1
[69,] 2 1
[70,] 2 1
[71,] 2 1
0
200
> table((Homu + Homr) - hom)
0
200
> table(saldiv*1000 - sal)
-9.09494701772928e-13 0 1.81898940354586e-12
1 197 2
> table(sqrt(saldiv2*100000) - sal)
-3.63797880709171e-12 -1.81898940354586e-12 0
1 7 184
9.09494701772928e-13 1.81898940354586e-12 3.63797880709171e-12
1 4 3
> table(sqrt(age2) – age)
Error: unexpected input in "table(sqrt(age2) –"
> table(sqrt(age2)- age)
Ecrire les modèles économétriques associés à l’estimation 1 et 2. Précisez bien les différentes
hypothèses retenues.
Call:
glm(formula = abo ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.255 -1.255 1.102 1.102 1.102
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1805 0.1420 1.271 0.204
> BetaAboCst<-coef(LogitAboCst)
> P1<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> LogitAbonCst<-glm(abon ~ 1, family = binomial(link="logit"))
> summary(LogitAbonCst)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204
Call:
glm(formula = abo ~ fem, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
fem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> BetaSexe<-coef(LogitSexe)
> Pfem<-exp(BetaSexe[1] + BetaSexe[2])/(1+exp(BetaSexe[1] + BetaSexe[2]))
> Pfem
(Intercept)
0.4596774
> BetaSexe<-coef(LogitSexe)
> Phom<-exp(BetaSexe[1])/(1+exp(BetaSexe[1]))
> Phom
(Intercept)
0.6842105
> OddH<-Phom/(1-Phom)
> OddH
(Intercept)
2.166667
> OddF<-Pfem/(1-Pfem)
> OddF
(Intercept)
0.8507463
Call:
glm(formula = abo ~ fem + marie + celib + cadre + empl + urbain +
age + sal, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3577 -0.8211 0.3776 0.7868 1.6585
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.736e+00 1.145e+00 -2.389 0.01687 *
fem -1.141e+00 3.816e-01 -2.989 0.00280 **
Call:
glm(formula = abo ~ fem + marie + celib + cadre + empl + urbain +
age + saldiv, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3577 -0.8211 0.3776 0.7868 1.6585
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.73595 1.14502 -2.389 0.01687 *
fem -1.14055 0.38161 -2.989 0.00280 **
marie 1.20914 0.49293 2.453 0.01417 *
celib -0.48205 0.52833 -0.912 0.36156
cadre 1.75291 0.64432 2.721 0.00652 **
empl -0.51224 0.39500 -1.297 0.19470
urbain -0.14865 0.36477 -0.408 0.68363
age 0.08629 0.02211 3.902 9.55e-05 ***
saldiv -0.01855 0.02753 -0.674 0.50044
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Call:
glm(formula = abo ~ fem + marie + celib + cadre + empl + urbain +
age + age2 + saldiv + saldiv2, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3084 -0.8019 0.1074 0.8211 1.9342
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 16.4043850 6.4066398 2.561 0.01045 *
fem -1.0203878 0.4067757 -2.508 0.01213 *
marie 0.9201744 0.5174169 1.778 0.07534 .
celib -0.7646153 0.5815115 -1.315 0.18855
cadre 1.5893378 0.6846792 2.321 0.02027 *
empl -0.6905511 0.4203864 -1.643 0.10045
urbain -0.1508788 0.3894397 -0.387 0.69844
age -0.9119657 0.3134578 -2.909 0.00362 **
age2 0.0120903 0.0038443 3.145 0.00166 **
saldiv 0.0878204 0.1356691 0.647 0.51743
saldiv2 -0.0002430 0.0003136 -0.775 0.43827
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Call:
glm(formula = abo ~ fem + marie + celib + cadre + empl + urbain +
logage + logsal, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3864 -0.8067 0.3883 0.8450 1.6142
> quantile(age, probs=c(0, 0.01 , 0.05, 0.1, 0.25, 0.5 , 0.75 , 0.9, 0.95,
0.99, 1))
0% 1% 5% 10% 25% 50% 75% 90% 95% 99% 100%
18.00 26.95 30.00 31.00 35.00 44.00 49.00 52.20 58.00 59.00 59.00
> age35<-ifelse(age<=35,1,0)
> age45<-ifelse(age>35 & age<=45,1,0)
> age60<-ifelse(age>45,1,0)
> table(age35 + age45 + age60)
1
200
> quantile(sal, probs=c(0, 0.01 , 0.05, 0.1, 0.25, 0.5 , 0.75 , 0.9, 0.95,
0.99, 1))
0% 1% 5% 10% 25% 50% 75% 90%
95% 99% 100%
3678.00 6530.63 8359.00 10725.50 13789.00 17037.50 22522.50 28848.70
33448.90 35787.00 35972.00
> sal15<-ifelse(sal<=15000,1,0)
> sal225<-ifelse(sal>15000 & sal<=22500,1,0)
> sal30<-ifelse(sal>22500 & sal<=30000,1,0)
> salsup<-ifelse(sal>30000,1,0)
> table(sal15 + sal225 + sal30 + salsup)
1
200
> Logitmodel5<-glm(abo ~ fem + marie + celib + cadre + empl + urbain + age45
+ age60 + sal225 + sal30 + salsup, family = binomial(link="logit"))
> summary(Logitmodel5)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1555 -0.7690 0.3513 0.8202 1.7381
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.8928 0.7631 -1.170 0.242033
fem -0.9723 0.3896 -2.496 0.012577 *
marie 1.3257 0.5278 2.512 0.012017 *
celib -0.2714 0.5460 -0.497 0.619072
cadre 1.9748 0.6860 2.879 0.003993 **
empl -0.5426 0.3993 -1.359 0.174201
urbain -0.1790 0.3780 -0.474 0.635848
age45 1.0952 0.5124 2.137 0.032582 *
age60 1.7658 0.4564 3.869 0.000109 ***
sal225 0.5910 0.4169 1.418 0.156277
sal30 -0.4469 0.5844 -0.765 0.444442
salsup -0.0087 0.7472 -0.012 0.990711
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Call:
glm(formula = abo ~ Femu + Femr + Homu + age + age2 + marie +
celib + cadre + empl + saldiv + saldiv2, family = binomial(link =
"logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2200 -0.8103 0.1021 0.8136 1.9393
Coefficients:
Estimate Std. Error z value Pr(>|z|)
> vcov(Logitmodel6)
(Intercept) Femu Femr Homu
age age2 marie celib cadre empl
saldiv
(Intercept) 41.797472688 -3.662931e-01 -4.710581e-01 -0.0045996203 -
1.984284e+00 2.409211e-02 -6.047388e-01 -8.340558e-01 1.585785e-01 -
3.438164e-01 -1.220164e-01
Femu -0.366293072 3.360578e-01 2.594732e-01 0.2459708281
4.974367e-03 -9.218309e-05 -1.370098e-02 -1.656787e-02 -2.904523e-02 -
2.360264e-03 4.964772e-03
Femr -0.471058104 2.594732e-01 4.190941e-01 0.2430897581
3.191492e-03 -5.707143e-05 -8.193036e-03 -3.421170e-02 -4.179343e-02
1.244309e-02 1.836028e-02
Homu -0.004599620 2.459708e-01 2.430898e-01 0.4116688275 -
1.122594e-02 1.335229e-04 1.346819e-02 -3.645484e-02 5.003942e-02
4.464801e-02 -5.671508e-03
age -1.984283628 4.974367e-03 3.191492e-03 -0.0112259396
1.003221e-01 -1.226524e-03 1.824812e-02 3.355463e-02 -5.162942e-03
1.625846e-02 -2.901064e-03
age2 0.024092113 -9.218309e-05 -5.707143e-05 0.0001335229 -
1.226524e-03 1.509508e-05 -2.063893e-04 -3.931868e-04 9.527985e-05 -
2.190399e-04 3.684612e-05
marie -0.604738801 -1.370098e-02 -8.193036e-03 0.0134681942
1.824812e-02 -2.063893e-04 2.698311e-01 2.032042e-01 -3.418169e-03
2.120221e-02 6.145067e-05
Call:
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3084 -0.8019 0.1074 0.8211 1.9342
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 16.4043850 6.4066398 2.561 0.01045 *
fem -1.0203878 0.4067757 -2.508 0.01213 *
marie 0.9201744 0.5174169 1.778 0.07534 .
celib -0.7646153 0.5815115 -1.315 0.18855
cadre 1.5893378 0.6846792 2.321 0.02027 *
empl -0.6905511 0.4203864 -1.643 0.10045
urbain -0.1508788 0.3894397 -0.387 0.69844
age -0.9119657 0.3134578 -2.909 0.00362 **
age2 0.0120903 0.0038443 3.145 0.00166 **
saldiv 0.0878204 0.1356691 0.647 0.51743
saldiv2 -0.0002430 0.0003136 -0.775 0.43827
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Call:
glm(formula = abo ~ hom, family = binomial(link = "probit"))
VENDREDI 11 SEPTEMBRE 2020
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1012 0.1128 -0.898 0.36925
hom 0.5808 0.1876 3.096 0.00196 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Call:
glm(formula = abo ~ fem + age + age2 + marie + celib + cadre +
empl + urbain + saldiv + saldiv2, family = binomial(link = "probit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.25886 -0.80121 0.05407 0.83502 1.92147
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 9.4792485 3.7221752 2.547 0.01087 *
fem -0.6072863 0.2370584 -2.562 0.01041 *
age -0.5334554 0.1817832 -2.935 0.00334 **
age2 0.0071238 0.0022246 3.202 0.00136 **
marie 0.5736498 0.3099084 1.851 0.06417 .
celib -0.3978892 0.3419977 -1.163 0.24466
cadre 0.8440002 0.3923651 2.151 0.03147 *
empl -0.4432831 0.2491456 -1.779 0.07520 .
urbain -0.0798572 0.2292545 -0.348 0.72759
saldiv 0.0531477 0.0794605 0.669 0.50359