Missael Devoir Econo Va Q

Centre de Technique de Planification et d’Économie Appliquée
(CTPEA)
Devoir d’Économétrie variable qualitative
Préparé par : Missael J.L SYLVAIN
Professeur : Septimus PIERRE
Septembre 2020
PREMIERE PARTIE : Tarification non linéaire
Exercice 1 : On s'intéresse à la distribution des revenus salariaux dans la
population, en fonction des secteurs d'activité. Les travailleurs sont répartis en ces 4
secteurs : Industrie, Services, Transport et autres.
Un analyste décide de traiter la variable "secteur d'activité" comme une explicative

du revenu :
REVENUEi = 𝛽0+ 𝛽1SECTi +𝜀𝑖 , i=1,2,…N Où la variable de secteur est multinomiale
et codée comme suit :
1 𝑠𝑖 𝑠𝑒𝑟𝑣𝑖𝑐𝑒𝑠
2 𝑠𝑖 𝑡𝑟𝑎𝑛𝑠𝑝𝑜𝑟𝑡
SECTi={
3 𝑠𝑖 𝐼𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑒
0 𝑠𝑖 𝑎𝑢𝑡𝑟𝑒𝑠
L'équation de régression estimée est : REVENUEi=17.56+1.53SECTi
1)- Calcul des moyennes des revenus par secteur à partir de cette estimation.
Comparer avec les données fournies. Que constatez-vous ?
Moyenne des Revenu

Secteur Effectif Ecart
revenus Chapeau
Industrie 1165 22.65 22.05 0.6
Services 582 16.64 18.99 -2.35
Transport 333 19.51 20.52 -1.01
Autres 1224 17.46 0.85

18.31
Tous
3304 19.67
Secteurs
Puisque nous avons la variable « Secteur d’activité » notée SECTi comme une
variable multinomiale, alors chaque modalité associée à cette variable deviendra
comme une variable indicatrice. De plus, on retirera une indicatrice associée
(Autres) pour éviter des problèmes de multi colinéarité. Donc on peut écrire
l’équation de la régression ainsi :
REVENUEi= = 𝛽0+ 𝛽1SERVi + 𝛽2TRANSPi + 𝛽3 INDUSi + 𝜀𝑖 , i=1,2...N
Avec SERVi = 1 si Services sinon 0 ; TRANSPi= 1 si Transport sinon 0 ;
INDUSi= 1 si Industrie sinon 0
Trouvons alors la valeur estimée des paramètres de l’équation de régression

0.000817 -0.000817 -0.000817 -0.000817
-0.000817 0.0025352 0.000817 0.000817
-0.000817 0.000817 0.00382 0.000817
-0.000817 0.000817 0.000817 0.0016754
Exercice 2 :
Le ministère de la santé Russe s'intéresse à la consommation de boissons
alcoolisées et au moyen de la réduire par une politique de taxation. Les données
suivantes sont tirées d'un échantillon de 1078 familles russes enquêtées en 1993 :
• QVOD : quantité de vodka consommée par personne et par jour, en litres ;
• REVENU : revenu mensuel du ménage ramené au nombre de personnes adultes
du ménage, en 105 roubles ;
• PVOD : prix du litre de vodka au détail, en 102 roubles.
Le modèle s’écrit : Y= 1 si QVOD > 1 sinon 0 ou Y= 1 si Y* > 0 sinon 0 avec =

QVOD -1
Un modèle a probabilité linéaire est estime et l’équation de régression estime est :
𝑌 ∗ = 0.2461 + 0.5009REVENUE - 0.1289PVOD
Calcul de la probabilité prédite associée a Y a la moyenne des régresseurs :
P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où : P(Yi=1/xi)=0.2461+0.5009 × 0.0326 – 0.1289 × 0.3727 alors P (yi=1/xi) =
0.2144
Calcul de la probabilité prédite associe à Y la plus faible
D’où P (Yi=1/Xi)= 0.2461+0.5009 × 0.0001 – 0.1289 × 0.12 alors P (Yi=1/Xi)=
0.2307
Calcul de la probabilité prédite associe à Y la plus forte
D’où P (Yi=1/Xi)= 0.2461+0.5009 × 0.2886 – 0.1289 × 5.4 alors P (Yi=1/Xi)= -
0.3064
Calcul de la probabilité qu'un ménage de 2 adultes avec un REVENU total égal à 10
000 roubles achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre.
(Indication : attention aux unités de mesure.)
REVENU= 10000/ (2× 105) = 47.62
PVOD= 45/102 = 0.44118
D’où P (Yi=1/Xi)= 0.2461+ 0.5009 × 47.62– 0.1289 × 0.44118 = 24.042
La probabilité qu’Y = 1 est estimé par un modèle Logit, dont le modèle s’écrit:
Le modèle s’écrit : Y= 1 si QVOD > 1 sinon 0 ou Y= 1 si Y* > 0 sinon 0 avec =
QVOD -1
Le modèle estimé
L’équation de régression estimée est donnée par :
𝑌 ∗ = -0.1721 + 5.9389REVENUE – 4.7353PVOD
On peut écrire la fonction de vraisemblance ainsi:
𝑁
ℒ(𝛽) = ∏[1 − Λ(𝑋𝑖 𝛽)]1−𝑌𝑖 [(Λ(𝑋𝑖 𝛽)]𝑌𝑖

𝑖=1
1 exp(𝑋 𝛽)
ℒ(𝛽)= ∏𝑁
𝑖=1[1+exp(𝑋 𝛽)]
1−𝑌𝑖
[1+exp(𝑋𝑖 𝛽)]𝑌𝑖
𝑖 𝑖
ℒ(𝛽)=
1 exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸 −4.7353𝑃𝑉𝑂𝐷 ))
∏1078
𝑖=1 [ ]1−𝑌𝑖 [1+exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸𝑖 −4.7353𝑃𝑉𝑂𝐷𝑖 ))]𝑌𝑖
1+exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸 −4.7353𝑃𝑉𝑂𝐷 )
𝑖 𝑖 𝑖 𝑖
- Calculons la probabilité que le ménage décrit à la question 1.5 achète plus de 1

litre de vodka.
P (Yi=1/Xi)= E (Yi/Xi)=Λ(Xi𝛽̂ ) (*)
Trouvons Xi𝛽̂
Xi𝛽̂ = -0.1721 + 5.9389REVENUE – 4.7353PVOD
Xi𝛽̂ = -0.1721 + 5.9389× 47.62 – 4.7353× 0.44118 alors Xi𝛽̂ = 280.5492

Ainsi, (*) devient:
1
P (Yi=1\Xi)= Λ(280.5492) Or, on sait que : Λ(Z) = 1+exp(−𝑍) alors P (Yi=1/Xi)= 1
Calculons l'effet marginal associé à la variable revenu pour un ménage vérifiant les
caractéristiques définies en 1.5 ou 2.2.
Pour le modèle a probabilité linéaire, l’effet marginal associe à la variable revenu se
calcule de la manière suivante :
𝜕𝑌̂ ∗
EM=𝜕𝑋𝑖 = 𝛽̂𝑗
𝑗𝑖
𝜕(0.2461 + 0.5009REVENUE − 0.1289PVOD)

EM= = 0.5009
𝜕𝑅𝐸𝑉𝐸𝑁𝑈𝐸
Pour le modèle logit, l’effet marginal associe à la variable revenue se calcule de la

manière suivante:
EM= 𝛽̂𝑗 × f(Xi𝛽̂ ) avec f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) (**)
Trouvons f(Xi𝛽̂ )
exp(𝑧)
f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) = (1+exp(𝑍))2
f(Xi𝛽̂ ) = λ(280.5492)= 1.4422× 10-122

D’où (**) devient :
EM= 0.5009 × 1.4422× 10-122 = 7.2241 × 10-123
Exercice 3 : On cherche à estimer la probabilité d'installation d'une climatisation à
partir d'un échantillon de ménages.
Les variables en votre possession sont les suivantes :
• CENTRAL : indicatrice égale à 1 si le ménage est équipé d'une climatisation.
• PORTABLE : indicatrice égale à 1 si le ménage est équipé d'un climatiseur mobile.
• REVENU : revenu annuel du ménage exprimé en logarithme.
• NBFOYER : nombre de personnes du ménage.
• TAILLE : surface de l'habitation.
• MAISON : indicatrice égale à 1 si le ménage réside en logement individuel.
L'objectif de cette étude est d'étudier l'impact des variables socioéconomiques

relatives au ménage sur la probabilité d'installer une climatisation (CENTRAL).
Le modèle estime peut s’écrire de la forme suivante :

1 𝑠𝑖 𝑌 ∗ > 0
CENTRALi= {
0 𝑠𝑖𝑛𝑜𝑛
𝑌𝑖∗ = 𝛽0+ 𝛽1PORTABLEi + 𝛽2REVENUi + 𝛽3 NBFOYERi + 𝛽4 TAILLEi + 𝛽5 MAISONi
+ 𝜀𝑖 ,i=1,2,…N
A partir des données du tableau, l’équation de régression estimée par le modèle

logit est :
𝑌̂𝑖∗ = - 12,04714 - 1,806437PORTABLEi + 1,158715REVENUEi -
0,064585NBFOYERi + 0,001099TAILLEi - 0,494055MAISONi
Commentaire sur les résultats obtenus.
On peut constater, grâce au tableau des résultats, que les variables : TAILLE,
REVENU, PORTABLE et la constante sont statistiquement significatifs avec 𝛼 = 5%.
Ce qui nous permet de conclure que ces trois variables peuvent expliquer la variable
CENTRAL. Les variables MAISON et NBFOYER ne sont pas statistiquement
significatifs. De plus, les paramètres associés aux variables TAILLE et REVENU sont
positifs. Ce qui pourrait dire qu’à mesure que la taille et le revenu pour l’individu i
augmente, 𝑌𝑖∗ augmente.
Calcul de la probabilité qu'un ménage de 3 personnes en maison individuelle de
revenu 10, de taille d'habitation 1360 et ne possédant pas de climatiseur portable
installe une climatisation.
NBFOYER=3 ; REVENU=10 ; TAILLE= 1360 ; PORTABLE=0
P (Yi=1\Xi)=E(Yi\Xi)= Λ(Xi𝛽̂ )
Trouvons Xi𝛽̂
Xi𝛽̂ = - 12.04714 – 1.806437PORTABLEi + 1.158715REVENUEi –

0.064585NBFOYERi + 0.001099TAILLEi - 0.494055MAISONi
Xi𝛽̂ = - 12.04714 – 1.806437× 0 + 1.158715 × 10 – 0.064585 × 3 + 0.001099 × 1360

- 0.494055× 1.
Xi𝛽̂ = 0.34684
D’où P (Yi=1/Xi)= Λ(0.34684) alors P (Yi=1/Xi) = 0.58585
Pour un ménage de 3 personnes en maison individuelle possédant un revenu 10, de
taille d’habitation 1360 et ne possédant pas de climatiseur portable, la probabilité
d’installer une climatisation est de 58.585%
Calculons l'effet marginal associé à la variable REVENU, au point moyen de
l'échantillon, à partir de l'estimation logit. Nous Utiliseront pour cela les moyennes
des variables explicatives dans le tableau de statistiques descriptives
EM= 𝛽̂𝑗 × f(Xi𝛽̂ ) (***) avec f(Xi𝛽̂ ) =λ(Xi𝛽̂ )

Trouvons f(Xi𝛽̂ )
exp(𝑧)
f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) = (1+exp(𝑍))2 (I)
Trouvons Xi𝛽̂
Xi𝛽̂ = - 12.04714 – 1.806437× 0.3942 + 1.158715× 9.3176 - 0.064585× 3.1752 +

0.001099× 1367.6788 - 0.494055 × 0.8467
Xi𝛽̂ = -1.0831
Alors (I) devient:
f(Xi𝛽̂ )= λ(−1.0831) = 0.18895
D’où (***) devient ;
EM= 1.158715 × 0.18895 alors EM= 0.21893
On peut dire que la différence de probabilité pour un ménage d’installer une
climatisation et de ne pas installer une climatisation est de 21.893%
Pour l’individu moyen, on peut dire que la probabilité d’installer une climatisation va
augmenter de 21.893 point de % suite à une augmentation du revenu moyen d’une
unité (passe de 9,3176 à 10,3176)
-Calcul de l'effet marginal associé à la variable PORTABLE, au point moyen de
l'échantillon.
EM=𝑃(𝐶𝐸𝑁𝑇𝑅𝐴𝐿 = 1\PORTABLE = 1, REVENU=c NBFOYER=d, TAILLE=e,
MAISON=f)- 𝑃(𝐶𝐸𝑁𝑇𝑅𝐴𝐿 = 0\PORTABLE = 1, REVENU=c NBFOYER=d,
TAILLE=e, MAISON=f), c, d, e, f etant fixee
EM= Λ( - 12.04714 – 1.806437× 1 + 1.158715× 9.3176 - 0.064585× 3.1752 +
0.001099× 1367.6788 - 0.494055 × 0.8467) - Λ( - 12.04714 – 1.806437× 0 +
1.158715× 9.3176 - 0.064585× 3.1752 + 0.001099× 1367.6788 - 0.494055 ×
0.8467)
EM= Λ(-2.17744178)- Λ(1.449189994)
EM = 0.10179- 0.40829
EM= -0.3065
DEUXIEME PARTIE
N.B. On a utilisé le logiciel R pour effectuer les calculs de la 2 eme partie. Les codes
sont en annexe.
1)- Statistiques descriptives sur la base de données

1.1)- Calcul de la moyenne, l’écart-type, le minimum et le maximum pour l’ensemble
des variables continues du fichier de la base.
Pour la variable Age on a :
La moyenne:42.52 ; Ecart-type:8.6698 ; Minimum:18.00 Maximum:59.00
Pour la variable salaire on a :
La moyenne:18615 ; Ecart-type:7082.49 ; Minimum:3678 Maximum:35972
1.2)- Calculer la moyenne, l’écart-type, le minimum et le maximum pour les variables

continues selon le type d’abonnement.
Pour Age
 Quand Abo=0
La moyenne: 40.27 ; Ecart-type: 6.752886 ; Minimum: 31.00 Maximum: 51.00
 Quand Abo=1
Pour Zau
 Quand Abo=0
 Quand Abo=1
Pour Sal
 Quand Abo=0
La moyenne:17654 ; Ecart-type:7150.625 ; Minimum: 3678 Maximum: 35374
 Quand Abo=1
La moyenne: 19418 ; Ecart-type: 6956.164 ; Minimum: 6296 Maximum: 35972

1.3)- Après avoir donné les principales statistiques descriptives, réaliser un tri à plat
pour l’ensemble des variables qualitatives.
Pour sexe
Femme : 124 ; Homme : 76
Lenght (sexe) : 200

Proportion de sexe : Femme : 62 ; Homme : 38
Pour Abo
0 1
91 109
Length(Abo) : 200
Proportion d’abonnée
0 1
45.5 54.5
Pour Sitfam
1 2 3
101 72 27
Length(Sitfam) : 200
Proportion de situation familiale
1 2 3
50.5 36.0 13.5
Pour Soc
Cadre : 32 Employe : 88 Ouvrier : 80
Length(Soc) : 200
Proportion de situation familiale : Cadre : 16 ; Employe : 44 ; Ouvrier : 40
Pour Zau
1 2 3 4 5 7
31 97 3 21 24 24
Length(Zau) : 200
Proportion Zau
1 2 3 4 5 7
15.5 48.5 1.5 10.5 12.0 12.0
1.4)- Faire un tableau croisé (avec un test de corrélation) entre les variables d’abonn
ement et le sexe. En déduire le pourcentage d’hommes et de femmes prêts à s’abon
ner.
Tableau croise entre sexe et abonnee
0 1 Sum
Femme 67 57 124
Homme 24 52 76
Sum 91 109 200
Tableau croise de proportion entre sexe et abonné
0 1 Sum
Femme 54.03226 45.96774 100.00000
Homme 31.57895 68.42105 100.00000
Sum 45.50000 54.50000 100.00000
Test de corrélation
Pearson's product-moment corrélation
Data: genre and Abo
t = 3.1561, df = 198, p-value = 0.001848
alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:
0.08262675 0.34706143
sample estimates:
cor
0.2188588
On rejette l’hyppothese ou la corrélation entre la variable sexe et abonnee est nulle.

2)- Création de nouvelles variables
2.1)- Compléter la base de données initiale par les variables suivantes :
Nouvelles variables :
Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
> Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
> Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
> Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
> Saldiv<-df$Sal/1000
> Saldivv<-(df$Sal^2)/100000
> logsal<-log(df$Sal)
> Age2<-df$Age^2
> logage<-log(df$Age)
2.2)- Vérifier, à l’aide de statistiques descriptives que ces variables ont été correctem
ent créées. Ces variables seront utilisées dans les différentes modélisations considé
rées.
Tableau des abonnes et ceux qui ne désire pas d’abonner

table (df$Abo +Pabon)
1
200
Tableau des variables dichotomiques associées à la variable caractérisant le sexe,
1
200
Tableau des variables dichotomiques associées à la variable caractérisant la

situation familiale,
1
200
Tableau des variables dichotomiques associées à la variable caractérisant la CSP,
0 1
88 112
Tableau de la variable prenant la valeur 1 lorsque l’individu vie en zone urbaine
Zau Urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0
Tableau >table ((Femur + Femru) - Ffem)
0
200
Tableau > table (Saldiv*1000 - df$Sal)
-9.09e-13 0 1.81e-12
1 197 2
Tableau >table (sqrt (Saldivv*100000)- df$Sal)
-3.63e-12 -1.81e-12 0
1 7 184
9.09e-13 1.81e-12 3.63e-12
1 4 3
Tableau >table (sqrt(Age2) - df$Age)
0
200
Tableau > table(exp(logage) - df$Age)
-1.42e-14 -7.10e-15 -3.55e-15 0

4 83 7 57
3.55e-15 7.10e-15 1.42e-14 2.13e-14
5 32 8 4
3)- Estimation d’un modèle logit
3.1)- Estimation sans variable explicative (avec la constante seulement.
1- Sur la variable caractérisant l’abonnement (variable d’origine)

En considérant la variable Abo comme variable à expliquer, sans variable
explicative, le modèle peut s’écrire comme suit :
1 𝑠𝑖 𝑦 ∗ > 0
Abo={ avec, y*=c : le seuil de tolerance, c etant une constante
2- Sur la variable caractérisant le non abonnement
En considérant la variable Pabon comme variable à expliquer, sans variable
explicative, le modèle peut s’écrire comme suit :
1 𝑠𝑖 𝑦 ∗ > 0
Pabon={ avec y*= c : le seuil de tolerance, c etant une constante
Précisons les hypothèses retenues.

Les deux modèles étant des modèles logit, alors on gardera comme
hypothèses :
1-E(ui)=0
𝜋
2-V (ui)=3
3-ui~iid
On vérifie :
Model 1 :
Call:
glm(formula = df$Abo ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.255 -1.255 1.102 1.102 1.102
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1805 0.1420 1.271 0.204
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 275.64 on 199 degrees of freedom

Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64
Number of Fisher Scoring iterations: 3

BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> Pl
(Intercept)
0.545
Model 2:
Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
(Intercept) -0.1805 0.1420 -1.271 0.204

AIC: 277.64

> BetaPabonCst<-coef(LogitPaboncst)
> P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
> P0
(Intercept)
0.455
3.2)- Estimation avec variables explicatives
 Une seule variable explicative : le sexe
Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))
Deviance Residuals:
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 269.89
BetaSexe<-coef(LogitSexe)
> PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]))
> PFfem
(Intercept)
0.4596774
> PHhom<-exp (BetaSexe [1]) / (1+exp (BetaSexe [1]))
> PHhom
(Intercept)
0.6842105
> OddH<-PHhom/ (1-PHhom)

> OddH
(Intercept)
2.166667
OddF<-PFfem/ (1-PFfem)
> OddF
(Intercept)
0.8507463
 Plusieurs variables
Inclure dans la modélisation les variables associées au sexe, à la situation familiale,

à la situation professionnelle, à la zone d’habitation et :
1er cas : à l’âge et au salaire,

Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + df$Sal, family = binomial(link = "logit"))
Deviance Residuals:
-2.3337 -0.8127 0.3788 0.7920 1.6387
Coefficients: (1 not defined because of singularities)

(Intercept) -3.363e+00 1.164e+00 -2.890 0.003847 **
Ffem -1.172e+00 3.847e-01 -3.046 0.002321 **
Marie 1.243e+00 4.949e-01 2.512 0.012007 *
Celibat -4.332e-01 5.318e-01 -0.814 0.415359
Cad 2.275e+00 6.167e-01 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 5.775e-01 4.005e-01 1.442 0.149283
Urbain -1.537e+00 1.380e+00 -1.114 0.265279
df$Age 8.596e-02 2.216e-02 3.878 0.000105 ***
df$Sal -1.764e-05 2.758e-05 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 226.18
2ième cas : à l’âge et au salaire divisé par 1000 ;
Call:
Ouv + Urbain + df$Age + Saldiv, family = binomial(link = "logit"))
Deviance Residuals:
-2.3337 -0.8127 0.3788 0.7920 1.6387

(Intercept) -3.36315 1.16353 -2.890 0.003847 **
Ffem -1.17159 0.38466 -3.046 0.002321 **
Marie 1.24318 0.49491 2.512 0.012007 *
Celibat -0.43318 0.53183 -0.814 0.415359
Cad 2.27509 0.61667 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 0.57748 0.40045 1.442 0.149283
Urbain -1.53701 1.37972 -1.114 0.265279
df$Age 0.08596 0.02216 3.878 0.000105 ***
Saldiv -0.01764 0.02758 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 226.18
3ième cas : à l’âge, l’âge au carré, au salaire divisé par 1000 et au salaire au carré d
ivisé par 10000,
Call:
Ouv + Urbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"))
Deviance Residuals:
-2.2813 -0.7946 0.1125 0.8222 1.8968

(Intercept) 15.2244715 6.3751035 2.388 0.016935 *
Ffem -1.0466956 0.4074845 -2.569 0.010209 *
Marie 0.9572624 0.5190814 1.844 0.065162 .
Celibat -0.7115023 0.5843278 -1.218 0.223360
Cad 2.2867560 0.6388771 3.579 0.000344 ***
Emplo NA NA NA NA
Ouv 0.7428700 0.4257637 1.745 0.081021 .
Urbain -1.1709368 1.3763118 -0.851 0.394892
df$Age -0.8946082 0.3133601 -2.855 0.004305 **
Age2 0.0118777 0.0038422 3.091 0.001992 **
Saldiv 0.0894349 0.1346012 0.664 0.506407
Saldivv -0.0002438 0.0003092 -0.789 0.430357
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 216.09
4ième cas : au logarithme de l’âge et au logarithme du salaire
Call:
Deviance Residuals:
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 269.89
ANNEXE
summary(df$Age)
summary(df$Sal)
sd(df$Age)
sd(df$Sal)
summary(df[df[,"Abo"]=="0","Age"])
sd(df[df[,"Abo"]=="0","Age"])
summary(df[df[,"Abo"]=="1","Age"])
sd(df[df[,"Abo"]=="1","Age"])
summary(df[df[,"Abo"]=="0","Zau"])
sd(df[df[,"Abo"]=="0","Zau"])
summary(df[df[,"Abo"]=="1","Zau"])
sd(df[df[,"Abo"]=="1","Zau"])
summary(df[df[,"Abo"]=="0","Sal"])
sd(df[df[,"Abo"]=="0","Sal"])
summary(df[df[,"Abo"]=="1","Sal"])
sd(df[df[,"Abo"]=="1","Sal"])
table(sexe)
table(Sexe)
table(df$Sexe)
length(df$Sexe)
prop.table(table(Sexe)*100
prop.table(table(df$Sexe))*100
table(df$Abo)
length(df$Abo)
prop.table(table(df$Sexe))*100
prop.table(table(df$Abo))*100
table(df$Sitfam)
length(df$Sitfam)
prop.table(table(df$Sitfam))*100
table(df$Soc)
length(df$Soc)
prop.table(table(df$Soc))*100
table(df$Zau)
prop.table(table(df$Zau))*100
addmargins(table(df$Sexe,Abo))
addmargins(table(df$Sexe,df$Abo))
Tab<-table(df$Sexe,df$Abo)
addmargins(prop.table(addmargins(Tab, 1),1),2)*100
genre<-ifelse(df$Sexe=="Homme",1,0)
cor.test(genre,df$Abo)
Pabon<-ifelse(df$Abo=="0",1,0)
Ffem<-ifelse(df$Sexe=="Femme",1,0)
Hhom<-ifelse(df$Sexe=="Homme",1,0)
Marie<-ifelse(df$Sitfam=="1",1,0)
Celibat<-ifelse(df$Sitfam=="2",1,0)
Divoc<-ifelse(df$Sitfam=="3",1,0)
Cad<-ifelse(df$Soc=="Cadre",1,0)
Emplo<-ifelse(df$Soc=="Employer",1,0)
Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
Urbain<-ifelse(df$Zau=="3",1,0)
Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
Saldiv<-df$Sal/1000
Saldivv<-(df$Sal^2)/100000
logsal<-log(df$Sal)
Age2<-df$Age^2
logage<-log(df$Age)
table(df$Abo +Pabon)
table(Ffem +Hhom)
table(Marie + Celibat + Divoc)
table(Cad + Emplo + Ouv)
cbind(df$Zau, Urbain)
table((Femur + Femru) - Ffem )
table(Saldiv*1000 - df$Sal)
table(sqrt(Saldivv*100000)- df$Sal)
table(sqrt(Age2) - df$Age)
table(exp(logage) - df$Age)
LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
summary(LogitAbocst)
BetaAboCst<-coef(LogitAbocst)
Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
Pl
LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
summary(LogitPaboncst)
BetaPabonCst<-coef(LogitPaboncst)
P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
P0
LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
summary(LogitSexe)
PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]))
PFfem
PHhom<-exp(BetaSexe[1]) / (1+exp(BetaSexe[1]))
PHhom
OddH<-PHhom/ (1-PHhom)
OddH
OddF<-PFfem/ (1-PFfem)
OddF
Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain +
df$Age + df$Sal, family = binomial(link = "logit"))
summary(Logitmodell)
Logitmodel2<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ df$Age + Saldiv, family = binomial(link = "logit"))
summary(Logitmodel2)
+ df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"))
+ logage + logsal, family = binomial(link = "logit"))
[1] 7082.492
> summary(df[df[,"abo"]=="0",age"])
+ summary(df[df[,"abo"]=="0",age"])
Error: unexpected string constant in:
"summary(df[df[,"abo"]=="0",age"])
summary(df[df[,""
> summary(df[df[,"abo"]=="0","age"])
Error in `[.data.frame`(df, , "abo") :
colonnes non définies sélectionnées
> summary(df[df[,"abo"]=="0","age"])
Error in `[.data.frame`(df, , "abo") :
colonnes non définies sélectionnées
> summary(df[df[,"Abo"]=="0","Age"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
31.00 34.00 39.00 40.27 46.00 51.00
> sd(df[df[,"Abo"]=="0","Age"])
[1] 6.752886
> summary(df[df[,"Abo"]=="1","Age"])
18.00 38.00 46.00 44.39 52.00 59.00
> sd(df[df[,"Abo"]=="1","Age"])
[1] 9.628294
> summary(df[df[,"Abo"]=="0","Zau"])
1.000 2.000 2.000 3.055 4.500 7.000
> sd(df[df[,"Abo"]=="0","Zau"])
[1] 1.928515
> summary(df[df[,"Abo"]=="1","Zau"])
1.000 2.000 2.000 3.009 4.000 7.000
> sd(df[df[,"Abo"]=="1","Zau"])
[1] 1.892947
> summary(df[df[,"Abo"]=="0","Sal"])
3678 12936 16227 17654 21320 35374
> sd(df[df[,"Abo"]=="0","Sal"])
[1] 7150.625
> summary(df[df[,"Abo"]=="1","Sal"])
6296 15528 18190 19418 23030 35972
> sd(df[df[,"Abo"]=="1","Sal"])
[1] 6956.164
> table(sexe)
Error in table(sexe) : object 'sexe' not found
> table(Sexe)
Error in table(Sexe) : object 'Sexe' not found
> table(Sexe)
Error in table(Sexe) : object 'Sexe' not found
> table(df$Sexe)
Femme Homme
124 76
> length(df$Sexe)
[1] 200
> prop.table(df$Sexe)
Error in Summary.factor(c(1L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, :
‘sum’ not meaningful for factors
> prop.table(table(Sexe)*100
+ prop.table(table(Sexe))*100
Error: unexpected symbol in:
"prop.table(table(Sexe)*100
prop.table"
> prop.table(df$table(Sexe))*100
Error in prop.table(df$table(Sexe)) : attempt to apply non-function
> prop.table(table(df$Sexe))*100
Femme Homme
62 38
> table(df$Abo)
0 1
91 109
> length(df$Abo)
[1] 200
> prop.table(table(df$Sexe))*100
Femme Homme
62 38
> prop.table(table(df$Abo))*100
0 1
45.5 54.5
> table(df$Sitfam)
1 2 3
101 72 27
> length(df$Sitfam)
[1] 200
> prop.table(table(df$Sitfam))*100
1 2 3
50.5 36.0 13.5
> table(df$Soc)
Cadre Employe Ouvrier

32 88 80
> length(df$Soc)
[1] 200
> prop.table(table(df$Soc))*100
Cadre Employe Ouvrier

16 44 40
> table(df$Zau)
1 2 3 4 5 7
31 97 3 21 24 24
> prop.table(table(df$Zau))*100
1 2 3 4 5 7
15.5 48.5 1.5 10.5 12.0 12.0
> addmargins(table(df$Sexe,Abo))
Error in table(df$Sexe, Abo) : object 'Abo' not found
> addmargins(df$table(Sexe,Abo))
Error in addmargins(df$table(Sexe, Abo)) : attempt to apply non-function
> addmargins(table(df$Sexe,df$Abo))
0 1 Sum
Femme 67 57 124
Homme 24 52 76
Sum 91 109 200
> Tab<-table(df$Sexe,df$Abo)
> addmargins(prop.table(addmargins(Tab, 1),1),2)*100
0 1 Sum
Femme 54.03226 45.96774 100.00000
Homme 31.57895 68.42105 100.00000
Sum 45.50000 54.50000 100.00000
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> cor.test(genre,Abo)
Error in cor.test(genre, Abo) : object 'genre' not found
> cor.test(df$genre,Abo)
Error in cor.test.default(df$genre, Abo) : object 'Abo' not found
> genre<-ifelse(df$Sexe=="Homme",1,0)
Pearson's product-moment correlation
data: genre and df$Abo

t = 3.1561, df = 198, p-value = 0.001848
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.08262675 0.34706143
sample estimates:
cor
0.2188588
> Pabon<-ifelse(df$Abo=="0",1,0)
> Femur<-ifelse(df$Sexe="Femme" & urbain="1",1,0)
Error: unexpected '=' in "Femur<-ifelse(df$Sexe="
> Femru<-ifelse(df$Sexe="Femme" & urbain="0",1,0)
Error: unexpected '=' in "Femru<-ifelse(df$Sexe="
> Femur<-ifelse(df$Sexe=="Femme" & urbain=="1",1,0)
Error in ifelse(df$Sexe == "Femme" & urbain == "1", 1, 0) :
object 'urbain' not found
> Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
> Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
> Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
> Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
> Saldiv<-df$Sal/1000
> Saldivv<-(df$Sal^2)/100000
> logsal<-log(df$Sal)
> Age2<-df$Age^2
> logage<-log(df$Age)
> table(df$Abo +Pabon)
1
200
> table(Ffem +Hhom)
1
200
>
>
> table(Marie + Celibat + Divoc)
1
200
> table(Cad + Emplo + Ouv)
0 1
88 112
> cbind(df$Zau + Urbain)
[,1]
[1,] 4
[2,] 4
[3,] 4
[4,] 4
[5,] 4
[6,] 4
[7,] 4
[8,] 4
[9,] 4
[10,] 4
[11,] 4
[12,] 4
[13,] 4
[14,] 2
[15,] 2
[16,] 2
[17,] 1
[18,] 1
[19,] 1
[20,] 1
[21,] 1
[22,] 1
[23,] 1
[24,] 1
[25,] 2
[26,] 2
[27,] 2
[28,] 2
[29,] 2
[30,] 2
[31,] 2
[32,] 2
[33,] 2
[34,] 2
[35,] 2
[36,] 2
[37,] 2
[38,] 2
[39,] 2
[40,] 2
[41,] 2
[42,] 2
[43,] 2
[44,] 2
[45,] 2
[46,] 2
[47,] 2
[48,] 5
[49,] 5
[50,] 5
[51,] 5
[52,] 2
[53,] 2
[54,] 2
[55,] 2
[56,] 2
[57,] 2
[58,] 2
[59,] 2
[60,] 2
[61,] 2
[62,] 2
[63,] 2
[64,] 2
[65,] 2
[66,] 2
[67,] 2
[68,] 2
[69,] 2
[70,] 2
[71,] 2
[72,] 2
[73,] 2
[74,] 2
[75,] 2
[76,] 2
[77,] 2
[78,] 2
[79,] 5
[80,] 5
[81,] 5
[82,] 5
[83,] 5
[84,] 5
[85,] 5
[86,] 5
[87,] 7
[88,] 1
[89,] 1
[90,] 1
[91,] 7
[92,] 7
[93,] 7
[94,] 7
[95,] 7
[96,] 2
[97,] 1
[98,] 1
[99,] 2
[100,] 2
[101,] 1
[102,] 1
[103,] 2
[104,] 1
[105,] 2
[106,] 2
[107,] 5
[108,] 1
[109,] 5
[110,] 5
[111,] 5
[112,] 1
[113,] 5
[114,] 5
[115,] 7
[116,] 7
[117,] 7
[118,] 7
[119,] 7
[120,] 7
[121,] 7
[122,] 7
[123,] 7
[124,] 7
[125,] 7
[126,] 7
[127,] 7
[128,] 1
[129,] 1
[130,] 1
[131,] 5
[132,] 5
[133,] 1
[134,] 1
[135,] 1
[136,] 1
[137,] 5
[138,] 5
[139,] 5
[140,] 4
[141,] 4
[142,] 1
[143,] 4
[144,] 4
[145,] 4
[146,] 4
[147,] 4
[148,] 7
[149,] 5
[150,] 2
[151,] 2
[152,] 2
[153,] 2
[154,] 2
[155,] 2
[156,] 2
[157,] 2
[158,] 7
[159,] 1
[160,] 7
[161,] 1
[162,] 7
[163,] 7
[164,] 4
[165,] 1
[166,] 1
[167,] 4
[168,] 4
[169,] 4
[170,] 2
[171,] 2
[172,] 2
[173,] 2
[174,] 2
[175,] 2
[176,] 2
[177,] 2
[178,] 1
[179,] 2
[180,] 2
[181,] 2
[182,] 2
[183,] 2
[184,] 2
[185,] 2
[186,] 2
[187,] 2
[188,] 2
[189,] 2
[190,] 2
[191,] 2
[192,] 2
[193,] 2
[194,] 2
[195,] 2
[196,] 2
[197,] 2
[198,] 2
[199,] 2
[200,] 2
> cbind(df$Zau, Urbain)
Urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0
[11,] 4 0
[12,] 4 0
[13,] 4 0
[14,] 2 0
[15,] 2 0
[16,] 2 0
[17,] 1 0
[18,] 1 0
[19,] 1 0
[20,] 1 0
[21,] 1 0
[22,] 1 0
[23,] 1 0
[24,] 1 0
[25,] 2 0
[26,] 2 0
[27,] 2 0
[28,] 2 0
[29,] 2 0
[30,] 2 0
[31,] 2 0
[32,] 2 0
[33,] 2 0
[34,] 2 0
[35,] 2 0
[36,] 2 0
[37,] 2 0
[38,] 2 0
[39,] 2 0
[40,] 2 0
[41,] 2 0
[42,] 2 0
[43,] 2 0
[44,] 2 0
[45,] 2 0
[46,] 2 0
[47,] 2 0
[48,] 5 0
[49,] 5 0
[50,] 5 0
[51,] 5 0
[52,] 2 0
[53,] 2 0
[54,] 2 0
[55,] 2 0
[56,] 2 0
[57,] 2 0
[58,] 2 0
[59,] 2 0
[60,] 2 0
[61,] 2 0
[62,] 2 0
[63,] 2 0
[64,] 2 0
[65,] 2 0
[66,] 2 0
[67,] 2 0
[68,] 2 0
[69,] 2 0
[70,] 2 0
[71,] 2 0
[72,] 2 0
[73,] 2 0
[74,] 2 0
[75,] 2 0
[76,] 2 0
[77,] 2 0
[78,] 2 0
[79,] 5 0
[80,] 5 0
[81,] 5 0
[82,] 5 0
[83,] 5 0
[84,] 5 0
[85,] 5 0
[86,] 5 0
[87,] 7 0
[88,] 1 0
[89,] 1 0
[90,] 1 0
[91,] 7 0
[92,] 7 0
[93,] 7 0
[94,] 7 0
[95,] 7 0
[96,] 2 0
[97,] 1 0
[98,] 1 0
[99,] 2 0
[100,] 2 0
[101,] 1 0
[102,] 1 0
[103,] 2 0
[104,] 1 0
[105,] 2 0
[106,] 2 0
[107,] 5 0
[108,] 1 0
[109,] 5 0
[110,] 5 0
[111,] 5 0
[112,] 1 0
[113,] 5 0
[114,] 5 0
[115,] 7 0
[116,] 7 0
[117,] 7 0
[118,] 7 0
[119,] 7 0
[120,] 7 0
[121,] 7 0
[122,] 7 0
[123,] 7 0
[124,] 7 0
[125,] 7 0
[126,] 7 0
[127,] 7 0
[128,] 1 0
[129,] 1 0
[130,] 1 0
[131,] 5 0
[132,] 5 0
[133,] 1 0
[134,] 1 0
[135,] 1 0
[136,] 1 0
[137,] 5 0
[138,] 5 0
[139,] 5 0
[140,] 4 0
[141,] 4 0
[142,] 1 0
[143,] 4 0
[144,] 4 0
[145,] 4 0
[146,] 4 0
[147,] 4 0
[148,] 7 0
[149,] 5 0
[150,] 2 0
[151,] 2 0
[152,] 2 0
[153,] 2 0
[154,] 2 0
[155,] 2 0
[156,] 2 0
[157,] 2 0
[158,] 7 0
[159,] 1 0
[160,] 7 0
[161,] 1 0
[162,] 7 0
[163,] 7 0
[164,] 4 0
[165,] 1 0
[166,] 1 0
[167,] 4 0
[168,] 4 0
[169,] 4 0
[170,] 2 0
[171,] 2 0
[172,] 2 0
[173,] 2 0
[174,] 2 0
[175,] 2 0
[176,] 2 0
[177,] 2 0
[178,] 1 0
[179,] 2 0
[180,] 2 0
[181,] 2 0
[182,] 2 0
[183,] 2 0
[184,] 2 0
[185,] 2 0
[186,] 2 0
[187,] 2 0
[188,] 2 0
[189,] 2 0
[190,] 2 0
[191,] 2 0
[192,] 2 0
[193,] 2 0
[194,] 2 0
[195,] 2 0
[196,] 2 0
[197,] 2 0
[198,] 2 0
[199,] 2 0
[200,] 2 0
> table((Femur + Femru) - Ffem )
0
200
> table(Saldiv*1000 - df$Sal)
-9.09494701772928e-13 0 1.81898940354586e-12
1 197 2
> table(sqrt(Saldivv*100000)- df$Sal)
-3.63797880709171e-12 -1.81898940354586e-12 0
1 7 184
9.09494701772928e-13 1.81898940354586e-12 3.63797880709171e-12
1 4 3
> table(sqrt(Age2) - df$Age)
0
200
> table(exp(logage) - df$Age)
-1.4210854715202e-14 -7.105427357601e-15 -3.5527136788005e-15

0
4 83 7
57
3.5527136788005e-15 7.105427357601e-15 1.4210854715202e-14 2.13162820
72803e-14
5 32 8
4
> LogitAbocst<-glm(df$Abo ~ 1, family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1, family = binomial(link = "logit"))
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> summary(LogitAbocst)
Call:
glm(formula = df$Abo ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
-1.255 -1.255 1.102 1.102 1.102
Coefficients:
(Intercept) 0.1805 0.1420 1.271 0.204

AIC: 277.64
> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
BetaAboCst"
BetaAboCst"
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst/ (1+exp(BetaAboCst))
"Pl<-exp(BetaAboCst/ (1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst / (1+exp(BetaAboCst))
"Pl<-exp(BetaAboCst / (1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst) / (1+exp(BetaAboCst))
> Pl
(Intercept)
0.545
> LogitAbocst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
> summary(LogitAbocst)
Call:
Deviance Residuals:
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
(Intercept) -0.1805 0.1420 -1.271 0.204

AIC: 277.64
> LogitAbocst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))

> summary(LogitPaboncst)
Error in summary(LogitPaboncst) : object 'LogitPaboncst' not found
> LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
Call:
Deviance Residuals:
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
(Intercept) -0.1805 0.1420 -1.271 0.204

AIC: 277.64
> LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))

Call:
Deviance Residuals:
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
(Intercept) -0.1805 0.1420 -1.271 0.204

AIC: 277.64
> Po
Error: object 'Po' not found
> BetaPabonCst<-coef(LogitPaboncst)
> P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
> P0
(Intercept)
0.455
> LogitSexecst<-glm(Abon ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Abon' not found
> LogitSexecst<-glm(Abo ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Abo' not found
> LogitSexecst<-glm(sdf$Abo ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'sdf' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> summary(LogitSexe)
Error in summary(LogitSexe) : object 'LogitSexe' not found
> Summary(Logitdf$Sexe)
Error in Summary(Logitdf$Sexe) : object 'Logitdf' not found
> Summary(LogitSexe)
Error in Summary(LogitSexe) : object 'LogitSexe' not found
> LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(LogitSexe)
> LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
Call:
Deviance Residuals:
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 269.89
> BetaSexe<-coef(LogitSexe)
> PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]
))
> PFfem
(Intercept)
0.4596774
> BetaSexe<-coef(LogitSexe)
> PHhom<-exp(BetaSexe[1]) / (1+exp(BetaSexe[1]))
> PHhom
(Intercept)
0.6842105
> OddH<-PHhom/ (1-PHhom)
> OddH
(Intercept)
2.166667
> OddF<-PFfem/ (1-PFfem)
> OddF
(Intercept)
0.8507463
> Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Empl + Ouv + Ur
bain + df$Age + df$Sal, family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Empl' not found
> Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U
rbain + df$Age + df$Sal, family = binomial(link = "logit"))
> summary(Logitmodell)
Call:
Ouv + Urbain + df$Age + df$Sal, family = binomial(link = "logit"))
Deviance Residuals:
-2.3337 -0.8127 0.3788 0.7920 1.6387

(Intercept) -3.363e+00 1.164e+00 -2.890 0.003847 **
Ffem -1.172e+00 3.847e-01 -3.046 0.002321 **
Marie 1.243e+00 4.949e-01 2.512 0.012007 *
Celibat -4.332e-01 5.318e-01 -0.814 0.415359
Cad 2.275e+00 6.167e-01 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 5.775e-01 4.005e-01 1.442 0.149283
Urbain -1.537e+00 1.380e+00 -1.114 0.265279
df$Age 8.596e-02 2.216e-02 3.878 0.000105 ***
df$Sal -1.764e-05 2.758e-05 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 226.18
> Logitmodel2<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U

rbain + df$Age + Saldiv, family = binomial(link = "logit"))
> summary(Logitmodel2)
Call:
Ouv + Urbain + df$Age + Saldiv, family = binomial(link = "logit"))
Deviance Residuals:
-2.3337 -0.8127 0.3788 0.7920 1.6387

(Intercept) -3.36315 1.16353 -2.890 0.003847 **
Ffem -1.17159 0.38466 -3.046 0.002321 **
Marie 1.24318 0.49491 2.512 0.012007 *
Celibat -0.43318 0.53183 -0.814 0.415359
Cad 2.27509 0.61667 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 0.57748 0.40045 1.442 0.149283
Urbain -1.53701 1.37972 -1.114 0.265279
df$Age 0.08596 0.02216 3.878 0.000105 ***
Saldiv -0.01764 0.02758 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 226.18

rbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"
))
> summary(Logitmodel3)
Call:
Ouv + Urbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(lin
k = "logit"))
Deviance Residuals:
-2.2813 -0.7946 0.1125 0.8222 1.8968

(Intercept) 15.2244715 6.3751035 2.388 0.016935 *
Ffem -1.0466956 0.4074845 -2.569 0.010209 *
Marie 0.9572624 0.5190814 1.844 0.065162 .
Celibat -0.7115023 0.5843278 -1.218 0.223360
Cad 2.2867560 0.6388771 3.579 0.000344 ***
Emplo NA NA NA NA
Ouv 0.7428700 0.4257637 1.745 0.081021 .
Urbain -1.1709368 1.3763118 -0.851 0.394892
df$Age -0.8946082 0.3133601 -2.855 0.004305 **
Age2 0.0118777 0.0038422 3.091 0.001992 **
Saldiv 0.0894349 0.1346012 0.664 0.506407
Saldivv -0.0002438 0.0003092 -0.789 0.430357
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 216.09

rbain + logage + logsal, family = binomial(link = "logit"))
Call:
Deviance Residuals:
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

AIC: 269.89

Missael Devoir Econo Va Q

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Missael Devoir Econo Va Q

Transféré par

Droits d'auteur :

Formats disponibles

Centre de Technique de Planification et d’Économie Appliquée

Devoir d’Économétrie variable qualitative

Préparé par : Missael J.L SYLVAIN

Professeur : Septimus PIERRE

Un analyste décide de traiter la variable "secteur d'activité" comme une explicative

Moyenne des Revenu

Autres 1224 17.46 0.85

Trouvons alors la valeur estimée des paramètres de l’équation de régression

-0.000817 0.0025352 0.000817 0.000817

-0.000817 0.000817 0.00382 0.000817

-0.000817 0.000817 0.000817 0.0016754

Le modèle s’écrit : Y= 1 si QVOD > 1 sinon 0 ou Y= 1 si Y* > 0 sinon 0 avec =

ℒ(𝛽) = ∏[1 − Λ(𝑋𝑖 𝛽)]1−𝑌𝑖 [(Λ(𝑋𝑖 𝛽)]𝑌𝑖

- Calculons la probabilité que le ménage décrit à la question 1.5 achète plus de 1

P (Yi=1/Xi)= E (Yi/Xi)=Λ(Xi𝛽̂ ) (*)

Xi𝛽̂ = -0.1721 + 5.9389REVENUE – 4.7353PVOD

Xi𝛽̂ = -0.1721 + 5.9389× 47.62 – 4.7353× 0.44118 alors Xi𝛽̂ = 280.5492

𝜕(0.2461 + 0.5009REVENUE − 0.1289PVOD)

Pour le modèle logit, l’effet marginal associe à la variable revenue se calcule de la

EM= 𝛽̂𝑗 × f(Xi𝛽̂ ) avec f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) (**)

f(Xi𝛽̂ ) = λ(280.5492)= 1.4422× 10-122

L'objectif de cette étude est d'étudier l'impact des variables socioéconomiques

Le modèle estime peut s’écrire de la forme suivante :

A partir des données du tableau, l’équation de régression estimée par le modèle

Xi𝛽̂ = - 12.04714 – 1.806437PORTABLEi + 1.158715REVENUEi –

Xi𝛽̂ = - 12.04714 – 1.806437× 0 + 1.158715 × 10 – 0.064585 × 3 + 0.001099 × 1360

EM= 𝛽̂𝑗 × f(Xi𝛽̂ ) (***) avec f(Xi𝛽̂ ) =λ(Xi𝛽̂ )

Xi𝛽̂ = - 12.04714 – 1.806437× 0.3942 + 1.158715× 9.3176 - 0.064585× 3.1752 +

1)- Statistiques descriptives sur la base de données

Pour la variable salaire on a :

La moyenne:18615 ; Ecart-type:7082.49 ; Minimum:3678 Maximum:35972

1.2)- Calculer la moyenne, l’écart-type, le minimum et le maximum pour les variables

La moyenne: 44.39 ; Ecart-type: 9.628294 ; Minimum: 18.00 Maximum: 59.00

La moyenne: 3.055 ; Ecart-type: 1.928515 ; Minimum: 1.000 Maximum: 7.000

La moyenne: 3.009 ; Ecart-type: 1.892947 ; Minimum: 1.000 Maximum: 7.000

La moyenne:17654 ; Ecart-type:7150.625 ; Minimum: 3678 Maximum: 35374

La moyenne: 19418 ; Ecart-type: 6956.164 ; Minimum: 6296 Maximum: 35972

Lenght (sexe) : 200

Proportion de situation familiale

Cadre : 32 Employe : 88 Ouvrier : 80

Proportion de situation familiale : Cadre : 16 ; Employe : 44 ; Ouvrier : 40

Tableau croise entre sexe et abonnee

Tableau croise de proportion entre sexe et abonné

Pearson's product-moment corrélation

Data: genre and Abo

t = 3.1561, df = 198, p-value = 0.001848

alternative hypothesis: true correlation is not equal to 0

On rejette l’hyppothese ou la corrélation entre la variable sexe et abonnee est nulle.

2.1)- Compléter la base de données initiale par les variables suivantes :

Tableau des abonnes et ceux qui ne désire pas d’abonner

Tableau des variables dichotomiques associées à la variable caractérisant la

Tableau des variables dichotomiques associées à la variable caractérisant la CSP,

Tableau >table ((Femur + Femru) - Ffem)

Tableau > table (Saldiv*1000 - df$Sal)

Tableau >table (sqrt (Saldivv*100000)- df$Sal)

Tableau >table (sqrt(Age2) - df$Age)

Tableau > table(exp(logage) - df$Age)

-1.42e-14 -7.10e-15 -3.55e-15 0

3.1)- Estimation sans variable explicative (avec la constante seulement.

1- Sur la variable caractérisant l’abonnement (variable d’origine)

Précisons les hypothèses retenues.

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom