Académique Documents
Professionnel Documents
Culture Documents
(CTPEA)
Septembre 2020
PREMIERE PARTIE : Tarification non linéaire
Exercice 1 : On s'intéresse à la distribution des revenus salariaux dans la
population, en fonction des secteurs d'activité. Les travailleurs sont répartis en ces 4
secteurs : Industrie, Services, Transport et autres.
1)- Calcul des moyennes des revenus par secteur à partir de cette estimation.
Comparer avec les données fournies. Que constatez-vous ?
Puisque nous avons la variable « Secteur d’activité » notée SECTi comme une
variable multinomiale, alors chaque modalité associée à cette variable deviendra
comme une variable indicatrice. De plus, on retirera une indicatrice associée
(Autres) pour éviter des problèmes de multi colinéarité. Donc on peut écrire
l’équation de la régression ainsi :
REVENUEi= = 𝛽0+ 𝛽1SERVi + 𝛽2TRANSPi + 𝛽3 INDUSi + 𝜀𝑖 , i=1,2...N
Avec SERVi = 1 si Services sinon 0 ; TRANSPi= 1 si Transport sinon 0 ;
INDUSi= 1 si Industrie sinon 0
Exercice 2 :
Le ministère de la santé Russe s'intéresse à la consommation de boissons
alcoolisées et au moyen de la réduire par une politique de taxation. Les données
suivantes sont tirées d'un échantillon de 1078 familles russes enquêtées en 1993 :
• QVOD : quantité de vodka consommée par personne et par jour, en litres ;
• REVENU : revenu mensuel du ménage ramené au nombre de personnes adultes
du ménage, en 105 roubles ;
• PVOD : prix du litre de vodka au détail, en 102 roubles.
P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où : P(Yi=1/xi)=0.2461+0.5009 × 0.0326 – 0.1289 × 0.3727 alors P (yi=1/xi) =
0.2144
Calcul de la probabilité prédite associe à Y la plus faible
P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où P (Yi=1/Xi)= 0.2461+0.5009 × 0.0001 – 0.1289 × 0.12 alors P (Yi=1/Xi)=
0.2307
Calcul de la probabilité prédite associe à Y la plus forte
P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où P (Yi=1/Xi)= 0.2461+0.5009 × 0.2886 – 0.1289 × 5.4 alors P (Yi=1/Xi)= -
0.3064
Calcul de la probabilité qu'un ménage de 2 adultes avec un REVENU total égal à 10
000 roubles achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre.
(Indication : attention aux unités de mesure.)
REVENU= 10000/ (2× 105) = 47.62
PVOD= 45/102 = 0.44118
P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où P (Yi=1/Xi)= 0.2461+ 0.5009 × 47.62– 0.1289 × 0.44118 = 24.042
La probabilité qu’Y = 1 est estimé par un modèle Logit, dont le modèle s’écrit:
Le modèle s’écrit : Y= 1 si QVOD > 1 sinon 0 ou Y= 1 si Y* > 0 sinon 0 avec =
QVOD -1
Le modèle estimé
L’équation de régression estimée est donnée par :
𝑌 ∗ = -0.1721 + 5.9389REVENUE – 4.7353PVOD
On peut écrire la fonction de vraisemblance ainsi:
𝑁
1 exp(𝑋 𝛽)
ℒ(𝛽)= ∏𝑁
𝑖=1[1+exp(𝑋 𝛽)]
1−𝑌𝑖
[1+exp(𝑋𝑖 𝛽)]𝑌𝑖
𝑖 𝑖
ℒ(𝛽)=
1 exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸 −4.7353𝑃𝑉𝑂𝐷 ))
∏1078
𝑖=1 [ ]1−𝑌𝑖 [1+exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸𝑖 −4.7353𝑃𝑉𝑂𝐷𝑖 ))]𝑌𝑖
1+exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸 −4.7353𝑃𝑉𝑂𝐷 )
𝑖 𝑖 𝑖 𝑖
Trouvons Xi𝛽̂
Calculons l'effet marginal associé à la variable revenu pour un ménage vérifiant les
caractéristiques définies en 1.5 ou 2.2.
Pour le modèle a probabilité linéaire, l’effet marginal associe à la variable revenu se
calcule de la manière suivante :
𝜕𝑌̂ ∗
EM=𝜕𝑋𝑖 = 𝛽̂𝑗
𝑗𝑖
Trouvons f(Xi𝛽̂ )
exp(𝑧)
f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) = (1+exp(𝑍))2
P (Yi=1\Xi)=E(Yi\Xi)= Λ(Xi𝛽̂ )
Trouvons Xi𝛽̂
Xi𝛽̂ = 0.34684
D’où P (Yi=1/Xi)= Λ(0.34684) alors P (Yi=1/Xi) = 0.58585
Pour un ménage de 3 personnes en maison individuelle possédant un revenu 10, de
taille d’habitation 1360 et ne possédant pas de climatiseur portable, la probabilité
d’installer une climatisation est de 58.585%
Calculons l'effet marginal associé à la variable REVENU, au point moyen de
l'échantillon, à partir de l'estimation logit. Nous Utiliseront pour cela les moyennes
des variables explicatives dans le tableau de statistiques descriptives
Trouvons Xi𝛽̂
Xi𝛽̂ = -1.0831
Alors (I) devient:
f(Xi𝛽̂ )= λ(−1.0831) = 0.18895
D’où (***) devient ;
EM= 1.158715 × 0.18895 alors EM= 0.21893
On peut dire que la différence de probabilité pour un ménage d’installer une
climatisation et de ne pas installer une climatisation est de 21.893%
Pour l’individu moyen, on peut dire que la probabilité d’installer une climatisation va
augmenter de 21.893 point de % suite à une augmentation du revenu moyen d’une
unité (passe de 9,3176 à 10,3176)
-Calcul de l'effet marginal associé à la variable PORTABLE, au point moyen de
l'échantillon.
EM=𝑃(𝐶𝐸𝑁𝑇𝑅𝐴𝐿 = 1\PORTABLE = 1, REVENU=c NBFOYER=d, TAILLE=e,
MAISON=f)- 𝑃(𝐶𝐸𝑁𝑇𝑅𝐴𝐿 = 0\PORTABLE = 1, REVENU=c NBFOYER=d,
TAILLE=e, MAISON=f), c, d, e, f etant fixee
EM= Λ( - 12.04714 – 1.806437× 1 + 1.158715× 9.3176 - 0.064585× 3.1752 +
0.001099× 1367.6788 - 0.494055 × 0.8467) - Λ( - 12.04714 – 1.806437× 0 +
1.158715× 9.3176 - 0.064585× 3.1752 + 0.001099× 1367.6788 - 0.494055 ×
0.8467)
EM= Λ(-2.17744178)- Λ(1.449189994)
EM = 0.10179- 0.40829
EM= -0.3065
DEUXIEME PARTIE
N.B. On a utilisé le logiciel R pour effectuer les calculs de la 2 eme partie. Les codes
sont en annexe.
Quand Abo=1
Pour Zau
Quand Abo=0
Quand Abo=1
Pour Sal
Quand Abo=0
Quand Abo=1
Pour Abo
0 1
91 109
Length(Abo) : 200
Proportion d’abonnée
0 1
45.5 54.5
Pour Sitfam
1 2 3
101 72 27
Length(Sitfam) : 200
1 2 3
50.5 36.0 13.5
Pour Soc
Length(Soc) : 200
Pour Zau
1 2 3 4 5 7
31 97 3 21 24 24
Length(Zau) : 200
Proportion Zau
1 2 3 4 5 7
15.5 48.5 1.5 10.5 12.0 12.0
1.4)- Faire un tableau croisé (avec un test de corrélation) entre les variables d’abonn
ement et le sexe. En déduire le pourcentage d’hommes et de femmes prêts à s’abon
ner.
0 1 Sum
Femme 67 57 124
Homme 24 52 76
Sum 91 109 200
0 1 Sum
Femme 54.03226 45.96774 100.00000
Homme 31.57895 68.42105 100.00000
Sum 45.50000 54.50000 100.00000
Test de corrélation
Nouvelles variables :
Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
> Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
> Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
> Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
> Saldiv<-df$Sal/1000
> Saldivv<-(df$Sal^2)/100000
> logsal<-log(df$Sal)
> Age2<-df$Age^2
> logage<-log(df$Age)
2.2)- Vérifier, à l’aide de statistiques descriptives que ces variables ont été correctem
ent créées. Ces variables seront utilisées dans les différentes modélisations considé
rées.
1
200
Tableau des variables dichotomiques associées à la variable caractérisant le sexe,
1
200
0 1
88 112
Tableau de la variable prenant la valeur 1 lorsque l’individu vie en zone urbaine
Zau Urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0
0
200
-9.09e-13 0 1.81e-12
1 197 2
-3.63e-12 -1.81e-12 0
1 7 184
9.09e-13 1.81e-12 3.63e-12
1 4 3
0
200
1 𝑠𝑖 𝑦 ∗ > 0
Pabon={ avec y*= c : le seuil de tolerance, c etant une constante
0 𝑠𝑖𝑛𝑜𝑛
Model 1 :
Call:
glm(formula = df$Abo ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.255 -1.255 1.102 1.102 1.102
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1805 0.1420 1.271 0.204
Model 2:
Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204
Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
BetaSexe<-coef(LogitSexe)
> PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]))
> PFfem
(Intercept)
0.4596774
BetaSexe<-coef(LogitSexe)
> PHhom<-exp (BetaSexe [1]) / (1+exp (BetaSexe [1]))
> PHhom
(Intercept)
0.6842105
OddF<-PFfem/ (1-PFfem)
> OddF
(Intercept)
0.8507463
Plusieurs variables
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387
Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Saldiv, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387
3ième cas : à l’âge, l’âge au carré, au salaire divisé par 1000 et au salaire au carré d
ivisé par 10000,
Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2813 -0.7946 0.1125 0.8222 1.8968
Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
ANNEXE
summary(df$Age)
summary(df$Sal)
sd(df$Age)
sd(df$Sal)
summary(df[df[,"Abo"]=="0","Age"])
sd(df[df[,"Abo"]=="0","Age"])
summary(df[df[,"Abo"]=="1","Age"])
sd(df[df[,"Abo"]=="1","Age"])
summary(df[df[,"Abo"]=="0","Zau"])
sd(df[df[,"Abo"]=="0","Zau"])
summary(df[df[,"Abo"]=="1","Zau"])
sd(df[df[,"Abo"]=="1","Zau"])
summary(df[df[,"Abo"]=="0","Sal"])
sd(df[df[,"Abo"]=="0","Sal"])
summary(df[df[,"Abo"]=="1","Sal"])
sd(df[df[,"Abo"]=="1","Sal"])
table(sexe)
table(Sexe)
table(df$Sexe)
length(df$Sexe)
prop.table(table(Sexe)*100
prop.table(table(df$Sexe))*100
table(df$Abo)
length(df$Abo)
prop.table(table(df$Sexe))*100
prop.table(table(df$Abo))*100
table(df$Sitfam)
length(df$Sitfam)
prop.table(table(df$Sitfam))*100
table(df$Soc)
length(df$Soc)
prop.table(table(df$Soc))*100
table(df$Zau)
prop.table(table(df$Zau))*100
addmargins(table(df$Sexe,Abo))
addmargins(table(df$Sexe,df$Abo))
Tab<-table(df$Sexe,df$Abo)
addmargins(prop.table(addmargins(Tab, 1),1),2)*100
genre<-ifelse(df$Sexe=="Homme",1,0)
cor.test(genre,df$Abo)
Pabon<-ifelse(df$Abo=="0",1,0)
Ffem<-ifelse(df$Sexe=="Femme",1,0)
Hhom<-ifelse(df$Sexe=="Homme",1,0)
Marie<-ifelse(df$Sitfam=="1",1,0)
Celibat<-ifelse(df$Sitfam=="2",1,0)
Divoc<-ifelse(df$Sitfam=="3",1,0)
Cad<-ifelse(df$Soc=="Cadre",1,0)
Emplo<-ifelse(df$Soc=="Employer",1,0)
Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
Urbain<-ifelse(df$Zau=="3",1,0)
Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
Saldiv<-df$Sal/1000
Saldivv<-(df$Sal^2)/100000
logsal<-log(df$Sal)
Age2<-df$Age^2
logage<-log(df$Age)
table(df$Abo +Pabon)
table(Ffem +Hhom)
table(Marie + Celibat + Divoc)
table(Cad + Emplo + Ouv)
cbind(df$Zau, Urbain)
table((Femur + Femru) - Ffem )
table(Saldiv*1000 - df$Sal)
table(sqrt(Saldivv*100000)- df$Sal)
table(sqrt(Age2) - df$Age)
table(exp(logage) - df$Age)
LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
summary(LogitAbocst)
BetaAboCst<-coef(LogitAbocst)
Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
Pl
LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
summary(LogitPaboncst)
BetaPabonCst<-coef(LogitPaboncst)
P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
P0
LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
summary(LogitSexe)
BetaSexe<-coef(LogitSexe)
PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]))
PFfem
BetaSexe<-coef(LogitSexe)
PHhom<-exp(BetaSexe[1]) / (1+exp(BetaSexe[1]))
PHhom
OddH<-PHhom/ (1-PHhom)
OddH
OddF<-PFfem/ (1-PFfem)
OddF
Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain +
df$Age + df$Sal, family = binomial(link = "logit"))
summary(Logitmodell)
Logitmodel2<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ df$Age + Saldiv, family = binomial(link = "logit"))
summary(Logitmodel2)
Logitmodel3<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"))
summary(Logitmodel3)
Logitmodel4<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ logage + logsal, family = binomial(link = "logit"))
summary(Logitmodel4)
[1] 7082.492
> summary(df[df[,"abo"]=="0",age"])
+ summary(df[df[,"abo"]=="0",age"])
Error: unexpected string constant in:
"summary(df[df[,"abo"]=="0",age"])
summary(df[df[,""
> summary(df[df[,"abo"]=="0","age"])
Error in `[.data.frame`(df, , "abo") :
colonnes non définies sélectionnées
> summary(df[df[,"abo"]=="0","age"])
Error in `[.data.frame`(df, , "abo") :
colonnes non définies sélectionnées
> summary(df[df[,"Abo"]=="0","Age"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
31.00 34.00 39.00 40.27 46.00 51.00
> sd(df[df[,"Abo"]=="0","Age"])
[1] 6.752886
> summary(df[df[,"Abo"]=="1","Age"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
18.00 38.00 46.00 44.39 52.00 59.00
> sd(df[df[,"Abo"]=="1","Age"])
[1] 9.628294
> summary(df[df[,"Abo"]=="0","Zau"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 2.000 3.055 4.500 7.000
> sd(df[df[,"Abo"]=="0","Zau"])
[1] 1.928515
> summary(df[df[,"Abo"]=="1","Zau"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 2.000 3.009 4.000 7.000
> sd(df[df[,"Abo"]=="1","Zau"])
[1] 1.892947
> summary(df[df[,"Abo"]=="0","Sal"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
3678 12936 16227 17654 21320 35374
> sd(df[df[,"Abo"]=="0","Sal"])
[1] 7150.625
> summary(df[df[,"Abo"]=="1","Sal"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
6296 15528 18190 19418 23030 35972
> sd(df[df[,"Abo"]=="1","Sal"])
[1] 6956.164
> table(sexe)
Error in table(sexe) : object 'sexe' not found
> table(Sexe)
Error in table(Sexe) : object 'Sexe' not found
> table(Sexe)
Error in table(Sexe) : object 'Sexe' not found
> table(df$Sexe)
Femme Homme
124 76
> length(df$Sexe)
[1] 200
> prop.table(df$Sexe)
Error in Summary.factor(c(1L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, :
‘sum’ not meaningful for factors
> prop.table(table(Sexe)*100
+ prop.table(table(Sexe))*100
Error: unexpected symbol in:
"prop.table(table(Sexe)*100
prop.table"
> prop.table(df$table(Sexe))*100
Error in prop.table(df$table(Sexe)) : attempt to apply non-function
> prop.table(table(df$Sexe))*100
Femme Homme
62 38
> table(df$Abo)
0 1
91 109
> length(df$Abo)
[1] 200
> prop.table(table(df$Sexe))*100
Femme Homme
62 38
> prop.table(table(df$Abo))*100
0 1
45.5 54.5
> table(df$Sitfam)
1 2 3
101 72 27
> length(df$Sitfam)
[1] 200
> prop.table(table(df$Sitfam))*100
1 2 3
50.5 36.0 13.5
> table(df$Soc)
1 2 3 4 5 7
31 97 3 21 24 24
> prop.table(table(df$Zau))*100
1 2 3 4 5 7
15.5 48.5 1.5 10.5 12.0 12.0
> addmargins(table(df$Sexe,Abo))
Error in table(df$Sexe, Abo) : object 'Abo' not found
> addmargins(df$table(Sexe,Abo))
Error in addmargins(df$table(Sexe, Abo)) : attempt to apply non-function
> addmargins(table(df$Sexe,df$Abo))
0 1 Sum
Femme 67 57 124
Homme 24 52 76
Sum 91 109 200
> Tab<-table(df$Sexe,df$Abo)
> addmargins(prop.table(addmargins(Tab, 1),1),2)*100
0 1 Sum
Femme 54.03226 45.96774 100.00000
Homme 31.57895 68.42105 100.00000
Sum 45.50000 54.50000 100.00000
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> cor.test(genre,Abo)
Error in cor.test(genre, Abo) : object 'genre' not found
> cor.test(df$genre,Abo)
Error in cor.test.default(df$genre, Abo) : object 'Abo' not found
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> genre<-ifelse(df$Sexe=="Homme",1,0)
> cor.test(genre,df$Abo)
> Pabon<-ifelse(df$Abo=="0",1,0)
> Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe="Femme" & urbain="1",1,0)
Error: unexpected '=' in "Femur<-ifelse(df$Sexe="
> Femru<-ifelse(df$Sexe="Femme" & urbain="0",1,0)
Error: unexpected '=' in "Femru<-ifelse(df$Sexe="
> Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & urbain=="1",1,0)
Error in ifelse(df$Sexe == "Femme" & urbain == "1", 1, 0) :
object 'urbain' not found
> Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
> Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
> Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
> Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
> Saldiv<-df$Sal/1000
> Saldivv<-(df$Sal^2)/100000
> logsal<-log(df$Sal)
> Age2<-df$Age^2
> logage<-log(df$Age)
> table(df$Abo +Pabon)
1
200
> table(Ffem +Hhom)
1
200
>
>
> table(Marie + Celibat + Divoc)
1
200
> table(Cad + Emplo + Ouv)
0 1
88 112
> cbind(df$Zau + Urbain)
[,1]
[1,] 4
[2,] 4
[3,] 4
[4,] 4
[5,] 4
[6,] 4
[7,] 4
[8,] 4
[9,] 4
[10,] 4
[11,] 4
[12,] 4
[13,] 4
[14,] 2
[15,] 2
[16,] 2
[17,] 1
[18,] 1
[19,] 1
[20,] 1
[21,] 1
[22,] 1
[23,] 1
[24,] 1
[25,] 2
[26,] 2
[27,] 2
[28,] 2
[29,] 2
[30,] 2
[31,] 2
[32,] 2
[33,] 2
[34,] 2
[35,] 2
[36,] 2
[37,] 2
[38,] 2
[39,] 2
[40,] 2
[41,] 2
[42,] 2
[43,] 2
[44,] 2
[45,] 2
[46,] 2
[47,] 2
[48,] 5
[49,] 5
[50,] 5
[51,] 5
[52,] 2
[53,] 2
[54,] 2
[55,] 2
[56,] 2
[57,] 2
[58,] 2
[59,] 2
[60,] 2
[61,] 2
[62,] 2
[63,] 2
[64,] 2
[65,] 2
[66,] 2
[67,] 2
[68,] 2
[69,] 2
[70,] 2
[71,] 2
[72,] 2
[73,] 2
[74,] 2
[75,] 2
[76,] 2
[77,] 2
[78,] 2
[79,] 5
[80,] 5
[81,] 5
[82,] 5
[83,] 5
[84,] 5
[85,] 5
[86,] 5
[87,] 7
[88,] 1
[89,] 1
[90,] 1
[91,] 7
[92,] 7
[93,] 7
[94,] 7
[95,] 7
[96,] 2
[97,] 1
[98,] 1
[99,] 2
[100,] 2
[101,] 1
[102,] 1
[103,] 2
[104,] 1
[105,] 2
[106,] 2
[107,] 5
[108,] 1
[109,] 5
[110,] 5
[111,] 5
[112,] 1
[113,] 5
[114,] 5
[115,] 7
[116,] 7
[117,] 7
[118,] 7
[119,] 7
[120,] 7
[121,] 7
[122,] 7
[123,] 7
[124,] 7
[125,] 7
[126,] 7
[127,] 7
[128,] 1
[129,] 1
[130,] 1
[131,] 5
[132,] 5
[133,] 1
[134,] 1
[135,] 1
[136,] 1
[137,] 5
[138,] 5
[139,] 5
[140,] 4
[141,] 4
[142,] 1
[143,] 4
[144,] 4
[145,] 4
[146,] 4
[147,] 4
[148,] 7
[149,] 5
[150,] 2
[151,] 2
[152,] 2
[153,] 2
[154,] 2
[155,] 2
[156,] 2
[157,] 2
[158,] 7
[159,] 1
[160,] 7
[161,] 1
[162,] 7
[163,] 7
[164,] 4
[165,] 1
[166,] 1
[167,] 4
[168,] 4
[169,] 4
[170,] 2
[171,] 2
[172,] 2
[173,] 2
[174,] 2
[175,] 2
[176,] 2
[177,] 2
[178,] 1
[179,] 2
[180,] 2
[181,] 2
[182,] 2
[183,] 2
[184,] 2
[185,] 2
[186,] 2
[187,] 2
[188,] 2
[189,] 2
[190,] 2
[191,] 2
[192,] 2
[193,] 2
[194,] 2
[195,] 2
[196,] 2
[197,] 2
[198,] 2
[199,] 2
[200,] 2
> cbind(df$Zau, Urbain)
Urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0
[11,] 4 0
[12,] 4 0
[13,] 4 0
[14,] 2 0
[15,] 2 0
[16,] 2 0
[17,] 1 0
[18,] 1 0
[19,] 1 0
[20,] 1 0
[21,] 1 0
[22,] 1 0
[23,] 1 0
[24,] 1 0
[25,] 2 0
[26,] 2 0
[27,] 2 0
[28,] 2 0
[29,] 2 0
[30,] 2 0
[31,] 2 0
[32,] 2 0
[33,] 2 0
[34,] 2 0
[35,] 2 0
[36,] 2 0
[37,] 2 0
[38,] 2 0
[39,] 2 0
[40,] 2 0
[41,] 2 0
[42,] 2 0
[43,] 2 0
[44,] 2 0
[45,] 2 0
[46,] 2 0
[47,] 2 0
[48,] 5 0
[49,] 5 0
[50,] 5 0
[51,] 5 0
[52,] 2 0
[53,] 2 0
[54,] 2 0
[55,] 2 0
[56,] 2 0
[57,] 2 0
[58,] 2 0
[59,] 2 0
[60,] 2 0
[61,] 2 0
[62,] 2 0
[63,] 2 0
[64,] 2 0
[65,] 2 0
[66,] 2 0
[67,] 2 0
[68,] 2 0
[69,] 2 0
[70,] 2 0
[71,] 2 0
[72,] 2 0
[73,] 2 0
[74,] 2 0
[75,] 2 0
[76,] 2 0
[77,] 2 0
[78,] 2 0
[79,] 5 0
[80,] 5 0
[81,] 5 0
[82,] 5 0
[83,] 5 0
[84,] 5 0
[85,] 5 0
[86,] 5 0
[87,] 7 0
[88,] 1 0
[89,] 1 0
[90,] 1 0
[91,] 7 0
[92,] 7 0
[93,] 7 0
[94,] 7 0
[95,] 7 0
[96,] 2 0
[97,] 1 0
[98,] 1 0
[99,] 2 0
[100,] 2 0
[101,] 1 0
[102,] 1 0
[103,] 2 0
[104,] 1 0
[105,] 2 0
[106,] 2 0
[107,] 5 0
[108,] 1 0
[109,] 5 0
[110,] 5 0
[111,] 5 0
[112,] 1 0
[113,] 5 0
[114,] 5 0
[115,] 7 0
[116,] 7 0
[117,] 7 0
[118,] 7 0
[119,] 7 0
[120,] 7 0
[121,] 7 0
[122,] 7 0
[123,] 7 0
[124,] 7 0
[125,] 7 0
[126,] 7 0
[127,] 7 0
[128,] 1 0
[129,] 1 0
[130,] 1 0
[131,] 5 0
[132,] 5 0
[133,] 1 0
[134,] 1 0
[135,] 1 0
[136,] 1 0
[137,] 5 0
[138,] 5 0
[139,] 5 0
[140,] 4 0
[141,] 4 0
[142,] 1 0
[143,] 4 0
[144,] 4 0
[145,] 4 0
[146,] 4 0
[147,] 4 0
[148,] 7 0
[149,] 5 0
[150,] 2 0
[151,] 2 0
[152,] 2 0
[153,] 2 0
[154,] 2 0
[155,] 2 0
[156,] 2 0
[157,] 2 0
[158,] 7 0
[159,] 1 0
[160,] 7 0
[161,] 1 0
[162,] 7 0
[163,] 7 0
[164,] 4 0
[165,] 1 0
[166,] 1 0
[167,] 4 0
[168,] 4 0
[169,] 4 0
[170,] 2 0
[171,] 2 0
[172,] 2 0
[173,] 2 0
[174,] 2 0
[175,] 2 0
[176,] 2 0
[177,] 2 0
[178,] 1 0
[179,] 2 0
[180,] 2 0
[181,] 2 0
[182,] 2 0
[183,] 2 0
[184,] 2 0
[185,] 2 0
[186,] 2 0
[187,] 2 0
[188,] 2 0
[189,] 2 0
[190,] 2 0
[191,] 2 0
[192,] 2 0
[193,] 2 0
[194,] 2 0
[195,] 2 0
[196,] 2 0
[197,] 2 0
[198,] 2 0
[199,] 2 0
[200,] 2 0
> table((Femur + Femru) - Ffem )
0
200
> table(Saldiv*1000 - df$Sal)
-9.09494701772928e-13 0 1.81898940354586e-12
1 197 2
> table(sqrt(Saldivv*100000)- df$Sal)
-3.63797880709171e-12 -1.81898940354586e-12 0
1 7 184
9.09494701772928e-13 1.81898940354586e-12 3.63797880709171e-12
1 4 3
> table(sqrt(Age2) - df$Age)
0
200
> table(exp(logage) - df$Age)
Call:
glm(formula = df$Abo ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.255 -1.255 1.102 1.102 1.102
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1805 0.1420 1.271 0.204
> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst/ (1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/ (1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst / (1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst / (1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst) / (1+exp(BetaAboCst))
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> Pl
(Intercept)
0.545
> LogitAbocst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
> summary(LogitAbocst)
Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204
Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204
Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204
> Po
Error: object 'Po' not found
> BetaPabonCst<-coef(LogitPaboncst)
> P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
> P0
(Intercept)
0.455
> LogitSexecst<-glm(Abon ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Abon' not found
> LogitSexecst<-glm(Abo ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Abo' not found
> LogitSexecst<-glm(sdf$Abo ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'sdf' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> summary(LogitSexe)
Error in summary(LogitSexe) : object 'LogitSexe' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(Logitdf$Sexe)
Error in Summary(Logitdf$Sexe) : object 'Logitdf' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(LogitSexe)
Error in Summary(LogitSexe) : object 'LogitSexe' not found
> LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(LogitSexe)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> summary(LogitSexe)
Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> BetaSexe<-coef(LogitSexe)
> PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]
))
> PFfem
(Intercept)
0.4596774
> BetaSexe<-coef(LogitSexe)
> PHhom<-exp(BetaSexe[1]) / (1+exp(BetaSexe[1]))
> PHhom
(Intercept)
0.6842105
> OddH<-PHhom/ (1-PHhom)
> OddH
(Intercept)
2.166667
> OddF<-PFfem/ (1-PFfem)
> OddF
(Intercept)
0.8507463
> Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Empl + Ouv + Ur
bain + df$Age + df$Sal, family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Empl' not found
> Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U
rbain + df$Age + df$Sal, family = binomial(link = "logit"))
> summary(Logitmodell)
Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + df$Sal, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387
Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Saldiv, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387
Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(lin
k = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-2.2813 -0.7946 0.1125 0.8222 1.8968
Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))
Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1