Vous êtes sur la page 1sur 38

Centre de Technique de Planification et d’Économie Appliquée

(CTPEA)

Devoir d’Économétrie variable qualitative

Préparé par : Missael J.L SYLVAIN

Professeur : Septimus PIERRE

Septembre 2020
PREMIERE PARTIE : Tarification non linéaire
Exercice 1 : On s'intéresse à la distribution des revenus salariaux dans la
population, en fonction des secteurs d'activité. Les travailleurs sont répartis en ces 4
secteurs : Industrie, Services, Transport et autres.

Un analyste décide de traiter la variable "secteur d'activité" comme une explicative


du revenu :
REVENUEi = 𝛽0+ 𝛽1SECTi +𝜀𝑖 , i=1,2,…N Où la variable de secteur est multinomiale
et codée comme suit :
1 𝑠𝑖 𝑠𝑒𝑟𝑣𝑖𝑐𝑒𝑠
2 𝑠𝑖 𝑡𝑟𝑎𝑛𝑠𝑝𝑜𝑟𝑡
SECTi={
3 𝑠𝑖 𝐼𝑛𝑑𝑢𝑠𝑡𝑟𝑖𝑒
0 𝑠𝑖 𝑎𝑢𝑡𝑟𝑒𝑠
L'équation de régression estimée est : REVENUEi=17.56+1.53SECTi

1)- Calcul des moyennes des revenus par secteur à partir de cette estimation.
Comparer avec les données fournies. Que constatez-vous ?

Moyenne des Revenu


Secteur Effectif Ecart
revenus Chapeau
Industrie 1165 22.65 22.05 0.6
Services 582 16.64 18.99 -2.35
Transport 333 19.51 20.52 -1.01

Autres 1224 17.46 0.85


18.31
Tous
3304 19.67
Secteurs

Puisque nous avons la variable « Secteur d’activité » notée SECTi comme une
variable multinomiale, alors chaque modalité associée à cette variable deviendra
comme une variable indicatrice. De plus, on retirera une indicatrice associée
(Autres) pour éviter des problèmes de multi colinéarité. Donc on peut écrire
l’équation de la régression ainsi :
REVENUEi= = 𝛽0+ 𝛽1SERVi + 𝛽2TRANSPi + 𝛽3 INDUSi + 𝜀𝑖 , i=1,2...N
Avec SERVi = 1 si Services sinon 0 ; TRANSPi= 1 si Transport sinon 0 ;
INDUSi= 1 si Industrie sinon 0

Trouvons alors la valeur estimée des paramètres de l’équation de régression


0.000817 -0.000817 -0.000817 -0.000817

-0.000817 0.0025352 0.000817 0.000817

-0.000817 0.000817 0.00382 0.000817

-0.000817 0.000817 0.000817 0.0016754

Exercice 2 :
Le ministère de la santé Russe s'intéresse à la consommation de boissons
alcoolisées et au moyen de la réduire par une politique de taxation. Les données
suivantes sont tirées d'un échantillon de 1078 familles russes enquêtées en 1993 :
• QVOD : quantité de vodka consommée par personne et par jour, en litres ;
• REVENU : revenu mensuel du ménage ramené au nombre de personnes adultes
du ménage, en 105 roubles ;
• PVOD : prix du litre de vodka au détail, en 102 roubles.

Le modèle s’écrit : Y= 1 si QVOD > 1 sinon 0 ou Y= 1 si Y* > 0 sinon 0 avec =


QVOD -1
Un modèle a probabilité linéaire est estime et l’équation de régression estime est :
𝑌 ∗ = 0.2461 + 0.5009REVENUE - 0.1289PVOD
Calcul de la probabilité prédite associée a Y a la moyenne des régresseurs :

P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où : P(Yi=1/xi)=0.2461+0.5009 × 0.0326 – 0.1289 × 0.3727 alors P (yi=1/xi) =
0.2144
Calcul de la probabilité prédite associe à Y la plus faible

P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où P (Yi=1/Xi)= 0.2461+0.5009 × 0.0001 – 0.1289 × 0.12 alors P (Yi=1/Xi)=
0.2307
Calcul de la probabilité prédite associe à Y la plus forte

P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où P (Yi=1/Xi)= 0.2461+0.5009 × 0.2886 – 0.1289 × 5.4 alors P (Yi=1/Xi)= -
0.3064
Calcul de la probabilité qu'un ménage de 2 adultes avec un REVENU total égal à 10
000 roubles achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre.
(Indication : attention aux unités de mesure.)
REVENU= 10000/ (2× 105) = 47.62
PVOD= 45/102 = 0.44118

P (Yi=1/Xi)= E (Yi/Xi)=Xi𝛽̂
D’où P (Yi=1/Xi)= 0.2461+ 0.5009 × 47.62– 0.1289 × 0.44118 = 24.042
La probabilité qu’Y = 1 est estimé par un modèle Logit, dont le modèle s’écrit:
Le modèle s’écrit : Y= 1 si QVOD > 1 sinon 0 ou Y= 1 si Y* > 0 sinon 0 avec =
QVOD -1
Le modèle estimé
L’équation de régression estimée est donnée par :
𝑌 ∗ = -0.1721 + 5.9389REVENUE – 4.7353PVOD
On peut écrire la fonction de vraisemblance ainsi:
𝑁

ℒ(𝛽) = ∏[1 − Λ(𝑋𝑖 𝛽)]1−𝑌𝑖 [(Λ(𝑋𝑖 𝛽)]𝑌𝑖


𝑖=1

1 exp(𝑋 𝛽)
ℒ(𝛽)= ∏𝑁
𝑖=1[1+exp(𝑋 𝛽)]
1−𝑌𝑖
[1+exp(𝑋𝑖 𝛽)]𝑌𝑖
𝑖 𝑖

ℒ(𝛽)=
1 exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸 −4.7353𝑃𝑉𝑂𝐷 ))
∏1078
𝑖=1 [ ]1−𝑌𝑖 [1+exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸𝑖 −4.7353𝑃𝑉𝑂𝐷𝑖 ))]𝑌𝑖
1+exp(−𝑜.1721+5.9389𝑅𝐸𝑉𝐸𝑁𝑈𝐸 −4.7353𝑃𝑉𝑂𝐷 )
𝑖 𝑖 𝑖 𝑖

- Calculons la probabilité que le ménage décrit à la question 1.5 achète plus de 1


litre de vodka.

P (Yi=1/Xi)= E (Yi/Xi)=Λ(Xi𝛽̂ ) (*)

Trouvons Xi𝛽̂

Xi𝛽̂ = -0.1721 + 5.9389REVENUE – 4.7353PVOD

Xi𝛽̂ = -0.1721 + 5.9389× 47.62 – 4.7353× 0.44118 alors Xi𝛽̂ = 280.5492


Ainsi, (*) devient:
1
P (Yi=1\Xi)= Λ(280.5492) Or, on sait que : Λ(Z) = 1+exp(−𝑍) alors P (Yi=1/Xi)= 1

Calculons l'effet marginal associé à la variable revenu pour un ménage vérifiant les
caractéristiques définies en 1.5 ou 2.2.
Pour le modèle a probabilité linéaire, l’effet marginal associe à la variable revenu se
calcule de la manière suivante :
𝜕𝑌̂ ∗
EM=𝜕𝑋𝑖 = 𝛽̂𝑗
𝑗𝑖

𝜕(0.2461 + 0.5009REVENUE − 0.1289PVOD)


EM= = 0.5009
𝜕𝑅𝐸𝑉𝐸𝑁𝑈𝐸

Pour le modèle logit, l’effet marginal associe à la variable revenue se calcule de la


manière suivante:

EM= 𝛽̂𝑗 × f(Xi𝛽̂ ) avec f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) (**)

Trouvons f(Xi𝛽̂ )
exp(𝑧)
f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) = (1+exp(𝑍))2

f(Xi𝛽̂ ) = λ(280.5492)= 1.4422× 10-122


D’où (**) devient :
EM= 0.5009 × 1.4422× 10-122 = 7.2241 × 10-123
Exercice 3 : On cherche à estimer la probabilité d'installation d'une climatisation à
partir d'un échantillon de ménages.
Les variables en votre possession sont les suivantes :
• CENTRAL : indicatrice égale à 1 si le ménage est équipé d'une climatisation.
• PORTABLE : indicatrice égale à 1 si le ménage est équipé d'un climatiseur mobile.
• REVENU : revenu annuel du ménage exprimé en logarithme.
• NBFOYER : nombre de personnes du ménage.
• TAILLE : surface de l'habitation.
• MAISON : indicatrice égale à 1 si le ménage réside en logement individuel.

L'objectif de cette étude est d'étudier l'impact des variables socioéconomiques


relatives au ménage sur la probabilité d'installer une climatisation (CENTRAL).

Le modèle estime peut s’écrire de la forme suivante :


1 𝑠𝑖 𝑌 ∗ > 0
CENTRALi= {
0 𝑠𝑖𝑛𝑜𝑛
𝑌𝑖∗ = 𝛽0+ 𝛽1PORTABLEi + 𝛽2REVENUi + 𝛽3 NBFOYERi + 𝛽4 TAILLEi + 𝛽5 MAISONi
+ 𝜀𝑖 ,i=1,2,…N

A partir des données du tableau, l’équation de régression estimée par le modèle


logit est :
𝑌̂𝑖∗ = - 12,04714 - 1,806437PORTABLEi + 1,158715REVENUEi -
0,064585NBFOYERi + 0,001099TAILLEi - 0,494055MAISONi
Commentaire sur les résultats obtenus.
On peut constater, grâce au tableau des résultats, que les variables : TAILLE,
REVENU, PORTABLE et la constante sont statistiquement significatifs avec 𝛼 = 5%.
Ce qui nous permet de conclure que ces trois variables peuvent expliquer la variable
CENTRAL. Les variables MAISON et NBFOYER ne sont pas statistiquement
significatifs. De plus, les paramètres associés aux variables TAILLE et REVENU sont
positifs. Ce qui pourrait dire qu’à mesure que la taille et le revenu pour l’individu i
augmente, 𝑌𝑖∗ augmente.
Calcul de la probabilité qu'un ménage de 3 personnes en maison individuelle de
revenu 10, de taille d'habitation 1360 et ne possédant pas de climatiseur portable
installe une climatisation.
NBFOYER=3 ; REVENU=10 ; TAILLE= 1360 ; PORTABLE=0

P (Yi=1\Xi)=E(Yi\Xi)= Λ(Xi𝛽̂ )

Trouvons Xi𝛽̂

Xi𝛽̂ = - 12.04714 – 1.806437PORTABLEi + 1.158715REVENUEi –


0.064585NBFOYERi + 0.001099TAILLEi - 0.494055MAISONi

Xi𝛽̂ = - 12.04714 – 1.806437× 0 + 1.158715 × 10 – 0.064585 × 3 + 0.001099 × 1360


- 0.494055× 1.

Xi𝛽̂ = 0.34684
D’où P (Yi=1/Xi)= Λ(0.34684) alors P (Yi=1/Xi) = 0.58585
Pour un ménage de 3 personnes en maison individuelle possédant un revenu 10, de
taille d’habitation 1360 et ne possédant pas de climatiseur portable, la probabilité
d’installer une climatisation est de 58.585%
Calculons l'effet marginal associé à la variable REVENU, au point moyen de
l'échantillon, à partir de l'estimation logit. Nous Utiliseront pour cela les moyennes
des variables explicatives dans le tableau de statistiques descriptives

EM= 𝛽̂𝑗 × f(Xi𝛽̂ ) (***) avec f(Xi𝛽̂ ) =λ(Xi𝛽̂ )


Trouvons f(Xi𝛽̂ )
exp(𝑧)
f(Xi𝛽̂ ) =λ(Xi𝛽̂ ) = (1+exp(𝑍))2 (I)

Trouvons Xi𝛽̂

Xi𝛽̂ = - 12.04714 – 1.806437× 0.3942 + 1.158715× 9.3176 - 0.064585× 3.1752 +


0.001099× 1367.6788 - 0.494055 × 0.8467

Xi𝛽̂ = -1.0831
Alors (I) devient:
f(Xi𝛽̂ )= λ(−1.0831) = 0.18895
D’où (***) devient ;
EM= 1.158715 × 0.18895 alors EM= 0.21893
On peut dire que la différence de probabilité pour un ménage d’installer une
climatisation et de ne pas installer une climatisation est de 21.893%
Pour l’individu moyen, on peut dire que la probabilité d’installer une climatisation va
augmenter de 21.893 point de % suite à une augmentation du revenu moyen d’une
unité (passe de 9,3176 à 10,3176)
-Calcul de l'effet marginal associé à la variable PORTABLE, au point moyen de
l'échantillon.
EM=𝑃(𝐶𝐸𝑁𝑇𝑅𝐴𝐿 = 1\PORTABLE = 1, REVENU=c NBFOYER=d, TAILLE=e,
MAISON=f)- 𝑃(𝐶𝐸𝑁𝑇𝑅𝐴𝐿 = 0\PORTABLE = 1, REVENU=c NBFOYER=d,
TAILLE=e, MAISON=f), c, d, e, f etant fixee
EM= Λ( - 12.04714 – 1.806437× 1 + 1.158715× 9.3176 - 0.064585× 3.1752 +
0.001099× 1367.6788 - 0.494055 × 0.8467) - Λ( - 12.04714 – 1.806437× 0 +
1.158715× 9.3176 - 0.064585× 3.1752 + 0.001099× 1367.6788 - 0.494055 ×
0.8467)
EM= Λ(-2.17744178)- Λ(1.449189994)
EM = 0.10179- 0.40829
EM= -0.3065
DEUXIEME PARTIE
N.B. On a utilisé le logiciel R pour effectuer les calculs de la 2 eme partie. Les codes
sont en annexe.

1)- Statistiques descriptives sur la base de données


1.1)- Calcul de la moyenne, l’écart-type, le minimum et le maximum pour l’ensemble
des variables continues du fichier de la base.
Pour la variable Age on a :
La moyenne:42.52 ; Ecart-type:8.6698 ; Minimum:18.00 Maximum:59.00

Pour la variable salaire on a :

La moyenne:18615 ; Ecart-type:7082.49 ; Minimum:3678 Maximum:35972

1.2)- Calculer la moyenne, l’écart-type, le minimum et le maximum pour les variables


continues selon le type d’abonnement.
Pour Age
 Quand Abo=0
La moyenne: 40.27 ; Ecart-type: 6.752886 ; Minimum: 31.00 Maximum: 51.00

 Quand Abo=1

La moyenne: 44.39 ; Ecart-type: 9.628294 ; Minimum: 18.00 Maximum: 59.00

Pour Zau

 Quand Abo=0

La moyenne: 3.055 ; Ecart-type: 1.928515 ; Minimum: 1.000 Maximum: 7.000

 Quand Abo=1

La moyenne: 3.009 ; Ecart-type: 1.892947 ; Minimum: 1.000 Maximum: 7.000

Pour Sal

 Quand Abo=0

La moyenne:17654 ; Ecart-type:7150.625 ; Minimum: 3678 Maximum: 35374

 Quand Abo=1

La moyenne: 19418 ; Ecart-type: 6956.164 ; Minimum: 6296 Maximum: 35972


1.3)- Après avoir donné les principales statistiques descriptives, réaliser un tri à plat
pour l’ensemble des variables qualitatives.
Pour sexe
Femme : 124 ; Homme : 76

Lenght (sexe) : 200


Proportion de sexe : Femme : 62 ; Homme : 38

Pour Abo

0 1
91 109

Length(Abo) : 200
Proportion d’abonnée
0 1
45.5 54.5

Pour Sitfam

1 2 3
101 72 27

Length(Sitfam) : 200

Proportion de situation familiale

1 2 3
50.5 36.0 13.5

Pour Soc

Cadre : 32 Employe : 88 Ouvrier : 80

Length(Soc) : 200

Proportion de situation familiale : Cadre : 16 ; Employe : 44 ; Ouvrier : 40

Pour Zau

1 2 3 4 5 7
31 97 3 21 24 24

Length(Zau) : 200
Proportion Zau

1 2 3 4 5 7
15.5 48.5 1.5 10.5 12.0 12.0

1.4)- Faire un tableau croisé (avec un test de corrélation) entre les variables d’abonn
ement et le sexe. En déduire le pourcentage d’hommes et de femmes prêts à s’abon
ner.

Tableau croise entre sexe et abonnee

0 1 Sum
Femme 67 57 124
Homme 24 52 76
Sum 91 109 200

Tableau croise de proportion entre sexe et abonné

0 1 Sum
Femme 54.03226 45.96774 100.00000
Homme 31.57895 68.42105 100.00000
Sum 45.50000 54.50000 100.00000

Test de corrélation

Pearson's product-moment corrélation

Data: genre and Abo

t = 3.1561, df = 198, p-value = 0.001848

alternative hypothesis: true correlation is not equal to 0


95 percent confidence interval:
0.08262675 0.34706143
sample estimates:
cor
0.2188588

On rejette l’hyppothese ou la corrélation entre la variable sexe et abonnee est nulle.


2)- Création de nouvelles variables

2.1)- Compléter la base de données initiale par les variables suivantes :

Nouvelles variables :
Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
> Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
> Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
> Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
> Saldiv<-df$Sal/1000
> Saldivv<-(df$Sal^2)/100000
> logsal<-log(df$Sal)
> Age2<-df$Age^2
> logage<-log(df$Age)

2.2)- Vérifier, à l’aide de statistiques descriptives que ces variables ont été correctem
ent créées. Ces variables seront utilisées dans les différentes modélisations considé
rées.

Tableau des abonnes et ceux qui ne désire pas d’abonner


table (df$Abo +Pabon)

1
200
Tableau des variables dichotomiques associées à la variable caractérisant le sexe,
1
200

Tableau des variables dichotomiques associées à la variable caractérisant la


situation familiale,
1
200

Tableau des variables dichotomiques associées à la variable caractérisant la CSP,

0 1
88 112
Tableau de la variable prenant la valeur 1 lorsque l’individu vie en zone urbaine

Zau Urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0

Tableau >table ((Femur + Femru) - Ffem)

0
200

Tableau > table (Saldiv*1000 - df$Sal)

-9.09e-13 0 1.81e-12
1 197 2

Tableau >table (sqrt (Saldivv*100000)- df$Sal)

-3.63e-12 -1.81e-12 0
1 7 184
9.09e-13 1.81e-12 3.63e-12
1 4 3

Tableau >table (sqrt(Age2) - df$Age)

0
200

Tableau > table(exp(logage) - df$Age)

-1.42e-14 -7.10e-15 -3.55e-15 0


4 83 7 57
3.55e-15 7.10e-15 1.42e-14 2.13e-14
5 32 8 4
3)- Estimation d’un modèle logit

3.1)- Estimation sans variable explicative (avec la constante seulement.

1- Sur la variable caractérisant l’abonnement (variable d’origine)


En considérant la variable Abo comme variable à expliquer, sans variable
explicative, le modèle peut s’écrire comme suit :
1 𝑠𝑖 𝑦 ∗ > 0
Abo={ avec, y*=c : le seuil de tolerance, c etant une constante
0 𝑠𝑖𝑛𝑜𝑛
2- Sur la variable caractérisant le non abonnement
En considérant la variable Pabon comme variable à expliquer, sans variable
explicative, le modèle peut s’écrire comme suit :

1 𝑠𝑖 𝑦 ∗ > 0
Pabon={ avec y*= c : le seuil de tolerance, c etant une constante
0 𝑠𝑖𝑛𝑜𝑛

Précisons les hypothèses retenues.


Les deux modèles étant des modèles logit, alors on gardera comme
hypothèses :
1-E(ui)=0
𝜋
2-V (ui)=3
3-ui~iid
On vérifie :

Model 1 :
Call:
glm(formula = df$Abo ~ 1, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.255 -1.255 1.102 1.102 1.102

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1805 0.1420 1.271 0.204

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64

Number of Fisher Scoring iterations: 3


BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> Pl
(Intercept)
0.545

Model 2:

Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64

Number of Fisher Scoring iterations: 3


> BetaPabonCst<-coef(LogitPaboncst)
> P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
> P0
(Intercept)
0.455

3.2)- Estimation avec variables explicatives

 Une seule variable explicative : le sexe

Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 265.89 on 198 degrees of freedom
AIC: 269.89

Number of Fisher Scoring iterations: 4

BetaSexe<-coef(LogitSexe)
> PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]))
> PFfem
(Intercept)
0.4596774

BetaSexe<-coef(LogitSexe)
> PHhom<-exp (BetaSexe [1]) / (1+exp (BetaSexe [1]))
> PHhom
(Intercept)
0.6842105

> OddH<-PHhom/ (1-PHhom)


> OddH
(Intercept)
2.166667

OddF<-PFfem/ (1-PFfem)
> OddF
(Intercept)
0.8507463

 Plusieurs variables

Inclure dans la modélisation les variables associées au sexe, à la situation familiale,


à la situation professionnelle, à la zone d’habitation et :

1er cas : à l’âge et au salaire,


Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + df$Sal, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387

Coefficients: (1 not defined because of singularities)


Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.363e+00 1.164e+00 -2.890 0.003847 **
Ffem -1.172e+00 3.847e-01 -3.046 0.002321 **
Marie 1.243e+00 4.949e-01 2.512 0.012007 *
Celibat -4.332e-01 5.318e-01 -0.814 0.415359
Cad 2.275e+00 6.167e-01 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 5.775e-01 4.005e-01 1.442 0.149283
Urbain -1.537e+00 1.380e+00 -1.114 0.265279
df$Age 8.596e-02 2.216e-02 3.878 0.000105 ***
df$Sal -1.764e-05 2.758e-05 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 208.18 on 191 degrees of freedom
AIC: 226.18

Number of Fisher Scoring iterations: 4

2ième cas : à l’âge et au salaire divisé par 1000 ;

Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Saldiv, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387

Coefficients: (1 not defined because of singularities)


Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.36315 1.16353 -2.890 0.003847 **
Ffem -1.17159 0.38466 -3.046 0.002321 **
Marie 1.24318 0.49491 2.512 0.012007 *
Celibat -0.43318 0.53183 -0.814 0.415359
Cad 2.27509 0.61667 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 0.57748 0.40045 1.442 0.149283
Urbain -1.53701 1.37972 -1.114 0.265279
df$Age 0.08596 0.02216 3.878 0.000105 ***
Saldiv -0.01764 0.02758 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 208.18 on 191 degrees of freedom
AIC: 226.18

Number of Fisher Scoring iterations: 4

3ième cas : à l’âge, l’âge au carré, au salaire divisé par 1000 et au salaire au carré d
ivisé par 10000,

Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-2.2813 -0.7946 0.1125 0.8222 1.8968

Coefficients: (1 not defined because of singularities)


Estimate Std. Error z value Pr(>|z|)
(Intercept) 15.2244715 6.3751035 2.388 0.016935 *
Ffem -1.0466956 0.4074845 -2.569 0.010209 *
Marie 0.9572624 0.5190814 1.844 0.065162 .
Celibat -0.7115023 0.5843278 -1.218 0.223360
Cad 2.2867560 0.6388771 3.579 0.000344 ***
Emplo NA NA NA NA
Ouv 0.7428700 0.4257637 1.745 0.081021 .
Urbain -1.1709368 1.3763118 -0.851 0.394892
df$Age -0.8946082 0.3133601 -2.855 0.004305 **
Age2 0.0118777 0.0038422 3.091 0.001992 **
Saldiv 0.0894349 0.1346012 0.664 0.506407
Saldivv -0.0002438 0.0003092 -0.789 0.430357
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 194.09 on 189 degrees of freedom
AIC: 216.09

Number of Fisher Scoring iterations: 6

4ième cas : au logarithme de l’âge et au logarithme du salaire

Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 265.89 on 198 degrees of freedom
AIC: 269.89

Number of Fisher Scoring iterations: 4

ANNEXE
summary(df$Age)
summary(df$Sal)
sd(df$Age)
sd(df$Sal)
summary(df[df[,"Abo"]=="0","Age"])
sd(df[df[,"Abo"]=="0","Age"])
summary(df[df[,"Abo"]=="1","Age"])
sd(df[df[,"Abo"]=="1","Age"])
summary(df[df[,"Abo"]=="0","Zau"])
sd(df[df[,"Abo"]=="0","Zau"])
summary(df[df[,"Abo"]=="1","Zau"])
sd(df[df[,"Abo"]=="1","Zau"])
summary(df[df[,"Abo"]=="0","Sal"])
sd(df[df[,"Abo"]=="0","Sal"])
summary(df[df[,"Abo"]=="1","Sal"])
sd(df[df[,"Abo"]=="1","Sal"])
table(sexe)
table(Sexe)
table(df$Sexe)
length(df$Sexe)
prop.table(table(Sexe)*100
prop.table(table(df$Sexe))*100
table(df$Abo)
length(df$Abo)
prop.table(table(df$Sexe))*100
prop.table(table(df$Abo))*100
table(df$Sitfam)
length(df$Sitfam)
prop.table(table(df$Sitfam))*100
table(df$Soc)
length(df$Soc)
prop.table(table(df$Soc))*100
table(df$Zau)
prop.table(table(df$Zau))*100
addmargins(table(df$Sexe,Abo))
addmargins(table(df$Sexe,df$Abo))
Tab<-table(df$Sexe,df$Abo)
addmargins(prop.table(addmargins(Tab, 1),1),2)*100
genre<-ifelse(df$Sexe=="Homme",1,0)
cor.test(genre,df$Abo)
Pabon<-ifelse(df$Abo=="0",1,0)
Ffem<-ifelse(df$Sexe=="Femme",1,0)
Hhom<-ifelse(df$Sexe=="Homme",1,0)
Marie<-ifelse(df$Sitfam=="1",1,0)
Celibat<-ifelse(df$Sitfam=="2",1,0)
Divoc<-ifelse(df$Sitfam=="3",1,0)
Cad<-ifelse(df$Soc=="Cadre",1,0)
Emplo<-ifelse(df$Soc=="Employer",1,0)
Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
Urbain<-ifelse(df$Zau=="3",1,0)
Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
Saldiv<-df$Sal/1000
Saldivv<-(df$Sal^2)/100000
logsal<-log(df$Sal)
Age2<-df$Age^2
logage<-log(df$Age)
table(df$Abo +Pabon)
table(Ffem +Hhom)
table(Marie + Celibat + Divoc)
table(Cad + Emplo + Ouv)
cbind(df$Zau, Urbain)
table((Femur + Femru) - Ffem )
table(Saldiv*1000 - df$Sal)
table(sqrt(Saldivv*100000)- df$Sal)
table(sqrt(Age2) - df$Age)
table(exp(logage) - df$Age)
LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
summary(LogitAbocst)
BetaAboCst<-coef(LogitAbocst)
Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
Pl
LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
summary(LogitPaboncst)
BetaPabonCst<-coef(LogitPaboncst)
P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
P0
LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
summary(LogitSexe)
BetaSexe<-coef(LogitSexe)
PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]))
PFfem
BetaSexe<-coef(LogitSexe)
PHhom<-exp(BetaSexe[1]) / (1+exp(BetaSexe[1]))
PHhom
OddH<-PHhom/ (1-PHhom)
OddH
OddF<-PFfem/ (1-PFfem)
OddF
Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain +
df$Age + df$Sal, family = binomial(link = "logit"))
summary(Logitmodell)
Logitmodel2<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ df$Age + Saldiv, family = binomial(link = "logit"))
summary(Logitmodel2)
Logitmodel3<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"))
summary(Logitmodel3)
Logitmodel4<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + Urbain
+ logage + logsal, family = binomial(link = "logit"))
summary(Logitmodel4)
[1] 7082.492
> summary(df[df[,"abo"]=="0",age"])
+ summary(df[df[,"abo"]=="0",age"])
Error: unexpected string constant in:
"summary(df[df[,"abo"]=="0",age"])
summary(df[df[,""
> summary(df[df[,"abo"]=="0","age"])
Error in `[.data.frame`(df, , "abo") :
colonnes non définies sélectionnées
> summary(df[df[,"abo"]=="0","age"])
Error in `[.data.frame`(df, , "abo") :
colonnes non définies sélectionnées
> summary(df[df[,"Abo"]=="0","Age"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
31.00 34.00 39.00 40.27 46.00 51.00
> sd(df[df[,"Abo"]=="0","Age"])
[1] 6.752886
> summary(df[df[,"Abo"]=="1","Age"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
18.00 38.00 46.00 44.39 52.00 59.00
> sd(df[df[,"Abo"]=="1","Age"])
[1] 9.628294
> summary(df[df[,"Abo"]=="0","Zau"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 2.000 3.055 4.500 7.000
> sd(df[df[,"Abo"]=="0","Zau"])
[1] 1.928515
> summary(df[df[,"Abo"]=="1","Zau"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 2.000 3.009 4.000 7.000
> sd(df[df[,"Abo"]=="1","Zau"])
[1] 1.892947
> summary(df[df[,"Abo"]=="0","Sal"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
3678 12936 16227 17654 21320 35374
> sd(df[df[,"Abo"]=="0","Sal"])
[1] 7150.625
> summary(df[df[,"Abo"]=="1","Sal"])
Min. 1st Qu. Median Mean 3rd Qu. Max.
6296 15528 18190 19418 23030 35972
> sd(df[df[,"Abo"]=="1","Sal"])
[1] 6956.164
> table(sexe)
Error in table(sexe) : object 'sexe' not found
> table(Sexe)
Error in table(Sexe) : object 'Sexe' not found
> table(Sexe)
Error in table(Sexe) : object 'Sexe' not found
> table(df$Sexe)

Femme Homme
124 76
> length(df$Sexe)
[1] 200
> prop.table(df$Sexe)
Error in Summary.factor(c(1L, 2L, 2L, 1L, 1L, 1L, 1L, 2L, 2L, 1L, 1L, :
‘sum’ not meaningful for factors
> prop.table(table(Sexe)*100
+ prop.table(table(Sexe))*100
Error: unexpected symbol in:
"prop.table(table(Sexe)*100
prop.table"
> prop.table(df$table(Sexe))*100
Error in prop.table(df$table(Sexe)) : attempt to apply non-function
> prop.table(table(df$Sexe))*100

Femme Homme
62 38
> table(df$Abo)

0 1
91 109
> length(df$Abo)
[1] 200
> prop.table(table(df$Sexe))*100

Femme Homme
62 38
> prop.table(table(df$Abo))*100

0 1
45.5 54.5
> table(df$Sitfam)

1 2 3
101 72 27
> length(df$Sitfam)
[1] 200
> prop.table(table(df$Sitfam))*100

1 2 3
50.5 36.0 13.5
> table(df$Soc)

Cadre Employe Ouvrier


32 88 80
> length(df$Soc)
[1] 200
> prop.table(table(df$Soc))*100

Cadre Employe Ouvrier


16 44 40
> table(df$Zau)

1 2 3 4 5 7
31 97 3 21 24 24
> prop.table(table(df$Zau))*100

1 2 3 4 5 7
15.5 48.5 1.5 10.5 12.0 12.0
> addmargins(table(df$Sexe,Abo))
Error in table(df$Sexe, Abo) : object 'Abo' not found
> addmargins(df$table(Sexe,Abo))
Error in addmargins(df$table(Sexe, Abo)) : attempt to apply non-function
> addmargins(table(df$Sexe,df$Abo))

0 1 Sum
Femme 67 57 124
Homme 24 52 76
Sum 91 109 200
> Tab<-table(df$Sexe,df$Abo)
> addmargins(prop.table(addmargins(Tab, 1),1),2)*100

0 1 Sum
Femme 54.03226 45.96774 100.00000
Homme 31.57895 68.42105 100.00000
Sum 45.50000 54.50000 100.00000
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> cor.test(genre,Abo)
Error in cor.test(genre, Abo) : object 'genre' not found
> cor.test(df$genre,Abo)
Error in cor.test.default(df$genre, Abo) : object 'Abo' not found
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> cor.test(genre,df$Abo)
Error in cor.test(genre, df$Abo) : object 'genre' not found
> genre<-ifelse(df$Sexe=="Homme",1,0)
> cor.test(genre,df$Abo)

Pearson's product-moment correlation

data: genre and df$Abo


t = 3.1561, df = 198, p-value = 0.001848
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.08262675 0.34706143
sample estimates:
cor
0.2188588

> Pabon<-ifelse(df$Abo=="0",1,0)
> Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe="Femme" & urbain="1",1,0)
Error: unexpected '=' in "Femur<-ifelse(df$Sexe="
> Femru<-ifelse(df$Sexe="Femme" & urbain="0",1,0)
Error: unexpected '=' in "Femru<-ifelse(df$Sexe="
> Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & urbain=="1",1,0)
Error in ifelse(df$Sexe == "Femme" & urbain == "1", 1, 0) :
object 'urbain' not found
> Pabon<-ifelse(df$Abo=="0",1,0)
> Ffem<-ifelse(df$Sexe=="Femme",1,0)
> Hhom<-ifelse(df$Sexe=="Homme",1,0)
> Marie<-ifelse(df$Sitfam=="1",1,0)
> Celibat<-ifelse(df$Sitfam=="2",1,0)
> Divoc<-ifelse(df$Sitfam=="3",1,0)
> Cad<-ifelse(df$Soc=="Cadre",1,0)
> Emplo<-ifelse(df$Soc=="Employer",1,0)
> Ouv<-ifelse(df$Soc=="Ouvrier",1,0)
> Urbain<-ifelse(df$Zau=="3",1,0)
> Femur<-ifelse(df$Sexe=="Femme" & Urbain=="1",1,0)
> Femru<-ifelse(df$Sexe=="Femme" & Urbain=="0",1,0)
> Homur<-ifelse(df$Sexe=="Homme" & Urbain=="1",1,0)
> Homru<-ifelse(df$Sexe=="Homme" & Urbain=="0",1,0)
> Saldiv<-df$Sal/1000
> Saldivv<-(df$Sal^2)/100000
> logsal<-log(df$Sal)
> Age2<-df$Age^2
> logage<-log(df$Age)
> table(df$Abo +Pabon)

1
200
> table(Ffem +Hhom)

1
200
>
>
> table(Marie + Celibat + Divoc)

1
200
> table(Cad + Emplo + Ouv)

0 1
88 112
> cbind(df$Zau + Urbain)
[,1]
[1,] 4
[2,] 4
[3,] 4
[4,] 4
[5,] 4
[6,] 4
[7,] 4
[8,] 4
[9,] 4
[10,] 4
[11,] 4
[12,] 4
[13,] 4
[14,] 2
[15,] 2
[16,] 2
[17,] 1
[18,] 1
[19,] 1
[20,] 1
[21,] 1
[22,] 1
[23,] 1
[24,] 1
[25,] 2
[26,] 2
[27,] 2
[28,] 2
[29,] 2
[30,] 2
[31,] 2
[32,] 2
[33,] 2
[34,] 2
[35,] 2
[36,] 2
[37,] 2
[38,] 2
[39,] 2
[40,] 2
[41,] 2
[42,] 2
[43,] 2
[44,] 2
[45,] 2
[46,] 2
[47,] 2
[48,] 5
[49,] 5
[50,] 5
[51,] 5
[52,] 2
[53,] 2
[54,] 2
[55,] 2
[56,] 2
[57,] 2
[58,] 2
[59,] 2
[60,] 2
[61,] 2
[62,] 2
[63,] 2
[64,] 2
[65,] 2
[66,] 2
[67,] 2
[68,] 2
[69,] 2
[70,] 2
[71,] 2
[72,] 2
[73,] 2
[74,] 2
[75,] 2
[76,] 2
[77,] 2
[78,] 2
[79,] 5
[80,] 5
[81,] 5
[82,] 5
[83,] 5
[84,] 5
[85,] 5
[86,] 5
[87,] 7
[88,] 1
[89,] 1
[90,] 1
[91,] 7
[92,] 7
[93,] 7
[94,] 7
[95,] 7
[96,] 2
[97,] 1
[98,] 1
[99,] 2
[100,] 2
[101,] 1
[102,] 1
[103,] 2
[104,] 1
[105,] 2
[106,] 2
[107,] 5
[108,] 1
[109,] 5
[110,] 5
[111,] 5
[112,] 1
[113,] 5
[114,] 5
[115,] 7
[116,] 7
[117,] 7
[118,] 7
[119,] 7
[120,] 7
[121,] 7
[122,] 7
[123,] 7
[124,] 7
[125,] 7
[126,] 7
[127,] 7
[128,] 1
[129,] 1
[130,] 1
[131,] 5
[132,] 5
[133,] 1
[134,] 1
[135,] 1
[136,] 1
[137,] 5
[138,] 5
[139,] 5
[140,] 4
[141,] 4
[142,] 1
[143,] 4
[144,] 4
[145,] 4
[146,] 4
[147,] 4
[148,] 7
[149,] 5
[150,] 2
[151,] 2
[152,] 2
[153,] 2
[154,] 2
[155,] 2
[156,] 2
[157,] 2
[158,] 7
[159,] 1
[160,] 7
[161,] 1
[162,] 7
[163,] 7
[164,] 4
[165,] 1
[166,] 1
[167,] 4
[168,] 4
[169,] 4
[170,] 2
[171,] 2
[172,] 2
[173,] 2
[174,] 2
[175,] 2
[176,] 2
[177,] 2
[178,] 1
[179,] 2
[180,] 2
[181,] 2
[182,] 2
[183,] 2
[184,] 2
[185,] 2
[186,] 2
[187,] 2
[188,] 2
[189,] 2
[190,] 2
[191,] 2
[192,] 2
[193,] 2
[194,] 2
[195,] 2
[196,] 2
[197,] 2
[198,] 2
[199,] 2
[200,] 2
> cbind(df$Zau, Urbain)
Urbain
[1,] 3 1
[2,] 3 1
[3,] 3 1
[4,] 4 0
[5,] 4 0
[6,] 4 0
[7,] 4 0
[8,] 4 0
[9,] 4 0
[10,] 4 0
[11,] 4 0
[12,] 4 0
[13,] 4 0
[14,] 2 0
[15,] 2 0
[16,] 2 0
[17,] 1 0
[18,] 1 0
[19,] 1 0
[20,] 1 0
[21,] 1 0
[22,] 1 0
[23,] 1 0
[24,] 1 0
[25,] 2 0
[26,] 2 0
[27,] 2 0
[28,] 2 0
[29,] 2 0
[30,] 2 0
[31,] 2 0
[32,] 2 0
[33,] 2 0
[34,] 2 0
[35,] 2 0
[36,] 2 0
[37,] 2 0
[38,] 2 0
[39,] 2 0
[40,] 2 0
[41,] 2 0
[42,] 2 0
[43,] 2 0
[44,] 2 0
[45,] 2 0
[46,] 2 0
[47,] 2 0
[48,] 5 0
[49,] 5 0
[50,] 5 0
[51,] 5 0
[52,] 2 0
[53,] 2 0
[54,] 2 0
[55,] 2 0
[56,] 2 0
[57,] 2 0
[58,] 2 0
[59,] 2 0
[60,] 2 0
[61,] 2 0
[62,] 2 0
[63,] 2 0
[64,] 2 0
[65,] 2 0
[66,] 2 0
[67,] 2 0
[68,] 2 0
[69,] 2 0
[70,] 2 0
[71,] 2 0
[72,] 2 0
[73,] 2 0
[74,] 2 0
[75,] 2 0
[76,] 2 0
[77,] 2 0
[78,] 2 0
[79,] 5 0
[80,] 5 0
[81,] 5 0
[82,] 5 0
[83,] 5 0
[84,] 5 0
[85,] 5 0
[86,] 5 0
[87,] 7 0
[88,] 1 0
[89,] 1 0
[90,] 1 0
[91,] 7 0
[92,] 7 0
[93,] 7 0
[94,] 7 0
[95,] 7 0
[96,] 2 0
[97,] 1 0
[98,] 1 0
[99,] 2 0
[100,] 2 0
[101,] 1 0
[102,] 1 0
[103,] 2 0
[104,] 1 0
[105,] 2 0
[106,] 2 0
[107,] 5 0
[108,] 1 0
[109,] 5 0
[110,] 5 0
[111,] 5 0
[112,] 1 0
[113,] 5 0
[114,] 5 0
[115,] 7 0
[116,] 7 0
[117,] 7 0
[118,] 7 0
[119,] 7 0
[120,] 7 0
[121,] 7 0
[122,] 7 0
[123,] 7 0
[124,] 7 0
[125,] 7 0
[126,] 7 0
[127,] 7 0
[128,] 1 0
[129,] 1 0
[130,] 1 0
[131,] 5 0
[132,] 5 0
[133,] 1 0
[134,] 1 0
[135,] 1 0
[136,] 1 0
[137,] 5 0
[138,] 5 0
[139,] 5 0
[140,] 4 0
[141,] 4 0
[142,] 1 0
[143,] 4 0
[144,] 4 0
[145,] 4 0
[146,] 4 0
[147,] 4 0
[148,] 7 0
[149,] 5 0
[150,] 2 0
[151,] 2 0
[152,] 2 0
[153,] 2 0
[154,] 2 0
[155,] 2 0
[156,] 2 0
[157,] 2 0
[158,] 7 0
[159,] 1 0
[160,] 7 0
[161,] 1 0
[162,] 7 0
[163,] 7 0
[164,] 4 0
[165,] 1 0
[166,] 1 0
[167,] 4 0
[168,] 4 0
[169,] 4 0
[170,] 2 0
[171,] 2 0
[172,] 2 0
[173,] 2 0
[174,] 2 0
[175,] 2 0
[176,] 2 0
[177,] 2 0
[178,] 1 0
[179,] 2 0
[180,] 2 0
[181,] 2 0
[182,] 2 0
[183,] 2 0
[184,] 2 0
[185,] 2 0
[186,] 2 0
[187,] 2 0
[188,] 2 0
[189,] 2 0
[190,] 2 0
[191,] 2 0
[192,] 2 0
[193,] 2 0
[194,] 2 0
[195,] 2 0
[196,] 2 0
[197,] 2 0
[198,] 2 0
[199,] 2 0
[200,] 2 0
> table((Femur + Femru) - Ffem )

0
200
> table(Saldiv*1000 - df$Sal)

-9.09494701772928e-13 0 1.81898940354586e-12
1 197 2
> table(sqrt(Saldivv*100000)- df$Sal)

-3.63797880709171e-12 -1.81898940354586e-12 0
1 7 184
9.09494701772928e-13 1.81898940354586e-12 3.63797880709171e-12
1 4 3
> table(sqrt(Age2) - df$Age)

0
200
> table(exp(logage) - df$Age)

-1.4210854715202e-14 -7.105427357601e-15 -3.5527136788005e-15


0
4 83 7
57
3.5527136788005e-15 7.105427357601e-15 1.4210854715202e-14 2.13162820
72803e-14
5 32 8
4
> LogitAbocst<-glm(df$Abo ~ 1, family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1, family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> Summary(LogitAbocst)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitAbocst<-glm(df$Abo ~ 1 , family = binomial(link = "logit"))
> summary(LogitAbocst)

Call:
glm(formula = df$Abo ~ 1, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.255 -1.255 1.102 1.102 1.102

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.1805 0.1420 1.271 0.204

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64

Number of Fisher Scoring iterations: 3

> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/(1+exp(BetaAboCst))
BetaAboCst"
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst/ (1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst/ (1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst / (1+exp(BetaAboCst))
+ BetaAboCst<-coef(LogitAbocst)
Error: unexpected symbol in:
"Pl<-exp(BetaAboCst / (1+exp(BetaAboCst))
BetaAboCst"
> Pl<-exp(BetaAboCst) / (1+exp(BetaAboCst))
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> BetaAboCst<-coef(LogitAbocst)
> Pl<-exp(BetaAboCst)/(1+exp(BetaAboCst))
> Pl
(Intercept)
0.545
> LogitAbocst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
> summary(LogitAbocst)

Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64

Number of Fisher Scoring iterations: 3

> LogitAbocst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))


> summary(LogitPaboncst)
Error in summary(LogitPaboncst) : object 'LogitPaboncst' not found
> LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))
> summary(LogitPaboncst)

Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64

Number of Fisher Scoring iterations: 3

> LogitPaboncst<-glm(Pabon ~ 1 , family = binomial(link = "logit"))


> summary(LogitPaboncst)

Call:
glm(formula = Pabon ~ 1, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.102 -1.102 -1.102 1.255 1.255

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.1805 0.1420 -1.271 0.204

(Dispersion parameter for binomial family taken to be 1)


Null deviance: 275.64 on 199 degrees of freedom
Residual deviance: 275.64 on 199 degrees of freedom
AIC: 277.64

Number of Fisher Scoring iterations: 3

> Po
Error: object 'Po' not found
> BetaPabonCst<-coef(LogitPaboncst)
> P0<-exp(BetaPabonCst) / (1+exp(BetaPabonCst))
> P0
(Intercept)
0.455
> LogitSexecst<-glm(Abon ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Abon' not found
> LogitSexecst<-glm(Abo ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Abo' not found
> LogitSexecst<-glm(sdf$Abo ~ Ffem , family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'sdf' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> summary(LogitSexe)
Error in summary(LogitSexe) : object 'LogitSexe' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(Logitdf$Sexe)
Error in Summary(Logitdf$Sexe) : object 'Logitdf' not found
> LogitSexecst<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(LogitSexe)
Error in Summary(LogitSexe) : object 'LogitSexe' not found
> LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> Summary(LogitSexe)
Error in (function (classes, fdef, mtable) :
impossible de trouver une méthode héritée pour la fonction ‘Summary’ pou
r la signature ‘"glm"’
> LogitSexe<-glm(df$Abo ~ Ffem , family = binomial(link = "logit"))
> summary(LogitSexe)

Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 265.89 on 198 degrees of freedom
AIC: 269.89

Number of Fisher Scoring iterations: 4

> BetaSexe<-coef(LogitSexe)
> PFfem<-exp(BetaSexe[1] + BetaSexe[2]) / (1+exp(BetaSexe[1] + BetaSexe[2]
))
> PFfem
(Intercept)
0.4596774
> BetaSexe<-coef(LogitSexe)
> PHhom<-exp(BetaSexe[1]) / (1+exp(BetaSexe[1]))
> PHhom
(Intercept)
0.6842105
> OddH<-PHhom/ (1-PHhom)
> OddH
(Intercept)
2.166667
> OddF<-PFfem/ (1-PFfem)
> OddF
(Intercept)
0.8507463
> Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Empl + Ouv + Ur
bain + df$Age + df$Sal, family = binomial(link = "logit"))
Error in eval(predvars, data, env) : object 'Empl' not found
> Logitmodell<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U
rbain + df$Age + df$Sal, family = binomial(link = "logit"))
> summary(Logitmodell)

Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + df$Sal, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387

Coefficients: (1 not defined because of singularities)


Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.363e+00 1.164e+00 -2.890 0.003847 **
Ffem -1.172e+00 3.847e-01 -3.046 0.002321 **
Marie 1.243e+00 4.949e-01 2.512 0.012007 *
Celibat -4.332e-01 5.318e-01 -0.814 0.415359
Cad 2.275e+00 6.167e-01 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 5.775e-01 4.005e-01 1.442 0.149283
Urbain -1.537e+00 1.380e+00 -1.114 0.265279
df$Age 8.596e-02 2.216e-02 3.878 0.000105 ***
df$Sal -1.764e-05 2.758e-05 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 208.18 on 191 degrees of freedom
AIC: 226.18

Number of Fisher Scoring iterations: 4

> Logitmodel2<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U


rbain + df$Age + Saldiv, family = binomial(link = "logit"))
> summary(Logitmodel2)

Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Saldiv, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-2.3337 -0.8127 0.3788 0.7920 1.6387

Coefficients: (1 not defined because of singularities)


Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.36315 1.16353 -2.890 0.003847 **
Ffem -1.17159 0.38466 -3.046 0.002321 **
Marie 1.24318 0.49491 2.512 0.012007 *
Celibat -0.43318 0.53183 -0.814 0.415359
Cad 2.27509 0.61667 3.689 0.000225 ***
Emplo NA NA NA NA
Ouv 0.57748 0.40045 1.442 0.149283
Urbain -1.53701 1.37972 -1.114 0.265279
df$Age 0.08596 0.02216 3.878 0.000105 ***
Saldiv -0.01764 0.02758 -0.640 0.522336
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 208.18 on 191 degrees of freedom
AIC: 226.18

Number of Fisher Scoring iterations: 4

> Logitmodel3<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U


rbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(link = "logit"
))
> summary(Logitmodel3)

Call:
glm(formula = df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo +
Ouv + Urbain + df$Age + Age2 + Saldiv + Saldivv, family = binomial(lin
k = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-2.2813 -0.7946 0.1125 0.8222 1.8968

Coefficients: (1 not defined because of singularities)


Estimate Std. Error z value Pr(>|z|)
(Intercept) 15.2244715 6.3751035 2.388 0.016935 *
Ffem -1.0466956 0.4074845 -2.569 0.010209 *
Marie 0.9572624 0.5190814 1.844 0.065162 .
Celibat -0.7115023 0.5843278 -1.218 0.223360
Cad 2.2867560 0.6388771 3.579 0.000344 ***
Emplo NA NA NA NA
Ouv 0.7428700 0.4257637 1.745 0.081021 .
Urbain -1.1709368 1.3763118 -0.851 0.394892
df$Age -0.8946082 0.3133601 -2.855 0.004305 **
Age2 0.0118777 0.0038422 3.091 0.001992 **
Saldiv 0.0894349 0.1346012 0.664 0.506407
Saldivv -0.0002438 0.0003092 -0.789 0.430357
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 194.09 on 189 degrees of freedom
AIC: 216.09
Number of Fisher Scoring iterations: 6

> Logitmodel4<-glm(df$Abo ~ Ffem + Marie + Celibat + Cad + Emplo + Ouv + U


rbain + logage + logsal, family = binomial(link = "logit"))
> summary(LogitSexe)

Call:
glm(formula = df$Abo ~ Ffem, family = binomial(link = "logit"))

Deviance Residuals:
Min 1Q Median 3Q Max
-1.5183 -1.1096 0.8712 1.2468 1.2468

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.7732 0.2468 3.133 0.00173 **
Ffem -0.9348 0.3056 -3.059 0.00222 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 275.64 on 199 degrees of freedom


Residual deviance: 265.89 on 198 degrees of freedom
AIC: 269.89

Number of Fisher Scoring iterations: 4

Vous aimerez peut-être aussi