Vous êtes sur la page 1sur 21

CENTRE DE TECHNIQUES DE PLANIFICATION ET

D’ÉCONOMIE APPLIQUÉE

DEVOIR D'ÉCONOMÉTRIE VARIABLE QUALITATIVE

PRÉPARÉ PAR : Emmanuel DÉMOSTHÈNE

NIVEAU : 4eme année

PROMOTION : 2015-2019

SOUS LA DIRECTION DE : Monsieur Septimus Pierre

DATE : 11 SEPTEMBRE 2020


PREMIERE PARTIE
Exercice 1
L'analyste estime le modèle: REVENUi = β0 + β1SECTi + Ɛi, i=1,2,…N

Avec:
- β0 et β1 des paramètres à estimer

- la variable de secteur multinomiale est donnée par : SECTi = 1 si services, 2 si transport, 3 si


industrie, 0 si autres.

L'équation de régression estimée est : REVENUi = 17.46 + 1.53SECTi

1)- Calculons les moyennes des revenus par secteur à partir de cette estimation.

Secteur Effectif Moyenne des Moyennes des


revenus revenus à partir de
l' estimation
Industrie 1165 22.65 22.05
Services 582 16.64 18.99
Transport 333 19.51 20.52

Autres 1224 18.31 17.46


Tous secteurs 3304 19.67

Les moyennes de revenus calculés sont différentes de celles fournies par le tableau.

Pour l'industrie l'écart entre les moyennes est relativement faible (0.6), pour le secteur Services
l'écart est de 2.35, l'écart entre les moyennes de revenus pour les secteurs transport et autres sont
respectivement 1.01 et 0.85.
2) La régression que l'analyste aurait dû utiliser un modèle avec constante et trois variables
indicatrices associées à trois secteurs en fonction d'un secteur choisi comme variable de
référence (comme autres) afin d'éviter la multicolinéarité dans le modèle.

Pour trouver les valeurs estimées des paramètres de cette régression nous allons créer des
variables indicatrices codées 0 et 1 pour les secteurs Industrie, Services et transports en fonction
de la variable autres.

2
SERVi ={1, si services 0 sinon, INDUSi = { 1 si Industries 0 sinon TRANSPi
={ 1 si Transport 0 sinon

Le modèle qu'on va estimer est donné par:


REVENUi= + SERVi + TRANSPi + INDUSi + ui , i=1,2...N , avec N=3304
L'estimation par les MCO pour le modèle est donnée par B =(X’X)-1XY.
Le modèle estimé après calculs sur excel est donné par:.
REVÊNUi= 18.317908-1.6779 SERVi +1.19209TRANSPi +4.33209 INDUSi

Exercice 2
Les données suivantes sont tirées d'un échantillon de 1078 familles russes enquêtées en 1993 :
QVOD : quantité de vodka consommée par personne et par jour, en litres
REVENU : revenu mensuel du ménage ramené au nombre de personnes adultes du ménage en
105 roubles
PVOD : prix du litre de vodka au détail, en 102 roubles

1.- Un modèle aa probabilité linéaire est estimé et l’équation de régression estimé est :
Yi = 0.2461 + 0.5009REVENUEi - 0.1289PVODi

1.1) Calculons la probabilité prédite associée a Y a la moyenne des regresseurs


P(Yi=1|Xi)= E(Yi|Xi)=XiB
D’où : P(Yi=1|Xi)=0.2461+0.5009 *0.0326 – 0.1289 *0.3727
P(Yi=1|Xi) = 0.2144

1.2) Calculons la probabilité prédite associe à Y la plus faible


P(Yi=1|Xi)=0.2461+0.5009*0.0001 – 0.1289 *0.1200= 0.2307

1.3) Calculons la probabilité prédite associée à Y la plus forte

3
P(Yi=1|Xi)=0.2461+0.5009 *0.2866 – 0.1289 *5.400= -0.3064

1.4) Nous constatons qu’ une des probabilités calculées est négative. C'est une des limites du
modèle à probabilité linéaire.

1.5) -Calculons la probabilité qu'un ménage de 2 adultes avec un REVENU total égal à
10 000 roubles achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre.

Procédons tout d’ abord à la conversion :


-REVENU = 47.6191 (10000/2 et 5000/105)
- PVOD = 0.4412 (45/102)

Calculons maintenant P(Y=1/Xi) pour ce ménage :

P (Y =1/Xi) = XiB =0.2461 + 47.6191* 0.5009 + 0.4412*-0.1289 = 24.04160

2) On estime la probabilité que Y = 1 par un modèle Logit

2.1) Ecrire avec précision le modèle estimé ainsi que la fonction de vraisemblance associée à ce
modèle:

Y*= -0.1721 + 5.9483REVENUE – 4.7353PVOD


La fonction de vraisemblable associée est: L(β) = ∏Λ(XiA)∏[1-Λ(XiA)] = ∏[Λ(XiA)]∏[Λ(-
XiA)]
I I I I
1 0 1 0
avec Avec : I1 = {i : yi = 1} card I1 = N1

I0 = {i : yi = 0} card I0 = N0 N1 + N0 = N

2.2) Calculons la probabilité que le ménage décrit à la question 1.5 achète plus de 1 litre de
vodka.

Y* = 0.1721 + 5.9483(47.6191) – 4.7353(0.4412) = 281.3356


P(Y=1/Xi) = Λ(XiB) = 1/[1+ exp(-XiB)] = 1/[1+ exp(-281.3356)]
P(Y =1/Xi) = 1

2.3)- Calculons l'effet marginal associé à la variable revenu pour un ménage vérifiant les
caractéristiques définies en 1.5 ou 2.2.

4
Effet Marginal de la variable revenu = B1Λ(XiB)= 5.9483*1= 5.9483.
Interprétation : Toutes choses égales par ailleurs, pour le ménage vérifiant les caractéristiques
définies dans 1.5, la probabilité de consommation de vodka par jour (en litres) va augmenter de
59.48 point de pourcentage lorsque le REVENU augmente d’ une unité c’ est-à-dire augmente
de 105 roubles par adulte dans le ménage.

Exercice 3 :

1)- Ecriture du modèle estimé :

Y* = - 12,04714 - 0,064585NBFOYER + 0,001099TAILLE + 1,158715REVENU -


0,494055MAISON - 1,806437PORTABLE

Interprétation des résultats:

1) Analyse des signes :


- Le signe de la constante est négatif
- Le signe du coefficient associe à la variable NBFOYER est négatif. Lorsque NBFOYER
augmente, la probabilité pour le ménage d’ être équipé d’ une climatisation diminue.
-Le signe du coefficient associe à la variable TAILLE est positif. Lorsque TAILLE
augmente, la probabilité pour le ménage d’ être équipe d’ une climatisation augmente.
-Le signe du coefficient associe à la variable REVENU est positif. Lorsque REVENU
augmente, la probabilité pour le ménage d’ être équipe d’ une climatisation augmente.
-Le coefficient associe à la variable MAISON est négatif. La probabilité d’ être équipé
d’ une climatisation diminue lorsque le ménage réside dans un logement individuel.
-Le coefficient associe à la variable PORTABLE est de signe négatif. La probabilité
d’ être équipé d’ une climatisation diminue lorsque le ménage est équipé d’ un climatiseur
mobile.

2) Significativité des coefficients :


- La constante est significative car la p-value est inferieure a 0.05 (0,0038)
- Le coefficient associe à la variable NBFOYER n’ est pas significatif car p-
value(0,6652) > 0.05
- Le coefficient associe à la variable TAILLE est significatif car p-value(0,0316) <0.05
- Le coefficient associe à la variable REVENU est significatif car p-value(0,0127) <0.05
- Le coefficient associe à la variable MAISON n’ est pas significatif car p-value(0,4706)
>0.05
- Le coefficient associe à la variable PORTABLE est significatif car p-value(0,0007)
<0.05

3)- Calculons la probabilité qu'un ménage de 3 personnes en maison individuelle de revenu 10, de
taille d'habitation 1360 et ne possédant pas de climatiseur portable installe une climatisation.
Commenter.

5
Y* = - 12,04714 - 0,064585(3) + 0,001099(1360) + 1,158715(10) - 0,494055(1) - 1,806437(0) =
0.34684
P(Y=1/Xi) = 1/[1+ exp(-Y*)] = 1/[1+exp(-0.34684)] = 0.5859

Commentaires : Toutes choses égales par ailleurs, la probabilité pour qu’ un ménage de 3
personnes en maison individuelle de revenu 10, de taille d’ habitation 1360 et ne possédant pas
de climatiseur portable installe une climatisation est de 58.59%.

4)- Calculons l'effet marginal associé à la variable REVENU, au point moyen de l'échantillon, à
partir de l'estimation logit.

Effet Marginal de la variable revenu = 1,158715Λ(XiB)


Calucul de XiB a partir des moyennes des variables explicatives dans le tableau de statistiques
descriptives.
XiB = - 12,04714 + (- 0,064585* 3,1752) + 0,001099* 1367,6788 + 1,158715*9,3176 + (-
0,494055* 0,8467) -1,806437* 0,3942
XiB = -1,0831

Λ(XiB) = 1/[1+ exp(-XiB)] = 0.7471

Effet Marginal de la variable revenu = 1,158715*0.7471 = 0.8657


Commentaires : Toutes choses égales par ailleurs, la probabilité d’ installer une climatisation
augmente
de 86,57 point de pourcentage lorsque le revenu augmente d’ une unité.

5) Calculons l'effet marginal associé à la variable PORTABLE, au point moyen de l'échantillon.?


Etant donné que la variable PORTABLE est discrète, Effet Marginal de la variable PORTABLE
= P(Y=1/PORTABLE=1, Xi = moy) – P(Y=1 /PORTABLE =0)
P(Y=1/PORABLE=1, Xi = moy) = Λ(XiB / PORTABLE=1) = Λ( - 12,04714 + (- 0,064585*
3,1752) + 0,001099* 1367,6788 + 1,158715*9,3176 + (- 0,494055* 0,8467) -1,806437*1)= Λ(-
2.1774)
P(Y=1/PORABLE=1, Xi = moy) = 1/[1+ exp(2.1774)]= 0.1018

P(Y=1 /PORTABLE =0, Xi = moy) = Λ(XiB / PORTABLE=0) = Λ( - 12,04714 + (- 0,064585*


3,1752) + 0,001099* 1367,6788 + 1,158715*9,3176 + (- 0,494055* 0,8467)) = Λ(-0.371)
P(Y=1 /PORTABLE =0, Xi = moy) = 1/[1+ exp(0.371)]= 0.4083

Donc Effet Marginal PORTABLE = 0.1018 – 0.4083 = -0.3065

Que pouvez-vous dire de la substitution entre l'installation d'une climatisation et la climatisation


portable ?
Toutes choses égales par ailleurs, la probabilité d’ installer une climatisation diminue de 30,65
point de pourcentage lorsque le ménage est équipé d’ un climatiseur mobile.

6
DEUXIÈME PARTIE

1) Statistiques descriptives

1.1) Calculons la moyenne, l’écart-type, le minimum et le maximum pour l’ensemble des variables
continues du fichier de la base.
La moyenne , l’ecart-type , le minimum et le maximum pour l’ensemble des variable continue a été donnee
en utilisant la fonction summary et sd. Aussi, les resultats sont presentes dans le tableau suivant :

variable moyenne Ecart-type min Max


Age 44 8.6698 18 59
Sal 18615 7082.492 3678 35972

1.2) Calculons la moyenne, l’écart-type, le minimum et le maximum pour les variables continues selon le
type d’abonnement.

7
Abo=1
variable moyenne Ecart-type min Max
Age 44.39 9.628294 18 59
Sal 19418 6956.164 6296 35972

8
Abo==0
variable moyenne Ecart-type min Max
Age 40.27 6.752886 31 51
Sal 17654 7150.625 3678 35374

1.3) -Après avoir donné les principales statistiques descriptives, réalisons un tri à plat pour l’ensemble des
variables qualitatives.

Pour la variable sexe on a :

pour la variable classe sociale on a :

Pour la variable abo on a :

9
Pour la variable zau on a :

1.4) Faisons un tableau croisé (avec un test de corrélation) entre les variables d’abonnement et le sexe. En
déduire le pourcentage d’hommes et de femmes prêts à s’abonner.

Realisons le test de correlation

2) Creation de nouvelles variables


2.1)

10
11
2.2)Verifions

3) Estimation d’un modele logit


3.1) Estimation sans variable explicative (avec la constante seulement)
sur la variable caractérisant l’abonnement (variable d’origine)

en considerant la variable abo comme variable a expliquer , sans variable variable explicative,
le modele peut s’ecrire comme suit :
abo= avec, y*=c :le seuil de tolerance , c etant une constante
sur la variable caractérisant le non abonnement

12
en considerant la variable abo comme variable a expliquer , sans variable variable explicative,
le modele peut s’ecrire comme suit :

nabo= avec y*= c :le seuil de tolerance, c etant une constante

precisons les hypotheses retenues.


Les deux modeles etant des modeles logit , alors on gardera comme hypotheses :
1-E(ui)=0
2-V(ui)=
3-ui iid

Verifions que

Modele 2

13
3.2) Estimation avec variables explicatives

a) - 1 seule variable explicative : le sexe

14
b) Plusieurs variables

inclure dans la modélisation les variables associées au sexe, à la situation familiale, à la situation
professionnelle, à la zone d’habitation et

1er cas : à l’age et au salaire

2 eme cas : l’age et le salaire divisee par 1000

15
3eme cas: 3ième cas : à l’âge, l’âge au carré, au salaire divisé par 1000 et au salaire au carré divisé
par 100000

4ième cas : au logarithme de l’âge et au logarithme du salaire

Creation d enouvelle varibale

16
Estimation du modele

17
c) Estimer (sous R, ou sous Excel) la probabilité moyenne de s’abonner pour :  l’individu « moyen
» de référence (en précisant ses caractéristiques)

Considerons le modele estime pour le 3 eme cas

5) Estimation du modele probit

18
19
20
21

Vous aimerez peut-être aussi