Vous êtes sur la page 1sur 8

PREMIERE PARTIE : Dossier 1 : Tarification non linéaire

Exercice 1 : On s'intéresse à la distribution des revenus salariaux dans la population, en


fonction des secteurs d'activité. Les travailleurs sont répartis en 4 secteurs:

Secteur Effectif Moyenne des revenus


Industrie 1165 22.65
Services 582 16.64
Transport 333 19.51
Autres 1224 18.31
Tous secteurs 3304 19.67

Un analyste décide de traiter la variable "secteur d'activité" comme une explicative du revenu
:

où la variable de secteur est multinomiale et codée comme suit :

L'équation de régression estimée est :

1)- Calculer les moyennes des revenus par secteur à partir de cette estimation. Comparer
avec les données fournies. Que constatez-vous ?

Pour ce faire, nous allons utiliser le codage de la variable secteur notée ci-dessus. Alors,

E(REVENUi|SECTi=services) = 17.46 + 1.53(1) = 18.99

E(REVENUi|SECTi=transport) = 17.46 + 1.53(2) = 20.52

E(REVENUi|SECTi=industrie) = 17.46 + 1.53(3) = 22.05

E(REVENUi|SECTi=autres) = 17.46 + 1.53(1) = 17.46

On remarque que les moyennes des revenus par secteur que nous venons de calculer sont
différentes de celles inscrites dans le tableau ci-dessus. La variable SECT a été mal introduite
dans la régression. L’analyste aurait mieux fait de créer des variables dichotomiques (codées
en 0 et 1) pour chaque modalité.
2)- Quelle régression l'analyste aurait-il dû réaliser ? Quelle serait alors la valeur estimée des
paramètres de l'équation de régression ?

L’analyste aurait dû créer des variables dichotomiques avec chaque modalité de la variable
sect. Alors, le modèle à réaliser serait le suivant :

Revenui = 𝛽0 + 𝛽1*servicesi + 𝛽2*transporti + 𝛽3*industriei + 𝜀i , Ɐi=1,2,…,N.

On a enlevé la modalité ‘autres’ du modèle pour éviter des problèmes de multicolinéarité.

Supposons que l’analyste réalise une régression par les MCO. Alors, on a les paramètres à
estimer d’après ces calculs : 𝛽= (X’X)-1 X’Y
3304 582 333 1165
582 582 0 0
X’X= 333 0 333 0
1165 0 0 1165

0.000817 -0.000817 -0.000817 -0.000817


-0.000817 0.0025352 0.000817 0.000817
(X’X)-1 = -0.000817 0.000817 0.00382 0.000817
-0.000817 0.000817 0.000817 0.0016754

64989.68
9684.48
6496.83
Et X‘Y = 26387.25

18.32
-1.68
Après calculs, on obtient : 𝛽= 1.19
4.33

Alors, la droite estimée serait : 18.32 - 1.68*services + 1.19*transport + 4.33*industrie


Exercice 2 : Le ministère de la santé Russe s'intéresse à la consommation de boissons
alcoolisées et au moyen de la réduire par une politique de taxation. Les données suivantes
sont tirées d'un échantillon de 1078 familles russes enquêtées en 1993 :

• QVOD : quantité de vodka consommée par personne et par jour, en litres ;


• REVENU : revenu mensuel du ménage ramené au nombre de personnes adultes du
ménage, en 105 roubles ;
• PVOD : prix du litre de vodka au détail, en 102 roubles.

Les statistiques descriptives sur l'échantillon sont les suivantes :

Variable Moyenne Ecart-type Min. Max.


QVOD 0.7209 0.5768 0.0285 2.8571
PVOD 0.3727 0.4598 0.1200 5.4000
REVENU 0.0326 0.0298 0.0001 0.2866

La quantité de vodka consommée est inobservée pour l'économètre, mais un indicateur de


consommation ‘excessive’ est connu. On note cette variable Y, où Y est égale à 1 si QVOD >1
(plus d'un litre par jour et par personne) et 0 sinon.

1)- Un modèle à probabilité linéaire (qui est un modèle de MCO réalisé sur une variable
dichotomique) est estimé et les résultats sont les suivants.
Variable Estimation Ecart-type t de Student p-value
Constante 0.2461 0.0208 11.83 0.0001
REVENU 0.5009 0.4190 1.19 0.2322
PVOD -0.1289 0.0273 -4.71 0.0001

Caractéristiques de la base de données


• Population : 1078 familles russes enquêtées en 1993.
• Variables :
o qvod : quantité de vodka consommée par personne et par jour, en litres ;
o revenu : revenu mensuel du ménage ramené au nombre de personnes adultes
du ménage, en 105 roubles ;
o pvod : prix du litre de vodka au détail, en 102 roubles.

La quantité de vodka consommée (qvod) est inobservée par le chercheur, mais un indicateur
de consommation ‘excessive’ est connu.

On note cette variable Y, où Y=1 si qvod >1.


Les résultats ont été obtenues en estimant un modèle linéaire par les MCO.
Alors l’estimation donne le résultat suivant:
yi = 0.2461+0.5009*revenu-0.1289*pvod
On remarque que la variable revenu n’a pas d’effet sur la variable a expliquer. Tandis que la
variable pvod a un effet négatif.

1.1)- Calculer la probabilité prédite associée à Y à la moyenne des régresseurs.

Proba=0.2461 +0.5009(0.0326) - 0.1289(0.3727) = 0.2144

Donc, la probabilité prédite associée a la moyenne des régresseurs est de 21.44%.

1.2)- Calculer la probabilité prédite associée à Y la plus faible.

Proba= 0.2461+0.5009(0.0001) - 0.1289(5.4000) = -0.4499

1.3)- Calculer la probabilité prédite associée à Y la plus forte.

Proba= 0.2461+0.5009(0.2866) - 0.1289(0.1200) = 0.3741

Donc, la probabilité prédite associée a Y la plus forte est de 37.41%.

1.4)- Que constatez-vous ?

La probabilité prédite associée a Y la plus faible est négative. Cela est absurde.

1.5)-Calculer la probabilité qu'un ménage de 2 adultes avec un revenu total égal à 10 000
roubles achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre.

Ramenons les variables revenu et pvod a 105 et 102 respectivement :

revenu= (10000)/(2*100000)=0.05

pvod= (45)/(100) = 0.45

Alors, la probabilité est de :

Proba= 0.2461 + 0.5009(0.05) - 0.1289(0.45) = 0.2131

Donc, la probabilité qu'un ménage de 2 adultes avec un revenu total égal à 10 000 roubles
achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre est de 21.31%.
2)- On estime la probabilité que Y = 1 par un modèle Logit, dont les résultats sont :
Variable Estimation Ecart-type t de Student p-value
Constante -0.1721 0.2334 -0.73 0.4609
REVENU 5.9483 2.6182 2.27 0.0231
PVOD -4.7353 0.8899 -5.32 0.01

2.1)- Ecrire avec précision le modèle estimé ainsi que la fonction de vraisemblance associée
à ce modèle.

Le modèle estimée est : -0.1721+ 5.9483*revenu-4.7353*pvod

1 𝑒 𝑋𝑖β
La fonction de vraisemblance associée au modèle est : L(𝛽)= ∏1078
𝑖=1 ( )y (
𝑋𝑖β i
)1-yi
1+𝑒 1+ 𝑒 𝑋𝑖β

2.2)- Calculer la probabilité que le ménage décrit à la question 1.5 achète plus de 1 litre de
vodka.
On a : Xi𝛽̂ = -0.1721+5.9483(0.05)-4.7353(0.45)
 Xi𝛽̂ =-2.0056
Alors,
1
P(yi=1|Xi)= ⋀(−2.0056) =
1+ 𝑒 −(−2.0056) = 0.1186

Donc, la probabilité qu'un ménage de 2 adultes avec un revenu total égal à 10 000 roubles
achète plus de 1 litre de vodka par jour au prix de 45 roubles par litre est de 11.86%.

2.3)- Calculer l'effet marginal associé à la variable revenu pour un ménage vérifiant les
caractéristiques définies en 2.2.
On sait que : EMrevenu = 𝛽̂ revenu ∗ 𝜆(𝑥𝑖𝛽̂ ) = 5.9483* 𝜆(−2.0056)
𝑒 −2.0056
 EMrevenu = 5.9483 * ( )= 0,6219
(1+𝑒 −2.0056 )2
Commentaires
Pour un ménage de 2 adultes avec un revenu total égal à 10 000 roubles, la probabilité d’
acheter plus de 1 litre de vodka par jour au prix de 45 roubles par litre va augmenter de 62.19
points de pourcentage suite à une augmentation du revenu.
Exercice 3 : Vous cherchez à estimer la probabilité d'installation d'une climatisation à partir
d'un échantillon de ménages.

Les variables en votre possession sont les suivantes :

• CENTRAL : indicatrice égale à 1 si le ménage est équipé d'une climatisation.


• PORTABLE : indicatrice égale à 1 si le ménage est équipé d'un climatiseur mobile.
• REVENU : revenu annuel du ménage exprimé en logarithme.
• NBFOYER : nombre de personnes du ménage.
• TAILLE : surface de l'habitation.
• MAISON : indicatrice égale à 1 si le ménage réside en logement individuel.

L'objectif de cette étude est d'étudier l'impact des variables socioéconomiques relatives au
ménage sur la probabilité d'installer une climatisation (central).

Les statistiques descriptives associées à cet échantillon sont les suivantes :


moyenne écart-type minimum maximum
NBFOYER 3,1752 1,6787 1 11
TAILLE 1367,6788 659,0316 216 4200
REVENU 9,3176 0,7383 7,2079 11,1664
MAISON 0,8467 0,3603 0 1
PORTABLE 0,3942 0,4887 0 1

Les estimations réalisées à l'aide d'un modèle logit donnent les résultats suivants :
coefficient t-statistic probabilité
constante - 12,04714 - 2,898415 0,0038
NBFOYER - 0,064585 - 0,432709 0,6652
TAILLE 0,001099 2,149067 0,0316
REVENU 1,158715 2,492847 0,0127
MAISON - 0,494055 - 0,721558 0,4706
PORTABLE - 1,806437 - 3,374169 0,0007

1)- Ecrire le modèle estimé.

Modèle à estimer

1 si Zi*=Xi𝜆 + ui ≥ 0
yi =
0 si Zi*=Xi𝜆 + ui ˂ 0
Caractéristiques de la base de données
• Population : Ménages
• Variables :
o portable : 1= ménage est équipé d'un climatiseur mobile, 0 sinon.
o revenu : revenu annuel du ménage exprimé en logarithme.
o nbfoyer : nombre de personnes du ménage.
o taille : surface de l'habitation.
o maison : 1= ménage réside en logement individuel, 0 sinon.

Les résultats ont été obtenues en estimant un modèle Logit.


Alors l’estimation donne le résultat suivant:
yi = -12.0471 - 0.0645*nbfoyer + 0.0011*taille + 1.1587*revenu - 0.4941*maison -
1.8064*portable

2)- Commenter avec précision les résultats obtenus.

Nos commentaires se feront à partir des comparaisons des t-stats a 1.96 (t-tabulé au seuil de
5%)
▪ portable : coefficient négatif et significatif. Toutes choses étant égales par ailleurs, la
probabilité d’installer un climatiseur diminue si le ménage possède un climatiseur
mobile.
▪ revenu : Effet significatif. Toutes choses étant égales par ailleurs, la probabilité
d’installer un climatiseur augmente avec le revenu du ménage.
▪ nbfoyer : coefficient négatif et non significatif. Toutes choses étant égales par ailleurs,
le nombre de personnes du ménage n’a aucun effet sur la probabilité d’installer un
climatiseur.
▪ taille: Effet significatif de la variable liée a la surface de l’habitation. Toutes choses
étant égales par ailleurs, la probabilité d’installer un climatiseur augmente avec la
surface de l’habitation.
▪ maison : coefficient négatif et non significatif. Toutes choses étant égales par ailleurs,
le mode de logement (individuel ou non) n’a aucun effet sur la probabilité d’installer
un climatiseur.

3)- Calculer la probabilité qu'un ménage de 3 personnes en maison individuelle de revenu 10,
de taille d'habitation 1360 et ne possédant pas de climatiseur portable installe une
climatisation. Commenter.

ŷi = Xi𝛽̂  ŷi = -12.0471- 0.065(3) + 0.0011(1360) + 1.1587(10) – 0.4941(1) – 1.8064(0)

 ŷi = 0.348

Alors, la probabilité d’installer un climatiseur est de :


1
⋀(0.35) = = 0.5861
1+ 𝑒 −0.348

Commentaires
Pour un ménage composé de 3 personnes, de revenu 10, vivant en maison individuelle de
surface d’habitation de 1360 et ne possédant pas de climatiseur portable est de 58.61%.

4)- Calculer l'effet marginal associé à la variable REVENU, au point moyen de l'échantillon, à
partir de l'estimation Logit. Utilise pour cela les moyennes des variables explicatives dans le
tableau de statistiques descriptives. Commenter.

On a : xi𝛽̂ = -12.0471- 0.065(3.1752) + 0.0011(1367.6788) + 1.1587(9.3176) –


0.4941(0.8467) – 1.8064(0.3942)
 xi𝛽̂ = -1.0819
Alors, EMrevenu = 𝛽̂ revenu∗ 𝜆(𝑥𝑖𝛽̂ )
𝑒 −1.0819
 EMrevenu = 1.1587 * ( )= 0,2192
(1+𝑒 −1.0819 )2
Commentaires
Pour un ménage moyen, la probabilité d’installer un climatiseur va augmenter de 21.91points
de pourcentage suite à une augmentation du revenu moyen d’une unité (passe de 9.3176 à
10.3176).

5)-Calculer l'effet marginal associé à la variable PORTABLE, au point moyen de l'échantillon.


Que pouvez-vous dire de la substitution entre l'installation d'une climatisation et la
climatisation portable ?

EMportable = ⋀(𝑐𝑒𝑛𝑡𝑟𝑎𝑙 = 1|𝑝𝑜𝑟𝑡𝑎𝑏𝑙𝑒 = 1, 𝑎𝑢𝑡𝑟𝑒𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑓𝑖𝑥𝑒 𝑎 𝑙𝑎 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 ) - ⋀(𝑐𝑒𝑛𝑡𝑟𝑎𝑙 =


1|𝑝𝑜𝑟𝑡𝑎𝑏𝑙𝑒 = 0, 𝑎𝑢𝑡𝑟𝑒𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑓𝑖𝑥𝑒 𝑎 𝑙𝑎 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 )

EMportable = ⋀(−2.1759) - ⋀(−𝑜. 3711) = 0.1019-0.4087

EMportable = -0.3068

Commentaires.
Ainsi, toutes choses étant égales par ailleurs, pour un ménage moyen, posséder un
climatiseur portable diminue de 30.68 points de pourcentage la probabilité d’installer un
climatiseur.

Vous aimerez peut-être aussi