Vous êtes sur la page 1sur 62

Econométrie des Variables Qualitatives. Cours C.

Hurlin 1

Maîtrise d’Econométrie

Université d’Orléans

Econométrie des Variables Qualitatives

Polycopié d’Exercices Corrigés

Christophe HURLIN

Année Universitaire 2004-2005


Université d’Orléans - Maitrise d’Econométrie
Econométrie des Variables Qualitatives
Examen Terminal Decembre 2003. C. Hurlin

Exercice 1 (12 points) : Modèle Tobit Simple Censuré


Le but de cet exercice est d’évaluer l’impact d’une action marketing sur le chiffre d’affaire d’une société
de cosmétique. Cette société dispose pour cela de données d’enquête concernant la consommation annuelle
du type de produit cosmétique concerné, notées ci , récoltées auprès d’un échantillon de 10 000 individus.
Pour chaque individu, indicé i, on dispose d’observations concernant:

• son revenu annuel moyen désigné par la variable ri , exprimé en milliers d’euros
• le prix moyen des biens en euros relevé à partir des différents achats effectués par l’individu i, noté pi .
• s’il a été ou non l’objet dans l’année d’une opération marketing. La variable dichotomique correspon-
dante est codée mi = 1 s’il y a une action marketing et mi = 0 sinon.
• la catégorie socio-professionnelle (CSP) de l’individu représentée par une variable polytomique si codée
respectivement 1 pour ”chômeurs”, 2 pour un statut ”cadres et cadres supérieurs, 3 pour ”retraités”
et 0 pour le statut ”ouvriers et employés” qui sera considéré comme référence.

On considère alors le modèle tobit simple censuré suivant :


 ∗
ci si c∗i > 0
ci = (1)
0 si c∗i ≤ 0

où ci désigne une variable inobservable telle que :

c∗i = β 0 + β 1 ri + β 2 pi + β 3 mi + β 4 si + εi (2)
 
où εi est N.i.d. 0, σ 2ε .

Partie I : Analyse de la spécification et modèle probit (7 points)


Question 1 (2 points) : (i) Précisez le signe attendu des paramètres théoriques β j , j = 0, 1, 2, 3 en
justifiant économiquement votre réponse. Que peut on conclure quant au signe de β 4 ? On définit des
(j)
variables dichotomiques cspi associées à la CSP de l’individu i :

(j) 1 si si = j
cspi = j = 0, 1, 2, 3, i = 1, .., N
0 sinon

(ii) Proposez une écriture du modèle (2) en substituant la variable si par autant de variables di-
(j)
chotomiques cspi qu’il est nécessaire et commentez les signes des coefficients γ j associés à ces vari-
ables.
Question 2 (1.5 points) : On construit une variable dichotomique zi valant 1 si la consommation observée
de l’individu i est strictement positive et 0 dans le cas contraire. Dérivez la probabilité que l’agent i
consomme effectivement un produit cosmétique de cette gamme en fonction des vecteurs de paramètres
β = ( β 1 β 2 β 3 ) et γ = (γ 1 γ 2 γ 3 ) , d’une constante θ et de la variance des résidus σ 2ε .
Question 3 (1.5 points) : Les paramètres du modèle probit associé à la probabilité de consommer ont été
estimés à partir des 10 000 individus de l’échantillon par maximum de vraisemblance. Le résultat de
ces estimations est reproduit sur la figure (1). Commentez ces résultats.
Figure 1: Résultats d’Estimation du Modèle Probit

Question 4 (2 points) : On s’intéresse au sous échantillon des individus appartenant à la CSP ”cadres
et cadres supérieurs”. On suppose que le revenu moyen annuel de ces individus est de 20000 euros,
que le prix moyen de leurs achats est de 30 euros. Calculez pour l’individu moyen de cette CSP, la
déformation de la probabilité d’achat imputable à l’action marketing.

Partie II : Modèle Tobit (5 points) Les résultats d’estimation par maximum de vraisemblance du
modèle tobit simple censuré sont reportés sur la figure (2). On admet que l’estimateur du maximum de
vraisemblance est convergent. On note
k l
(1) (2) (3)
xi = 1 ri pi mi cspi cspi cspi
(1,K)

Υ = (θ β 1 β 2 β 3 γ 1 γ 2 γ 3 )
(K,1)

Question 1 (1.5 points) : On considère l’individu moyen de la CSP des ”cadres et cadres supérieurs”
(2)
(cspi = 1) pour lequel on rappelle que ri = 20 et p = 30. Calculez pour cet individu une prévision
du niveau de consommation potentiel E (c∗i /xi ) en l’absence d’action marketing, puis refaites le même
calcul en cas d’action marketing. Quelle est alors la variation de consommation potentielle c∗i imputable,
toutes choses égales par ailleurs, à ce type d’action marketing ?
Question 2 (1.5 points) : La société X vous demande d’évaluer (toujours pour le même individu moyen)
la variation de la consommation effective imputable à l’action marketing. Vous calculerez pour cela
la prévision de la variable dépendante E (ci /xi ) avec ou sans action marketing, et vous en déduirez la
variation consommation effective imputable à cette action marketing.

2
Figure 2: Estimation du Modèle Tobit

Question 3 (2 points) : Déterminez l’effet marginal associé au revenu ri et décomposez cet effet marginal
en un effet sur la probabilité de consommer et un effet sur le montant de consommation lorsque cette
dernière est observable (McDonald1 et Moffit 1980). Appliquez cette décomposition à l’individu moyen
de la CSP ”cadres et cadres supérieurs” en l’absence d’action marketing.

1 McDonald, J. and R. Moffitt (1980) ”The Uses of Tobit Analysis”, Review of Economic and Statistics, 62, pp. 318-321

3
Exercice 2 (10 points) : Modèle de déséquilibre
On cherche dans le cadre de cet exercice à construire la log-vraisemblance associée à un modèle de
déséquilibre suivant la méthodologie proposée par Nelson et Maddala (1974)2 . Ce type de modèle se classe
dans la famille des modèles à régime inobservable et présentent de fortes similarités avec les modèles Tobit
censurés.

Les modèles de déséquilibre sont fondés sur l’idée selon laquelle les prix ne s’ajustent qu’imparfaitement
et qu’ils ne peuvent à tout moment équilibrer l’offre et la demande sur le marché étudié (Benassy 19763 ).
On note Dt la demande qui dépend d’un ensemble de facteurs X1,t et St l’offre supposée dépendre d’un
ensemble de facteurs X2,t .
Dt = X1,t β 1 + ε1,t (3)
St = X2,t β 2 + ε2,t (4)
K
où ε1,t et ε2,t désignent les résidus des deux régimes, β i ∈ R pour i = 1, 2 et où les variables explicatives X1,t
et X2,t sont continues et observables. En revanche, on suppose que l’offre et la demande sur le marché
ne sont pas directement observables. En l’absence d’ajustement des prix, la règle nous permet toutefois
de postuler que la quantité effectivement échangée sur le marché notée Qt , qui est observable,
correspond au minimum de l’offre et la demande.

Qt = min (Dt , St ) (5)

Ainsi par exemple, on observe la demande (Qt = Dt ) dans le cas d’un régime de demande c’est à
dire lorsque Dt < St . On suppose pour simplifier que le vecteur des résidus εt = (ε1,t ε2,t ) est i.i.d. et
normalement distribué N (0, Ω) , avec :
 2 
σ1 0
Ω = E (εt εt ) = (6)
0 σ 22

On cherche ici à construire la log-vraisemblance associée à un échantillon de T observations q = (q1 , .., qT )


 
et x = (x1 , ..., xT ) avec x = (x1,t x2,t ) pour un ensemble de paramètres θ = β 1 β 2 σ21 σ 22 .
T
[
h (θ) = L (θ, q, x) =
L log [fQt (qt , θ)] (7)
t=1

où fQt (qt , θ) désigne la densité marginale de Qt associée à une observation qt . A partir de cette vraisemblance,
Nelson et Maddala (1974) construisent des estimateurs du maximum de vraisemblance des paramètres β.

Les questions peuvent être traitées indépendamment les unes des autres en utilisant les résultats fournis.

On cherche tout d’abord à construire la densité marginale fQt (qt , θ), notée fQt (qt ) pour simplifier les
notations, à la base de la construction de la log-vraisemblance. Pour cela, on admet que :

fQt (qt ) = f Qt |Dt <St (qt ) + f Qt |St <Qt (qt ) (8)

où f Qt |Dt <St (qt ) désigne la densité marginale de Qt sous l’hypothèse Dt < St et f Qt |St <Qt (qt ) désigne la
densité marginale de Qt sous l’hypothèse St < Dt . On note gDt ,St (dt , st ) la densité jointe de Dt et St pour
des réalisations respectives dt et st de la demande et de l’offre.

Question 1 (3 points) : En remarquant que la densité marginale de la demande Dt s’écrit :


] ∞
fDt (dt ) = gDt ,St (dt , z) dz
−∞
2 Nelson, F.D,.et Maddala, G.S., (1974), “Maximum Likelihood Methods for Models of Markets in Disequilibrium”, Econo-
metrica, 42, No. 6, November, pp. 1013-1030.
3 Benassy, J.P. (1976), ”Macroéconomie et théorie du déséquilibre”, Dunod

4
montrez que la densité marginale de la quantité Qt lorsque Dt < St s’écrit sous la forme :
] ∞
f Qt |Dt <St (qt ) = gDt ,St (dt , z) dz (9)
qt =dt

et que de façon symétrique :


] ∞
f Qt |St <Dt (qt ) = gDt ,St (z, st ) dz (10)
qt =st

Question 2 (2 points) : En reprenant la définition de la densité marginale d’un vecteur de variables


normales, montrez que la densité jointe gDt ,St (dt , st ) des variables Dt et St s’écrit :
%  2 & %  2 &
1 1 qt − x1,t β 1 1 1 st − x2,t β 2
gDt ,St (dt , st ) = √ exp − ×√ exp − (11)
2πσ 1 2 σ1 2πσ2 2 σ2

Question 3 (3 points) : A partir des résultats des questions 1 et 2, montrez que la densité marginale de la
quantité échangée Qt lorsque l’on est en régime de demande Dt < St peut s’écrire sous la forme :
  ] ∞ %  2 &
1 qt − x1,t β 1 1 1 z − x2,t β 2
f Qt |Dt <St (qt ) = φ ×√ exp − dz
σ1 σ1 2πσ2 qt 2 σ2

où φ (.) désigne
 la fonction
 de densité de la loi normale centrée réduite. En posant un changement de
variable zh = z − x2,t β 2 /σ 2 , avec dz = dh
z σ 2 , montrez que cette expression se ramène à :
   
1 qt − x1,t β 1 x2,t β 2 − qt
f Qt |Dt <St (qt ) = φ ×Φ (12)
σ1 σ1 σ2

où Φ (.) désigne la fonction de répartition de la loi normale centrée réduite.

Question 4 (2 points) : On admet que de façon, symétrique


   
1 qt − x2,t β 2 x1,t β 1 − qt
f Qt |St <Qt (qt ) = φ ×Φ (13)
σ2 σ2 σ1

Montrez que la log-vraisemblance du modèle de déséquilibre s’écrit alors :


T
[         
1 qt − x1,t β 1 x2,t β 2 − qt 1 qt − x2,t β 2 x1,t β 1 − qt
h (θ) =
L log φ ×Φ + φ ×Φ
t=1
σ1 σ1 σ2 σ2 σ2 σ1

Que devient cette expression lorsque σ1 tend vers 0 ? Quels problèmes cela pose-t-il en termes d’opti-
misation numérique lorsque l’on cherche à déterminer l’estimateur du maximum de vraisemblance des
paramètres ?

5
Université d’Orléans - Maitrise Econométrie
Econométrie des Variables Qualitatives
Correction Examen Terminal Décembre 2003. C. Hurlin

Exercice 1 (12 points) : Modèle Tobit Simple Censuré

Partie I : Modèle Probit (7 points)


Question 1 : Dans le modèle, la variable c∗i désigne la consommation potentielle. On s’attend donc à ce
que la consommation incompressible vérifie β 0 > 0, on s’attend à ce que la consommation augmente
avec le revenu de l’agent (β 1 > 0), qu’elle diminue avec le prix moyen des bien (β 2 < 0) et que les
actions de marketing augmentent ou au pire laissent inchangée la consommation (β 3 ≥ 0) (0.5 point)
On ne peut pas conclure quant au signe de β 4 . Il faut donc définir 3 variables dummy:

(j) 1 si si = j
cspi = j = 1, 2, 3, i = 1, .., N
0 sinon
(0)
On n’introduit ici que 3 variables dummy, la référence cspi n’étant pas introduite. Soit γ j le paramètre
(j)
associé à cspi . Le modèle devient alors :
(1) (2) (3)
c∗i = θ + β 1 ri + β 2 pi + β 3 mi + γ 1 cspi + γ 2 cspi + γ 3 cspi + εi (1)

où θ désigne une constante différente de β 0 . On s’attend alors à ce que la situation ”chômeur” conduise
à une consommation moindre par rapport à la référence ”ouvrier et employé” (γ 1 < 0), qu’au contraire
les deux autres cas (”cadres et cadres supérieurs”, et ”retraités”) conduisent à une consommation plus
forte toutes choses égales par ailleurs : γ 2 > 0 et γ 3 > 0 (1.5 point)
Question 2 : On pose une variable zi telle que :

1 si ci > 0
zi = (2)
0 sinon

La probabilité que l’agent consomme effectivement est alors égale à :

P rob (zi = 1) = P rob (c∗i > 0)


 
(1) (2) (3)
= P rob εi > −θ − β 1 ri − β 2 pi − β 3 mi − γ 1 cspi − γ 2 cspi − γ 3 cspi
 
(1) (2) (3)
= 1 − P rob εi < −θ − β 1 ri − β 2 pi − β 3 mi − γ 1 cspi − γ 2 cspi − γ 3 cspi
 
(1) (2) (3)
= P rob εi < θ + β 1 ri + β 2 pi + β 3 mi + γ 1 cspi + γ 2 cspi + γ 3 cspi

On en déduit que cette probabilité s’écrit sous la forme :


 
(1) (2) (3)
P rob (zi = 1) = Φ θ + β 1 ri + β 2 pi + β 3 mi + γ 1 cspi + γ 2 cspi + γ 3 cspi (3)

où Φ (.) désigne la fonction de répartition de la loi normale centrée réduite (1.5 points).
Question 3 : On observe tout d’abord que l’algorithme de maximisation de la vraisemblance a convergé
et que les paramètres sont tous significatifs à l’exception de la constante pour un risque de première
espèce de 5% (0.5 point). Le modèle est globalement significatif (LR-test) et semble très correct au sens
du R2 de McFadden. Conformément à l’intuition économique, une hausse du revenu tend à accroître
la probabilité de consommation tandis qu’une hausse du prix moyen semble diminuer cette probabilité.
L’action marketing tend toutes choses égales par ailleurs à augmenter la probabilité de consommer.
Enfin, on vérifie que par rapport à la CSP de référence (ouvrier et employé), la CSP ”cadre” augmente
la probabilité tout comme l’appartenance à la CSP ”retraité”. Inversement, l’appartenance à la CSP
”Chômeur” diminue la probabilité d’acheter (1 point).
Question 4 : Considérons l’individu moyen cadre (csp(1) = csp(3) = 0 et csp(2) = 1) qui gagne en moyenne
r = 20 (attention la variable r est exprimée en milliers d’euros) et pour lequel p = 30. Sans action
marketing (m = 0), son index est alors égal à :

index = 3.199342216 ∗ R − 2.34606849 ∗ P + 5.624149321 + 0.392022012 = −0.3790

La probabilité d’achat pour cet individu est alors égale à 0.3523. Dans le cas où cet individu a été
l’objet d’une action marketing (m = 1) son index passe à :

index = 3.199342216 ∗ R − 2.34606849 ∗ P + 1.507599386 ∗ M + 5.624149321 + 0.392022012 = 1.1286

La probabilité associée passe alors à 0.8705, soit une différence de probabilité toutes choses égales par
ailleurs de 0.5182 (2 points).

Partie II : Modèle Tobit (5 points)


Question 1 : On sait que la prévision de la variable latente dans le modèle tobit s’écrit :

E (c∗i /xi ) = xi Υ

Dès lors, en l’absence d’action marketing (mi = 0) on a :

e = 0.492956823 + 1.600256402 ∗ R − 1.198180892 ∗ P + 0.7886033013 ∗ M + 2.771210716


xi Υ

La prévision est alors égale à :


E (c∗i /xi , mi = 0) = −0.6761 (4)
Etant donné que nous évaluons ici la consommation potentielle, il est possible d’obtenir une quantité
négative. Dans le cas d’une action marketing, la prévision vaut :

E (c∗i /xi , mi = 1) = 0.1125 (5)

Ainsi, toutes choses égales par ailleurs la variation de la consommation potentielle imputable à l’action
marketing est égale à:
E (c∗i /xi , mi = 1) − E (c∗i /xi , mi = 0) = 0.7886 (6)

Question 2 : On sait que la prévision de la variable dépendante s’écrit dans ce cas :


# $ # $
e
xi Υ e
xi Υ
E (ci /xi ) = Φ e eε φ
xi Υ + σ

σ eε
σ

Ainsi, en l’absence d’action marketing (mi = 0) on a :


   
−0.6761 −0.6761
E (ci /xi , mi = 0) = Φ eε φ
(−0.6761) + σ = 0.0991

σ eε
σ

Avec action marketing (mi = 1) on a :


   
0.1125 0.1125
E (ci /xi , mi = 1) = Φ eε φ
0.1125 + σ = 0.2649

σ eε
σ

Ainsi, l’accroissement de consommation effective est de 0.1658.

2
Question 3 : Selon la décomposition de McDonald et Moffit (1980), la variation du revenu ri a deux effets
sur la prévision de la variable dépendante ci :
∂E ( ci / xi ) ∂E ( ci / xi , ci>0 ) ∂P rob (ci > 0)
= P rob (ci > 0) + E ( ci / xi , ci>0 )
∂ri ∂ri ∂ri
D’une part, la variation de ri modifie l’espérance conditionnelle de ci dans la partie positive de la
distribution. D’autre part, la variation de ri affecte la probabilité que l’observation ci appartienne à
cette partie de la distribution. On, montre que cette décomposition peut se réécrire sous la forme :
      
∂E ( ci / xi ) xi Υ xi Υ xi Υ xi Υ
=Φ β 1 1 − λi + λi
∂ri σε σε σε σε
   
xi Υ xi Υ xi Υ
+β 1 φ + λi
σε σε σε

On sait que si mi = 0, on a xi Υ e = −0.6761 et β e1 = 1.60. Ainsi, ici il vient :


# $ + # $% # $&,
∂E ( ci / xi , ci>0 ) e
xi Υ e
xi Υ e
xi Υ e
xi Υ
P rob (ci > 0) =Φ e
β 1 1 − λi + λi
∂ri eε
σ eε
σ eε
σ eε
σ
      
−0.6761 −0.6761 −0.6761 −0.6761
=Φ × 1.60 × 1 − λi + λi
0.5012 0.5012 0.5012 0.5012
= 0.0231
De la même façon on a :
# $% # $&
∂P rob (ci > 0) e e
xi Υ e
xi Υ e
xi Υ
E ( ci / xi , ci>0 ) = β1φ + λi
∂ri eε
σ eε
σ eε
σ
   
−0.6761 −0.6761 −0.6761
= 1.60 × φ + λi
0.5012 0.5012 0.5012
= 0.1188
On a donc un effet plus fort du revenu sur la probabilité d’obtenir une consommation positive que sur
l’espérance conditionnelle de la consommation sur sa partie quantitative.

Exercice 2 (8 points) : Modèle de déséquilibre

Question 1 (3 points) : On sait que la densité marginale de la demande Dt s’écrit :


] ∞
fDt (dt ) = gDt ,St (dt , z) dz
−∞

Lorsque Dt < St , on sait alors que Qt = min (Dt , St ) = Dt . Par conséquent, si Dt < S la densité
marginale de Qt correspond à celle de Dt . Mais le domaine sur lequel on intègre la fonction de densité
jointe gDt ,St (dt , z) en z n’est pas alors défini de −∞ à +∞. Puisque l’on intègre sur les niveaux d’offre
st = z, ceux si doivent vérifier la contrainte z > dt pour chaque observations st comme on le voit sur
le graphique ci-dessous. Ainsi, on montre aisément que l’on a :
] ∞
f Qt |Dt <St (qt ) = gDt ,St (dt , z) dz (7)
qt =dt

puisque l’on intègre uniquement pour des valeurs de l’offre st = z supérieures à l’observation dt .
Naturellement de façon symétrique :
] ∞
f Qt |St <Dt (qt ) = gDt ,St (z, st ) dz (8)
qt =st

3
Figure 1: Densité jointe gDt ,St (dt , st ) pour un niveau donné dt

1.4

1.2

g(dt,st)
0.8

0.6

0.4

st >dt
0.2

dt
0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
st

Question 2 (2 points) : Alors on sait que sous nos hypothèses le vecteur Zt = (Dt St ) suit une loi normale
contrée sur (X1,t β 1 X2,t β 2 ) et de matrice de variance covariance égale à Ω. On en déduit que :
%    &
1 1 dt − x1,t β 1 dt − x β
gDt ,St (dt , st ) = s exp − Ω−1 1,t 1
2π det (Ω) 2 st − x2,t β 2 st − x2,t β 2
%    2 −1  &
1 1 dt − x1,t β 1 σ1 0 dt − x1,t β 1
= s exp −
2π det (Ω) 2 st − x2,t β 2 0 σ22 st − x2,t β 2

On montre ainsi que :


+ % 2  2 &,
1 1 dt − x1,t β 1 st − x2,t β 2
gDt ,St (dt , st ) = exp − +
2πσ1 σ 2 2 σ1 σ2
%  2 & %  2 &
1 1 dt − x1,t β 1 1 st − x2,t β 2
= exp − × exp −
2πσ1 σ 2 2 σ1 2 σ2
%  2 & %  2 &
1 1 qt − x1,t β 1 1 1 st − x2,t β 2
= √ exp − ×√ exp −
2πσ1 2 σ1 2πσ2 2 σ2

Question 3 (3 points) : A partir des résultats des questions 1, on sait que


] ∞
f Qt |Dt <St (qt ) = gDt ,St (dt , z) dz (9)
qt =dt

En utilisant l’expression de la densité jointe de la question 2, il vient :


] ∞ %  2 & %  2 &
1 1 qt − x1,t β 1 1 1 z − x2,t β 2
f Qt |Dt <St (qt ) = √ exp − ×√ exp − dz
qt 2πσ1 2 σ1 2πσ 2 2 σ2
%  2 & ] ∞ %  2 &
1 1 qt − x1,t β 1 1 1 z − x2,t β 2
= √ exp − × √ exp − dz
2πσ1 2 σ1 qt 2πσ 2 2 σ2
  ] ∞ %  2 &
1 qt − x1,t β 1 1 1 z − x2,t β 2
= φ ×√ exp − dz
σ1 σ1 2πσ2 qt 2 σ2

4
On vérifie que l’on a alors :
  ] %  2 &
qt − x1,t β 1 ∞ z − x2,t β 2
1 1 1
f Qt |Dt <St (qt ) = φ ×√ exp − dz (10)
σ1 σ1 2πσ2 qt 2 σ2
 
Posons un changement de variable zh = z − x2,t β 2 /σ 2 , avec dz = dh z σ 2 , il vient pour le deuxième
terme du produit :
] ∞ %  2 & ] ∞ # $
1 1 z − x2,t β 2 1 zh2
√ exp − dz = √ exp − dh
z σ2
2πσ 2 qt 2 σ2 2πσ2 h qt 2
] ∞ # $
1 zh 2
= √ exp − dhz
2π h qt 2
 
avec qht = qt − x2,t β 2 /σ2 . Donc cette intégrale peut s’exprimer en fonction de Φ (.) comme suit :
] %  2 &
∞ z − x2,t β 2
1 1
√ exp − qt ) = Φ (−h
dz = 1 − Φ (h qt )
2πσ2 qt 2 σ2

Finalement on a bien :
   
1 qt − x1,t β 1 x2,t β 2 − qt
f Qt |Dt <St (qt ) = φ ×Φ (11)
σ1 σ1 σ2

Question 4 (2 points) : On admet que :


   
1 qt − x2,t β 2 x1,t β 1 − qt
f Qt |St <Qt (qt ) = φ ×Φ (12)
σ2 σ2 σ1

Nous avions vu que :


T
[ T
[  
h (θ) =
L log [fQt (qt , θ)] = log f Qt |Dt <St (qt ) + f Qt |St <Qt (qt )
t=1 t=1

En substituant ces deux termes par leurs expressions, on montre que :


T
[         
1 qt − x1,t β 1 x2,t β 2 − qt 1 qt − x2,t β 2 x1,t β 1 − qt
h (θ) =
L log φ ×Φ + φ ×Φ
t=1
σ1 σ1 σ2 σ2 σ2 σ1
(13)

5
Université d’Orléans - Maitrise d’Econométrie
Econométrie des Variables Qualitatives
Novembre 2003. C. Hurlin

Exercice 1 : Le choix d’un médecin (12 points)

Supposons que dans un village, les consommateurs ont le choix entre deux médecins indicés
m = 1 et m = 2. Si le consommateur i consulte le médecin m, son utilité est :

Ui,m = γ m + Xi β − α pm + εi,m i = 1, ......, N m = 1, 2. (1)


 
où εi,m est i.i.d. 0, σ 2ε et où les variables pm , Xi désignent respectivement :

• pm le prix de la consultation chez le médecin m = 1, 2

• Xi , le vecteur de dimension (1, K) de caractéristiques individuelles du consommateur i

• (γ 1 , γ 2 ) ∈ R2+ , α∈ R+ et β = (β 1 , .., β K ) ∈ RK désignent les paramètres du modèle

On fait l’hypothèse que pour tous les individus i = 1, ......., N, la variable aléatoire définie
 
π εi,2 − εi,1
vi = √ (2)
3 2σε

suit une distribution logistique standard. On suppose en outre que l’on observe d’une part les prix
des consultations p1 et p2 ainsi que les vecteurs des caractéristiques Xi pour chaque individu. On
dispose enfin des N observations associées au choix des individus quant à leur médecin : on fait
l’hypothèse qu’aucun patient ne consulte les 2 médecins.

Question 1 (1.5 points) : Déterminer la condition sur εi,2 − εi,1 pour qu’un individu i = 1, ..N
préfère le médecin 2 au médecin 1. Cette condition dépend elle des caractéristiques des
individus ? Quelles conséquences en tirez vous ?

Question 2 (1 point) : Proposez une modélisation sous forme de variable latente yi∗ du choix de
médecin d’un individu i quelconque. Pour cela, on posera l’existence d’une variable aléatoire
discrète yi observable telle

1 si l’individu i consulte le médecin 2
yi = (3)
0 si l’individu i consulte le médecin 1

Question 3 (2 points) : En déduire l’expression de la probabilité qu’un individu i consulte le


médecin 2 en fonction des paramètres, des prix des consultations p1 et p2 , et de la fonction
de répartition de la loi logistique notée Λ (.).
Question 4 (1.5 points) : Donnez l’expression de la probabilité P rob (yi = 1) que l’on aurait
obtenu si l’on avait postulé que la variable wi définie par wi = (εi,2 − εi,1 ) /2σ ε , suivait une
loi normale centrée réduite de fonction de répartition Φ (.) . Discutez brièvement les avan-
tages et inconvénients de ces deux hypothèses sur les résultats d’estimation des probabilités
P rob (yi = 1) .

Question 5 (1.5 points) : On revient à l’hypothèse initiale de distribution sur la variable vi .


Ecrivez la log-vraisemblance associée à un échantillon de N observations y = (y1 , y2 , .., yN )
en fonction des paramètres initiaux α, γ 1 et γ 2 ainsi que des prix p1 et p2 .

Question 6 (1 point) : On suppose que sur la population des N habitants du village, N2 habitants
ont choisi le médecin 2 (yi = 1) et N1 ont choisi le médecin 1 (yi = 0). Montrez que la log-
vraisemblance associée à l’échantillon y = (y1 , y2 , .., yN ) pour le modèle logit peut se réécrire
sous la forme :
   
1 1
L (y, α, γ 1 , γ 2 , p1 , p2 ) = N1 log + N2 log 1 − (4)
1 + e−z 1 + e−z
avec
π
z= √ [γ 2 − γ 1 − α (p2 − p1 )] (5)
2σε 3
Question 7 (2 points) : Déterminez l’impact (sous forme d’élasticité) sur la probabilité d’aller
consulter le médecin 2 d’une augmentation d’une unité de l’écart (p2 − p1 ) entre les prix des
consultations du médecin 2 et du médecin 1. Commentez.

Question 8 (1.5 point) : Proposez une statistique de test permettant de tester l’hypothèse
H0 : α = 1 et nécessitant d’estimer les paramètres du modèle uniquement sous l’hypothèse
alternative H1 : α = 1.

Exercice 2 : Les facteurs du déclassement au premier emploi (8 points)

Le déclassement sur le marché du travail correspond à une dévaluation des diplômes. Un salarié
est considéré comme déclassé lorsque le niveau de formation requis pour le poste qu’il occupe est
inférieur à son niveau de formation initiale : les déclassés sont donc surdiplômés par rapport à
l’emploi occupé.

On cherche ici à déterminer les facteurs influençant le déclassement. La variable expliquée yi


prend la valeur 1 si l’individu est déclassé et 0 sinon. Les variables explicatives sont : peragric, per-
arti, percadre, pertech, perempl perouvr représentent la profession du père qui peut être agriculteur,
artisan-commerçant, cadre, technicien, employé ou cadre (la référence étant père inactif) ; CDI,
fctionar, interim, CES, tpart désignent le type d’emploi trouvé par l’individu (CDI, fonctionnaire,
intérim, CES et temps partiel, la référence est ici le CDD). Nous vous donnons les sorties LIMDEP
de l’estimation du modèle PROBIT associé à la question que nous nous posons.

2
Figure 1: Résultats d’Estimation

Question 1 (2 points) : Quelles influences ont la profession du père, le type d’emploi trouvé ainsi
que l’âge de l’individu sur la probabilité de déclassement ?

Question 2 (2 points) : A partir des résultats du probit, donnez la probabilité qu’individu de 20


ans, se trouvant en CDI et ayant un père cadre, soit déclassé. Commentez. Calculez la cote
du déclassement de cet individu. Commentez.

Question 3 (2 points) : Calculez l’élasticité pour l’individu décrit à la question précédente de la


probabilité de déclassement par rapport à l’âge médian.

Question 4 (1 point) : La qualité de l’ajustement de la modélisation probit vous paraît-elle


suffisante? Peut-on envisager une autre modélisation ?

Question 5 (1 point) : Effectuez un test de significativité globale de la régression.

3
Maîtrise Econométrie Année Universitaire 2003-2004

Elements de corrigé de l’interrogation n◦ 1


Econométrie des variables qualitatives

Exercice 1
Question 1 : Les habitants du village iront voir le médecin 2 si l’utilité qu’il
retire de la visite à ce médecin est supérieure à l’utilité d’aller voir le médecin
1, autrement dit l’individu i se rendra chez le médecin 2 si
Ui2 > Ui1 ⇐⇒ Ui2 − Ui1 > 0 ∀i = 1, ..., N
⇐⇒ γ2 − γ1 + Xi β − Xi β − α(p2 − p1 ) + εi,2 − εi,1 > 0
⇐⇒ εi,2 − εi,1 > γ1 − γ2 − α(p1 − p2 ) (1 pt)

On a donc εi,2 − εi,1 > θ où θ ne dépend pas de i. On aura donc la même


probabilité pour tous les individus, ∀i = 1, ..., N , d’aller chez le médecin 2.

Prob (individu i choisisse le médecin 2) = P ∀i = 1, ..., N (0,5 pt)

Question 2 : Soit Yi∗ une variable latente continue inobservable telle que :
Yi∗ = γ2 − γ1 + Xi β − Xi β − α(p2 − p1 ) + εi,2 − εi,1 (0,5 pt)

On peut alors modéliser la probabilité d’aller voir le médecin 2 telle que :


1 si yi∗ ≥ 0 ∀i = 1, ..., N
Yi =
0 sinon
(0,5 pt)

Question 3 : La probabilité d’aller voir le médecin 2 est:

P (Yi = 1) = P (yi∗ > 0)


= P (γ2 − γ1 + Xi β − Xi β − α(p2 − p1 ) + εi,2 − εi,1 )
= P (εi,2 − εi,1 > γ1 − γ2 − α(p1 − p2 ))
On pose θ = γ1 − γ2 − α(p1 − p2 ). Il vient :

 π ε − ε  θπ 
i,2 i,1
P (Yi = 1) = P √ > √
2 3 σε 2 3 σε
 π ε − ε  θπ 
i,2 i,1
P (Yi = 1) = 1 − P √ < √
2 3 σε 2 3 σε
 θπ   −θπ 
P (Yi = 1) = 1 − Λ √ =Λ √
2 3 σε 2 3 σε

1
où Λ(.) désigne la fonction de répartition de la loi logistique.
D’où:
k π l
P (Yi = 1) = Λ √ (γ2 − γ1 − α(p2 − p1 )
2 3 σε
(2 pts)
Ou encore,

1
P (Yi = 1) = √−π (γ2 −γ1 −α(p2 −p1 ))
1+e 2 3 σε

Rq : On vérifie que l’on a la même probabilité pour tous les individus.

Question 4 : On a vu que :

P (Yi = 1) = P (εi,2 − εi,1 > γ1 − γ2 − α(p1 − p2 ))


εi,2 −εi,1
D’où si, 2σ  N (0,1), on a:

k γ − γ − α(p − p ) l
2 1 2 1
P (Yi = 1) = Φ ∀i = 1, ..., N
2σε
(1 pt)

Avantages / Inconvénients : cf cours. (0,5 pt)

Question 5 :
La log-vraisemblance s’écrit :

[N k k  π l
Log L (y, α, γ1 , γ2 , p1 , p2 ) = yi log Λ √ (γ2 − γ1 − α(p2 − p1 )
i=1
2 3σε
k  π ll
+ (1 − yi ) log 1 − Λ √ (γ2 − γ1 − α(p2 − p1 )
2 3σε
Ou encore :

N k
[ k l
1
Log L(y, α, γ1 , γ2 , p1 , p2 ) = yi log −π
√ (γ −γ −α(p −p )
i=1 1 + e 2 3σε 2 1 2 1

k 1 ll
+ (1 − yi ) log 1 − −π
√ (γ −γ −α(p2 −p1 )
1 + e 2 3σε 2 1
(1,5 pt)
Question 6 :
On a alors :

2
S
N S
N
yi = N1 (1 − yi ) = N2
i=1 i=1

D’où l’expression :
1 lk
Log L(y, α, γ1 , γ2 , p1 , p2 ) = N1 log
1 + e−z
k 1 l
+ N2 log 1 −
1 + e−z
(1 pt)
avec z = √π (γ2 − γ1 − α(p2 − p1 )
2 3σε

Question 7 :
On cherche à mesurer :
∂P (Yi = 1) p2 − p1
εP (yi =1)/p2 −p1 = ×
∂(p2 − p1 ) P (Yi = 1)

(0,5 pt)
On peut démontrer que : (1 pt)


(p2 − p1 )(−απ/2 3 σε )
εP (yi =1)/p2 −p1 =
1 + ez
(0,5 pt)
Question 8 :
Une statistique permettant de tester l’hypothèse H0 : α = 1 et nécessitant
d’estimer les paramètres du modèle uniquement sous l’hypothèse alternative est
la statistique de Wald :

(α̂ − 1)2
W =  χ2i (1)
V ar(α̂)

(1,5 pt)
Exercice 2
Question 1 :

• Avant de regarder l’influence de la profession du père sur la probabilité


de déclassement, il faut d’abord se renseigner sur la significativité des co-
effcients associés à cette variable. On constate alors grâce au significant
level que seul le coefficient associé à père cadre sort significativement. On
ne peut donc pas commenter l’influence d’un père agriculteur, artisan-
commerçant, technicien, employé et ouvrier sur la probabilité de déclas-
sement. Dans ce cas nous pouvons donc juste dire que le fait d’avoir un
père cadre diminue la probabilité de déclassement par rapport à avoir un
père inactif.

3
• Concernant le type d’emploi trouvé, nous pouvons commenter chacune
des variables présentées dans le tableau puisque celle-ci rssortent systé-
matiquement significatives. On constate alors que le fait d’avoir trouvé un
CDI ou d’être fonctionnaire diminue la probabilité de déclassement, par
rapport au fait d’être en CDD, et que par contre se trouver en intérim, en
CES où à temps partiel augmente la probabilité d’être déclassé, toujours
comparativment au fait d’être en CDD.
• L’âge a un impact significatif et négatif sur la probabilité d’être déclassé.
Plus on vieillit, plus la probabilité de déclassement diminue.

(2 pts)
Question 2 :
L’indice correspondant à un individu de 20 ans, se trouvant en CDI et ayant un
père cadre est :

Xi β = 1, 365406519 − 0, 0829644595 × 20 − 0, 2684435318 − 1, 180945312 = −1, 68991124

Donc,

Prob (que l’individu décrit soit déclassé) = Φ(−1, 68991124)


= 1 − Φ(1, 68991124) = 1 − 0, 9545 = 0, 0455

La probabilité qu’un individu de 20 ans, se trouvant en intérim et ayant un père


cadre soit déclassé est de 4,5%. (1,5 pt)

pi
Cote = = 0, 04551 − 0, 0455 = 0, 048
1 − pi
Il y a 0, 048 fois plus de chance que le déclassement ait lieu qu’il n’ait pas
lieu. (0,5 pt)

Question 3 :
On sait que dans le cadre d’un probit :

(J)
(J) ∂P (Yi = 1) xi
εP (yi =1)/xi = (J)
×
∂xi P (Yi = 1)
1 k 1 l x
(J)
= √ exp − (xi β)2 × βJ × i
2π 2 pi
1 k 1 l 20
= √ exp − (−1, 68991124)2 × 0, 0829644595 ×
2π 2 0, 0455
= 3, 48892523

(2 pts)

4
Question 4 :
La variable Profession du père n’est pas très judicieuse car non significative.
Pour les 2483 observations de non déclassement, le modèle en prédit 2442, soit
98%. Et pour les 638 individus déclassés, le modèle prévoit seulement 69 dé-
classés pour 569 non déclassés, soit 11% de prévisions correctes. On ne peut
donc pas dire que notre modèle est « bon ». Modélisation Logit, types de ré-
sultats espérés...

Question 5 :
Le test du Quotient de Vraisemblance convient parfaitement pour tester la si-
gnificativité globale de la régression :

QV = 2[logNC − logC ]  χ2i (12)


= 2[−1447, 098 + 1580, 697] = 267, 198

où H0 : βi = 0, ∀i = 1, 12.

Or au seuil de 5%, χ2i (12) = 21, 0, nous rejetons donc fortement H0, la régression
est globalement significative.

5
Université d’Orléans - Maitrise Econométrie
Econométrie des Variables Qualitatives
Examen Novembre 2002

Exercice 1 (12 points) : On considère le problème traditionnel du dosage d’un insecticide (Gurland, Lee
et Dahm 1960), dont la structure peut naturellement être reprise dans de nombreux problèmes économiques
(crises de change, défaillance dans les relations bancaires, décision d’achat etc..). Le problème est le suivant
: on diffuse dans un espace clos un insecticide et l’on cherche à déterminer la dose minimale permettant
de tuer les insectes ainsi que les principales caractéristiques permettant de modéliser leur tolérance à cette
insecticide.

A l’issue de l’expérience, on observe les N insectes de l’échantillon, indicés i = 1.., N . On adopte le code
yi = 1 lorsque le ième insecte est mort à l’issue de l’expérience et yi = 0 lorsque l’insecte est vivant. On
admet que dans tous les insectes reçoivent la même dose d’insecticide, notée γ h. Or, chaque insecte dispose
d’une capacité de résistance propre représentée par une tolérance à l’insecticide, notée yi∗ . Si la tolérance à
l’insecticide de l’individu i est inférieure à la dose de produit reçu, l’insecte décède (yi = 1), et il reste vivant
(yi = 0) lorsque la tolérance est au contraire supérieure à la dose d’insecticide reçue. La tolérance yi∗ est
inobservable, toutefois on suppose qu’elle peut être modélisée sous la forme d’une combinaison linéaire d’un
ensemble de K caractéristiques propres à chaque insecte (poids, âge, sexe etc..), représentées par un vecteur
xi (sans constante) et d’un résidu noté εi
h + εi
yi∗ = xi β (1)
 1 K    
avec xi = xi ..xi , ∀i = 1, .., N , β h= β h
h ...β ∈ RK , εi i.i.d. 0, σ 2ε et où la variable réduite εi /σ ε
1 K
suit une loi de fonction de répartition F (.) .

1. Question 1 (1 point) : Compte tenu des éléments précédents exprimez la probabilité que le ième
h γ
insecte soit mort à l’issue de l’expérience en fonction des paramètres β, h et σ ε , des caractéristiques xi
et de la fonction F (.) .
2. Question 2 (1 point) : Discutez brièvement les avantages et les inconvénients respectifs d’une mod-
élisation logit ou probit de ce problème.
3. Question 3 (2.5 points) : On considère une modélisation logit où F (.) désigne la fonction de répartition
d’une loi logistique :
ex 1
F (x) = Λ (x) = x
= ∀x ∈ R (2)
1+e 1 + e−x
Sachant que la variance d’une variable distribuée selon une loi logistique est égale à π2 /3, montrez que
le choix d’un modèle logit revient en fait à normaliser les coefficients βh et γ
h en imposant :
P rob (yi = 1) = Λ (γ − xi β) (3)

Exprimez les paramètres normalisés γ et β en fonction des paramètres β h et γ


h du modèle initial. Qu’en
concluez vous quant à l’interprétation de ces paramètres normalisés ? Ecrivez les résidus normalisés
du modèle transformé, notés vi , en fonction des εi . Vérifiez que ces résidus normalisés ont une variance
égale à π 2 /3.
4. Question 4 (3 points) : On considère à présent un modèle logit où la tolérance s’écrit :
yi∗ = xi β + vi (4)
     
où xi = x1i ..xK h= β
, ∀i = 1, .., N , β h
h ...β ∈ RK , vi i.i.d. 0, π 2 /3 . On note γ le seuil mortel
i 1 K
d’insecticide tel que : 
1 si yi∗ < γ
yi = ∀i = 1.., N (5)
0 sinon
Examen Novembre 2002 page 2

Ecrivez la log-vraisemblance log L (y, β, γ) associée à l’échantillon des N insectes et dérivez le gradient
de cette log-vraisemblance par rapport au vecteur de paramètres β. Commentez la forme du gradient
de ce problème par rapport à celle vue en cours et indiquez brièvement comment obtenir un estimateur
du maximum de vraisemblance des paramètres du modèle.
5. Question 5 (2.5 points) : On suppose pour simplifier que γ = 0 et que K = 1. On note β e l’estimateur
du maximum de vraisemblance (MV) du paramètre β associé à l’unique caractéristique xi . En sup-
posant que les conditions nécessaire à la normalité asymptotique de l’estimateur du MV sont vérifiées,
construisez un intervalle de confiance pour un risque de première espèce de α%, sur le paramètre β.
6. Question 6 (2 points) : En conservant les hypothèses γ = 0 et K = 1, calculez l’élasticité de la
probabilité associée à la mort du ième insecte par rapport à l’unique variable explicative xi . Commentez.
Déterminez la cote associée à cet évenement.

Exercice 2 (10 points) : On cherche ici à expliquer par un modèle à réponse binaire la probabilité de
vote pour le candidat démocrate Jimmy Carter aux éléctions présidentielles américaines de 1976 en fonction
de caractéristiques propres aux Etats. La variable expliquée yi = 1 prend la valeur 1 si dans l’état indicé
i, les votes ont été majoritaires pour le candidat démocrate Jimmy Carter, et 0 si au contraire le candidat
républicain Gerry Ford a obtenu la majorité des voix dans cet état. Les variables explicatives sont les
suivantes : Inc désigne le revenu médian de l’état en 1975, School désigne la médiane du nombre d’années
de scolarité suivies par les habitants de l’état âgés de plus de 18 ans, U rban désigne le pourcentage de la
population vivant en zone urbaine et la variable Region est une variable dummy prenant la valeur 1 pour
la région Nord Est, 2 pour le Sud Est, 3 pour le Sud et le Middle West et 4 pour l’Ouest. Les données
couvrent les 51 états américains et sont tirées de Greene1 (1997). Sur la figure (1) sont reportés les résultats
d’estimation d’un modèle probit sous Eviews.

Figure 1: Estimation d’un Modèle Probit

1 Greene W. (1997) ”Econometric Analysis ”.

2
Examen Novembre 2002 page 3

Figure 2: Nombres de Prédictions Fausses

7. Question 1 (2 points) : Dans quelle mesure le revenu médian des états a-t-il eu une influence sur
le vote démocrate aux éléctions de 1976 ? Même question pour le niveau de scolarité médian et
l’importance de la population urbaine.
8. Question 2 (2 points) : A partir des estimations du modèle probit, donnez la probabilité qu’un Etat
comme le Texas, ayant un revenu médian de 12672$, un niveau médian d’étude de 12.4, et un taux
d’urbanisation de 71.4 ait voté démocrate aux éléctions de 1976. Calculez la cote du vote démocrate
dans cet état. Quelle utilisation pourrait on envisager pour ce modèle probit dans le cadre de nouvelles
éléctions présidentielles ? Précisez les limites d’un tel exercice.
9. Question 3 (1.5 points) : Compte tenu des différents éléments à votre disposition (figures 1 et 2),
établissez un diagnostic quant à la qualité de la modélisation probit de la probabilité du vote démocrate.
10. Question 4 (1.5 points) : Le choix d’un modèle probit vous semble—t-il justifié dans ce cas ? Pro-
posez une valeur approximée de la réalisation des estimateurs des différents paramètres des variables
explicatives dans le cas d’un modèle logit et d’un modèle linéaire simple pour cet échantillon.
11. Question 5 (2 points) : Calculez l’élasticité pour l’état du Texas de la probabilité du vote démocrate
par rapport au revenu médian. Vous utiliserez pour cela les élements et résultats de la question 2.
Quel serait l’impact d’une augmentation de 20% du revenu médian dans cet état en matière de vote
aux présidentielles ?
12. Question 6 (1 point) : L’estimation d’un probit avec pour seule variable explicative la variable
U rban donne comme valeur pour la log vraisemblance Loglikelihood − 35.28002. Testez la nullité des
coefficients des variables de revenu Inc et de scolarité School.

3
Correction Examen Novembre 2002
Christophe Hurlin
January 21, 2003

1 Exercice 1
Q1 : Soit yi∗ la tolérance. On a un modèle du type :
+
si yi∗ = xi βh + εi < γh
yi =
sinon
Dès lors sachant que εi iid (0, σ ε ). On a
pi = Prob (yi = 1)
# $
εi γh βh
= Prob < − xi
σε σε σε
Si F (.) est la répartition associée à la loi de εi /σ ε , on a donc :
# $
γh βh
pi = F − xi ((1 pt))
σε σε

Q2 : cf. cours. (1 point)


Q3 : On pose F (.) = Λ(.). On sait que si X suit une loi logistique, alors
π2
E(X) = 0 E(X 2 ) =
3
Dans notre problème :
# $
εi γh βh
pi = Prob < − xi
σε σε σε
# $
π εi π γh π βh
= Prob √ <√ − xi √
3 σε 3 σε 3 σε

1
π εi
On pose vi = √ et l’on pose
3 σε
π γh π βh
γ=√ β=√
3 σε 3 σε
Dès lors, la probailité devient :
pi = Prob(vi < γ − xi β)
où les résidus normalisés vi ont une variance égale à π 2 /3 par construction
π
E(vi ) = √ E (εi ) = 0 ((0.5 pt))
σε 3
# $2
π π2
E(vi2 ) = √ .E(ε2i ) = √
σε 3 3
Donc si l’on suppose que vi est distribué selon une loi logistique, on obtient
un modèle logit :
pi = Prob(yi = 1) = Λ (γ − xi β) (1)
π γh π βh
avec γ = √ β=√ ((1.5 point))
3 σε 3 σε
Conséquences :
− interprétation des paramètres impossibles :
(0.5 pt)
− seuls les signes sont interprétables

Q4 : Soit +
1 si yi∗ < γ
yi =
0 sinon
On a donc :
L(y, β) = pi yi (1 − pi )(1−yi )
(ou)
N
[
log L(y, β) = yi log Λ (γ − xi β) + (1 − yi ) log [1 − Λ (γ − xi β)]
i=1

Connaissant Λ(.) on a donc


N
# $ % &
[ eγ−xi β eγ−xi β
log L(y, β) = yi log γ−x β + (1 − yi ) log 1 − γ−x β
i=1 1+e i 1+e i
(1 pt)

2
Ici on a :
∂ log L(y, β)
G(p) =
∂β
N
[ λ (γ − xi β) −λ (γ − xi β)
= yi (−xi ) + (1 − yi ) (−xi )
i=1 Λ (γ − xi β) 1 − Λ (γ − xi β)

où λ (x) désigne la densité de loi logistique. Sachant que λ(x) = Λ(x)[1 −


Λ(x)]. On a donc :
N
[
G (β) = −yi [1 − Λ(γ − xi β)] xi + (1 − yi )Λ(γ − xi β)xi
i=1

N
[
⇒ G(β) = −yi xi + Λ(γ − xi β)xi
i=1
D’où :
N
[
G(β) = [Λ (γ − xi β) − yi ] xi (2)
i=1

Commentaire (0.5 pt)

→ Forme non linéaire sur β, γ


→ Pas d’expression analytique par estimateur du MV βh et γh

→ Recours à des algorithmes d’optimisation numérique.

Q5 : On suppose γ = 0, K = 1. Soit βe l’estimateur du MV de β. Sous les


conditions mentionnées, on sait que :
√ L
N(βe − β) −→ N(0, I(β)−1 )
N→∞

e un estimateur convergent de la matrice d’information de Fischer.


e β)
Soit I(
Dans un modèle Logit, on sait que :
% &
∂ 2 logL(y, β)
I(β) = −E (0.5pt)
∂β 2
N
[ exp(xi β)
⇒ I(β) = x2
2 i
i=1 [1 + exp(x i β)]
Dès lors, on sait que :
N
[ e
exp(xi β)
I( e =
e β) x2i (1.5)
e 2
i=1 [1 + exp(xi β)]

3
Donc, si on définit C α le quantile de la loi normale centrée réduite à α%. On
a:
prob [βe − C α I( e −1/2 , β
e β) e + C α I( e −1/2 ] = 1 − α
e β) (1 pt)

Q6 : On pose γ = 0, F = 1, dès lors il vient :


# $
∂pi ∂ exp (xi β)
=
∂xi ∂xi 1 + exp(xi β)

∂pi exi β
= β
∂xi (1 + exi β )2
Dès lors :
∂pi xi
εpi /xi = .
∂xi pi
exi β xi β
⇒ εpi /xi = 2 (1 + exiβ )
(1 + e i ) exi β
x β

xi β
εpi /xi = ((1.5 pt))
1 + exiβ
Si xi augmente de 1%, alors la probabilité de l’évènement yi = 1 augmente
de εpi /xi %.
pi
Cote = ci = = exi β ((0.5 pt))
1 − pi
Il y a exi β fois plus de chances que l’évenement yi = 1 se réalise qu’il ne
se réalise pas.

2 Exercice 2
Q1 (2 points) : Une hausse du revenu médian diminue la probabilité de vote
démocrate.
(*) Une hausse du taux de scolarisation augmente la probabilité du vote
démocrate
(*) Une hausse de l’urbanisation augmente la probabilité du vote démocrate
+ discussion sur la significativité des coefficients (z-statistique).

Q2 (2 points):
xi β = −12672 × 0, 000406
+12, 4 × 0, 269580
+714 × 0, 035902 = 0, 76

4
Donc
prob (Texas vote démocrate) = Φ (0.76) 77.64%
pe 0.7764
(*) cote = = = 3. 4723
1 − pe 1 − 0.7764
Il y a environ 3.5 fois plus de chance que le vote démocrate se réalise qu’il
ne se réalise pas pour l’Etat du Texas .

(*) prévision de votes ultérieurs pour des éléctions présidentielles futures


par projection des variables explicatives dans le futur. Limites : stabilité
du modèle et hypothèse IIA sans doute pas vérifiée en matière d’élections.
L’introduction d’un nouveau candidat ou parti va sans doute déformer les
rapports de probabilité des partis en place.

Q3 (1.5 points) :

1. coefficient statistiquement = de 0 à 5% (z statistique)


2. Nombre de prévisions fausses : Pour les 27 oservations de vote républi-
cains, le modèle prévoit 20 vote pour les républicains et 7 pour les dé-
mocrates, soit un taux de réussite de 75%. Pour les 24 états ayant voté
démocrates, le modèle prévoit 6 votes républicains et 18 démocrates,
soit 75% de prévisions correctes

⇒relativement bon modèle

Q4 (1.5 points) choix du logit/probit : cf cours


soit βe LM l’estimateur de β dans modèle linéaire et βe L l’estimateur du
modèle logit, βe p du modèle probit. On a

βe L 1.6βe p

βe LM = 0, 4βe p

βe L βe LM
INC -0,0006496 -0,0001624
SCHOOL 0,431328 0,107832
URBAN 0,0574432 0,0143608

Q5 (2 points): On sait que pour un probit


 
∂pi 1 1
(J)
= √ exp − (xi β)2 .β J
∂xi 2π 2

5
Donc pour le Texas :

xi β = 0, 76
β J = −0, 000406

Donc
∂pi
J
= −6, 84 · 10−5
∂xi
D’où :
∂pi xJi
εpi/xJ = ·
i ∂xJi pi
12672
⇒ εpi/xi = −6, 84.10−5 ·
0, 7764
⇒ εpi/xi = −1, 11
Si INC baisse de 20%, la probabilité de vote démocrate baisse de 22. 2%..

Q6 : Stat
k    c l L
LRT = −2 log L y, βe − log L y, βe −→ χ2 (2) (3)
N→∞

Ici,

LRT = 6.6275 (4)


Seuil à 5% d’un χ2 (2) = 5.99.. On rejette l’hypothèse de nullité jointe
des coefficients.

6
Université d’Orléans - Maitrise Econométrie
Econométrie des Variables Qualitatives
Examen Décembre 2002. C. Hurlin

Exercice 1 (15 points) : Politique de Dividendes


On considère un problème de politique de distribution de dividendes dérivé de Maddala (1977). Soit une
société par action susceptible de distribuer des dividendes à ses actionnaires de façon régulière à chaque date
t = 1, .., T . On suppose que le montant des dividendes potentiels yt∗ dépend d’un ensemble de caractéris-
tiques de l’entreprise parmi lesquelles le montant x1,t des bénéfices de l’année écoulée et le montant x2,t des
investissements futurs anticipés de la firme à la date t selon la relation :
yt∗ = β 0 + β 1 x1,t + β 2 x2,t + εt ∀t (1)
avec β 1 > 0, β 2 < 0 et où les perturbations εt sont i.i.d. N 0, σ 2ε et indépendantes de toutes les variables
explicatives du modèle.

On suppose que des dividendes ne sont effectivement versé que lorsque les dividendes potentiels sont
positifs. Le montant des dividendes effectif yt correspond alors au montant des dividendes potentiels :
yt∗ si yt∗ > 0
yt = (2)
0 si yt∗ ≤ 0

Partie I : Modélisation Probit (5 points) Dans un premier temps, en tant qu’analyste financier,
les actionnaires vous demandent de déterminer la probabilité qu’à une date t l’entreprise étudiée verse
effectivement des dividendes et cela sans analyser la valeur de ceux-ci. Vous utiliserez la variable :
1 si yt∗ > 0
zt = (3)
0 sinon
Question 1 (1 point) : Modélisez la probabilité que l’entreprise verse des dividendes à la date t en
fonction du vecteur de caractéristiques xt = (1 x1,t x2,t ) . Montrez que l’on obtient un modèle probit
de paramètres :
β
γ i = 0 i = 0, 1, 2 (4)
σε
Question 2 (1 point) : Ecrivez la log-vraisemblance du modèle probit associé à un échnatillon de T
observations z = (z1 , .., zT ) . Soit γ l’estimateur du M V du vecteur de paramètres γ = (γ 0 γ 1 γ 2 ) .
Quelles sont les propriétés asympotiques de cet estimateur ?
Question 3 (2 points) : Déterminer l’effet marginal sur la probabilité de distribution des dividendes d’une
augmentation d’une unité des bénéfices x1,t de l’entreprise à une date t quelconque. Exprimez l’effet
marginal sous forme d’élasticité et commentez vos résultats.
Question 4 (1 point) : On vous communique une prévision des résultats de l’entreprise pour l’année T + 1
: bénéf ices = 100 et investisements prévus = 390. Les résultats d’estimation du modèle probit sur
l’échantillon sont les suivants :
γ0 = 1 γ 1 = 0.05 γ 2 = −0.29 (5)
Fournissez aux actionnaires (i ) la probabilité estimée que les dividendes soient effectivement versés en
T + 1 (ii ) l’élasticité de la probabilité de versement en T + 1 par rapport à une augmentation de 1%
des bénéfices attendus.
Examen Décembre 2002. C. Hurlin page 2

Partie II : Modélisation Tobit (12 points) Les actionnaires s’intéressent à présent à la valeur des
dividendes versés et non plus uniquement à la probabilité qu’ils soient effectivement versés. Pour cela on
considère que les dividendes effectifs à la date t, notés yt , sont déterminés par le modèle :
yt∗ si yt∗ > 0
yt = (6)
0 si yt∗ ≤ 0
où les dividendes potentiels sont décrits par le même modèle que précédemment

yt∗ = β 0 + β 1 x1,t + β 2 x2,t + εt ∀t (7)

avec β 1 > 0, β 2 < 0 et εt i.i.d. N 0, σ 2ε . On cherche alors à estimer les paramètres β i et à prévoir le
montant des dividendes en fonction des bénéfices x1,t et des investissements x2,t . On dispose pour cela d’un
échantillon de T observations des dividendes passés y = (y1 , .., yT ) parmi lesquelles on trouve T observations
correspondent à des années pour lesquelles il n’y pas eu de dividendes versés.

On suppose que les bénéfices et les investissements attendus sont exprimés en déviation à la moyenne :

E (x1,t ) = E (x2,t ) = 0 ∀t = 1, .., T (8)

et l’on suppose que les investissement de l’entreprise sont deux fois plus volatiles que les bénéfices et que les
deux grandeurs sont indépendantes. On pose xt = (x1,t x2,t ) :

1 0
E (xt xt ) = σ2x ∀t = 1, .., T (9)
0 2

Question 1 (3 points) : Un ”bon” ami vous conseille d’estimer les paramètres β i par la méthodes des
Moindres Carrés Ordinaires en utilisant les T observations yi de l’échantillon. A partir des résultats
du cours, montrez lui que l’estimateur des M CO β LS des paramètres β = (β 1 β 2 ) est alors non
convergent et qu’il vérifie alors la propriété suivante :
 
p β
β LS −→ β × Φ  0  (10)
T →∞ 2 2 2 2
σ ε + β 1 + 2β 2 σ x

Commentez la forme du biais asymptotique et ses conséquences sur l’analyse des dividendes. Existe-t-il
une condition sur σ 2x qui permette de faire disparaître ce biais asymptotique ?
Question 2 (2 points) : Proposez à votre ”bon” ami un estimateur convergent de β à partir de son
estimateur biaisé β LS . Commentez.
Question 3 (2 points) : On se propose d’estimer les paramètres du modèle par maximum de vraisemblance.

(i ) Ecrivez la log-vraisemblance complète du modèle Tobit associé à un ensemble d’observations


y = (y1 , .., yT ) de dividendes yi et des paramètres β 0 , β 1 , β 2 , σ 2ε .
(ii) Cette fonction est elle globalement concave ? Qu’implique ce résultat ?
(iii) Proposez une re-paramétrisation de la fonction de log-vraisemblance garantissant la concavité
globale de cette fonction.

Question 4 (3 points) : Déterminez les effets marginaux associés à une augmentation de 1% des bénéfices
de l’entreprise (i ) sur les dividendes potentiels yt∗ (ii ) sur les dividendes effectifs yt . Commentez.
Question 5 (2 points) : Construisez un test du multiplicateur de Lagrange pour tester l’hétéroscédasticité
dans un modèle où la variance des perturbations vérifie :

σ 2ε,t = σ 2ε exp (α0 + α1 wt ) ∀t = 1, .., T (11)

où (α0 , α1 ) ∈ R2 .

2
Examen Décembre 2002. C. Hurlin page 3

Exercice 2 (4 points) : Modèle logit multinomial


Suite à une recrudescence du nombre d’accidents de la circulation, vous avez été embauché par une
compagnie d’assurances en qualité d’économètre appliqué. L’objectif de votre travail est de déterminer
les types d’individus à risque, c’est-à-dire ayant tendance à occasionner des accidents. Dans une première
approche, vous allez vous intéresser aux personnes ayant occasionné au plus deux accidents. Le but de votre
étude est alors de définir trois types d’assurés :

- ceux n’ayant pas eu d’accident,


- ceux ayant eu un accident,
- ceux ayant eu deux accidents.

Plusieurs modélisations peuvent être appliquées à votre problème. En particulier donnez une modélisation
non séquentielle et une modélisation séquentielle en justifiant l’un et l’autre modèle. Ecrivez ensuite la
vraisemblance des deux modèles en question.

3
Université d’Orléans - Maitrise Econométrie
Econométrie des Variables Qualitatives
Correction Examen Décembre 2002. C. Hurlin

Partie II : Modélisation Tobit (12 points) On considère le modèle suivant :


yt∗ si yt∗ > 0
yt = (1)
0 si yt∗ ≤ 0

avec yt∗ = β 0 + β 1 x1,t + β 2 x2,t + εt et β 1 > 0, β 2 < 0 et εt i.i.d. N 0, σ 2ε .

Question 1 (3 points) :
On sait que l’application des M CO à l’ensemble des observations va conduire à des estimateurs biaisés
des paramètres β 0 , β 1 et β 2 . L’ami n’est sans doute pas si ”bon” que ça... Sous les hypothèses de Goldberger
(1981), c’est à dire sous l’hypothèse de normalité des variables explicatives xi , on montre en effet que
l’estimateur des M CO est non convregent. Plus précisèment, la proposition 1.2 duc ours stipule que sous les
hypothèses de Goldberger (1981), l’estimateur β LS des Moindres Carrés Ordinaires obtenu sur l’ensemble
des observations (xi , yi ) vérifie :
p α
β LS −→ β × Φ
N→∞ σy
où α correspond à la constante de l’équation yi∗ = α + xi β + εi et σ 2y = σ 2ε + β Ωβ, où Ω désigne la matrice
de variance covariance des variables explicatives xi . Dans le cadre de notre application, on pose β = (β 1 β 2 )
et α = β 0 , il vient :
σ 2y = σ 2ε + β E (xt xt ) β
1 0 β1
= σ 2ε + σ 2x β1 β2
0 2 β2
= σ 2ε + σ 2x β 21 + 2β 22
Ainsi, le biais asymptotique est défini par :
 
p β0
β LS −→ β × Φ   (1.5 point)
T →∞
σ 2ε + β 21 + 2β 22 σ 2x

La forme du biais appelle plsusieurs commentaires :


• L’application des MCO va conduire à sous estimer les paramètres β 1 et β 2 , puisque par définition ∀z
Φ (z) ≤ 1, on a donc :
β i < β i i = 1, 2 (2)
On va donc sous estimer l’impact des bénéfices et des investissements sur le montant des dividendes
potentiels. Par exemple, en cas de repli des bénéfices, l’utilisation des M CO tend à minorer la baisse
induite des dividendes versés (0.5 point).
• Le biais asymptotique sur les M CO est le même sur β 1 et sur β 2 . En effet, on sait que sous l’hypothèse
de normalité des variables xi , le degré de sous estimation est totalement uniforme pour tous les éléments
de β (0.5 point).
1 (k)
(k)
plim β y>0 = ξ ∀k = 1, .., K (3)
β N →∞
Correction Examen Décembre 2002. C. Hurlin page 2

Enfin, il n’existe pas bien entendu de condition sur σ 2x perlmettant d’annuler le biais. Pour que celui-ci
p
s’annule il faut que β LS −→ β. Il faut pour cela que la condition suivante soit satisfaite :
T →∞
 
β0 β0
Φ  = 1 ⇐⇒ lim
2
=∞
σ x →h
σ 2ε + β 21 + 2β 22 σ 2x σ 2ε + β 21 + 2β 22 σ 2x

Puisque β 21 + 2β 22 > 0 et σ 2ε > 0, il n’existe pas de condition permettant à σ 2ε donné de faire disparaître
le biais. Même dans le cas où σ2x tend vers 0 (cas où l’on tend vers des variables explicatives déterministes
cf. cours), le biais demeure conformément aux démonstrations vues en cours (0.5 point).

Question 2 (2 points) :
Notre ami, pas si ”bon” que cela que ce soit en économétrie ou en conseil, peut construire un estimateur
convergent de β à partir de son estimateur biaisé β LS . Pour cela il doit le corriger du rapport T / T − T ,
c’est à dire du ratio du nombre total d’observations T au nombre d’observations pour lesquelles il y a eu
effectivement distributions de dividendes, c’est à dire pour lesquelles il y a eu yt∗ > 0. On peut en effet
montrer que :
c T p
β LS = β LS −→ β (1.5 point)
T −T T →∞

Considérons le cas où β 0 = 0. Etant donné que Φ (0) = 0.5, lorsque il n’y pas de constante dans la
définition de la variable latente yt∗ (β 0 = 0), alors on obtient une relation du type plim β LS = 0.5 × β.
Dans ce cas, l’estimateur obtenu sur la totalité de l’échantillon converge asymptotiquement vers la moitié de
la vraie valeur β des paramètres. En effet, sous l’hypothèse de normalité avec E (xt ) = 0, si la constante β 0
est nulle, on a alors E (yt∗ ) = 0. La variable yt∗ est centrée et distribuée selon une loi symétrique, la loi normale
N xt β, σ 2ε . Dès lors sous l’hypothèse de Goldberger lorsque β 0 = 0, on a P rob (yt∗ > 0) = P rob (yt∗ ≤ 0) =
0.5. Il y a autant de chance que les dividendes soient versés qu’il ne le soient pas. Pour un échantillon de taille
T suffisante, on a donc approximativement autant d’observations nulles de yt que d’observations strictement
positives : T − T T /2. Dès lors, la prise en compte de l’ensemble des observations dans l’estimation des
M CO va conduire à un estimateur de β convergeant vers la moitié de la vraie valeur du vecteur β (0.5
point).

Question 3 (2 points) :
On se propose d’estimer les paramètres du modèle par maximum de vraisemblance. Commençons par
écrire la log-vraisemblance du modèle tobit. On pose β = (β 0 β 1 β 2 ) et xt = (1 x1,t x2,t ) . On sait que pour
un échantillon de T observations yt , noté y = (yt , .., yT ) , la vraisemblance de ce modèle est définie par :
xt β 1 yt − xt β
L y, β 0 , β 1 , β 2 , σ 2ε = 1−Φ φ
t: yt =0
σε t: yt >0
σε σε

Le premier terme correspond à la probabilité que l’observation yt soit nulle tandis que le second terme
correspond à la densité marginale des dividendes yt = yt∗ sachant qu’il y a
xt β 1 yt − xt β
log L y, β 0 , β 1 , β 2 , σ 2ε = log 1 − Φ + log φ (4)
t: yt =0
σε t: yt >0
σε σε

En arrangeant cette expression, on obtient alors :


xt β T −T
log L y, β 0 , β 1 , β 2 , σ 2ε = log 1 − Φ − log σ 2ε (1 point)
t: yt =0
σε 2
1 T −T T −T
− (yt − xt β) − ln 2 − ln π2
2σ 2ε t: yt >0
2 2

2
Correction Examen Décembre 2002. C. Hurlin page 3

On sait d’après les résultats d’Amemiya (1973) que cette fonction de vraisemblance du modèle Tobit
paramétrée en β et σ ε n’est pas globalement concave. Cette propriété est alors particulièrement gênante
puisque nous savons que les solutions des algorithmes d’optimisation numérique sont généralement sensibles
au problème du choix des conditions initiales. S’il existe des extrema locaux de la fonction à optimiser, en
l’occurrence ici la fonction de log-vraisemblance, il peut arriver que l’algorithme converge vers ces extrema
locaux. En effet, si l’on utilise des conditions initiales dans l’algorithme d’optimisation relativement proches
des extrema locaux de la fonction de log-vraisemblance, alors il y a des risques que l’algorithme d’optimisation
s’arrête en ces points pour lesquels le gradient est nul, mais qui ne maximisent pas de façon globale la fonction
de log-vraisemblance. On risque alors d’obtenir des estimateurs non convergents des vrais paramètres du
modèle Tobit, non pas en raison de mauvaises propriétés de la méthode économétrique utilisée (maximum de
vraisemblance), mais simplement en raison de la défaillance de l’algorithme d’optimisation numérique utilisé
pour maximiser la log-vraisemblance. (0.5 point)

Olsen a proposé une re-paramétrisation permettant d’obtenir une fonction de vraisemblance globalement
concave. On sait en effet que la log-vraisemblance d’un modèle Tobit re-paramétrée en θi = β i /σ ε , i = 0, 1, 2
et h = σ −1
ε est globalement concave. La log-vraisemblance concentrée devient (0.5 point) :

log L (y, θ0 , θ1 , θ2 , h) = log [1 − Φ (xt θ)] + T − T log (h) (5)


t: yt =0
1 2
− (hyt − xt θ) (6)
2 t: y
t >0

Question 4 (3 points) :

Les effets marginaux dans un modèle de régression censuré correspondent à la déformation des prévisions
sur une variable continue engendrée par une variation d’une unité d’une des variables explicatives. Il y alors
plusieurs prévisions possible dans le cas du modèle Tobit suivant que l’on s’intéresse à la variable censurée
yt ou à la variable latente yt∗ . Tout d’abord en ce qui concerne les dividendes potentiels yt∗ , on a :

∂E ( yt∗ / xt ) ∂ (β 0 + β 1 x1,t + β 2 x2,t )


= = β1 ∀t = 1, .., T (7)
∂x1,t ∂x1,t

ou par l’élasticité εy∗ /x[k] :


i i

∂E ( yt∗ / xt ) x1,t β 1 x1,t


εyt∗ /x1 = ∗ = (8)
∂x1,t E ( yt / xt ) β 0 + β 1 x1,t + β 2 x2,t

Ainsi une augmentation de 1% des bénéfices engendre une augmentation (car β 1 > 0) de εyt∗ /x1 % des
dividendes potentiels yt∗ (1 point). Dans ce cas, l’élasticité moyenne vaut :
T
1 β 1 x1,t
εyt∗ /x1 =
T t=1
β 0 + β 1 x1,t + β 2 x2,t

On peut en outre calculer les effets marginaux sur les dividendes effectifs yt :

∂E ( yt / xt ) β 0 + β 1 x1,t + β 2 x2,t
=Φ β1 ∀t = 1, .., T (9)
∂x1,t σε

Puisque Φ (z) ≤ 1, on a bien naturellement la relation :

∂E ( yt / xt ) ∂E ( yt∗ / xt )
<
∂x1,t ∂x1,t

3
Correction Examen Décembre 2002. C. Hurlin page 4

De la même façon on peut exprimer cette quantité sous forme d’élasticité :


∂E ( yt / xt ) x1,t x1,t β 1
εyt /x1,t = = ∀i = 1, .., N (10)
∂x1,t E ( yt / xt ) xi β + σ ε λ xi β
σε

avec xi β = β 0 + β 1 x1,t + β 2 x2,t . Une augmentation de 1% des bénéfices engendre une augmentation (car
β 1 > 0) de εyt∗ /x1 % des dividendes effectifs yt (1 point). Dans ce cas, l’élasticité moyenne vaut :
 
T
1  x1,t β 1 
εyt /x1 =
T t=1 xi β + σ ε λ xi β
σε

Cet effet marginal peut se décomposer sous la forme de McDonald et Moffit (1980).
∂E ( yt / xt ) ∂E ( yt / xt , yt>0 ) ∂P rob (yt > 0)
= P rob (yt > 0) + E ( yt / xt , yt>0 )
∂x1,t ∂x1,t ∂x1,t
Remark 1 1. D’une part, la variation des bénéfices x1,t modifie l’espérance conditionnelle des dividendes
yt dans la partie positive de la distribution : cela modifie donc le montant des dividendes si ceux-ci
sont versés.
2. D’autre part, la variation des bénéfices x1,t affecte la probabilité que les dividendes soit effectivement
versés (1point).

Question 5 (2 points) :

Dans ce cas le test de l’hypothèse nulle d’homoscédasticité revient à tester la nullité du coefficient α1 (et
pas de α0 ). On a donc un test (0.5 point) :
H0 : α = 0
H1 : α = 0
Il y a trois façon de construire la statistique de Lagrange associée à ce test (au choix) :

3. La première consiste tout simplement à appliquer la définition suivante :


   
∂ log L y, β, σ ε , α ∂ log L y, β, σ ε , α
LM =   Qα α   (11)
∂α ∂α
α=0 α=0

où β et σε désignent les estimateurs du M V des paramètres β et σ 2ε obtenus sous l’hypothèse nulle


α = 0, et où la matrice Qα α désigne le bloc de dimension (1, 1) correspondant au vecteur de paramètre
α de la matrice inverse de la matrice d’information de Fischer estimée sous H0 :
 
Qββ Qβσ2ε Qβ α
 (3,3) (3,1) (3,1) 
−1  
2  Qβ σ2ε Q σε2 Q α σ 2ε 
I β, σ ε , α =  (12)
 (1,3) (1,1) (1,1) 
(5,5) α=0
 Qα β Qασ2ε Qαα 
(1,3) (1,1) (1,1)

4. Une autre expression de la statistique LM du test de l’hypothèse nulle d’homoscédasticité H0 : α = 0


est :  −1
LM = eT G β, σ 2ε , 0 G β, σ 2ε , 0 G β, σ 2ε , 0  G β, σ 2ε , 0 eT (13)
(1,1) (1,T ) (T,1)
(T,5) (5,T ) (T,5) (5,T )

4
Correction Examen Décembre 2002. C. Hurlin page 5

où eT désigne un vecteur unitaire de dimension (T, 1) et où β et σ ε désignent les estimateurs du M V


des paramètres β et σ 2ε obtenus sous l’hypothèse nulle α = 0 avec
 
g1 β, σ 2ε , 0
   
 (1,5)  a1 x1 b1 σ2ε b1 w1
 
G β, σ 2ε , 0 = ... = ... 
  2
(T,5) α=0
 gT β, σ ε , 0 
2 aT xT bT σε bT wT
(1,5)

1 xt β zt
at = − (1 − zt ) λ + (yt − xt β) (14)
σε σε σε
1 xt β zt zt
bt = (1 − zt ) xt β λ − + 4 (yt − xt β)2 (15)
2σ 3ε σε 2σ 2ε 2σ ε
avec λ (z) = φ (z) / [1 − Φ (z)] = λ (−z) et où la quantité zt correspond à la variable dichotomique
simple suivante :
1 si yt > 0
zt = (16)
0 sinon

5. Une troisième expression de la statistique LM du test de l’hypothèse nulle d’homoscédasticité H0 :


α = 0 est :
LM = T R2 (17)
où T désigne le nombre d’observations et où R2 est le coefficient de détermination de la régression du
vecteur unitaire eT = (1, ...1) de dimension (T, 1) sur les 5 colonnes de la matrice G β, σ 2ε , 0 .

Quelle que soit la mainère de construire LM, on montre alors que sous H0 cette statistique converge en
loi :
L
LM −→ χ2 (1) (18)
N→∞

Ainsi, si la réalisation de la statistique LM est supérieure au fractile de la loi du chi-2 à 1 degrés de liberté,
alors on rejette l’hypothèse nulle d’homoscédasticité. Les résidus du modèle Tobit sont hétéroscédastiques :
les estimateurs du M V des paramètres β et σ 2ε sont asymptotiquement biaisés selon les résultats d’Arabmazar
et Schmidt (1981) (1 point).

5
Correction Décembre 2002

Exercice 1

Partie I : Modélisation Probit

Q1 - La probabilité que l’entreprise verse des dividendes est déterminée par:

Pr ob(zt = 1) = Pr ob(yt∗ > 0)

ce qui peut se réécrire sous la forme :


Pr ob(zt = 1) = Pr ob(εt ) − xt β)
(0,5pt)
= 1 − F (−xt β)

avec β = (β 0 , β 1 , β 2 ) et xt = (x1,t , x2,t ).


Sachant que εt  N (0, σ 2ε ), on a alors :
εt β
Pr ob(zt = 1) = Pr ob( > −xt )
σε σε
β
⇔ Pr ob(zt = 0) = Φ(xt )
σε
où Φ(x) désigne la fonction de répartition de la loi normale centrée ré-
duite N (0, 1). On reconnaît ici la probabilité associé à un modèle probit
de paramètre β h:

h
Pr ob(zt = 1) = Φ(xt , β) (0,5 pt)

avec β h = (β
h = β/σ ε ou encore β h0 , β
h1 , β
h2 )

h0 = β 0
β h1 = β 1
β h2 = β 2
β
σε σε σε

Q2 - La log-vraisemblance associée à un échantillon de T observations noté


z = (z1 , ..., zT ). On a une observation zt

L(zt , γ 0 , γ 1 , γ 2 ) = pzt t (1 − pt )1−zt avec pt = Pr ob(zt = 1) = Φ(xt , γ)

Dès lors la log-vraisemblance associée à l’échantillon z = (z1 , z2 , ..., zT ) est :

log L(zt , γ) =Tt=1 zt log[Φ(xt , γ) + (1 − zt ) log[1 − Φ(xt , γ)]

1
avec γ = (γ 0 , γ 1 , γ 2 ) et où la variable dichotomique zt est définie par :

1 si yt∗ = xt β + εt > 0
zt =
0 sinon

On sait d’après le cours, que sous certaines conditions de régularité, l’es-


timateur du N est convergent

P
−−−−→
e
γT → ∞ γ

De plus on a le résultat suivant :


√ L
γ − γ) −−−−→ N (0, I(γ))
T (e (0,5 pt)
T →∞


 
∂ 2 log L(y, γ) φ(xt , γ)2
I(γ) = −E =N
t=1 x , xt
∂γ∂γ Φ(xt , γ)[1 − Φ(xt , γ)] t

où φ(.) désigne la densité de la loi N (0, 1).

Q3 - L’effet marginal mesure ici l’augmentation de la probabilité de versement


de dividende suscitée par l’augmentation des bénéfices. Formellement, on a :
U Pr ob(zt = 1) ∂ ∂Φ(.) ∂(xt , γ)
∀t = Φ(xt , γ) =
Ux1,t ∂x1 , t ∂(xt , γ) ∂x1 , t
β
= φ(xt , γ).γ 1 = φ(xt , γ). 1
σε
où φ(.) désigne la fonction de distribution de la loi N (0, 1).L’élasticité corre-
spondante est la suivante :
∂ Pr ob(xt = 1) x1,t
εpt /x1,t = · 0, 5pt (1)
∂x1,t Pr ob(zt = 1)
γ .x1,t
⇔ εpt /x1,t = φ(xt , γ) · 1
Φ(xt , γ)
⇔ εpt /x1,t = λ(xt , γ) · γ 1 .x1,t ∀t

où λ(.) désigne le ratio de Mill.

Commentaire : Une hausse de 1 % des bénéfices de l’entreprise augmente de


εpt /x1,t % la probabilité que l’entreprise verse effectivement des dividendes

2
à cette date. On constate que via le ratio de Mill, cette élasticité dépend
des autres variables (xz,t ici) qui déterminent l’environnement économique
de l’entreprise.

Q4 - On suppose ici à la date T + 1

x1,T +1 = 100 x2,T +1 = 390.

Les estimations au point moyen de l’échantillon donnent :

e0 = 1
γ e1 = 0, 05
γ e
γ 2 = −0, 29

(i) Probabilité de versement de dividendes en T + 1 :

e)
Pr ob(zT +1 = 1) = Φ(xT +1 γ
= Φ(1 + 0, 05 × 100 − 0, 29 × 390)
= Φ(−0, 10) = 1 − Φ(0, 10)

On a donc

Pr ob(zT +1 = 1) = 0, 4602 (0,5 pt)

(ii) élasticité
On a vu que :

e) · e
eh = epT +1 /x1,T +1 = λ(xT +1 , γ γ 1 .x1,T +1 .

Ici
φ(−0, 10)
eh = × 0, 05 × 100
Φ(−0, 10)
φ(0, 10)
⇔ eh = × 0, 05 × 100
1 − Φ(0, 10)

eh 8, 62 (0,5 pt)

Si les bénéfices attendus en T + 1 augmentent de 1 % cela augmente la


probabilité de versement de dividendes de 8,62 %.

3
Université d’Orléans - Maitrise d’Econométrie
Econométrie des Variables Qualitatives
Examen Terminal Janvier 2003. C. Hurlin

Exercice 1 (20 points) : Modèle Logit Multinomial

On considère un modèle logit multinomial non ordonné dans lequel la variable dépendante
observée pour le ième individu, notée yi , peut prendre 3 modalités codées respectivement 0, 1 et 2.
La probabilité que l’individu i choisisse la modalité j, ∀j = 0, 1, 2, est définie par :
exp [v (xi,j )]
P rob (yi = j) = (1)
exp [v (xi,0 )] + exp [v (xi,1 )] + exp [v (xi,2 )]
où xi,j désigne un vecteur (1, K) de variables explicatives conditionnant le choix de la j ème modalité
pour l’individu i. Nous allons successivement envisager le cas où la fonction v (.) est définie par
v (xi,j ) = xi β j (modèle logit indépendant) et où la fonction v (.) est définie par v (xi,j ) = xi,j β
(modèle logit conditionnel).

Partie I : Hypothèse IIA (5 points) On s’intéresse tout d’abord à l’hypothèse d’Indépendance


des Alternatives Non Pertinentes (IIA en anglais pour Independance of Irrelevant Alternative) dans
le cadre des modèles logit multinomiaux.

Question 1 (1.5 point) : Définissez de façon générale l’hypothèse d’Indépendance des Alterna-
tives Non Pertinentes et montrez que, dans le modèle logit, la condition nécessaire à cette
hypothèse se ramène à la condition ∀ (z, k) , v (xi,z )−v (xi,k ) indépendant de j, ∀j = z, j = k

Question 2 (2 points) : Montrez que cette condition est satisfaite dans le cas du modèle logit
multinomial indépendant et dans le cas du modèle logit multinomial conditionnel. Quelles
implications ont ces résultats notamment dans le cas du modèle conditionnel ?

Question 3 (1.5 point) : Trouvez un exemple de fonction v (xi,j ) pour laquelle le modèle logit
multinomial universel ne satisfait pas l’hypothèse IIA.

Partie II : Modèle Logit Indépendant (9 points) On considère à présent un modèle logit


multinomial indépendant dans lequel la probabilité que l’individu i choisisse la modalité j, ∀j =
0, 1, 2, est définie par :
exp xi β j
P rob (yi = j) = (2)
exp (xi β 0 ) + exp (xi β 1 ) + exp (xi β 2 )
Question 1 (1.5 point) : En divisant le numérateur et le dénominateur des probabilités pi,j =
P rob (yi = j) , j = 0, 1, 2, par la quantité exp (xi β 0 ) , montrez que dans le modèle logit in-
dépendant, les paramètres β 0 , β 1 et β 2 ne sont pas identifiables simultanément. Quelle solu-
tion adopte-ton généralement ?
Examen Terminal Janvier 2003. C. Hurlin page 2

Question 2 (1.5 point) : Montrez que la log-vraisemblance associée à un échantillon de N observations


y = (y1 , .., yN ) dans ce modèle s’écrit, en l’absence de toute normalisation des paramètres,
sous la forme suivante :
N 2 N 2
log L (y, β 0 , β 1 , β 2 ) = yi,j xi β j − log exp (xi β k ) (3)
i=1 j=0 i=1 k=0

Question 3 (3 points) : En posant β 0 = 0, dérivez à partir de l’expression précédente le vecteur du


gradient ainsi que la matrice hessienne de la log-vraisemblance. Montrez que cette fonction
est globalement concave. Qu’en déduisez concernant la phase d’estimation par M V des
paramètres du modèle ?

Question 4 (3 points) : On suppose qu’il n’y a qu’une seule variable explicative (K = 1) , notée
xi . Montrer que l’effet marginal associé à une variation de cette variable sur la probabilité
que l’individu i choisisse la j ème modalité, ∀j = 0, 1, 2, est défini par
∂pi,j
= pi,j β j − pi,1 β 1 − pi,2 β 2 (4)
∂xi
où pi,j = P rob (yi = j) . Qu’en déduisez vous concernant la variable exogène xi , si l’on suppose
que les paramètres vérifient
pi,2
β1 > β2 (5)
1 − pi,1

Partie III : Modèle Logit Conditionnel (6 points) On considère à présent un modèle logit
multinomial conditionnel dans lequel la probabilité que l’individu i choisisse la modalité j, ∀j =
0, 1, 2, est définie par :
exp (xi,j β)
P rob (yi = j) = (6)
exp (xi,0 β) + exp (xi,1 β) + exp (xi,2 β)

Question 1 (1.5 point) : Quel est le principal avantage du modèle logit conditionnel ?

Question 2 (1.5 point) : Montrez que la log-vraisemblance associée à un échantillon de N observations


y = (y1 , .., yN ) dans ce modèle s’écrit :
N 2 N 2
log L (y, β) = yi,j xi,j β − log exp (xi,k β) (7)
i=1 j=0 i=1 k=0

Question 3 (3 points) : On suppose que l’on dispose pour chacun des N individus de l’échantillon
d’une évaluation, notée xi,3 , du vecteur des variables explicatives pour une quatrième modalité
codée 3, non encore disponible dans l’espace de choix des agents. (i) Décrivez précisément la
démarche permettant d’estimer la probabilité que chaque individu i choisisse cette modalité 3
lorsqu’elle sera effectivement mise en place. On notera pi,3 l’estimateur obtenu. (ii) A partir
d’un intervalle de confiance sur l’estimateur du maximum de vraisemblance de β, proposez
un encadrement de la vraie probabilité pi,3 .

2
Examen Terminal Janvier 2003. C. Hurlin page 3

Exercice 2 (10 points) : Modèle Probit Ordonné

On considère une application tirée d’une étude de J. Gunther de la Federal Reserve Bank de
Dallas, intitulée ”Between a Rock and a Hard Place : The CRA-Safety and Soundness Pinch”.
Cette étude porte sur le Community Reinvestment Act (CRA), loi promulgué aux Etats Unis en
1977 et visant à encourager les institutions de dépôts (banques et autres institutions financières)
à répondre aux besoins en crédit des communautés dans lesquelles elles opèrent. Dans le cadre de
cette loi, les banques commerciales sont régulièrement évaluées par différentes instances de contrôle1
au regard des objectifs du CRA. La performance d’une institution de dépôt est contrôlée à partir
des informations disponibles sur cette institution (capacités, contraintes diverses, stratégie..), des
informations sur la communauté dans laquelle elle opère (démographie, données économiques, prêts,
investissements..) et des informations sur ses concurrents et sur l’état du marché. Une notation
(ou rating) est alors attribué selon quatre modalité. Si l’on considère une institution i, la note yi
est codée de la façon suivante :


 1 performances remarquables

2 performances satisfaisantes
yi =

 3 performances à améliorer

4 performances déplorables
On dispose d’un échantillon de 350 observations et l’on se propose de modéliser ces rating en
fonction de plusieurs variables explicatives :

• ASS : logarithme de l’actif de l’institution de dépôt.

• EQU : ratio capitaux propres sur actif.

• GROW T H : taux de croissance du P.I.B. de l’état dans lequel la banque opère.

• LOA : ratio prêts sur actif total de la banque

Afin de modéliser la notation des institutions en fonction de ces caractéristiques, on utilise un


modèle probit multinomial ordonné. On suppose que l’attribution du rating dépend de la
valeur prise par une variable latente continue inobservable yi∗ telle que :

yi∗ = xi β + εi (8)

où xi désigne le vecteur (1, 4) des quatre caractéristiques de la banque i et εi est i.i.d N 0, σ 2ε .


On suppose que le rating est déterminé par le modèle :


 1 si yi∗ < c1

2 si c1 ≤ yi∗ < c2
yi = (9)

 3 si c2 ≤ yi∗ < c3

4 si yi∗ > c3

où (c1 , c2 , c3 )3 ∈ R.
1
Office of the Comptroller of the Currency (OCC), Board of Governors of the Federal Reserve System (FRB),
Office of Thrift Supervision (OTS), and Federal Deposit Insurance Corporation (FDIC).

3
Examen Terminal Janvier 2003. C. Hurlin page 4

Question 1 (1 point) : Justifiez l’utilisation du modèle probit ordonné dans ce cas.

Question 2 (1.5 points) : Donnez, en fonction des paramètres β, c1 , c2 , c3 et σ 2ε , la formulation


des probabilités théoriques que le rating de l’institution de dépôt i, ∀i = 1, .., N, prenne les
valeurs 1, 2, 3 et 4 :

P rob (yi = 1) P rob (yi = 2) P rob (yi = 3) P rob (yi = 4)

Question 3 (1.5 points) : Commentez les résultats d’estimation par maximum de vraisemblance
reportés sur la figure (1) :

Figure 1: Probit Ordonné

Question 4 (3 points) : Calculez les réalisations des estimateurs des probabilités que la 70ème
institution de dépôt reçoive une notation ”performances remarquables”, ”performances sat-
isfaisantes”, ”performances à améliorer ” ou ”performances déplorables”, sachant que pour
cette institution a les caractéristiques suivantes :

ASS = 9.949 EQU = 0.066 GROW T H = 0.046 LOA = 0.660

Qu’en concluez vous pour le rating de cette banque ?

Question 5 (3 points) : En utilisant les résultats du premier chapitre de cours, déterminez la


variation de la probabilité que cette banque obtienne la rating ”performances remarquables”
engendrée par une augmentation d’une unité de son ratio capitaux propres sur actif.

4
Université d’Orléans - Maitrise Econométrie
Econométrie des Variables Qualitatives
Correction Examen Terminal Janvier 2003. C. Hurlin

Exercice 1 (20 points) : Modèle Logit Multinomial

Partie I : Hypothèse IIA (5 points)


Question 1 :
Cette hypothèse traduit le fait que le rapport de deux probabilités associés à deux évenements
particuliers est indépendant des autres événements (0.5 point). Ainsi, l’hypothèse est satisfaite si
∀ (z, k) le rapport de probabilité
pi,z P rob (yi = j)
=
pi,k P rob (yi = k)
est indépendant des alternatives j autres que z et k. Dans le modèle logit multinomial, on a :
pi,z exp [v (xi,z )]
= = exp [v (xi,z ) − v (xi,k )]
pi,k exp [v (xi,k )]
Ainsi, la condition garantissant l’hypothèse IIA dans un modèle logit multinomial se ramène à
∀ (z, k) , v (xi,z ) − v (xi,k ) indépendant de j, ∀j = z, j = k (1 point)

Question 2

Dans le cas du modèle logit multinomial indépendant, on a :


v (xi,z ) − v (xi,k ) = xi β z − xi β k = xi (β z − β k )
Cette différence est indépendante de la valeur des paramètres β j associés aux modalités j autres
que z et k. L’hypothèse IIA est vérifiée dans le modèle logit multinomial indépendant (0.5 point).

Dans le cas du modèle logit multinomial conditionnel, on a :


v (xi,z ) − v (xi,k ) = xi,z β − xi,k β = (xi,z − xi,k ) β
Cette différence est indépendante de la valeur des variables explicatives xi,j associées aux modalités
j autres que z et k. L’hypothèse IIA est vérifiée dans le modèle logit multinomial conditionnel (0.5
point).

On a vu dans le cours que l’hypothèse IIA n’est que rarement (exemple bus bleu, bus rouge)
satisfaite, ce qui pose le problème de la cohérence d’une modélisation de type logit multinomial
pour rendre compte de choix probabilistes (0.5 point). Toutefois, ces modèles logit multinomial
sont très souvent utilisés compte tenu de la simplicité de leur mise en oeuvre pratique. Dans
le cadre du modèle conditionnel, c’est cette hypothèse IIA qui permet notamment de faire des
prévisions sur les probabilités que les agents retiennent des modalités virtuelles, c’est à dire non
encore disponible dans le cadre des choix courants. L’exemple typique est le modèle hypothétique
de choix de transport (0.5 point).
Correction Examen Terminal Janvier 2003. C. Hurlin page 2

Question 3

Il existe bien évidemment une infinité de fonctions v (xi,j ) pour laquelle le modèle logit multino-
mial universel ne satisfait pas l’hypothèse IIA : on peut par exemple considérer la fonction :
m β
1
v (xi,j ) = xi,j − xi,s (1 point)
m+1 s=0

où m + 1 désigne le nombre de modalités, ici m = 2. Dans ce cas, on a en effet :


pi,z
= exp [v (xi,z ) − v (xi,k )]
pi,k
 
m β m β
 1 1 
= exp xi,z − xi,s − xi,k − xi,s
m + 1 s=0 m+1 s=0

Cette expression dépend des valeurs des variables explicatives pour les autres modalités j dif-
férentes de z et k. L’hypothèse IIA n’est pas satisfaite : ainsi un modèle logit universel ne satisfait
pas nécessairement l’hypothèse IIA. Les modèles logit conditionnels et logit indépendant, qui sont
des cas particuliers du modèle logit universel, vérifient cette hypothèse, mais ce n’est pas un résultat
général. (0.5 point)

Partie II : Modèle Logit Indépendant (9 points)


Question 1
Les probabilités s’écrivent :

exp xi β j
P rob (yi = j) = 2 (0.5 point)
k=0 exp (xi β k )
exp xi β j / exp (xi β 0 )
= 2
k=0 exp (xi β k ) / exp (xi β 0 )

On obtient alors :
1
P rob (yi = 0) =
1 + exp [xi (β 1 − β 0 )] + exp [xi (β 2 − β 0 )]
1
P rob (yi = 1) =
1 + exp [xi (β 0 − β 1 )] + exp [xi (β 2 − β 1 )]
1
P rob (yi = 2) =
1 + exp [xi (β 0 − β 2 )] + exp [xi (β 1 − β 2 )]
Par construction 2j=0 pj = 1, on dispose ainsi de deux probabilités indépendantes pour déter-
miner trois différences de paramètres (β 1 − β 0 ) , (β 2 − β 0 ) et (β 2 − β 1 ) . Naturellement, ces dif-
férences de paramètres ne sont identifiables que si l’on impose une contrainte de normalisation du
type β 0 = 0. Dès lors, on a deux probabilités indépendantes qui nous permettent d’identifier deux
paramètres β 1 et β 2 . Ces paramètres s’interprètent comme des écarts au vecteur β 0 . (1 point)

Question 2

2
Correction Examen Terminal Janvier 2003. C. Hurlin page 3

La log-vraisemblance associée à un échantillon de N observations y = (y1 , .., yN ) dans ce modèle


logit indépendant à trois modalités s’écrit :

N 2
log L (y, β 0 , β 1 , β 2 ) = yi,j log [P rob (yi = j)] (0.5 point)
i=1 j=0
N 2
exp xi β j
yi,j log 2
i=1 j=0 k=0 exp (xi β k )
avec
1 si yi = j
yij = ∀i = 1.., N ∀j = 0, 1, 2
0 sinon
On obtient alors :
N 2 N 2 2
log L (y, β 0 , β 1 , β 2 ) = yi,j xi β j − yi,j log exp (xi β k )
i=1 j=0 i=1 j=0 k=0
N 2 N 2
= yi,j xi β j − hi log exp (xi β k )
i=1 j=0 i=1 k=0

avec ∀i = 1.., N :
2
hi = yi,j = yi,0 + yi,1 + yi,2 = 1 (0.5 point)
j=0
En effet, on sait que la variable yi ne peut prendre qu’une seule et même valeur parmi les 3
modalités, dès lors 2j=0 yi,j = 1. Ainsi, on obtient finalement :
N 2 N 2
log L (y, β 0 , β 1 , β 2 ) = yi,j xi β j − log exp (xi β k ) (0.5 point)
i=1 j=0 i=1 k=0

Question 3
Sous l’hypothèse β 0 = 0, on a :
N 2 N 2
log L (y, β 1 , β 2 ) = yi,j xi β j − log 1 + exp (xi β k )
i=1 j=1 i=1 k=1

Dès lors, le vecteur du gradient s’écrit :


∂ log L(y,β 1 ,β 2 )
∂β 1
G (y, β 1 , β 2 ) = ∂ log L(y,β 1 ,β 2 )
∂β 2
avec pour z = 1, 2 :
N N 2
∂ log L (y, β 1 , β 2 ) ∂
= yi,z xi − log 1 + exp (xi β k ) (1 point)
∂β z ∂β z
i=1 i=1 k=1
N N
exp (xi β z )
= yi,z xi − xi
i=1 i=1
1 + 2k=1 exp (xi β k )
N
= (yi,z − pi,z ) xi (1)
i=1

3
Correction Examen Terminal Janvier 2003. C. Hurlin page 4

avec pi,z = P rob (yi = z) . De la même façon, on peut dériver la matrice hessienne :
 
∂ log L(y,β 1 ,β 2 ) ∂ log L(y,β 1 ,β 2 )
∂β 21 ∂β 1 ∂β 2
H (y, β 1 , β 2 ) =  ∂ log L(y,β 1 ,β 2 ) ∂ log L(y,β 1 ,β 2 )

∂β 1 ∂β 2 ∂β 22

Les éléments de cette matrice pour z = 1, 2 et k = 1, 2 sont définis par :


N N
∂ log L (y, β 1 , β 2 ) ∂ ∂pi,z
= (yi,z − pi,z ) xi =− xi
∂β z ∂β k ∂β k ∂β k
i=1 i=1

avec :
∂pi,z ∂ exp (xi β z )
= 2
∂β k ∂β k h=0 exp (xi β h )
Si k = z, alors cette expression devient :
 
∂pi,z  exp (xi β z ) exp (xi β k ) 
= −xi  2  = −xi piz pik ∀k = z
∂β k 2
h=0 exp (xi β h )

Si k = z, alors cette expression devient :


 
2
∂pi,z  exp (xi β z ) h=0 exp (xi β h ) − exp (xi β z ) exp (xi β k ) 
= −xi  2 
∂β k 2
h=0 exp (xi β h )
= −xi (piz − pi,z pik ) ∀k = z

On a donc finalement :
N
∂ log L (y, β 1 , β 2 ) − i=1 piz pik xi x i ∀k = z
= N
∂β z ∂β k − i=1 piz (1 − pik ) xi x i ∀k = z

On retrouve ainsi l’expression du cours :


N
∂ 2 log L (y, β 1 , β 2 , ..., β m )
=− pi,j (Ij,k − pi,k ) xi xi (1 point)
∂β j ∂β k i=1

On peut alors montrer que la fonction de log-vraisemblance est globalement concave en (β 1 , β 2 ) .


Ainsi, la fonction de log-vraisemblance d’un modèle logit multinomial indépendant est globalement
concave. Par conséquent, on peut utiliser différents algorithmes d’optimisation numérique propres
à ce type de problème (Newton Raphson par exemple) et les résultats ne sont pas sensibles au choix
des conditions initiales de ces algorithmes.

Question 4

L’effet marginal associé à une variation de cette variable sur la probabilité que l’individu i
choisisse la j ème modalité, ∀j = 0, 1, 2, est défini par :

∂pi,j ∂ exp xi β j ∂ exp xi β j


= 2 = (2)
∂xi ∂xi h=0 exp (xi β h )
∂xi H (xi )

4
Correction Examen Terminal Janvier 2003. C. Hurlin page 5

2
avec H (xi ) = h=0 exp (xi β h ) . On a donc :

∂pi,j 1 ∂ exp xi β j ∂H (xi )


= × H (xi ) − exp xi β j
∂xi H (xi )2 ∂xi ∂xi
2
1
= β j exp xi β j × H (xi ) − exp xi β j β z exp (xi β z )
H (xi )2 z=0
2
exp xi β j exp xi β j exp (xi β z )
= βj − βz
H (xi ) H (xi ) z=0
H (xi )

On obtient finalement :
2
∂pi,j
= β j pi,j − pi,j β z pi,z = pi,j β j − pi,1 β 1 − pi,2 β 2 (2 points)
∂xi z=0

Ainsi si
pi,2 β 2
β1 > ⇐⇒ β 1 − pi,1 β 1 − pi,2 β 2 > 0
1 − pi,1
Puisque pi,1 ≥ 0, on en déduit que :
∂pi,1
= pi,1 (β 1 − pi,1 β 1 − pi,2 β 2 ) ≥ 0 (0.5 point)
∂xi
Ainsi une augmentation d’une unité de la variable explicative induit ici une augmentation de
la probabilité que l’agent i choisisse la modalité 1 (0.5 point). C’est en effet la comparaison de la
valeur du coefficient obtenue dans la modalité 1, c’est à dire β 1 , à la moyenne pondérée par les
probabilités des autres coefficients dans les différents régimes :

pi,0 β 0 + pi,1 β 1 + pi,2 β 2 = pi,1 β 1 + pi,2 β 2

qui permet de déterminer si l’effet marginal est positif ou négatif.

Partie III : Modèle Logit Conditionnel (6 points)


Question 1
L’avantage de ce modèle se situe dans la possibilité qui est offerte de prédire la probabilité
d’une nouvelle modalité (virtuelle) en fonction de variables explicatives simulées. Le modèle logit
conditionnel permet en effet d’estimer la probabilité associée à une modalité virtuelle de la façon
suivante :
exp x∗i,m+1 β
Pm+1 = m (3)
1+ exp x∗i,k β + exp x∗i,m+1 β
k=1

où β désigne un estimateur convergent de β obtenu sur la base des modalités j = 0, .., m existant
et où x∗i,m+1 est une estimation des caractéristiques exogènes associées à la m + 1ème modalité
virtuelle. (1.5 point)

Question 2

5
Correction Examen Terminal Janvier 2003. C. Hurlin page 6

La log-vraisemblance associée à un échantillon de N observations y = (y1 , .., yN ) dans ce modèle


logit conditionnel à trois modalités s’écrit :

N 2
log L (y, β) = yi,j log [P rob (yi = j)] (0.5 point)
i=1 j=0
N 2
exp (xi,j β)
yi,j log 2
i=1 j=0 k=0 exp (xi,k β)

avec
1 si yi = j
yij = ∀i = 1.., N ∀j = 0, 1, 2
0 sinon
On obtient alors :
N 2 N 2 2
log L (y, β) = yi,j xi,j β − yi,j log exp (xi,j β)
i=1 j=0 i=1 j=0 k=0
N 2 N 2
= yi,j xi,j β − hi log exp (xi,j β)
i=1 j=0 i=1 k=0

avec ∀i = 1.., N :
2
hi = yi,j = yi,0 + yi,1 + yi,2 = 1 (0.5 point)
j=0

En effet, on sait que la variable yi ne peut prendre qu’une seule et même valeur parmi les 3
modalités, dès lors 2j=0 yi,j = 1. Ainsi, on obtient finalement :

N 2 N 2
log L (y, β) = yi,j xi,j β − log exp (xi,k β) (0.5 point)
i=1 j=0 i=1 k=0

Question 3

La démarche se fait en trois étapes : (i) On estime le vecteur β sur la base des 3 modalités
existant par une procédure de maximum de vraisemblance. Soit β l’estimateur ainsi obtenu :

β =arg max log L (y, β) (4)


{β}

On note Ω la matrice de variance covariance asymptotique de cet estimateur. Sous des conditions
standard on a : √ L
N β − β 0 −→ N 0, I (β 0 )−1
N→∞

∂ 2 log L (y, β)
Ω = I (β 0 ) = −E
∂β∂β β=β 0

6
Correction Examen Terminal Janvier 2003. C. Hurlin page 7

où β 0 désigne la vraie valeur du vecteur de paramètres (1 point). (ii) On estime alors la probabilité
que l’agent i choisisse la modalité 3 comme suit :

exp xi,3 β
pi,3 = 2
(5)
exp xi,k β + exp xi,3 β
k=0

On connaît ainsi pour chaque individu i une estimation de la probabilité que cet agent choisisse
la modalité 3 lorsqu’elle sera effectivement disponible (1 point). (iii ) On cherche alors la forme
de l’intervalle de confiance sur pi,3 . Pour simplifier on admet que les évaluations sur les variables
explicatives sont déterministes. On sait que sous des conditions standard pour un risque de premier
espèce de α% :
P rob β ≤ β ≤ β = 1 − α
avec β = β − Cα diag Ω1/2 et β = β + Cα diag Ω1/2 . La probabilité estimée s’écrit alors :

1
pi,3 = 2
(6)
1+ exp (xi,k − xi,3 ) β
k=0

Si l’on suppose que c’est une fonction croissante de β on a alors une encadrement du type (1 point)
:
2 −1 2 −1

1+ exp (xi,k − xi,3 ) β ≤ pi,3 ≤ 1+ exp (xi,k − xi,3 ) β


k=0 k=0

7
Correction Examen Terminal Janvier 2003. C. Hurlin page 8

Exercice 2 (10 points) : Modèle Logit Multinomial

Question 1 :

Les modèles ordonnés sont utilisés lorsque les valeurs prises par la variable multinomiale cor-
respondent à des intervalles dans lesquels va se trouver une seule variable latente inobservable
continue. Ainsi, un modèle polytomique univarié ordonné est un modèle dans lequel on a une vari-
able, plusieurs modalités, et un ordre naturel sur ces modalités. Ici tel est la cas pour la variable
de rating (1 point).

Question 2 :

Si l’on note Φ la fonction de répartition de la loi normale centrée réduite :

c1 β
P rob (yi = 1) = P rob (yi∗ < c1 ) = Φ − xi (0.5 point)
σε σε

c2 β c1 β
P rob (yi = 2) = P rob (c1 ≤ yi∗ < c2 ) = Φ − xi −Φ − xi (7)
σε σε σε σε
c3 β c2 β
P rob (yi = 3) = P rob (c2 ≤ yi∗ < c3 ) = Φ − xi −Φ − xi (0.5 point)
σε σε σε σε
c3 β
P rob (yi = 4) = P rob (yi∗ > c3 ) = 1 − Φ − xi (0.5 point)
σε σε

Question 3 :

Il s’agit de l’estimation d’un probit ordonné par MV. Tout d’abord on remarque que la procédure
d’optimisation de la vraisemblance a convergé. On dispose des estimateurs des paramètres β/σ ε
pour les quatre variables explicatives, mais encore une fois on ne peut pas les interpréter directement
(0.5 point). On constate qu’il n’y a pas de constante dans le vecteur des variables explicatives :
le vecteur xi ne peut contenir de constante pour les mêmes raison d’identification qui avaient été
évoquées dans le cas du modèle dichotomique en ce qui concerne la normalisation du seuil γ. On
ne peut identifier à la fois le paramètre associé à la constante et les seuils cj . Enfin, on dispose
des estimateurs des paramètres c1 /σ ε , c2 /σ ε et c3 /σ ε . (0.5 point). Tous les coefficients sont
statistiquement différents de zéro pour un risque de première espèce de 5% (z-statistiques) et le
test joint de la nullité de tous les coefficients (LR statistique) permet de rejeter H0 (0.5 point)

Question 4 :

Si l’on note β et cj les estimateurs du MV des paramètres β/σ ε et cj /σ ε , on a (1 point) :

pi,1 = Φ c1 − xi β (8)

8
Correction Examen Terminal Janvier 2003. C. Hurlin page 9

pi,2 = Φ c2 − xi β − Φ c1 − xi β (9)

pi,3 = Φ c3 − xi β − Φ c1 − xi β (10)

pi,4 = 1 − Φ c3 − xi β (11)
où pi,j = P rob (yi = j) , j = 1, 2, 3, 4. Après évaluations numériques on a (2 points) :
pi,1 0.272 (12)
pi,2 0.309 (13)
pi,3 0.302 (14)
pi,4 0.117 (15)
On en déduit que la plus grande probabilité est que cette banque obtienne un rating ”performances
satisfaisantes” ou un rating ”performances à améliorer ”.

Question 5 :

On suppose ici pour simplifier les notations que σ ε = 1. On sait que la probabilité que cette
banque obtienne ”performances remarquables” est donnée par pi,1 = Φ (c1 − xi β) . On cherche donc
à déterminer :
∂pi,1 ∂Φ (c1 − xi β)
= (16)
∂equi ∂equi
Si l’on note f (.) la fonction de densité des résidus du modèle, on a vu dans le cadre des modèles
dichotomiques que :
∂F (xi β) ∂F (xi β) ∂ (xi β) ∂F (xi β)
= = β = f (xi β) .β j
[j]
∂xi ∂ (xi β) ∂x[j] ∂ (xi β) j
i

Donc ici, on a :
∂Φ (c1 − xi β) ∂Φ (c1 − xi β) ∂ (xi β) ∂Φ (c1 − xi β)
= = β equ = −φ (c1 − xi β) β equ
∂equi ∂ (xi β) ∂equi ∂ (xi β)
où β equ désigne le coefficient associé à la variable EQU et φ (.) la fonction de densité de la loi
normale centrée réduite. Ainsi dans notre application un estimateur de l’effet marginal de EQU
sur la probabilité du rating ”performances remarquables” est :
∂pi,1
= −φ c1 − xi β β equ
∂equi

où β est un estimateur de β/σ ε , c1 est un estimateur de c1 /σ ε et β equ un estimateur de β equ /σ ε .


On a alors :
∂pi,1
= −φ −3.076 − xi β × 4.036
∂equi
avec xi β = −2.465. On a donc :
∂pi,1
= −1.335
∂equi
Une augmentation du ratio capitaux propres sur actif réduit donc la probabilité que la banque
obtienne le rating ”performances remarquables” au regard des objectifs du CRA.

9
Université d’Orléans - Maitrise d’Econométrie
Econométrie des Variables Qualitatives
Examen Terminal Decembre 2003. C. Hurlin

Exercice 1 (12 points) : Modèle Tobit Simple Censuré


Le but de cet exercice est d’évaluer l’impact d’une action marketing sur le chiffre d’affaire d’une société
de cosmétique. Cette société dispose pour cela de données d’enquête concernant la consommation annuelle
du type de produit cosmétique concerné, notées ci , récoltées auprès d’un échantillon de 10 000 individus.
Pour chaque individu, indicé i, on dispose d’observations concernant:

• son revenu annuel moyen désigné par la variable ri , exprimé en milliers d’euros
• le prix moyen des biens en euros relevé à partir des différents achats effectués par l’individu i, noté pi .
• s’il a été ou non l’objet dans l’année d’une opération marketing. La variable dichotomique correspon-
dante est codée mi = 1 s’il y a une action marketing et mi = 0 sinon.
• la catégorie socio-professionnelle (CSP) de l’individu représentée par une variable polytomique si codée
respectivement 1 pour ”chômeurs”, 2 pour un statut ”cadres et cadres supérieurs, 3 pour ”retraités”
et 0 pour le statut ”ouvriers et employés” qui sera considéré comme référence.

On considère alors le modèle tobit simple censuré suivant :


 ∗
ci si c∗i > 0
ci = (1)
0 si c∗i ≤ 0

où ci désigne une variable inobservable telle que :

c∗i = β 0 + β 1 ri + β 2 pi + β 3 mi + β 4 si + εi (2)
 
où εi est N.i.d. 0, σ 2ε .

Partie I : Analyse de la spécification et modèle probit (7 points)


Question 1 (2 points) : (i) Précisez le signe attendu des paramètres théoriques β j , j = 0, 1, 2, 3 en
justifiant économiquement votre réponse. Que peut on conclure quant au signe de β 4 ? On définit des
(j)
variables dichotomiques cspi associées à la CSP de l’individu i :

(j) 1 si si = j
cspi = j = 0, 1, 2, 3, i = 1, .., N
0 sinon

(ii) Proposez une écriture du modèle (2) en substituant la variable si par autant de variables di-
(j)
chotomiques cspi qu’il est nécessaire et commentez les signes des coefficients γ j associés à ces vari-
ables.
Question 2 (1.5 points) : On construit une variable dichotomique zi valant 1 si la consommation observée
de l’individu i est strictement positive et 0 dans le cas contraire. Dérivez la probabilité que l’agent i
consomme effectivement un produit cosmétique de cette gamme en fonction des vecteurs de paramètres
β = ( β 1 β 2 β 3 ) et γ = (γ 1 γ 2 γ 3 ) , d’une constante θ et de la variance des résidus σ 2ε .
Question 3 (1.5 points) : Les paramètres du modèle probit associé à la probabilité de consommer ont été
estimés à partir des 10 000 individus de l’échantillon par maximum de vraisemblance. Le résultat de
ces estimations est reproduit sur la figure (1). Commentez ces résultats.
Figure 1: Résultats d’Estimation du Modèle Probit

Question 4 (2 points) : On s’intéresse au sous échantillon des individus appartenant à la CSP ”cadres
et cadres supérieurs”. On suppose que le revenu moyen annuel de ces individus est de 20000 euros,
que le prix moyen de leurs achats est de 30 euros. Calculez pour l’individu moyen de cette CSP, la
déformation de la probabilité d’achat imputable à l’action marketing.

Partie II : Modèle Tobit (5 points) Les résultats d’estimation par maximum de vraisemblance du
modèle tobit simple censuré sont reportés sur la figure (2). On admet que l’estimateur du maximum de
vraisemblance est convergent. On note
k l
(1) (2) (3)
xi = 1 ri pi mi cspi cspi cspi
(1,K)

Υ = (θ β 1 β 2 β 3 γ 1 γ 2 γ 3 )
(K,1)

Question 1 (1.5 points) : On considère l’individu moyen de la CSP des ”cadres et cadres supérieurs”
(2)
(cspi = 1) pour lequel on rappelle que ri = 20 et p = 30. Calculez pour cet individu une prévision
du niveau de consommation potentiel E (c∗i /xi ) en l’absence d’action marketing, puis refaites le même
calcul en cas d’action marketing. Quelle est alors la variation de consommation potentielle c∗i imputable,
toutes choses égales par ailleurs, à ce type d’action marketing ?
Question 2 (1.5 points) : La société X vous demande d’évaluer (toujours pour le même individu moyen)
la variation de la consommation effective imputable à l’action marketing. Vous calculerez pour cela
la prévision de la variable dépendante E (ci /xi ) avec ou sans action marketing, et vous en déduirez la
variation consommation effective imputable à cette action marketing.

2
Figure 2: Estimation du Modèle Tobit

Question 3 (2 points) : Déterminez l’effet marginal associé au revenu ri et décomposez cet effet marginal
en un effet sur la probabilité de consommer et un effet sur le montant de consommation lorsque cette
dernière est observable (McDonald1 et Moffit 1980). Appliquez cette décomposition à l’individu moyen
de la CSP ”cadres et cadres supérieurs” en l’absence d’action marketing.

1 McDonald, J. and R. Moffitt (1980) ”The Uses of Tobit Analysis”, Review of Economic and Statistics, 62, pp. 318-321

3
Exercice 2 (10 points) : Modèle de déséquilibre
On cherche dans le cadre de cet exercice à construire la log-vraisemblance associée à un modèle de
déséquilibre suivant la méthodologie proposée par Nelson et Maddala (1974)2 . Ce type de modèle se classe
dans la famille des modèles à régime inobservable et présentent de fortes similarités avec les modèles Tobit
censurés.

Les modèles de déséquilibre sont fondés sur l’idée selon laquelle les prix ne s’ajustent qu’imparfaitement
et qu’ils ne peuvent à tout moment équilibrer l’offre et la demande sur le marché étudié (Benassy 19763 ).
On note Dt la demande qui dépend d’un ensemble de facteurs X1,t et St l’offre supposée dépendre d’un
ensemble de facteurs X2,t .
Dt = X1,t β 1 + ε1,t (3)
St = X2,t β 2 + ε2,t (4)
K
où ε1,t et ε2,t désignent les résidus des deux régimes, β i ∈ R pour i = 1, 2 et où les variables explicatives X1,t
et X2,t sont continues et observables. En revanche, on suppose que l’offre et la demande sur le marché
ne sont pas directement observables. En l’absence d’ajustement des prix, la règle nous permet toutefois
de postuler que la quantité effectivement échangée sur le marché notée Qt , qui est observable,
correspond au minimum de l’offre et la demande.

Qt = min (Dt , St ) (5)

Ainsi par exemple, on observe la demande (Qt = Dt ) dans le cas d’un régime de demande c’est à
dire lorsque Dt < St . On suppose pour simplifier que le vecteur des résidus εt = (ε1,t ε2,t ) est i.i.d. et
normalement distribué N (0, Ω) , avec :
 2 
σ1 0
Ω = E (εt εt ) = (6)
0 σ 22

On cherche ici à construire la log-vraisemblance associée à un échantillon de T observations q = (q1 , .., qT )


 
et x = (x1 , ..., xT ) avec x = (x1,t x2,t ) pour un ensemble de paramètres θ = β 1 β 2 σ21 σ 22 .
T
[
h (θ) = L (θ, q, x) =
L log [fQt (qt , θ)] (7)
t=1

où fQt (qt , θ) désigne la densité marginale de Qt associée à une observation qt . A partir de cette vraisemblance,
Nelson et Maddala (1974) construisent des estimateurs du maximum de vraisemblance des paramètres β.

Les questions peuvent être traitées indépendamment les unes des autres en utilisant les résultats fournis.

On cherche tout d’abord à construire la densité marginale fQt (qt , θ), notée fQt (qt ) pour simplifier les
notations, à la base de la construction de la log-vraisemblance. Pour cela, on admet que :

fQt (qt ) = f Qt |Dt <St (qt ) + f Qt |St <Qt (qt ) (8)

où f Qt |Dt <St (qt ) désigne la densité marginale de Qt sous l’hypothèse Dt < St et f Qt |St <Qt (qt ) désigne la
densité marginale de Qt sous l’hypothèse St < Dt . On note gDt ,St (dt , st ) la densité jointe de Dt et St pour
des réalisations respectives dt et st de la demande et de l’offre.

Question 1 (3 points) : En remarquant que la densité marginale de la demande Dt s’écrit :


] ∞
fDt (dt ) = gDt ,St (dt , z) dz
−∞
2 Nelson, F.D,.et Maddala, G.S., (1974), “Maximum Likelihood Methods for Models of Markets in Disequilibrium”, Econo-
metrica, 42, No. 6, November, pp. 1013-1030.
3 Benassy, J.P. (1976), ”Macroéconomie et théorie du déséquilibre”, Dunod

4
montrez que la densité marginale de la quantité Qt lorsque Dt < St s’écrit sous la forme :
] ∞
f Qt |Dt <St (qt ) = gDt ,St (dt , z) dz (9)
qt =dt

et que de façon symétrique :


] ∞
f Qt |St <Dt (qt ) = gDt ,St (z, st ) dz (10)
qt =st

Question 2 (2 points) : En reprenant la définition de la densité marginale d’un vecteur de variables


normales, montrez que la densité jointe gDt ,St (dt , st ) des variables Dt et St s’écrit :
%  2 & %  2 &
1 1 qt − x1,t β 1 1 1 st − x2,t β 2
gDt ,St (dt , st ) = √ exp − ×√ exp − (11)
2πσ 1 2 σ1 2πσ2 2 σ2

Question 3 (3 points) : A partir des résultats des questions 1 et 2, montrez que la densité marginale de la
quantité échangée Qt lorsque l’on est en régime de demande Dt < St peut s’écrire sous la forme :
  ] ∞ %  2 &
1 qt − x1,t β 1 1 1 z − x2,t β 2
f Qt |Dt <St (qt ) = φ ×√ exp − dz
σ1 σ1 2πσ2 qt 2 σ2

où φ (.) désigne
 la fonction
 de densité de la loi normale centrée réduite. En posant un changement de
variable zh = z − x2,t β 2 /σ 2 , avec dz = dh
z σ 2 , montrez que cette expression se ramène à :
   
1 qt − x1,t β 1 x2,t β 2 − qt
f Qt |Dt <St (qt ) = φ ×Φ (12)
σ1 σ1 σ2

où Φ (.) désigne la fonction de répartition de la loi normale centrée réduite.

Question 4 (2 points) : On admet que de façon, symétrique


   
1 qt − x2,t β 2 x1,t β 1 − qt
f Qt |St <Qt (qt ) = φ ×Φ (13)
σ2 σ2 σ1

Montrez que la log-vraisemblance du modèle de déséquilibre s’écrit alors :


T
[         
1 qt − x1,t β 1 x2,t β 2 − qt 1 qt − x2,t β 2 x1,t β 1 − qt
h (θ) =
L log φ ×Φ + φ ×Φ
t=1
σ1 σ1 σ2 σ2 σ2 σ1

Que devient cette expression lorsque σ1 tend vers 0 ? Quels problèmes cela pose-t-il en termes d’opti-
misation numérique lorsque l’on cherche à déterminer l’estimateur du maximum de vraisemblance des
paramètres ?

5
Université d’Orléans - Maitrise Econométrie
Econométrie des Variables Qualitatives
Correction Examen Terminal Décembre 2003. C. Hurlin

Exercice 1 (12 points) : Modèle Tobit Simple Censuré

Partie I : Modèle Probit (7 points)


Question 1 : Dans le modèle, la variable c∗i désigne la consommation potentielle. On s’attend donc à ce
que la consommation incompressible vérifie β 0 > 0, on s’attend à ce que la consommation augmente
avec le revenu de l’agent (β 1 > 0), qu’elle diminue avec le prix moyen des bien (β 2 < 0) et que les
actions de marketing augmentent ou au pire laissent inchangée la consommation (β 3 ≥ 0) (0.5 point)
On ne peut pas conclure quant au signe de β 4 . Il faut donc définir 3 variables dummy:

(j) 1 si si = j
cspi = j = 1, 2, 3, i = 1, .., N
0 sinon
(0)
On n’introduit ici que 3 variables dummy, la référence cspi n’étant pas introduite. Soit γ j le paramètre
(j)
associé à cspi . Le modèle devient alors :
(1) (2) (3)
c∗i = θ + β 1 ri + β 2 pi + β 3 mi + γ 1 cspi + γ 2 cspi + γ 3 cspi + εi (1)

où θ désigne une constante différente de β 0 . On s’attend alors à ce que la situation ”chômeur” conduise
à une consommation moindre par rapport à la référence ”ouvrier et employé” (γ 1 < 0), qu’au contraire
les deux autres cas (”cadres et cadres supérieurs”, et ”retraités”) conduisent à une consommation plus
forte toutes choses égales par ailleurs : γ 2 > 0 et γ 3 > 0 (1.5 point)
Question 2 : On pose une variable zi telle que :

1 si ci > 0
zi = (2)
0 sinon

La probabilité que l’agent consomme effectivement est alors égale à :

P rob (zi = 1) = P rob (c∗i > 0)


 
(1) (2) (3)
= P rob εi > −θ − β 1 ri − β 2 pi − β 3 mi − γ 1 cspi − γ 2 cspi − γ 3 cspi
 
(1) (2) (3)
= 1 − P rob εi < −θ − β 1 ri − β 2 pi − β 3 mi − γ 1 cspi − γ 2 cspi − γ 3 cspi
 
(1) (2) (3)
= P rob εi < θ + β 1 ri + β 2 pi + β 3 mi + γ 1 cspi + γ 2 cspi + γ 3 cspi

On en déduit que cette probabilité s’écrit sous la forme :


 
(1) (2) (3)
P rob (zi = 1) = Φ θ + β 1 ri + β 2 pi + β 3 mi + γ 1 cspi + γ 2 cspi + γ 3 cspi (3)

où Φ (.) désigne la fonction de répartition de la loi normale centrée réduite (1.5 points).
Question 3 : On observe tout d’abord que l’algorithme de maximisation de la vraisemblance a convergé
et que les paramètres sont tous significatifs à l’exception de la constante pour un risque de première
espèce de 5% (0.5 point). Le modèle est globalement significatif (LR-test) et semble très correct au sens
du R2 de McFadden. Conformément à l’intuition économique, une hausse du revenu tend à accroître
la probabilité de consommation tandis qu’une hausse du prix moyen semble diminuer cette probabilité.
L’action marketing tend toutes choses égales par ailleurs à augmenter la probabilité de consommer.
Enfin, on vérifie que par rapport à la CSP de référence (ouvrier et employé), la CSP ”cadre” augmente
la probabilité tout comme l’appartenance à la CSP ”retraité”. Inversement, l’appartenance à la CSP
”Chômeur” diminue la probabilité d’acheter (1 point).
Question 4 : Considérons l’individu moyen cadre (csp(1) = csp(3) = 0 et csp(2) = 1) qui gagne en moyenne
r = 20 (attention la variable r est exprimée en milliers d’euros) et pour lequel p = 30. Sans action
marketing (m = 0), son index est alors égal à :

index = 3.199342216 ∗ R − 2.34606849 ∗ P + 5.624149321 + 0.392022012 = −0.3790

La probabilité d’achat pour cet individu est alors égale à 0.3523. Dans le cas où cet individu a été
l’objet d’une action marketing (m = 1) son index passe à :

index = 3.199342216 ∗ R − 2.34606849 ∗ P + 1.507599386 ∗ M + 5.624149321 + 0.392022012 = 1.1286

La probabilité associée passe alors à 0.8705, soit une différence de probabilité toutes choses égales par
ailleurs de 0.5182 (2 points).

Partie II : Modèle Tobit (5 points)


Question 1 : On sait que la prévision de la variable latente dans le modèle tobit s’écrit :

E (c∗i /xi ) = xi Υ

Dès lors, en l’absence d’action marketing (mi = 0) on a :

e = 0.492956823 + 1.600256402 ∗ R − 1.198180892 ∗ P + 0.7886033013 ∗ M + 2.771210716


xi Υ

La prévision est alors égale à :


E (c∗i /xi , mi = 0) = −0.6761 (4)
Etant donné que nous évaluons ici la consommation potentielle, il est possible d’obtenir une quantité
négative. Dans le cas d’une action marketing, la prévision vaut :

E (c∗i /xi , mi = 1) = 0.1125 (5)

Ainsi, toutes choses égales par ailleurs la variation de la consommation potentielle imputable à l’action
marketing est égale à:
E (c∗i /xi , mi = 1) − E (c∗i /xi , mi = 0) = 0.7886 (6)

Question 2 : On sait que la prévision de la variable dépendante s’écrit dans ce cas :


# $ # $
e
xi Υ e
xi Υ
E (ci /xi ) = Φ e eε φ
xi Υ + σ

σ eε
σ

Ainsi, en l’absence d’action marketing (mi = 0) on a :


   
−0.6761 −0.6761
E (ci /xi , mi = 0) = Φ eε φ
(−0.6761) + σ = 0.0991

σ eε
σ

Avec action marketing (mi = 1) on a :


   
0.1125 0.1125
E (ci /xi , mi = 1) = Φ eε φ
0.1125 + σ = 0.2649

σ eε
σ

Ainsi, l’accroissement de consommation effective est de 0.1658.

2
Question 3 : Selon la décomposition de McDonald et Moffit (1980), la variation du revenu ri a deux effets
sur la prévision de la variable dépendante ci :
∂E ( ci / xi ) ∂E ( ci / xi , ci>0 ) ∂P rob (ci > 0)
= P rob (ci > 0) + E ( ci / xi , ci>0 )
∂ri ∂ri ∂ri
D’une part, la variation de ri modifie l’espérance conditionnelle de ci dans la partie positive de la
distribution. D’autre part, la variation de ri affecte la probabilité que l’observation ci appartienne à
cette partie de la distribution. On, montre que cette décomposition peut se réécrire sous la forme :
      
∂E ( ci / xi ) xi Υ xi Υ xi Υ xi Υ
=Φ β 1 1 − λi + λi
∂ri σε σε σε σε
   
xi Υ xi Υ xi Υ
+β 1 φ + λi
σε σε σε

On sait que si mi = 0, on a xi Υ e = −0.6761 et β e1 = 1.60. Ainsi, ici il vient :


# $ + # $% # $&,
∂E ( ci / xi , ci>0 ) e
xi Υ e
xi Υ e
xi Υ e
xi Υ
P rob (ci > 0) =Φ e
β 1 1 − λi + λi
∂ri eε
σ eε
σ eε
σ eε
σ
      
−0.6761 −0.6761 −0.6761 −0.6761
=Φ × 1.60 × 1 − λi + λi
0.5012 0.5012 0.5012 0.5012
= 0.0231
De la même façon on a :
# $% # $&
∂P rob (ci > 0) e e
xi Υ e
xi Υ e
xi Υ
E ( ci / xi , ci>0 ) = β1φ + λi
∂ri eε
σ eε
σ eε
σ
   
−0.6761 −0.6761 −0.6761
= 1.60 × φ + λi
0.5012 0.5012 0.5012
= 0.1188
On a donc un effet plus fort du revenu sur la probabilité d’obtenir une consommation positive que sur
l’espérance conditionnelle de la consommation sur sa partie quantitative.

Exercice 2 (8 points) : Modèle de déséquilibre

Question 1 (3 points) : On sait que la densité marginale de la demande Dt s’écrit :


] ∞
fDt (dt ) = gDt ,St (dt , z) dz
−∞

Lorsque Dt < St , on sait alors que Qt = min (Dt , St ) = Dt . Par conséquent, si Dt < S la densité
marginale de Qt correspond à celle de Dt . Mais le domaine sur lequel on intègre la fonction de densité
jointe gDt ,St (dt , z) en z n’est pas alors défini de −∞ à +∞. Puisque l’on intègre sur les niveaux d’offre
st = z, ceux si doivent vérifier la contrainte z > dt pour chaque observations st comme on le voit sur
le graphique ci-dessous. Ainsi, on montre aisément que l’on a :
] ∞
f Qt |Dt <St (qt ) = gDt ,St (dt , z) dz (7)
qt =dt

puisque l’on intègre uniquement pour des valeurs de l’offre st = z supérieures à l’observation dt .
Naturellement de façon symétrique :
] ∞
f Qt |St <Dt (qt ) = gDt ,St (z, st ) dz (8)
qt =st

3
Figure 1: Densité jointe gDt ,St (dt , st ) pour un niveau donné dt

1.4

1.2

g(dt,st)
0.8

0.6

0.4

st >dt
0.2

dt
0
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1
st

Question 2 (2 points) : Alors on sait que sous nos hypothèses le vecteur Zt = (Dt St ) suit une loi normale
contrée sur (X1,t β 1 X2,t β 2 ) et de matrice de variance covariance égale à Ω. On en déduit que :
%    &
1 1 dt − x1,t β 1 dt − x β
gDt ,St (dt , st ) = s exp − Ω−1 1,t 1
2π det (Ω) 2 st − x2,t β 2 st − x2,t β 2
%    2 −1  &
1 1 dt − x1,t β 1 σ1 0 dt − x1,t β 1
= s exp −
2π det (Ω) 2 st − x2,t β 2 0 σ22 st − x2,t β 2

On montre ainsi que :


+ % 2  2 &,
1 1 dt − x1,t β 1 st − x2,t β 2
gDt ,St (dt , st ) = exp − +
2πσ1 σ 2 2 σ1 σ2
%  2 & %  2 &
1 1 dt − x1,t β 1 1 st − x2,t β 2
= exp − × exp −
2πσ1 σ 2 2 σ1 2 σ2
%  2 & %  2 &
1 1 qt − x1,t β 1 1 1 st − x2,t β 2
= √ exp − ×√ exp −
2πσ1 2 σ1 2πσ2 2 σ2

Question 3 (3 points) : A partir des résultats des questions 1, on sait que


] ∞
f Qt |Dt <St (qt ) = gDt ,St (dt , z) dz (9)
qt =dt

En utilisant l’expression de la densité jointe de la question 2, il vient :


] ∞ %  2 & %  2 &
1 1 qt − x1,t β 1 1 1 z − x2,t β 2
f Qt |Dt <St (qt ) = √ exp − ×√ exp − dz
qt 2πσ1 2 σ1 2πσ 2 2 σ2
%  2 & ] ∞ %  2 &
1 1 qt − x1,t β 1 1 1 z − x2,t β 2
= √ exp − × √ exp − dz
2πσ1 2 σ1 qt 2πσ 2 2 σ2
  ] ∞ %  2 &
1 qt − x1,t β 1 1 1 z − x2,t β 2
= φ ×√ exp − dz
σ1 σ1 2πσ2 qt 2 σ2

4
On vérifie que l’on a alors :
  ] %  2 &
qt − x1,t β 1 ∞ z − x2,t β 2
1 1 1
f Qt |Dt <St (qt ) = φ ×√ exp − dz (10)
σ1 σ1 2πσ2 qt 2 σ2
 
Posons un changement de variable zh = z − x2,t β 2 /σ 2 , avec dz = dh z σ 2 , il vient pour le deuxième
terme du produit :
] ∞ %  2 & ] ∞ # $
1 1 z − x2,t β 2 1 zh2
√ exp − dz = √ exp − dh
z σ2
2πσ 2 qt 2 σ2 2πσ2 h qt 2
] ∞ # $
1 zh 2
= √ exp − dhz
2π h qt 2
 
avec qht = qt − x2,t β 2 /σ2 . Donc cette intégrale peut s’exprimer en fonction de Φ (.) comme suit :
] %  2 &
∞ z − x2,t β 2
1 1
√ exp − qt ) = Φ (−h
dz = 1 − Φ (h qt )
2πσ2 qt 2 σ2

Finalement on a bien :
   
1 qt − x1,t β 1 x2,t β 2 − qt
f Qt |Dt <St (qt ) = φ ×Φ (11)
σ1 σ1 σ2

Question 4 (2 points) : On admet que :


   
1 qt − x2,t β 2 x1,t β 1 − qt
f Qt |St <Qt (qt ) = φ ×Φ (12)
σ2 σ2 σ1

Nous avions vu que :


T
[ T
[  
h (θ) =
L log [fQt (qt , θ)] = log f Qt |Dt <St (qt ) + f Qt |St <Qt (qt )
t=1 t=1

En substituant ces deux termes par leurs expressions, on montre que :


T
[         
1 qt − x1,t β 1 x2,t β 2 − qt 1 qt − x2,t β 2 x1,t β 1 − qt
h (θ) =
L log φ ×Φ + φ ×Φ
t=1
σ1 σ1 σ2 σ2 σ2 σ1
(13)

Vous aimerez peut-être aussi