Vous êtes sur la page 1sur 59

Variables instrumentales

1 / 34
Introduction

Dans ce chapitre, on supposera que les échantillons suffisamment


grands (résultats asymptotiques)
On a considéré jusqu’à présent le modèle suivant

yi = xi0 β 0 + ... + xiK β K + ε i

avec l’hypothèse E [Xi0 ε i ] = 0.


Trois exemples types d’endogénéité des régresseurs.
Erreur de mesure sur les variables
Simultanéité
Omission de régresseurs

2 / 34
Introduction
Erreur de mesure sur les variables (1)

Considérons le modèle suivant

yi = xi∗ β + ε i

3 / 34
Introduction
Erreur de mesure sur les variables (1)

Considérons le modèle suivant

yi = xi∗ β + ε i

La variable xi∗ est supposée pour simplifier de dimension 1 et centrée


comme la variable yi et on fait l’hypothèse E [ε i /xi∗ ] = 0

3 / 34
Introduction
Erreur de mesure sur les variables (1)

Considérons le modèle suivant

yi = xi∗ β + ε i

La variable xi∗ est supposée pour simplifier de dimension 1 et centrée


comme la variable yi et on fait l’hypothèse E [ε i /xi∗ ] = 0
On suppose que la variable xi∗ est mesurée avec erreur

3 / 34
Introduction
Erreur de mesure sur les variables (1)

Considérons le modèle suivant

yi = xi∗ β + ε i

La variable xi∗ est supposée pour simplifier de dimension 1 et centrée


comme la variable yi et on fait l’hypothèse E [ε i /xi∗ ] = 0
On suppose que la variable xi∗ est mesurée avec erreur
xi = xi∗ + ei avec E ei /xi∗ = 0 et ei et ε i non corrélés.
 

3 / 34
Introduction
Erreur de mesure sur les variables (2)*

Dans ces conditions le modèle dont on dispose est

yi = xi β + ε i − βei
| {z }
vi

On est dans une situation dans laquelle le résidu de l’équation vi est


corrélé avec la variable explicative.

E [vi xi ] = E [(ε i − βei ) (xi∗ + ei )] = − βE ei2 = − βσe2 6= 0


 

On voit alors qu’à la limite le paramètre de la regression ne coincide


pas avec celui du modèle

E [xi0 vi ] σe2
 
P
β̂ mco → β + = β 1− 2
E [xi0 xi ] σe + σx2∗

4 / 34
Introduction
Simultanéité

La simultanéité est la situation dans laquelle certains régresseurs et la


variable à expliquer sont déterminés simultanément. Un exemple
typique est celui d’un équilibre offre demande
Une équation de demande va s’écrire

yid = −αd pi + xid βd + εdi

La variable de prix pi ne peut pas être considérée comme exogène. En


effet, il y a aussi une équation d’offre

yis = αs pi + xis βs + εsi

5 / 34
Introduction
Simultanéité

On peut résoudre ce système pour exprimer


1 
d d s s d s

pi = x β − x β + ε − ε
αd + αs i i i i

Un choc de demande εdi est transmis dans les prix : E εdi pi 6= 0.


 

On peut voir que l’estimateur des MCO de l’équation de demande ou


d’offre sera biaisé
Exemple : estimation Offre/Demande de travail en fonction du salaire;
Relation Criminalité/Nombre de policiers (cf TD sur ordinateur)

6 / 34
Plan

La méthode des variables instrumentales


L’estimateur des doubles moindres carrés
Interprétation de la condition de rang: lim rangE [Zi0 Xi ] = K + 1
Test de suridentification
Test d’exogénéité des variables explicatives

7 / 34
Plan

La méthode des variables instrumentales


L’estimateur des doubles moindres carrés
Interprétation de la condition de rang: lim rangE [Zi0 Xi ] = K + 1
Test de suridentification
Test d’exogénéité des variables explicatives

8 / 34
La méthode des variables instrumentales
Biais de l’estimateur mco

Le modèle
yi = Xi β + ε i
K
avec Xi = xi0 , ..., xi

est dit à variables endogènes si on n’a pas la
propriété
E Xi0 ε i = 0
 

Les variables xik pour lesquelles E ε i xik 6= 0 sont endogènes, les


 

autres sont exogènes.

9 / 34
La méthode des variables instrumentales
Biais de l’estimateur mco

Dans ce modèle l’estimateur des MCO n’est pas convergent.


  −1
 n  n  −1
β̂ mco = β +  ∑ Xi0 Xi  ∑ Xi0 ε i → β + E Xi0 Xi E Xi0 ε i
    
 i =1  i =1 | {z }
| {z } | {z } 6 =0
X 0X X 0ε

donc plim β̂ mco 6= β


L’ensemble des coefficients est biaisé et pas seulement ceux des
variables endogènes.

10 / 34
La méthode des variables instrumentales
Identification (1)

Considérons le modèle suivant

yi = X1i β 1 + X2i β 2 + ε i

les variables X2i (dimX2i =K2 + 1) contiennent la constante et sont


exogènes, mais on ne fait pas l’hypothèse d’exogénéité des variables
X1i (dimX1i =K1 =K − K2 ).

11 / 34
La méthode des variables instrumentales
Identification (2)*

Définition : un ensemble de variables Zi = (Zie , X2i ), de dimension


H + 1, non parfaitement corrélées (lim rangE [zi0 zi ] = H + 1) est dit
ensemble de variables instrumentales si les deux conditions
(conditions de d’orthogonalité et de rang) suivantes sont satisfaites

E Zi0 ε i = 0
 
(1)

lim rangE Zi0 Xi = K + 1


 
(2)
La condition (1) peut être réécrite comme suit

E Zi0 ε i = E Zi0 (yi − Xi β) = 0 ⇐⇒ E Zi0 yi = E Zi0 Xi β (3)


       

12 / 34
La méthode des variables instrumentales
Identification (3)

On distingue trois situations


Si H < K , le modèle est sous identifié. Il n’y a pas suffisamment de
variables instrumentales
Si H = K et lim rangE Zi0 Xi  = K + 1 le modèle est juste identifié.


Si H > K et lim rangE Zi0 Xi = K + 1 le modèle est sur-identifié. Il y


a plus de variables instrumentales qu’il n’est nécessaire
La condition (2) garantit que l’on se trouve dans l’une des deux
dernières situations.

13 / 34
La méthode des variables instrumentales
L’estimateur des moindres carrés indirects (1)

Si H = K et E [Zi0 Xi ] est inversible (ce qui est le cas dès lors que la
condition (2) est satisfaite) alors on peut résoudre (3). On obtient un
estimateur de β appelé estimateur des MCI en remplaçant les
espérances par leur contreparties empiriques :
! −1
1 n 0 1 n 0
N i∑ N i∑
β̂ mci = Zi Xi Xi yi
=1 =1

14 / 34
La méthode des variables instrumentales
L’estimateur des moindres carrés indirects (2)

Si H > K , on se ramène au cas précédent en sélectionnant K + 1


combinaisons linéaires des instruments : AZi0 où A est une matrice
K + 1 × H + 1, de rang K + 1. On obtient une classe d’estimateur de
β:
! −1
n n
1 1
β̂ mci (A) = × A ∑ Zi Xi
0
× A ∑ Xi0 yi
N i =1 N i =1

15 / 34
La méthode des variables instrumentales
Propriétés asymptotiques des estimateurs des MCI

Dans le modèle
yi = Xi β + ε i
à K+1 variables explicatives. On pose les hypothèses suivantes:
H1VI : condition d’orthogonalité
H2VI : condition de rang
H3VI : Les observations (Xi , Zi , yi ) sont iid
H4VI : E [ε i /Zi ] = σ2
H5VI : Les moments de (Xi , Zi , yi ) existent jusqu’à un ordre suffisant
Sous les hypothèses du chapitre 1 (sauf H2) et H1VI − H5VI ,
β̂ mci (A) est convergent et asymptotiquement normal

16 / 34
Plan

La méthode des variables instrumentales


L’estimateur des doubles moindres carrés
Interprétation de la condition de rang: lim rangE [Zi0 Xi ] = K + 1
Test de suridentification
Test d’exogénéité des variables explicatives

17 / 34
L’estimateur des doubles moindres carrés

On peut se demander s’il n’existe pas une matrice A∗ qui conduise à


un estimateur de variance minimale.

18 / 34
L’estimateur des doubles moindres carrés

On peut se demander s’il n’existe pas une matrice A∗ qui conduise à


un estimateur de variance minimale.
i.e., pour toutecombinaison linéaire
 de λβ on ait
V λ β̂ mci (A∗ ) < V λ β̂ mci (A)

18 / 34
L’estimateur des doubles moindres carrés

On peut se demander s’il n’existe pas une matrice A∗ qui conduise à


un estimateur de variance minimale.
i.e., pour toutecombinaison linéaire
 de λβ on ait
V λ β̂ mci (A∗ ) < V λ β̂ mci (A)
Oui!

18 / 34
L’estimateur des doubles moindres carrés

On peut se demander s’il n’existe pas une matrice A∗ qui conduise à


un estimateur de variance minimale.
i.e., pour toutecombinaison linéaire
 de λβ on ait
V λ β̂ mci (A∗ ) < V λ β̂ mci (A)
Oui!
Mène à l’estimateur des doubles moindres carrés.

18 / 34
L’estimateur des doubles moindres carrés

L’estimateur des 2MC peut être déterminé en deux étapes

19 / 34
L’estimateur des doubles moindres carrés

L’estimateur des 2MC peut être déterminé en deux étapes


On regresse X1i sur Zi et on récupère X̂1i

19 / 34
L’estimateur des doubles moindres carrés

L’estimateur des 2MC peut être déterminé en deux étapes


On regresse X1i sur Zi et on récupère X̂1i
On régresse yi sur X̂1i et X2i

19 / 34
L’estimateur des doubles moindres carrés

L’estimateur des 2MC peut être déterminé en deux étapes


On regresse X1i sur Zi et on récupère X̂1i
On régresse yi sur X̂1i et X2i

La matrice de variance de l’estimateur est V β̂ 2mc dépend de σ2 .




19 / 34
L’estimateur des doubles moindres carrés

Pour obtenir une estimation de V β̂ 2mc , il faut estimer σ2 .




20 / 34
L’estimateur des doubles moindres carrés

Pour obtenir une estimation de V β̂ 2mc , il faut estimer σ2 .




Attention l’écart type des résidus à retenir est celui du modèle

yi = Xi β + ε i

1 N
2
et peut être estimé par σ̂2 = N i =1 yi − Xi β̂ 2mc . Il s’agit du résidu
ε̂ i et non du résidu de la deuxième étape yi − X̂i β̂ 2mc .

20 / 34
L’estimateur des doubles moindres carrés

On peut interpréter l’estimateur à variables instrumentales comme


opérant un filtrage de l’information. On ne retient de la variabilité des
variables explicatives que la partie qui correspond à des chocs non
corrélés avec la perturbation. Ce filtrage est opéré en projetant les
variables explicatives sur un ensemble de variables non corrélées avec
la perturbation.

21 / 34
L’estimateur des doubles moindres carrés

On peut interpréter l’estimateur à variables instrumentales comme


opérant un filtrage de l’information. On ne retient de la variabilité des
variables explicatives que la partie qui correspond à des chocs non
corrélés avec la perturbation. Ce filtrage est opéré en projetant les
variables explicatives sur un ensemble de variables non corrélées avec
la perturbation.
Dans cette opération de filtrage on perd de l’information et que cette
perte d’information conduit à une moins grande précision de
l’estimateur

21 / 34
L’estimateur des doubles moindres carrés

On peut interpréter l’estimateur à variables instrumentales comme


opérant un filtrage de l’information. On ne retient de la variabilité des
variables explicatives que la partie qui correspond à des chocs non
corrélés avec la perturbation. Ce filtrage est opéré en projetant les
variables explicatives sur un ensemble de variables non corrélées avec
la perturbation.
Dans cette opération de filtrage on perd de l’information et que cette
perte d’information conduit à une moins grande précision de
l’estimateur
 
V β̂ 2mc  V β̂ mco

21 / 34
L’estimateur des doubles moindres carrés

On peut interpréter l’estimateur à variables instrumentales comme


opérant un filtrage de l’information. On ne retient de la variabilité des
variables explicatives que la partie qui correspond à des chocs non
corrélés avec la perturbation. Ce filtrage est opéré en projetant les
variables explicatives sur un ensemble de variables non corrélées avec
la perturbation.
Dans cette opération de filtrage on perd de l’information et que cette
perte d’information conduit à une moins grande précision de
l’estimateur
 
V β̂ 2mc  V β̂ mco
La précision de l’estimateur à variables instrumentales ne peut donc
dépasser celle qu’aurait l’estimateur des mco si les variables explicatives
étaient exogénes.

21 / 34
L’estimateur des doubles moindres carrés

On peut interpréter l’estimateur à variables instrumentales comme


opérant un filtrage de l’information. On ne retient de la variabilité des
variables explicatives que la partie qui correspond à des chocs non
corrélés avec la perturbation. Ce filtrage est opéré en projetant les
variables explicatives sur un ensemble de variables non corrélées avec
la perturbation.
Dans cette opération de filtrage on perd de l’information et que cette
perte d’information conduit à une moins grande précision de
l’estimateur
 
V β̂ 2mc  V β̂ mco
La précision de l’estimateur à variables instrumentales ne peut donc
dépasser celle qu’aurait l’estimateur des mco si les variables explicatives
étaient exogénes.
On retrouve l’arbitrage robustesse précision

21 / 34
Plan

La méthode des variables instrumentales


L’estimateur des doubles moindres carrés
Interprétation de la condition de rang: lim rangE [Zi0 Xi ] = K + 1
Test de suridentification
Test d’exogénéité des variables explicatives

22 / 34
Interprétation de la condition de rang

Cette condition s’interprète comme le fait que les variables


instrumentales extérieures expliquent suffisamment bien les variables
endogènes.

23 / 34
Interprétation de la condition de rang

Cette condition s’interprète comme le fait que les variables


instrumentales extérieures expliquent suffisamment bien les variables
endogènes.
Capture-t-on suffisamment d’informations avec les instruments?

23 / 34
Interprétation de la condition de rang

Cette condition s’interprète comme le fait que les variables


instrumentales extérieures expliquent suffisamment bien les variables
endogènes.
Capture-t-on suffisamment d’informations avec les instruments?
Il est possible que la condition de rang soit vérifiée avec des
instruments expliquant très mal les variables endogènes.

23 / 34
Interprétation de la condition de rang

Cette condition s’interprète comme le fait que les variables


instrumentales extérieures expliquent suffisamment bien les variables
endogènes.
Capture-t-on suffisamment d’informations avec les instruments?
Il est possible que la condition de rang soit vérifiée avec des
instruments expliquant très mal les variables endogènes.
On parle d’instruments faibles

23 / 34
Interprétation de la condition de rang

Cette condition s’interprète comme le fait que les variables


instrumentales extérieures expliquent suffisamment bien les variables
endogènes.
Capture-t-on suffisamment d’informations avec les instruments?
Il est possible que la condition de rang soit vérifiée avec des
instruments expliquant très mal les variables endogènes.
On parle d’instruments faibles
L’estimateur pourra être calculer mais sera très instable et présentera
des écarts type élevés.

23 / 34
Interprétation de la condition de rang

Cette condition s’interprète comme le fait que les variables


instrumentales extérieures expliquent suffisamment bien les variables
endogènes.
Capture-t-on suffisamment d’informations avec les instruments?
Il est possible que la condition de rang soit vérifiée avec des
instruments expliquant très mal les variables endogènes.
On parle d’instruments faibles
L’estimateur pourra être calculer mais sera très instable et présentera
des écarts type élevés.
Problème que l’on retrouve avec les MCO dans le cas de
multicolinéarité.

23 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.

24 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.
Lorsque le nombre d’instruments sur lequel on projette les variables
devient grand, mécaniquement, la prédiction de la variable explicative
va devenir meilleure.

24 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.
Lorsque le nombre d’instruments sur lequel on projette les variables
devient grand, mécaniquement, la prédiction de la variable explicative
va devenir meilleure.
elle va se rapprocher des variables explicatives simplement parce que
l’espace sur lequel on projette devient plus grand.

24 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.
Lorsque le nombre d’instruments sur lequel on projette les variables
devient grand, mécaniquement, la prédiction de la variable explicative
va devenir meilleure.
elle va se rapprocher des variables explicatives simplement parce que
l’espace sur lequel on projette devient plus grand.
dans ce cas l’estimateur à variables instrumentales se rapproche de
l’estimateur des mco.

24 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.
Lorsque le nombre d’instruments sur lequel on projette les variables
devient grand, mécaniquement, la prédiction de la variable explicative
va devenir meilleure.
elle va se rapprocher des variables explicatives simplement parce que
l’espace sur lequel on projette devient plus grand.
dans ce cas l’estimateur à variables instrumentales se rapproche de
l’estimateur des mco.
L’utilisation d’un grand nombre de variables instrumentales au pouvoir
explicatif médiocre est donc une situation peu souhaitable.

24 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.
Lorsque le nombre d’instruments sur lequel on projette les variables
devient grand, mécaniquement, la prédiction de la variable explicative
va devenir meilleure.
elle va se rapprocher des variables explicatives simplement parce que
l’espace sur lequel on projette devient plus grand.
dans ce cas l’estimateur à variables instrumentales se rapproche de
l’estimateur des mco.
L’utilisation d’un grand nombre de variables instrumentales au pouvoir
explicatif médiocre est donc une situation peu souhaitable.
Il n’existe pas de test formel de cette condition qui puisse être
facilement mis en oeuvre.

24 / 34
Interprétation de la condition de rang

On peut être tenté de pallier ce manque de pouvoir explicatif des


instruments par l’utilisation d’un grand nombre d’entre eux.
Lorsque le nombre d’instruments sur lequel on projette les variables
devient grand, mécaniquement, la prédiction de la variable explicative
va devenir meilleure.
elle va se rapprocher des variables explicatives simplement parce que
l’espace sur lequel on projette devient plus grand.
dans ce cas l’estimateur à variables instrumentales se rapproche de
l’estimateur des mco.
L’utilisation d’un grand nombre de variables instrumentales au pouvoir
explicatif médiocre est donc une situation peu souhaitable.
Il n’existe pas de test formel de cette condition qui puisse être
facilement mis en oeuvre.
On peut tester la nullité globale des coefficients des variables
instrumentales extérieures dans la régression des variables explicatives
endogènes sur l’ensemble variables instrumentales.
24 / 34
Plan

La méthode des variables instrumentales


L’estimateur des doubles moindres carrés
Interprétation de la condition de rang: lim rangE [Zi0 Xi ] = K + 1
Test de suridentification
Test d’exogénéité des variables explicatives

25 / 34
Test de suridentification

En pratique, on est souvent amené à effectuer des estimations d’une


même équation en étendant ou restreignant la liste des variables
instrumentales.
Accroı̂tre le nombre de variables instrumentales conduit à des
estimateurs plus précis mais fait apparaitre des risques de biais.
On a a priori toujours intérêt à avoir un ensemble d’instrument le plus
large possible. En effet retirer une variable instrumentale et mettre en
oeuvre l’estimateur des doubles moindres carrés correspond à
sélectionner une matrice particulière pour l’estimateur des moindres
carrés indirects avec le jeu complet d’instruments. Comme on l’a
montré cet estimateur est alors nécessairement moins précis que
l’estimateur des doubles moindres carrés avec l’ensemble des
instruments.

26 / 34
Test de suridentification

Test de suridentification ou test de Sargan permet de contrôler qu’il


n’y a pas d’incohérence dans le choix des variables instrumentales
(i.e., on teste la compatibilité globale des instruments utilisés)
Exemple : supposons que la régression VI contienne un regresseur
endogène et deux instruments (potentiels). Il est possible de calculer
deux estimateurs différents des DMC.
Si les deux instruments sont exogènes, les deux estimateurs tendent à
être proches l’un de l’autre.
Que se passe-t-il si les deux estimateurs sont très différents?
On peut en conclure que l’un des deux au moins n’est pas exogène.

27 / 34
Test de suridentification

Le test de suridentification n’est pas à proprement parlé un test


de validité des instruments mais un test de compatibilité des
instruments.
Ceci est une propriété statistique des données, qui peut être testée.
Il ne signifie pas que β̂ mci (A) → β̃ et β̃ = β le paramètre structurel
que l’on souhaite identifier.
Il signifie uniquement que ∃ β̃ tq β̂ mci (A) → β̃.

28 / 34
Test de suridentification
Intuition

Le test de suridentification fait implicitement cette comparaison ;


”implicitement” car le test ne calcule pas explicitement tous les
estimateurs VI possibles
L’idée est la suivante: l’exogénéité des instruments signifie qu’ils sont
non corrélés avec le terme d’erreur ε i . Cette hypothèse implique que
les instruments sont approximativement non corrélés avec ε̂ i .
Par conséquent, si les instruments sont réellement exogènes, leurs
coefficients associés, dans la régression de ε̂ i sur les instruments et
toutes les variables exogènes incluses, sont nuls.

29 / 34
Test de suridentification
Mise en oeuvre du test

Ce test peut être effectué à partir du R 2 de la régression de ε̂ i sur les


instruments et toutes les variables exogènes incluses. La statistique de
test utilisée est Ŝ = NR 2 .
(i) Estimation par les 2MC de l’équation structurelle. On calcul les résidus
ε̂ i .
(ii) On régresse ε̂ i sur les variables instrumentales (i.e., instruments
extérieurs au modèle + exogènes du modèle; H + 1 variables). On
calcule le R 2 .
(iii) Sous H0 , NR 2 est asymptotiquement distribué suivant un khi-deux à
H − K degrés de liberté.
Attention
même si le nombre de contraintes à tester est à égal à H, le degré de
liberté de la distribution est H − K . Il n’est possible de tester que les
H − K contraintes qui entrainent la suridentification.
résidus doivent être homoscédastiques
30 / 34
Plan

La méthode des variables instrumentales


L’estimateur des doubles moindres carrés
Interprétation de la condition de rang: lim rangE [Zi0 xi ] = K + 1
Test de suridentification
Test d’exogénéité des variables explicatives

31 / 34
Test d’exogénéité des variables explicatives

Hausman (1978) a proposé un test pour détecter la présence


d’endogénéité. Sous l’hypothèse d’absence d’endogénéité, l’estimateur
MCO et l’estimateur VI sont tous les deux convergents mais
l’estimateur MCO est à variance minimale.
En présence d’endogénéité, seul l’estimateur VI est convergent.
Le test d’Hausman examine la différence entre ces deux estimateurs.
i.e., plim β̂ 2MC =plim β̂ MCO .

32 / 34
Test d’exogénéité des variables explicatives

Là encore il ne s’agit que d’un test de compatibilité des conditions


d’orthogonalité entre elles et non pas un test de leur validité dans le
cadre de l’estimation d’un paramètre structurel.
La statistique de test d’Hausman est
0  −1 
H = β̂ 2MC − β̂ MCO V β̂ 2MC − β̂ MCO β̂ 2MC − β̂ MCO
→ χ2 (K1 )

avec K1 le nombre de variables explicatives endogènes.

33 / 34
Test d’exogénéité des variables explicatives
Mise en oeuvre du test

Le test d’exogénéité peut être mis en oeuvre très simplement par le


biais d’une simple régression de la variable dépendante yi sur les
variables potentiellement endogènes (X1i ), les variables exogènes
(X2i ) et sur la projection des variables endogènes sur les variables
instrumentales (X̂1i ).

yi = X1i c1 + X2i c2 + X̂1i δ + wi

Le test plim β̂ 2MC =plim β̂ MCO est équivalent au test δ = 0. Il peut


donc être effectué très simplement par l’intermédiaire d’un test sur
contrainte simple ou contraintes linéaires.

34 / 34

Vous aimerez peut-être aussi