Vous êtes sur la page 1sur 24

Equations simultanées

I Jusqu’à présent, nous avons étudié des modèles à une seule


équation
I Cependant, la théorie économique traite parfois de modèles à
plusieurs équations, sous la forme de systèmes d’équations
I Ces équations sont souvent dépendantes les unes des autres,
donc elles ne peuvent être estimées indépendamment

4/27
Terminologie

I Considérons le modèle à une équation : Yt = a + bXt + ut


I Yt est la variable dépendante : appelée endogène car elle est
déterminée par le modèle
I Xt est la variable explicative ou indépendante : appelée
exogène car elle est considérée comme donnée 1
I De façon générale, les variables endogènes sont déterminées
par les variables exogènes
I Ceci est la difficulté majeure avec les équations simultanées :
une même variable peut être exogène dans une équation et
endogène dans une autre, rendant l’estimation non triviale

5/27

1. sauf si on a un problème d’endogénéité


Exemple

Soit le système d’équations suivant :


I Yt = a + bXt + ut (1)
I Xt = Yt + Zt (2)
A cause de l’équation (1), Yt est endogène, et à cause de
l’équation (2), Xt est endogène également. Au niveau du système,
seule Zt est exogène. Pour se ramener au cas usuel, il faut réécrire
les variables endogènes en fonction des variables exogènes
uniquement

6/27
Exemple

Le système peut se réécrire de la manière suivante :


a b 1
I Yt = 1−b + 1−b Zt + 1−b ut
a 1 1
I Xt = 1−b + 1−b Zt + 1−b ut
Appelons µ le nouveau terme d’erreur : on retrouve le cadre usuel.
Remarquons que Xt apparaît comme une fonction de ut : dans
l’équation (1) du système original, il est donc corrélé au terme
d’erreur. Une hypothèse de base des MCO est donc violée
(cov (Xt , ut ) 6= 0) et si on estime (1) sans prendre en compte
l’information fournie par l’équation (2), les estimateurs seront non
convergents

7/27
Exemple d’un modèle structurel

Soit le modèle suivant utilisant des variables centrée :


I qtd = a1 pt + a2 yt + utd : équation de demande
I qts = b1 pt + uts : équation d’offre
I qtd = qts = qt : équation d’équilibre (pas de terme d’erreur)
Ceci est la forme structurelle du modèle. Le prix et la quantité sont
tous deux endogènes, alors que le revenu est exogène. Le modèle
est complet car il y a autant d’équations que de variables
endogènes (3).

8/27
Forme réduite

Le modèle peut être réécrit de la façon suivante :


I qt = γ1 yt + µ1t
I pt = γ2 yt + µ2t
a2 b 1 a2 b1 utd −a1 uts utd −uts
Avec γ1 = b1 −a1 , γ2 = b1 −a1 , µ1t = b1 −a1 et µ2t = b1 −a1 .

Ceci est la forme réduite du modèle.

9/27
La forme structurelle générale

Appelons Yi,t les M variables endogènes et Xi,t les k variables


exogènes. On a besoin de M équations dans le modèle. Pour
chaque individu (ou période) t, on a :
b1,1 Y1,t + b1,2 Y2,t + ... + b1,M YM,t + γ1,1 X1,t + γ1,2 X2,t + ... +
γ1,k Xk,t = u1,t
b2,1 Y1,t + b2,2 Y2,t + ... + b2,M YM,t + γ2,1 X1,t + γ2,2 X2,t + ... +
γ2,k Xk,t = u2,t
...
bM,1 Y1,t + bM,2 Y2,t + ... + bM,M YM,t + γM,1 X1,t + γM,2 X2,t + ... +
γM,k Xk,t = uM,t
Remarque : pour prendre en compte la constante, l’une de ces
variables peut être égale à 1. Les u sont les termes d’erreur
structurels.

10/27
Ecriture matricielle

B Y + Γ X = u
(M,M)(M,1) (M,k)(k,1) (M,1)

Avec B la matrice des paramètres b, Γ la matrice des paramètres γ.

Dans chaque équation, une variable endogène a son coefficient égal


à 1 : c’est la variable dépendante de l’équation correspondante. Les
équations où le terme d’erreur structurel est 0 sont des équations
d’équilibre (équations comptables).

11/27
Identification

On a le système d’équations suivant :

BY + ΓX = u
Si B est inversible, on peut multiplier à gauche l’équation par B −1 :

Y + B −1 ΓX = B −1 u
qui est la forme réduite du modèle. B doit être non singulière (càd
inversible). Cette forme réduite peut être estimée par MCO.
Cependant, les MCO fourniront une estimation de B −1 Γ, et il n’est
pas toujours possible d’identifier séparément les matrices B et Γ :
c’est un système de M ∗ k équations avec M ∗ M + M ∗ k
paramètres inconnus. Pour résoudre le problème, on doit imposer
certaines restrictions.

12/27
Le problème de l’identification

I L’estimation de la forme réduite fournit des paramètres


I Mais le but est de retrouver les paramètres structurels, pour
tester la théorie économique ayant fourni le modèle structurel
I S’il est impossible d’identifier les paramètres structurels, le
modèle est dit sous-identifié
I Cela survient si le nombre d’équations est inférieur au nombre
de paramètres structurels à identifier : le modèle est donc
impossible à résoudre
I Si les paramètres structurels peuvent être obtenus à partir de
la forme réduite, le modèle est dit identifié
I juste identifié : on obtient des valeurs uniques pour les
paramètres structurels
I sur-identifié : pas de valeur unique

13/27
Le problème de l’identification
La forme structurelle est : BY + ΓX = u
Alors que la forme réduite est : Y + B −1 ΓX = B −1 u
Ce qui peut être réécrit : Y + ΠX = v
I Paramètres structurels inconnus : B , Γ et la matrice de
(M,M) (M,k)
variance-covariance des termes d’erreur Ωu
I Paramètres connus de la forme réduite : Π et la matrice de
variance-covariance des résidus de la forme réduite Ωv
M(M+1)
I Nombre de paramètres structurels : NS = M 2 + Mk + 2
I Nombre de paramètres de la forme réduite :
NR = Mk + M(M+1)
2
I NS − NR = M 2 : il y a M 2 paramètres non identifiés et
l’identification est impossible. On a besoin d’information
supplémentaire (càd des restrictions sur les paramètres) pour
résoudre le modèle
14/27
Restrictions possibles

I Normalisation : fixer un paramètre à 1. C’est effectivement le


cas pour les variables dépendantes du modèle : cela fait passer
le nombre de paramètres non identifiés de M 2 à M 2 − M
I Identités : les équations d’équilibre n’ont pas besoin d’être
identifiées
I Restrictions d’exclusion : fixer un paramètre à 0 dans certaines
équations si la variable n’est pas pertinente
I Restrictions linéaires : si selon la théorie, certains paramètres
sont égaux à une combinaison linéaire d’autres paramètres
I Restrictions sur la matrice de variance-covariance des termes
d’erreur : par exemple, fixer certaines covariances à 0 le cas
échéant

15/27
Conditions d’identification (1)
Supposons que la normalisation soit faite ainsi que certaines
restrictions d’exclusion.
I Dans le modèle à M équations, considérons l’équation j
I Les paramètres de cette équation sont dans la j e colonne des
matrices B et Γ
I Appelons M le nombre de variables endogènes dans le modèle
(qui est aussi le nombre d’équations dans le modèle)
I k : nombre de variables exogènes
I Mj : nb de variables endogènes de l’équation j, et Mj∗ : nb de
variables endogènes exclues de l’équation j
I kj : nb de variables exogènes dans l’équation j, et kj∗ : nb de
variables exogènes exclues de l’équation j
I On a : M = Mj + Mj∗ et k = kj + kj∗
La condition d’ordre pour que l’équation j soit identifiée est :
kj∗ ≥ Mj (càd : au moins autant d’équations que de paramètres
16/27
inconnus).
Conditions d’identification (2)
I Si la condition d’ordre est vérifiée, alors il y a une solution,
mais pas nécessairement unique
I La condition de rang est nécessaire pour l’unicité
I Condition de rang : l’équation j est identifiée s’il est possible
d’obtenir au moins un déterminant non nul d’ordre
(M − 1, M − 1) (sur les sous-matrices de Π) sur les
coefficients des variables exclues de l’équation j, mais inclues
dans les autres équations du modèle
I Cette condition est rarement vérifiée sur des modèles
complexes
Au final :
I Si kj∗ < Mj : le modèle est sous-identifié
I Si kj∗ = Mj : le modèle est exactement identifié
I If kj∗ > Mj : le modèle est sur-identifié
Remarque : si on a rj restrictions linéaires supplémentaires, alors la
condition d’ordre devient rj + kj∗ ≥ Mj 17/27
Le modèle de Klein

1. Ct = a0 + a1 πt + a2 πt−1 + a3 (W1,t + W2,t ) + u1,t


2. It = b0 + b1 πt + b2 πt−1 + b3 Kt−1 + u2,t
3. W1,t = c0 + c1 Yt + c2 Yt−1 + c3 t + u3,t
4. Ct + It + Gt = Yt
5. πt = Yt − W1,t − W2,t − Tt
6. Kt − Kt−1 = It

I π : profits ; W1 : salaires du secteur privé ; W2 : salaires du


secteur public ; Y : output
I Variables endogènes : C , I, W1 , Y , π, K
I Variables exogènes : W2 , T , G, t
I Variables prédéterminées, considérées comme exogènes à la
période courante : πt−1 , Kt−1 , Yt−1
18/27
Méthodes d’estimation

I L’estimation des équations simultanées est fortement liée aux


variables instrumentales
I Deux grandes catégories :
I Méthodes à information limitée (limited information : LI) : les
équations sont estimées séparément
I Méthodes à information complète (full information : FI) : le
système est estimé en une seule fois et toutes les M équations
sont estimées simultanément
I Les méthodes FI sont plus efficaces (ont une variance plus
faible) mais moins utilisées car elles sont plus difficiles à
mettre en oeuvre

19/27
Moindres carrés indirects (LI)

I Fonctionne avec des équations juste identifiées


I Principe : estimer la forme réduite avec les MCO, puis
recalculer les paramètres structurels
I Les estimateurs de la forme réduite sont BLUE (MCO)
I Cependant, les estimateurs des paramètres structurels sont
biaisés en petit échantillon
I Problème : la forme réduite n’est pas toujours facile à trouver,
donc cette méthode est rarement utilisée

20/27
Moindres carrés en 2 étapes (2SLS) (LI)

I Fonctionne avec des modèles juste ou sur-identifiés


I Soit le modèle suivant, avec M variables endogènes et k
variables exogènes, pour tout individu t :
Y1,t =
b1,2 Y2,t + ... + b1,M YM,t + γ1,1 X1,t + γ1,2 X2,t + ... + γ1,k Xk,t + u1,t
Y2,t =
b2,1 Y1,t + ... + b2,M YM,t + γ2,1 X1,t + γ2,2 X2,t + ... + γ2,k Xk,t + u2,t
...
YM,t =
bM,1 Y1,t +...+bM,M YM,t +γM,1 X1,t +γM,2 X2,t +...+γM,k Xk,t +uM,t

21/27
Moindres carrés en 2 étapes

I 1e étape : régresser chaque variable endogène (les Y ) sur


toutes les exogènes (les X ) et calculer les valeurs prédites (Ŷ )
I On obtient Ŷ1,t = α̂1,1 X1,t + α̂1,2 X2,t + ... + α̂1,k Xk,t , idem
pour Ŷ2,t , etc (c’est une sorte de forme réduite)
I 2e étape : dans le premier modèle (structurel), remplacer les
Y par leurs valeurs prédites
I On obtient : Y1,t =
b1,2 Ŷ2,t +...+b1,M ŶM,t +γ1,1 X1,t +γ1,2 X2,t +...+γ1,k Xk,t +v1,t
I Enfin, ce nouveau modèle est estimé par MCO

22/27
Remarques

I Ceci revient à estimer le modèle avec les variables


instrumentales
I Le but de la 1e étape était en effet de supprimer la corrélation
entre les variables endogènes et le terme d’erreur
I Algébriquement, les Y sont projetés sur le sous-espace
vectoriel engendré par les colonnes de X , le résultat de la
projection étant Ŷ . Comme les X sont exogènes, elles ne sont
pas corrélées au terme d’erreur, tout comme Ŷ
I Autres méthodes que l’on peut rencontrer : méthode des
moments généralisés, limited information maximum likelihood
(LIML) ...

23/27
Moindres carrés en 3 étapes (3SLS) (FI)

Procedure :
I Même 1e étape que les 2SLS (estimation d’une forme réduite)
I Même 2e étape que les 2SLS (estimation de l’équation de 2e
étape)
I 3e étape : avec l’aide des résultats de 2e étape, calculer les
estimateurs MCG pour prendre en compte l’hétéroscédasticité
et l’autocorrélation

24/27
Autres méthodes et remarques

I Full information maximum likelihood (FIML) : en supposant


que les termes d’erreur sont normaux, on maximise la
vraisemblance du modèle, en prenant toutes les équations
simultanément
I Méthode des moments généralisés (cas hétéroscédastique)
I Les méthodes FI sont en général plus efficaces que les
méthodes LI
I Mais une mauvaise spécification du modèle a un impact plus
fort sur les modèles FI que les modèles LI (l’erreur aura un
impact sur tout le système et pas seulement sur une seule
équation)

25/27
Tester la simultanéité

Avant d’utiliser ces méthodes, on doit vérifier s’il y a réellement un


problème de simultanéité : test d’Hausman.
Soit le modèle suivant :
Qt = a0 + a1 Pt + a2 Yt + a3 Wt + u1,t : équation de demande (Prix,
Revenu, Richesse)
Qt = b0 + b1 Pt + u2,t : équation d’offre
Avec Y et W exogènes, P et Q endogènes.
I Il faut détecter s’il y a simultanéité entre P et Q

26/27
Le test d’Hausman
1. Estimer par MCO le modèle en forme réduite (chaque
endogène fonction des exogènes) : Pt = c0 + c1 Yt + c2 Wt + vt
2. Remarque : tout comme avec les méthodes précédentes, on ne
cherche pas à retrouver les paramètres structurels
3. Calculer les résidus de ces régressions : v̂t = Pt − P̂t
4. Dans l’équation structurelle, ajouter v̂t comme variable
explicative : Qt = b0 + b1 Pt + b2 v̂t + u2,t dans l’équation
d’offre
5. On estime ce modèle, et on fait un test de Student sur b2 : si
b2 n’est pas significativement différent de 0, il n’y a pas de
simultanéité et les MCO peuvent être utilisés tels quels sur
chaque équation du modèle structurel
6. Si b2 est significativement différent de 0, alors il y a
simultanéité et nous devons utiliser les méthodes spécifiques
aux systèmes d’équations simultanées (3SLS etc)
27/27

Vous aimerez peut-être aussi