Vous êtes sur la page 1sur 9

Abonnez-vous à DeepL Pro pour traduire des fichiers plus volumineux.

Visitez www.DeepL.com/pro pour en savoir plus.

ECONOMÉTRIE II DOCUMENT 1
:

GÁBOR NYÉKI

Ce document présente le concept d'endogénéité et le relie à la théorie microéconomique par le biais


d'un exemple de production domestique ( ).

1. ENDOGÉNÉITÉ DANS L'ANALYSE DE RÉGRESSION

L'endogénéité se manifeste de deux manières principales dans les travaux empiriques : (i) la causalité
inversée et (ii) l'endogénéité.
(ii) le biais de la variable omise. Ce que nous entendons par ces deux notions est le suivant. Supposons
que nous observions des réalisations d'un vecteur de deux variables aléatoires, (Yi , Xi ), où nous
considérons Yi comme la variable de résultat et Xi comme la variable explicative ou covariable. Nous
voulons estimer l'effet causal de Xi sur Yi , c'est-à-dire que nous voulons savoir de combien Yi
change si nous modifions Xi .
Nous avons ajusté la spécification suivante à nos observations par la méthode des moindres carrés
ordinaires (MCO) :

Yi = α + βXi + εi (1)

où εi est un terme résiduel non observé. L'estimateur MCO de β utilise la corrélation entre Yi et Xi pour
estimer l'effet causal. Cependant, il repose sur l'hypothèse que εi et Xi ne sont pas corrélés, et si cette
hypothèse n'est pas respectée, l'estimateur est biaisé.
La causalité inverse peut être l'une des raisons pour lesquelles l'hypothèse de corrélation zéro n'est
pas respectée. Si Yi affecte Xi , alors ce qui affecte Yi par l'intermédiaire de εi affectera également Xi
par l'intermédiaire de Yi . Il en résulte que εi et Xi sont corrélés. L'estimateur des MCO est donc
biaisé et nous pourrions dire que les MCO souffrent d'endogénéité.
Les variables omises peuvent également briser l'hypothèse de corrélation zéro. En particulier, s'il
existe une variable omise qui affecte Yi et qui est corrélée avec Xi , alors le terme résiduel εi contient
cette variable omise et est corrélé avec Xi . Le biais qui en résulte est appelé biais de la variable omise,
mais nous pourrions également nous référer à ce problème comme étant de l'endogénéité.
Dans le contexte des estimateurs MCO, nous pourrions donc résumer ces points en disant que nous
sommes confrontés à l'endogénéité si le terme résiduel est corrélé avec la covariable. Mais nous
n'observons jamais le terme résiduel . Comment savoir s'il est corrélé avec la covariable ? C'est ici que
nous nous tournons vers la théorie économique.

1
2. UN EXEMPLE : la PRODUCTION AGRICOLE DES MÉNAGES

Supposons que nous disposions de données sur les niveaux de consommation des ménages et sur le
facteur travail agricole, ainsi que sur le prix auquel ils peuvent vendre leur production. Nous voulons
utiliser ces données pour estimer le produit marginal du travail des ménages par la méthode des MCO.
Pour voir ce qui se retrouve dans le terme résiduel et si nos covariables sont corrélées avec le produit
marginal du travail.
Date d'entrée en vigueur : 27 mai 2021.

2
Pour ce faire, nous devons écrire un modèle de la façon dont le ménage choisit la consommation et le
travail, et comment il produit sa production.
Le problème de base que nous considérons est celui dans lequel le ménage résout

max u(c, ℓ) (2)


c≥0,
ℓ∈(0,1)

s.t. c = pf (1 - ℓ)

où c est son niveau de consommation, ℓ son temps consacré au loisir, f : (0, 1) '→ (0, ∞) la fonction
de production du ménage, et p le prix d'une unité de sa production par rapport au prix du bien de
consommation. Tout au long de cette section, nous paramétrons la fonction de production comme f
(h) := hβ . Alors le produit marginal du travail, (Df )(1 - ℓ) = β(1 - ℓ)β−1 , est entièrement déterminé si
nous identifions β parce que 1 - ℓ est observé dans l'ensemble de données hypothétiques de cette
section.
La fonction de production est contenue dans la contrainte budgétaire, et cette contrainte doit être
respectée dans les données si le modèle est correct. Par conséquent, nous pouvons dériver des
spécifications de régression à partir de la contrainte budgétaire et évaluer si le terme résiduel est
indépendant du prix et du travail. Si c'est le cas, il est facile d'estimer β.

2.1. Pas de résidu. En prenant les logarithmes de la contrainte budgétaire, on obtient l'équation linéaire
suivante

ln c = ln p + β ln(1 - ℓ). (3)

Si le modèle est correct, en ajustant (3) par les MCO aux observations des logarithmes de la
consommation, du prix et des heures travaillées, nous obtenons R2 = 1 et des résidus égaux à zéro. Si
nous obtenons un R2 < 1, cela signifie que le comportement des ménages n'est pas entièrement expliqué
par le modèle.

2.2. Facteur de production exogène non observé. Le modèle peut être complété par un terme non observé
qui fera partie du résidu de la régression. Considérons tout d'abord l'ajout d'un facteur de production non
observé à la contrainte budgétaire :

c = pf (1 - ℓ)η. (4)

En prenant les logs, cela


devient

ln c = ln p + β ln(1 - ℓ) + ln η . (5)
`˛¸x
terme
résidu
el

Si (p, ℓ) ��η est valide, alors le terme résiduel n'est pas corrélé avec les covariables et les MCO estiment β
de manière cohérente. (Nous discuterons de la signification formelle du terme " cohérence " dans le
3
document 2.) Pour vérifier cette hypothèse d'indépendance, nous résolvons le problème du ménage afin
d'exprimer son choix de loisir optimal.
Le problème (2) avec l'équation (4) comme contrainte budgétaire peut être réécrit comme suit

max u(pf (1 - ℓ)η, ℓ).


ℓ∈(0,1)

4
La condition du premier ordre de ce problème est

(∂1 u)(c, ℓ)pη(Df )(1 - ℓ) = (∂2 u)(c, ℓ). (6)

Soit u(c, ℓ) := ln c + θ ln ℓ. Par conséquent, (6) peut être écrit comme suit
1 θ
pηβ(1 - ℓ)β−1 = .
p(1 - ℓ)βη ℓ

Le facteur de production non observé, η, s'annule1 et nous pouvons exprimer le loisir comme suit
θ
ℓ= . (7)
β +θ

Par conséquent, la décision de loisir du ménage, et par conséquent sa décision de travail 1 - ℓ = β/(β + θ),
n'est qu'une fonction du paramètre de préférence θ et de notre paramètre d'intérêt β. Il est important de
noter qu'elle n'est pas une fonction de η. Ainsi, le travail et le facteur de production non observé sont
indépendants tant que (p, θ) ⊥⊥ η est présent,2 et dans ce cas, les MCO sont cohérents.
Cependant, pour différents paramétrages de la fonction d'utilité, le choix optimal du ménage peut être
une fonction de η. Considérons l'utilité linéaire u(c, ℓ) := c + ℓ. En la transformant en (6), on obtient

pηβ(1 - ℓ)β−1 = 1

à partir de laquelle le choix de


loisir est
1 1/(β-1)
ℓ= 1- . (8)
pηβ

Pour la paramétrisation linéaire de l'utilité, ℓ est une fonction de η, de sorte que la spécification (5) souffre
d'endogénéité et que les MCO sont incohérents.

2.3. Si le terme non observé n'est pas un facteur de production mais une source de revenu
supplémentaire, le modèle est différent, de même que le terme résiduel. Supposons que
1Cet argument s'applique également à la forme fonctionnelle générale CRRA pour l'utilité,
( )1-φ
cℓθ -1
,
u(c, ℓ) :=
1 -φ
qui reprend la spécification logarithmique précédente : dans la limite de φ → 1, u(c, ℓ) → ln c + θ ln ℓ. Les dérivées partielles sont
( )-φ ( )-φ
1 (∂ u)(c, ℓ) = cℓθ ℓθ = c−φ ℓθ(1−φ) et (∂ u)(c,
2 ℓ) = cℓθ cθℓθ−1 = θc1−φ ℓθ(1−φ)−1 .

En introduisant ces données dans (6),


( )-φ ( )1-φ
p(1 - ℓ)β η ℓθ(1−φ) pηβ(1 - ℓ)β−1 = θ p(1 - ℓ)β η ℓθ(1−φ)−1
ce qui se simplifie à βℓ = θ(1 - ℓ).
2Dans le cadre de cette note, β est supposé être le même pour chaque ménage dans les données, il n'est donc pas inclus
dans la condition d'indépendance.

5
que cette source de revenus ne nécessite pas de travail. La contrainte budgétaire peut s'écrire comme suit

c = pf (1 - ℓ) + µ (9)

où µ est le revenu hors travail exprimé en unités du bien de consommation. En prenant les logs,
µ
ln c = ln p + β ln(1- ℓ) + ln 1 + (10)
p(1 - ℓ)β
` x
résidu˛a¸l du terme

où nous utilisons le fait que ln(a + b) = ln a + ln(1 + b/a). Il est immédiatement évident que le terme
résiduel est et n'est pas indépendant du prix p et de l'allocation du travail 1 - ℓ. Cela rend les MCO
incohérents.

2.4. Facteur de production non observé endogène. Le même problème se pose si le terme résiduel
contient un facteur de production non observé qui est choisi de manière endogène par le ménage. Une
interprétation intuitive de ce phénomène est que le ménage utilise non seulement du travail mais aussi du
capital pour sa production, mais nous n'observons que le travail dans les données. Considérons la
contrainte budgétaire suivante :

c = pf (1 - ℓ)η(1 - ℓ) - κ(η(1 - ℓ)) (11)

où η est maintenant une fonction du travail, et κ : (0, ∞) '→ (0, ∞) est une fonction de coût associée au
facteur de production non observé. La valeur η(1 - ℓ) peut être considérée comme le choix optimal du
ménage pour le facteur non observé compte tenu de l'allocation du travail 1 - ℓ.
En prenant les logs de (11),
κ(η(1 - ℓ))
ln c = ln p + β ln(1- ℓ) + ln η(1 - ℓ) + ln 1- (12)
p(1 - ℓ)βη(1 - ℓ)
` x
résidu˛a¸l du terme

Une fois encore, il est évident que le terme résiduel n'est pas indépendant du prix ou de l'allocation du
travail. Dans ce cas, ce n'est pas seulement parce que p et 1 - ℓ sont directement présents dans le résidu,
mais aussi parce que 1 - ℓ entre indirectement par la fonction η. Les MCO sont donc incohérents.

2.5. Revenu non agricole non observé endogène. Supposons que le terme résiduel contienne le
revenu non agricole non observé du ménage vers lequel il doit également allouer du travail. Le ménage
résout

max u(c, 1 - h1 - h )2
c≥0,
h1,h2∈(0,1)

sous réserve de la contrainte budgétaire


modifiée

c = pf (h1 ) + µ(h )2 (13)

6
avec la contrainte supplémentaire que h1 + h2 ≤ 1. Dans cette formulation du problème, le ménage
résout pour les heures de travail h1 et h2 au lieu du loisir ℓ comme auparavant. Ni h2 ni µ(h2 ) ne sont
observés dans les données.
L'équation (13) peut être linéarisée comme suit
!
µ(h2)
ln c = ln p + β ln + ln 1 + . (14)
ph1β
h1
` x
résidu˛a¸l terme

Les MCO sont incohérents parce que h1 apparaît dans le terme résiduel. Mais ils sont également
incohérents parce que, en général, le choix optimal du ménage pour h1 dépend de h2 et de la forme de µ.
On peut s'en rendre compte en trouvant les conditions du premier ordre pour le problème simplifié du
ménage

max u(pf (h1 ) + µ(h2 ), 1 - h1 - h2 ).


h1,h2∈(0,1)

Dans une solution intérieure, les conditions du premier ordre suivantes permettent de déterminer h1 et h2 :

(∂1 u)(c, 1 - h1 - h2 )p(Df )(h1 ) = (∂2 u)(c, 1 - h1 - h2 ) et (15)


(∂1 u)(c, 1 - h1 - h2 )(Dµ)(h2 ) = (∂2 u)(c, 1 - h1 - h2 ). (16)

Si les dérivées partielles sont non nulles, ces deux conditions impliquent que p(Df )(h1 ) = (Dµ)(h2 ), ce
qui peut s'écrire comme suit

pβh1β−1 = (Dµ)(h2 ). (17)

Deux exemples illustrent ce que cela implique pour h1 , et pour la condition d'indépendance de h1 et du
terme résiduel :

1. Soit µ(h2 ) := αh2 . En introduisant ce résultat dans (17), nous obtenons que le ménage choisit h1 =
(α/(pβ))1/(β−1) . Le terme résiduel est
!
p1/(β-1)ββ/(β-1)
ln 1 +
αh2 αh2 h2
= ln 1 + = ln 1 + .
ph1β p(α/(pβ))β/(β-1) α 1/(β−1)

Bien que h1 ne soit pas une fonction de h2 , les MCO sont généralement incohérents parce que le
terme résiduel contient
α, β, et p, et h1 est une fonction de chacun de ces éléments.

2. Soit µ(h2 ) := 2√h2 . Le ménage choisit h1 = 1/(pβ√h )21/(β−1) . Le terme résiduel est
2√h2 ! 2√h2 )
1/(β-1)β β/(β-1 (2β-1)/(β-1)
ln 1 + ph1β = ln = ln 1 + √h2 .
1+
p(1/(pβ√h2))β/(β-1) 2p
Cela contient β, p et h2 , chacun d'eux étant une fonction de h1 , de sorte qu'en général, les MCO sont

7
incohérents.

2.6. Approximation de Taylor du premier ordre. Dans les sous-sections 2.1 et 2.2, la contrainte
budgétaire du ménage était purement multiplicative et pouvait donc être linéarisée en prenant
simplement les logarithmes. En revanche, dans les sous-sections 2.1 et 2.2

8
Dans les sections 2.3, 2.4 et 2.5, la contrainte budgétaire contenait un terme additif. De ce fait, la prise en
compte des logarithmes ne permet pas d'obtenir des spécifications de régression linéaire.
Cependant, nous pouvons toujours utiliser une spécification de régression linéaire comme
approximation de la véritable contrainte budgétaire. Une telle spécification pourrait être interprétée
comme une expansion de Taylor du premier ordre de la log-consommation. Dans ce cas, le résidu de la
régression inclurait le terme résiduel de l'expansion de Taylor. Comme l'ont montré les exemples de cette
section, ces termes résiduels seraient des fonctions de l'allocation du travail du ménage et seraient donc
endogènes. Plus la contrainte budgétaire est approximée par la spécification linéaire, moins l'estimateur
des MCO est biaisé asymptotiquement en raison du terme résiduel.

Vous aimerez peut-être aussi