Académique Documents
Professionnel Documents
Culture Documents
e
Licence 3 année de Sciences Économiques
Mentions : Économie internationale,
Économie des Entreprises et des Marchés,
Monnaie-Finance
Magistère Banque-Finance 1
Introduction
Chapitre 1 : La modélisation
Conclusion
2
Références bibliographiques (sélection)
3
Pour des compléments d’algèbre, consulter en priorité les ouvrages suivants :
Abadir K.M. and J.R. Magnus (2005), Matrix Algebra, Cambridge University
Press, Cambridge.
Dhrymes P.J. (1984), Mathematics for Econometrics, Springer-Verlag, New York.
Simon C.P. and L. Blume (1998), Mathématiques pour Économistes, Traduit par
V. Darmon, G. Dufrénot, O. Ferrier, M. Paul, A. Pirotte, B. Planès et M. Séris, De
Boeck Université Presses, Bruxelles.
4
Thèmes des séances de travaux dirigés
Tous les exemples d’économie appliquée seront réalisés sous le logiciel Stata.
5
Fiche de TD n 1/2 : Le modèle de régression simple
Exercice n 1
Soit le modèle de régression simple
Exercice n 2
Soit le modèle
yt = axt + ut ; t = 1; :::; T: (2)
Trois estimateurs du coe¢cient a sont proposés :
y
b
a1 = ;
x
PT
xt yt
t=1
b
a2 = ;
PT
x2t
t=1
P
T
(xt x)(yt y)
t=1
b
a3 = ;
P
T
(xt x)2
t=1
où
1X 1X
T T
y= yt et x = xt :
T t=1 T t=1
6
2. Montrer que ces trois estimateurs sont sans biais.
Exercice n 3
Soit un échantillon de 10 observations qui concernent les salariés d’une …rme de
chocolat1 :
n yi xi
1 11 10
2 10 7
3 12 10
4 6 5
5 10 8
6 7 8
7 9 6
8 10 7
9 11 9
10 10 10
2. Calculer les estimateurs des MCO des coe¢cients du modèle proposé. Com-
menter.
Exercice n 4
Cet exercice est consacré à l’étude du taux de salaire horaire des salariés américains
1
Ici, le raisonnement s’e¤ectue dans la dimension individuelle (transversale) et non temporelle
(longitudinale). Les variables sont donc indicées en i et non en t.
7
sur la base d’une coupe transversale. La base de données est extraite de l’“US Na-
tional Longitudinal Survey”. Elle concerne 3296 salariés (dont 1569 femmes) observés
en 1987. La base de données wages contient les variables suivantes :
- exper : nombre d’années d’expérience ( =âge études 6);
- male : variable dummy valant 1 si l’individu est un homme;
- school : nombre d’années d’études;
- wage : taux de salaire horaire (en $ 1980).
1. Représenter les nuages de points (school wage) et (exper wage).
2. Calculer la moyenne, l’écart-type, le min et le max de chaque variable de la
base.
3. Calculer les percentiles 10, 25, 50, 75 et 90 des variables exper, school et wage.
4. Calculer la matrice de corrélation des 4 variables de la base.
5. Créer une variable indicatrice valant 1 si l’individu est une femme.
6. Calculer le taux de salaire horaire moyen, la moyenne du nombre d’années
d’études et du nombre d’années d’expérience pour les hommes et pour les
femmes. Que peut-on en déduire ?
8
Fiche de TD n 3/4/5 : Le modèle de régression multiple
Exercice n 1
Démontrer que l’estimateur bb des MCO du modèle de régression multiple est e¢cace,
mais que celui de la variance b2u ne l’est pas.
Exercice n 2
Soit un échantillon de 9 entreprises spécialisées dans la production de peinture2 :
n yi x1i x2i
1 60 1100 300
2 120 1200 400
3 190 1430 420
4 250 1500 400
5 300 1520 510
6 360 1620 590
7 380 1800 600
8 430 1820 630
9 440 1800 610
où x1i est le travail (heures travaillées), x2i est le capital (machines/heures) et yi est
la quantité de peinture produite (tonnes). On cherche à étudier la relation qui existe
entre la quantité de peinture produite, le nombre d’heures travaillées et le nombre
machines/heures.
2. Calculer les estimateurs des MCO des coe¢cients du modèle proposé. Com-
menter.
9
Exercice n 3
Soit le modèle d’investissement d’une …rme i
Ii = b0 + b1 Vi + b2 Ki + b3 Si + ui ; i = 1; : : : ; N;
Exercice n 4
Dans la théorie keynésienne, la demande de monnaie existe pour des motifs spéci…ques
: le motif de transaction, le motif de précaution et en…n celui de spéculation. Pour
10
simpli…er, ce raisonnement aboutit à une fonction où la demande de monnaie dépend
du revenu et du taux d’intérêt. Supposons que la demande de monnaie puisse s’écrire
sous forme linéaire
mt = b0 + b1 rt + b2 it + ut ;
où mt est l’agrégat M1, rt est le produit intérieur brut (PIB) et it le taux d’intérêt à
six mois des bons du trésor américain. Ces données sont disponibles pour l’économie
américaine sur la période 1960-1983 (base de données “monnaie”). m et r sont
exprimés en milliards de dollars et le taux d’intérêt i est en pourcentage.
3. Estimer par les MCO les coe¢cients de ce modèle. Les coe¢cients estimés ont-
ils les signes attendus ? Comment interpréter chacun de ces coe¢cients estimés
?
Exercice n 5
Supposons qu’au lieu de considérer le modèle de l’exercice 4 pour la demande de
monnaie, on retienne maintenant un modèle log-linéaire
ln mt = 0 + 1 ln rt + 2 ln it + "t :
11
1. Estimer par les MCO les coe¢cients de ce modèle.
12
Fiche de TD n 6/7 : Autocorrélation des perturbations
Exercice n 1
Exercice n 2
Lorsque les rendements d’échelle sont croissants, la situation d’une entreprise en
monopole est appelée monopole naturel au sens où c’est la plus e¢cace économique-
ment. Un économiste s’interroge donc sur l’existence de rendements d’échelle crois-
sants dans “l’industrie” de la distribution de courrier (i.e. la poste). Pour ce faire,
il estime la fonction de production suivante sur données trimestrielles couvrant la
période 1970:1 à 1994:4
ln Qt = b0 + b1 ln Kt + b2 ln Lt + "t ; (4)
[
ln Qt = 10:4 + 0:38 ln Kt + 0:72 ln Lt : (5)
(2:971) (9:50) (12:0)
h i
d bb1 ; bb2 = 0:05, R2 = 0:81, R2 = 0:79, DW = 1:87 et b2" = 0:97.
Par ailleurs, on a Cov
H0 : b1 + b2 1 contre H1 : b1 + b2 < 1:
13
Exercice n 3
Cet exercice est consacré à l’étude de l’o¤re de logement. On retient le modèle
2. Estimer par les MCO les coe¢cients du modèle (6). A¢cher la matrice de
variances-covariances estimée de l’estimateur des MCO.
3. Tracer le graphique des valeurs observées et ajustées, celui des résidus. Com-
menter ?
14
Fiche de TD n 8/9 : Hétéroscédasticité des perturbations
Exercice n 1
On considère le modèle de régression
yi = + ui
avec
2 2
E(ui j xi ) = 0; Cov(ui ; uj j xi ; xj ) = 0; 8i 6= j et V (ui j xi ) = u xi ; xi > 0;
Exercice n 2
L’objectif de cet exercice est d’estimer une fonction de demande de travail. Les don-
nées sont extraites de Verbeek (2000).3 Elle concerne 570 entreprises belges observées
en 1996. La base de données labor comprend les variables suivantes : labori , capitali ,
wagei et outputi où labori est l’e¤ectif total de la …rme, capitali , le stock de capital
(en millions de francs belges), wagei , le coût salarial (en millions de francs belges)
et outputi , la valeur ajoutée (en millions francs belges). On considère le modèle de
demande de travail4
15
3. Tester l’absence d’hétéroscédasticité des perturbations grâce au test de Breusch
et Pagan (1979). Commenter.
4. Même question que la précédente en utilisant le test de White (1980).
5. En supposant que l’on ne connaisse pas la forme de l’hétéroscédasticité, calculer
la matrice de variances-covariances des coe¢cients des MCO par la méthode de
White. Commenter (par rapport à la matrice de variances-covariances d’origine
des MCO).
6. Donner l’intervalle de con…ance à 95% des coe¢cients associés au coût salarial
(wage), à la valeur ajoutée (output) et au stock de capital (capital). Interpréter.
7. En supposant cette fois-ci que l’on connaisse la forme de l’hétéroscédasticité
(cas de l’hétéroscédasticité multiplicative) qui serait telle que 2i = 2u exp (Zi a),
calculer les estimateurs des moindres carrés pondérés. Commenter. La forme
de l’hétéroscédasticité envisagée semble-t-elle appropriée ?
Exercice n 3
L’objectif de cet exercice est d’analyser les déterminants de la croissance économique.
On dispose d’une base de données qui comprend les observations liées à un certain
nombre de variables de 167 pays des continents africaine, américains (nord et sud),
asiatique et européen. On considère le modèle suivant :
16
Fiche de TD n 10 : Les moindres carrés sous contraintes
et tests d’hypothèses
Exercice n 1
Soit le modèle y = Xb + u et la contrainte Rb = r. On rappelle que l’estimateur
des moindres carrés sous contraintes (MCC) est donné par
b M CC = b
b b M CO 0 0 0
b M CO
(X X) 1 R fR(X X) 1 R g 1 (Rb
0
r):
b M CO .
où w n’est pas fonction de b
Exercice n 2
On considère le modèle de production
2
ln Qi = b0 + b1 ln Li + b2 ln Ki + ui , ui N (0; u ), i = 1; :::; 23;
ln Q ln Q ln L ln L ln K ln K
0 1
ln Q ln Q 10 10 8
ln L ln L @ 10 12 8 A:
ln K ln K 8 8 12
17
2. Commenter les di¤érences (en termes de propriétés des estimateurs et de va-
lidité des t de Student) entre l’estimation de b1 obtenue sous l’hypothèse de
rendements d’échelle non contraints et celle obtenue sous l’hypothèse de rende-
ments d’échelle constants sachant que :
Exercice n 3
Cet exercice est consacré à l’étude d’une fonction de gains de salariés belges sur la
base d’une coupe transversale. Elle est extraite de l’European Community Household
Panel. Elle concerne 1472 salariés (dont 579 femmes) observés en 1994. La base de
données bwages comprend les variables suivantes : experi , malei , educi et wagei
où experi est l’expérience professionnelle en nombre d’années, malei , une variable
indicatrice valant 1 si le salarié est un homme, 0 sinon, educi , le niveau d’études et
wagei , le taux de salaire horaire (en francs belges). On considère le modèle
18
Chapitre 1
––––––––––––––––––––––––––
La modélisation
L’analyse économique repose sur des schémas théoriques qui retracent les
comportements des agents et les mécanismes qui sont à l’origine des phénomènes
observés. Comme les corpus théoriques influencent les actions sur le réel, il est
indispensable qu’ils soient confrontés aux observations. Dans cette perspective,
l’économétrie constitue l’approche la plus féconde. Avant toute chose, il est
nécessaire de formaliser un modèle qui permettra de tester la théorie avec les
observations.
La conception de modèle n’existait pas dans les prémices de l’économétrie, on
concentrait alors l’analyse en mesurant approximativement les phénomènes à partir
de statistiques descriptives. Celles-ci servaient à établir des lois et à prévoir les
évolutions futures. Les écarts importants constatés par rapport aux réalisations
effectives amenèrent à remettre en cause totalement ce type d’approche. De plus,
un inconvénient majeur était d’aboutir à une dissociation entre les lois statistiques
et les lois économiques. Cette séparation a contribué à «donner naissance à une
entité plus maniable et plus modeste qu’une loi, le modèle» (Qin (1993, p. 37)).
Par ailleurs, les méthodes statistiques – avec l’introduction des probabilités – ont
permis d’effectuer une inférence statistique beaucoup plus formelle et rigoureuse.
Un modèle sous-entend une certaine structure, une certaine organisation.
Progressivement l’économie a retenu et utilisé ce concept. Une démarche cohérente
est apparue pour rendre compatible modèle et théorie économique; c’est ce que l’on
qualifie de procédure de modélisation. La logique des modèles consiste à choisir
délibérement une représentation simple pour des phénomènes économiques réels
complexes, dans l’espoir de gagner énormément en facilité de compréhension sans
perdre trop en terme d’information disponible. Malinvaud (1983, p. 45) en donne
une définition plus large et précise. Il écrit :
«un modèle consiste en la représentation formelles d’idées ou de connaissances re-
latives à un phénomène. Ces idées, souvent appelées «théorie du phénomène»,
s’expriment par un ensemble d’hypothèses sur les éléments essentiels du phénomène
21
Introduction aux méthodes de l’économétrie 22
et des lois qui le régissent. Elles sont généralement traduites sous la forme d’un
système mathématique dénommé lui-même «modèle»».
Grâce au concept de modèle, il est possible d’étudier les implications des
hypothèses retenues, de les confronter aux résultats empiriques, d’arriver ainsi à
mieux appréhender la réalité pour agir plus efficacement sur elle. La procédure de
modélisation se scinde en quatre étapes : la spécification du modèle, l’identification
des paramètres, l’estimation des paramètres et les procédures de tests et la réalisation
de prévisions.
C = f (R) (1.1)
Y = C +I (1.2)
1. La modélisation 23
Y = R (1.3)
Les équations du modèle keynésien sont de deux types :
• l’équation (1.1) traduit le fait que la consommation dépend du revenu. Elle reflète
un comportement de consommation. On parle d’«équation de comportement».
Sa forme est tributaire du type d’économie considérée et est empiriquement
estimée sur la base d’un échantillon (le plus souvent à partir des agrégats définis
et fournis par la comptabilité nationale);
• les équations (1.2) et (1.3) retracent respectivement le fait que la production
est obtenue par sommation de la consommation et de l’investissement, et que
la totalité de la production est distribuée sous forme de revenu. Ces deux
équations ne sont en définitive que des «identités comptables», et servent à
assurer l’identification des paramètres dans des modèles plus complexes7 .
Les variables du modèle peuvent être classées de deux façons selon que l’on
appréhende le système d’équations dans son ensemble ou chacune des équations
séparément. Ainsi, l’investissement I est fixé par l’État et est donc une quantité
prédéterminée : une telle variable est qualifiée d’exogène; alors que les autres
variables se déduisent de l’investissement par l’intermédiaire du modèle : on parle
alors de variables endogènes. Il est toujours possible d’exprimer les variables
endogènes en fonction des seules variables exogènes. Le nouveau système obtenu
est alors appelé forme réduite, tandis que le système d’équations initial correspond
à la forme structurelle.
Maintenant, si l’on suppose que la fonction de consommation est linéaire, telle
que :
C = f (R) = aR + b (1.4)
où a et b sont des paramètres constants; la forme réduite associée au modèle
keynésien simplifié est alors :
a b
C = I+ (1.5)
1−a 1−a
1 b
Y = I+ (1.6)
1−a 1−a
1 b
R = I+ (1.7)
1−a 1−a
La forme réduite n’est bien entendue définie que si a = 1. Si l’on s’intéresse à la seule
7
L’identification fait l’objet de la section 1.2 de ce chapitre et de la section 13.2 du chapitre 13.
Introduction aux méthodes de l’économétrie 24
et/ou les élasticités. Pour le modèle (1.10), les effets marginaux correspondent aux
productivités marginales des facteurs (i. e. du travail et du capital), soit :
∂Qt Qt ∂Qt Qt
pmL = = b1 et pmK = = b2
∂Lt Lt ∂Kt Kt
et les élasticités
∂ log Qt ∂Qt Lt ∂ log Qt ∂Qt Kt
ηQt /Lt = = × = b1 et η Qt /Kt = = × = b2
∂ log Lt ∂Lt Qt ∂ log Kt ∂Kt Qt
Plus généralement, l’hypothèse de linéarité par rapport aux paramètres à l’avantage
d’être peu restrictive. Elle recouvre un grand nombre de cas possibles. En
considérant le cas simple où n’intervient qu’une seule variable explicative xt , en
voici quelques exemples :
• polynômes : yt = b0 + b1 xt + b2 x2t + · · · + bn xn
t . En envisageant le cas quadratique
(n = 2), il vient pour l’effet marginal :
∂yt
= b1 + 2b2 xt
∂xt
et pour l’élasticité de yt par rapport à xt :
xt
η yt /xt = (b1 + 2b2 xt )
yt
• exponentielles (log-linéaires) : yt = exp[b0 + b1 xt + · · · + bn xn
t ]. Pour simplifier en
posant n = 1, l’effet marginal est donné par :
∂yt
= b1 exp [b0 + b1 xt ]
∂xt
et l’élasticité de yt par rapport à xt par :
η yt /xt = b1 xt
b
• linéaires-log (semi-log) : exp[yt ] = exp[b0 ]xt 1 . L’effet marginal est obtenu par :
∂yt b1
=
∂xt xt
et l’élasticité de yt par rapport à xt par :
b1
ηyt /xt =
yt
Introduction aux méthodes de l’économétrie 26
∂yt b1
=− 2
∂xt xt
et l’élasticité de yt par rapport à xt par :
b1
η yt /xt = −
xt yt
yt = 2x0.5
t Cas 1 : 0 < b1 < 1 log yt = 0.693 + 0.5 log xt
8
Ce point fait l’objet de plusieurs exercices dans le chapitre suivant.
1. La modélisation 27
yt = 10x−1
t Cas 5 : b1 < 0 log yt = 2.303 − log xt
1. La modélisation 29
yt = 15 Cas 2 : b1 = 0 yt = 15
appelé perturbation, ou encore écart, est introduit pour chacune des observations :
Dans la sous-section précédente, plusieurs arguments ont déjà été avancés pour
justifier l’incorporation de ce terme. Néanmoins, on peut y adjoindre quelques
compléments. Ainsi, les T observations (yt , x1t , ..., xkt ) ne sont jamais sur un même
sous espace, car le modèle n’est qu’une approximation. Il est donc nécessaire
d’introduire la perturbation ut sorte de passerelle entre la réalité et l’approximation.
Cette perturbation traduit principalement :
• le fait que la forme fonctionnelle f n’est pas forcément linéaire dans les
paramètres;
• le fait que cette fonction varie en fonction du temps ou des individus observés;
• l’omission de variables d’importance secondaire;
• la non prise en compte de variables psychologiques, sociologiques, etc.
difficilement quantifiables;
• des erreurs de mesure sur les variables;
• des anticipations aléatoires réalisées par les individus.
Les deux dernières composantes peuvent être considérées comme aléatoires et
justifient donc partiellement l’hypothèse, que la perturbation ut soit elle-même une
variable aléatoire. La perturbation ut comprenant un grand nombre de composantes,
et si le modèle est bien choisi, il est souvent supposé que les perturbations suivent
une loi normale; ceci est une conséquence du théorème central limite. Il convient
de bien percevoir les principales implications du passage d’un modèle certain à un
modèle aléatoire :
• d’une part, on est maintenant condamné à n’effectuer que des jugements en
probabilité sur les résultats obtenus, et il faut un certain entrainement pour
bien apprécier de tels jugements. En particulier, la notion de contre exemple,
si commode dans le domaine certain, doit faire place dans le domaine aléatoire la
notion infiniment plus délicate de test statistique;
• de plus, il va falloir définir la loi de probabilité de la perturbation aléatoire
introduite. Mais dans la mesure où cette perturbation aléatoire constitue une
variable «fourre-tout» qui recouvre simultanément plusieurs notions délicates à
cerner rigoureusement, il est difficile de faire des hypothèses très précises sur la
loi de probabilité pourtant il sera par la suite nécessaire d’en faire. La démarche
qui sera adoptée dans les chapitres qui vont suivre consistera à se donner des
hypothèses assez restrictives afin de pouvoir mettre en œuvre des méthodes
37
expression (Q1t = et − Q2t − Q3t − Q4t ) dans l’équation (1.12), ce qui donne :
yt = b0 + b1 xt + b2 Q2t + b3 Q3t + b4 Q4t + ut (1.14)
où les coefficients bj sont définis par :
b0 = α + c1 (1.15)
b1 = β (1.16)
b2 = c2 − c1 (1.17)
b3 = c3 − c1 (1.18)
b4 = c4 − c1 (1.19)
On aboutit donc à un système de cinq équations (1.15 à 1.19) à six inconnues.
Le modèle (1.12) n’est pas identifiable (sous-identifié) puisqu’il est impossible de
déterminer les valeurs des coefficients α, c1 , c2 , c3 et c4 . Il faut donc imposer une
contrainte supplémentaire pour que les paramètres du modèle (1.12) deviennent
identifiables (cela revient à rajouter de l’information). Ici, la contrainte identifiante
la plus naturelle consiste à poser :
4
cj = 0 (1.20)
j=1
10
On renvoie au chapitre 15 consacré à l’économétrie variables qualitatives. Se reporter à Thomas
(2000), Maddala (1994) et Gouriéroux (1989).
Introduction aux méthodes de l’économétrie 40
La droite D obtenue dépend bien entendu de la distance choisie. Trois cas sont
particulièrement importants :
• la méthode des moindres carrés ordinaires (MCO) pour régresser yt sur xt (figure
1.7). Dans ce cas, la distance est mesurée parallèlement à l’axe des ordonnées
0y. Le point de même abscisse que Mt qui se trouve sur la droite D est :
′ ′ ′
Mt = (xt , axt + b). La distance entre Mt et Mt sera d(Mt , D) = d(Mt , Mt ) =
(yt − axt − b)2 , qui correspond au carré de la distance euclidienne. Les paramètres
a et b seront déterminés en minimisant :
T T
2 2
(yt − axt − b) = u2t = u
t=1 t=1
• la méthode des moindres carrés ordinaires (MCO) pour régresser xt sur yt (figure
1.8). La distance est ici mesurée parallèlement à l’axe des abscisses 0x. Le point
′ ′
Mt de la droite D ayant la même ordonnée que Mt , soit Mt = a1 yt − ab , yt . Les
paramètres a et b seront déterminés en minimisant :
T 2 T
1 b ut 2 u 2
x t − yt + = =
t=1
a a t=1
a a
1. La modélisation 41
figure 1.6
Introduction aux méthodes de l’économétrie 42
figure 1.7
figure 1.8
43
figure 1.9
↓
Spécification du modèle
Modèle déterministe ←
Modèle probabiliste
↓
Pb d’identification ?
Forme structurelle - Forme réduite
↓
Données statistiques
↓
Méthodes statistiques
↓
Estimation
↓
Validation des hypothèses faites
Validation statistique ⇒ Tests - Méthodes d’estimation → non
alternatives
↓
Tests d’hypothèses
Intervalles de confiance
↓
Validation économique ⇒ Analyse économique des résultats → non
La théorie est-elle validée ?
↓
Prévisions
Variantes
11
On parle également de bruit blanc faible.
Introduction aux méthodes de l’économétrie 50
Figure 2.1
1.6
0.8
- 0.0
- 0.8
- 1.6
- 2.4
Figure 2.2
PERTURBATIONS AUTOCORRELEES
4
-1
-2
-3
2. Le modèle de régression simple 51
Figure 2.3
PERTURBATIONS HETEROSCEDASTIQUES
25
20
15
10
-5
- 10
- 15
- 20
Figure 2.4
15
10
-5
- 10
- 15
- 20
- 25
Introduction aux méthodes de l’économétrie 52
où
0 1 0 1 0 1 0 1
y1 x1 1 u1
B y2 C B x2 C B 1 C B u2 C
y =B C B
@ ... A ; x = @ .. C
A , eT = B
@ .. C
A et u = B
@ .. C
. . . A
yT xT 1 uT
Pour cela, on dispose d’un échantillon. En raisonnant dans R2 , il est possible
d’obtenir une représentation graphique simple des observations de l’échantillon.
Chaque observation e¤ectuée peut être caractérisée par un couple (xt ; yt ). On obtient
alors un nuage de points (…gure 2.5).
^ et ^b telle qu’une droite d’équation
Le problème posé est de choisir des valeurs de a
^
^x+ b passe le plus près possible de tous les points du nuage. Cette droite est
a
appelée «droite de régression linéaire». Dans ce chapitre, les résultats présentés
ne retiennent pas les notations matricielles. Elles seront utilisées dans le chapitre
suivant pour présenter le modèle de régression multiple et généraliser les résultats
vus dans ce chapitre. Ne pas considérer, dans un premier temps, les notations
matricielles permet de bien se rendre compte des di¢cultés qui se posent dans
tout modèle économétrique, de voir tous les tenants et aboutissants du principe
des moindres carrés ordinaires et les implications des hypothèses faites.
2. Le modèle de régression simple 53
Figure 2.5
2.1.1 Dé…nition
T
X T
X T
X
min u2t = min (yt axt 2
b) = min (yt E[yt ])2 = min S (2.3)
a;b a;b a;b a;b
t=1 t=1 t=1
^xt + ^b et u^t = yt y^t . L’équation (2.6) traduit le fait qu’il n’y a pas de
car y^t = a
corrélation entre la variable explicative xt et le résidu u^t .
L’équation (2.7) montre que la somme des résidus sur l’échantillon est nulle, ce qui
implique que leur moyenne l’est également (i. e. u^ = 0)13 .
13
Cette équation est liée à la présence d’un terme constant dans le modèle de régression simple. Elle
exprime en fait que le vecteur résiduel u
^ est orthogonal au vecteur unitaire eT .
2. Le modèle de régression simple 55
14
Autrement dit, pour un minimum, il faut que les mineurs soient strictement positifs (> 0). Pour un
maximum, il faut que les mineurs soient de signes alternés (< 0, > 0, < 0, etc.).
Introduction aux méthodes de l’économétrie 56
^b + a
^x = y
donc
^b = y a
^x
Cela signi…e que la droite des moindres carrés ordinaires passe par le point moyen
de l’échantillon (i. e. du nuage).
De plus, l’équation (2.8) permet d’obtenir l’estimateur a
^ de a :
T
X T
X T
X
^b xt + a
^ x2t = xt yt
t=1 t=1 t=1
T
X T
X T
X
(y a
^x) xt + a
^ x2t = xt yt
t=1 t=1 t=1
T
X T
X T
X XT
y xt + a
^( x2t x xt ) = xt yt
t=1 t=1 t=1 t=1
T PT
1X 2 2 t=1 xt yt
yx + a
^( x x) =
T t=1 t T
P
T
xt yt T xy
t=1
a
^ =
PT
x2t T x2
t=1
PT P
or 2
t=1 xt T x2 = Tt=1 (xt x)2 , d’après l’hypothèse H5 le dénominateur est
donc di¤érent de 0. Les estimateurs des moindres carrés ordinaires de a et b sont
donc :
^b = y a
^x (2.11)
2. Le modèle de régression simple 57
et,
P
T
xt yt T xy
t=1
a
^= (2.12)
PT
x2t T x2
t=1
L’estimateur a
^ de a peut se réécrire comme suit :
P
T
(xt x) (yt y)
t=1 Covariance empirique entre xt et yt
a
^= = (2.13)
P
T
2 Variance empirique de xt
(xt x)
t=1
On en déduit que :
v v
u T u T
uX p uX p
t (y y) = sy T et t
2
(xt x)2 = sx T
t
t=1 t=1
Introduction aux méthodes de l’économétrie 58
donc
sy
a
^= (2.14)
sx
Il en découle que la pente de la droite de régression (^
a) et du coe¢cient de corrélation
( ) ont le même signe. Si le coe¢cient de corrélation tend vers zéro alors a ^ tend
également vers zéro.
L’équation (2.13) permet aussi de déboucher sur :
T
!
X (xt x)2 yt y
a
^= PT 2
(2.15)
t=1 t=1 (xt x) xt x
P
T
puisque (xt x) = 0.
t=1
Terminologie :
^xt + ^b est appelée valeur ajustée de la variable expliquée;
l’expression y^t = a
la droite y^ = a^x + ^b est appelée droite des moindres carrés ordinaires, ou droite
de régression linéaire;
en…n, l’expression yt y^t = u^t est appelée résidu de l’estimation des moindres
carrés ordinaires (…gure 2.6).
2. Le modèle de régression simple 59
Figure 2.6
où SCT signi…e somme des carrés totale (somme des carrés des écarts par rapport
à sa moyenne de la variable expliquée yt ). En se servant de la relation yt = y^t + u^t
et en soustrayant de chaque côté y (…gure 2.7), on obtient :
(yt y) = (^ ^xt + ^b et ^b = y
yt y) + u^t or y^t = a a
^x
(yt y) = a
^ (xt x) + u^t
Figure 2.7
où SCE signi…e somme des carrés expliquée et SCR somme des carrés résiduelle (ou
encore somme des carrés des résidus). Or on a y = y^ et u^ = 0, donc :
T
X T
X T
X
(yt y)2 = (^
yt y)2 + u^2t (2.18)
t=1 t=1 t=1
2. Le modèle de régression simple 61
La dernière colonne du tableau est obtenue en divisant chaque somme des carrés
par le nombre de degrés de liberté qui lui est associé. Intuitivement, le nombre de
degrés de liberté représente le nombre de valeurs que l’on peut choisir arbitrairement.
Les degrés de liberté correspondent au nombre de termes linéairement indépendants
impliqués dans chacune des sommes des carrés. Ils reposent sur les T observations
indépendantes (y1 ; : : : ; yT ) et sur le nombre de paramètres à estimer. La SCT
nécessite (T 1) termes indépendants. En e¤et, il n’est possible de choisir librement
que (T 1) valeurs de (yt y), la n-ième étant déterminée par la condition
PT
t=1 (yt y) = 0. De même pour la SCR, on ne peut retenir que (T 2) valeurs de
u^t , l’ajustement
PT des moindres carrésPT imposant deux conditions que les résidus doivent
satisfaire : t=1 (x t x) u
^ t = ^t = 0. En…n, à la somme des carrés expliquée
t=1 u
n’est rattachée qu’un seul degré de liberté (i.e. di¤érence entre ((T 1) (T 2))).
Les degrés de liberté peuvent également s’interpréter comme le nombre d’éléments
dans les sommes des carrés moins le nombre de paramètres à estimer dans ces
sommes.
Coe¢cient de détermination
Sur la base de l’équation (2.19), on dé…nit le coe¢cient de détermination, appelé
R2 . Il correspond au rapport entre la SCE et la SCT de la variable expliquée yt ,
soit :
PT
2 yt y)2
t=1 (^ SCE
R = PT = (2.20)
t=1 (yt y) 2
SCT
Introduction aux méthodes de l’économétrie 62
or,
T
X T
X T
X
2 2
(^
yt y) = (yt y) u^2t
t=1 t=1 t=1
d’où
P
T
u^2t
t=1 SCR
R2 = 1 =1 (2.21)
P
T
2 SCT
(yt y)
t=1
0 R2 1
15
Se reporter à Dormont (1999, pp. 78-79).
2. Le modèle de régression simple 63
Pour démontrer que les estimateurs a^ et ^b des MCO sont des estimateurs sans biais
respectivement de a et b, il est nécessaire que leurs espérances soient égales aux
vraies valeurs des paramètres. Autrement dit, on doit avoir :
a] = a et E[^b] = b
E[^
2 3
P
T
6 t=1(xt x)(yt y) 7
a] = E 6
E[^ 4
7
5 H5
P
T
(xt x)2
t=1
P
T
(xt x)E[(yt y)]
t=1
= H3
P
T
(xt x)2
t=1
or,
T
1X
E[yt y] = E[yt yt ]
T t=1
" T T
!#
1 X X
= E axt + b + ut a xt + T b + ut H4
T t=1 t=1
= E[axt + b + ut ax b u]
= a(xt x) H1
Introduction aux méthodes de l’économétrie 64
donc
0 1
P
T
2
B t=1(xt x) C
a] = a B
E[^ @P T
C
A
(xt x)2
t=1
= a
E[^b] = E[y a
^x]
or y = ax + b + u, donc
E[^b] = E[ax + b + u a
^x]
= ax + b ax H1 , H3 et E[^
a] = a
= b
Les estimateurs des MCO de a et b sont donc sans biais. On peut constater que
^ et ^b. Cependant,
l’hypothèse H2 n’intervient pas dans la démonstration du biais de a
l’absence de biais est loin d’être su¢sante, il faut également que la précision qui
caractérise ces estimateurs soit bonne.
2.2.2 ^ et ^b des MCO et leur covariance
Les variances des estimateurs a
V [^
a] = E[(^
a a])2 ] = E[(^
E[^ a a)2 ]
a; ^b] = E[(^
Cov[^ a E[^ a])(^b E[^b])]
= E[(^
a E[^ a])(y a ^x E[y a ^x])]
= E[(^
a E[^ a])( a^x E[^ a]x)]
2 2
= xE[^a ] + xE[^ a]
2
= x E[^ a ] E[^ a]2
= xV [^
a]
x
a; ^b] =
Cov[^ 2
u T (2.24)
P
(xt x)2
t=1
Remarques :
On constate d’après les expressions des variances des estimateurs de a ^ et ^b, que
ces
PTestimateurs2 sont d’autant plus précis que l’expression …gurant au dénominateur
( t=1 (xt x) ) est élevée, c’est-à-dire :
que le nombre d’observations est important;
que les valeurs observées de la variable explicative sont dispersées.
Implications :
Il en découle que pour estimer n’importe quelle forme linéaire des coe¢cients de
a et b dans le modèle de régression simple, il faut être prêt à endurer certains
^ et ^b des moindres carrés ordinaires ne sont pas
désagréments si les estimateurs a
retenus. En e¤et :
soit on choisit un estimateur sans biais, qui est une fonction linéaire des
Introduction aux méthodes de l’économétrie 66
Pour cela, il est nécessaire de poser une hypothèse supplémentaire H6 , qui assure
cette convergence :
T
1X
H6 : lim (xt x)2 = qx > 0
T !1 T
t=1
E[^
a] = a 8t
2 2 =T
0
lim V [^
a] = lim u
= lim u ! = qx
=0
T !1 P (xt x)2
T P
T
T !1 T !1
(xt x)2 =T
t=1 t=1
donc
plima
^=a
T !1
plim^b = plim(y a
^x)
T !1 T !1
= plim(ax + b + u a
^x)
T !1
= b
P
T
car plimu = plim T1 ut = 0 et plima
^ = a.
T !1 T !1 t=1 T !1
16
Sauf dans le cas où les perturbations suivent une loi normale.
Introduction aux méthodes de l’économétrie 68
Cette hypothèse de normalité des perturbations peut parfois être justi…ée par une
référence implicite au théorème central limite; dans la mesure où les perturbations
traduiraient l’in‡uence additive d’un grand nombre de variables explicatives omises
indépendantes et chacune d’importance in…nitésimale. Dans ces circonstances, la
somme de ces variables suivrait bien approximativement une loi normale. Les sous-
^ et ^b des
sections suivantes décrivent les propriétés supplémentaires des estimateurs a
MCO qui résultent de l’ajout de cette hypothèse.
2.5.1 ^ et ^b suivent une loi normale
Les estimateurs a
Sous les hypothèses H1 à H8 , les estimateurs a ^ et ^b suivent une loi normale, quel
que soit le nombre d’observations. Ce résultat tient à la linéarité du modèle et à
celle des estimateurs a^ et ^b. Kmenta (1986) montre qu’une combinaison linéaire
de variables aléatoires suivant une loi normale suit également une loi normale (se
reporter à la sous-section suivante et au théorème fourni en note de bas de page).
2.5.2 Les estimateurs des MCO et du maximum de vraisemblance de
a et b sont identiques
17
Théorème : Soit y, z,...,w des variables aléatoires normales et identiquement et indépendamment
distribuées, et a, b,...,d des constantes, alors la combinaison linéaire ay + bz + ::: + dw est également
normalement distribuée (cf. Kmenta (1986, pp. 90-91 )).
2. Le modèle de régression simple 69
u 2
Celle du n-uple (y1 ; y2 ; :::; yT ) s’obtient à cause de l’indépendance en faisant le
produit des densités marginales de chaque yt , soit :
2
L(y1 ; y2 ; :::; yT ; a; b; u) = f (y1 ):f (y2 ):::f (yT )
YT
= f (yt )
t=1
YT axt b)2
1 (yt
2 2
= p exp u
t=1 u 2
PT
b)2
1 t=1 (yt axt
2 2
= T exp u
(2 2) 2
u
(2.25)
Introduction aux méthodes de l’économétrie 70
T
@ log L 1 X ^b) = 0
a=a ^ = 2(yt a
^ xt (2.27)
@b 2^ 2u t=1
b = ^b
2 2
u = ^u
T
@ log L T 1 X ^b) = 0
a=a ^ = + (yt a
^ xt (2.28)
@ 2u 2^ 2u 2^ 4u t=1
b = ^b
2 2
u = ^u
Les deux premières équations (2.26) et (2.27) ne sont autres que les équations
normales présentées à la sous-section 2.1.1 (équations (2.4) et (2.5)) et admettent
donc comme solutions les estimateurs a^ et ^b des MCO précédemment trouvés (2.11)
et (2.13).
P
T
u^2t
t=1
^ 2uM V = (2.29)
T
P
T
u^2t
t=1
6= = ^ 2uM CO
T 2
18
Se reporter à Tassi (1985).
2. Le modèle de régression simple 71
(T 2)
E[^ 2uM V ] = 2
u
T
2
6= u
0 i h 1
V [^
a] Cov a ^
^; b 0
B h i h i C
I( ) 1
=B
@ Cov ^b; a
^ V ^b 0 C
A (2.30)
2 4u
0 0 T
on va estimer la variance des perturbations à partir des résidus des MCO c’est-à-dire
u^t = yt a ^xt ^b. L’estimateur des MCO de la variance des perturbations est donné
par :
P
T
u^2t
t=1
^ 2u = (2.31)
T 2
2 3
P
T
" T #
6 7 u^2tX
1
E[^ 2u ] = E 6 t=1 7
4T 25 = T 2E u^2t
t=1
2. Le modèle de régression simple 73
hP i
T
or E t=1 u^2t = (T 2) u,
2
ce qui implique que :
E[^ 2u ] = 2
u
donc l’estimateur ^ 2u des MCO est un estimateur sans biais de la variance des
perturbations 2u .
2.7.1 L’estimateur des MCO de 2u suit à une constante près une loi
du khi-deux à (T 2) degrés de liberté
^ 2u 2
(T 2) 2
(T 2)
u
une variance minimale (la variance minimale est dé…nie par la borne de FDCR, la
démonstration a été e¤ectuée par Rao (1965)).
2.7.4 Les estimateurs des MCO et du MV de 2
u ne sont pas identiques
En e¤et, la section 2.6 a montré que l’estimateur des MCO de la variance des
perturbations 2u est fourni par :
P
T
u^2t
t=1
^ 2uM CO =
T 2
Par ailleurs, on a vu qu’il est sans biais. En revanche, la section 5 a montré que
l’estimateur du MV de cette même variance est donné par :
P
T
u^2t
t=1
^ 2uM V =
T
et qu’il est biaisé vers le bas puisque :
2
E ^ 2uM V = 2
u
2
u
T
Cependant, asymptotiquement (T ! 1), l’estimateur du MV est convergent car le
biais 2 2
T u
tend vers zéro.
Pour le démontrer, il faut prouver que les estimateurs a ^ et ^b sont indépendants des
^ et ^b
résidus u^t . Dans cette perspective, puisque les résidus u^t et les estimateurs a
suivent des lois normales, il su¢t de montrer que leurs covariances sont nulles22 .
h i
a a) u^t ] = 0 et E ^b b u^t = 0
E [(^
con…ance que l’on peut accorder à cette estimation. En d’autres termes, est-il
possible que la vraie valeur des paramètres soit assez éloignée de cette estimation ?
Pour répondre à cette question, on peut procéder à l’estimation de ces paramètres
par intervalles de con…ance.
2.8.1 Intervalles de con…ance
et donc,
a
^ a
N (0; 1)
a
^
où,
v
u 2
u u
a
^ =u T
tP
(xt x)2
t=1
23
Cette écriture est justi…ée car les bornes a1 et a2 sont aléatoires. Elles dépendent des observations
(xt ; yt ) par le biais de l’estimation du coe¢cient a.
Introduction aux méthodes de l’économétrie 76
Le rapport d’une loi normale à une loi du khi-deux détermine une loi de Student
à (T 2) degrés de liberté24 . On a donc :
a
^ a
t(T 2)
^ a^
On peut donc rechercher la valeur critique t d’ordre 1 =2 de la loi de Student
à (T 2) degrés de liberté qui véri…e l’égalité :
a
^ a
Pr t1 =2 (T 2) t1 =2 (T 2) = 1
^ a^
soit,
Pr a
^ ^ a^ t1 =2 (T 2) a a
^ + ^ a^ t1 =2 (T 2) = 1 (2.33)
L’intervalle de con…ance est alors donné par :
Ia = a
^ ^ a^ t1 =2 (T 2) (2.34)
Ainsi, on peut conclure que la vraie valeur du paramètre a se trouve, avec une
probabilité égale à (1 ) dans l’intervalle Ia . Cet intervalle permet d’apprécier
le degré de précision de l’estimation. En e¤et, d’après l’expression de l’intervalle,
on s’aperçoit qu’il sera d’autant plus large que la précision de l’estimation est
faible.
Intervalles de con…ance asymptotiques
L’intervalle de con…ance asymptotique pour le coe¢cient a est dé…ni par :
Ia = [^
a ^ a^ N1 =2 ] (2.35)
où N1 =2 est la valeur critique d’ordre 1 =2 de la loi normale centrée réduite.
Une des …nalités de l’estimation d’un modèle économétrique est d’apporter des
éléments d’information sur l’adéquation entre un modèle et le phénomène qu’il est
censé représenter. A…n d’évaluer cette adéquation, on procède à la mise en œuvre
de tests statistiques. Les tests les plus fréquemment mis en œuvre sont les tests
d’égalité qui permettent de tester l’égalité d’un (ou plusieurs) paramètre(s) à une
(des) valeur(s) …xée(s) a priori.
24
Se reporter à Tassi (1985).
2. Le modèle de régression simple 77
La théorie économique sert souvent de base pour avoir une idée sur la vraie valeur
du coe¢cient a0 . Ensuite, il faut un critère qui permet de dire si l’hypothèse nulle
peut être non-rejettée (acceptée) au regard de la réalité. L’idée va être de distinguer
une région de non-rejet (d’acceptation) et une région de rejet (non acceptation) de
l’hypothèse nulle. Plus précisément, on parle de région critique et de région de
non-rejet. Si la statistique de test se situe dans la région de non-rejet, alors on ne
rejette pas l’hypothèse nulle contre l’hypothèse alternative. Les bornes des régions
sont déterminées par la distribution de la statistique de test (sa loi), par la forme
de l’hypothèse alternative.
Soit donc H0 l’hypothèse nulle (a = a0 ) et H1 l’hypothèse alternative (a 6= a0 ), on
conçoit intuitivement que l’on va baser le non-rejet ou le rejet de l’hypothèse nulle
sur l’écart qui existe entre l’estimation obtenue a ^ et la valeur testée a0 . La valeur
de a^ peut être beaucoup plus grande que celle de a0 comme elle peut être nettement
plus petite que celle de a0 . Ces possibilités constituent deux alternatives possibles à
l’hypothèse nulle. Les bornes entre les régions critique et de non-rejet doivent être
telles que l’on rejettera H0 lorsque la valeur de a^ est supérieure ou inférieure à celle
de a0 compte tenu du caractère rare attribué à cet évènement. À celui-ci est a¤ecté
une probabilité 0:01, qui est séparée en deux parties équivalentes.
Ensuite, il est nécessaire de connaître la loi suivie par la variable aléatoire. Ici,
c’est une loi de Student. On peut se référer aux tabulations de cette loi pour trouver
ses valeurs théoriques, et ainsi déterminer les régions de non-rejet et critique. Par
ailleurs, lorsqu’on réalise un test, on base la décision de non-rejet ou de rejet de
l’hypothèse H0 sur l’estimation du paramètre testé. Il existe par conséquent deux
risques d’erreur liés simplement au fait que a ^ est di¤érent de a :
le risque de rejeter H0 alors qu’elle est vraie; appelé risque de 1re espèce;
le risque d’accepter H0 alors qu’elle est fausse; appelé risque de 2e espèce.
Le tableau 2.2 résume les di¤érents cas possibles. La procédure de test conduit à
privilégier l’hypothèse H0 en ce sens que l’on va en général se donner une très faible
probabilité ( 0:10) de rejeter H0 alors qu’elle est vraie et minimiser ensuite le
Introduction aux méthodes de l’économétrie 78
1- ^ 2 a0 ^ a^ t1
a =2 (T 2) ;a0 + ^ a^ t1 =2 (T 2)
ou tc = a^ ^ a^a0 2 t1 =2(T 2) ;t1 =2 (T 2)
2- ^ 2 [ 1;a0 + ^ a^ t1 (T 2)]
a
ou tc = a^ ^ a^a0 2 [ 1;t1 (T 2)]
3- ^ 2 [a0 ^ a^ t1 (T 2) ; + 1]
a
ou tc = a^ ^ a^a0 2 [ t1 (T 2) ; + 1]
1- ^2
a 1;a0 ^ ba t1 =2 (T 2) ou a
^ 2 a0 + ^ a^ t1 =2 (T 2) ; + 1
a
^ a0
ou tc = ^a
^
2 1; t1 =2 (T 2) ou tc = a^ ^ a^a0 2 t1 =2 (T 2) ; + 1
2- ^ 2 ]a0 + ^ a^ t1 (T 2) ; + 1[
a
ou tc = ba ^ a^a0 2 ]t1 (T 2) ; + 1[
Remarque : Lorsque le nombre d’observations tend vers l’in…ni alors la loi de Student converge vers une
loi normale. Les valeurs des statistiques théoriques sont alors celles données par la loi normale.
Introduction aux méthodes de l’économétrie 80
a
^ a0 a
^ a0
1- jtc j = ^a
^
t1 =2 (T 2) jtc j = ^a
^
> t1 =2 (T 2)
a
^ a0 a a0
b
2- tc = ^a
^
t1 (T 2) tc = ^a
^
> t1 (T 2)
a
^ a0 a
^ a0
3- tc = ^a
^
t1 (T 2) tc = ^a
^
< t1 (T 2)
Sur la base des sommes des carrés reportées (SCT, SCE et SCR) dans le tableau
2.1 d’analyse de la variance pour le modèle de régression simple, il est possible de
réaliser le test suivant :
H0 : a = 0 contre H1 : a 6= 0
Si l’hypothèse H0 est véri…ée, on peut montrer que les espérances de ces sommes
sont égales à :
E [SCT] = (T 1) 2
u ) E SCT
T 1
= 2
u
E [SCE] = 2u ) E [SCE] = 2
u
E [SCR] = (T 2) 2
u ) E SCR
T 2
= 2
u
(SCE= 2u ) et (SCR= 2
u) sont indépendantes. Il en découle que, sous l’hypothèse H0 ,
la statistique :
SCE
1 2u SCE (T 2) CMSCE
Fc = SCR
= = F (1; T 2) (2.37)
(T 2) 2 SCR 1 CMSCR
u
Cette statistique suit une loi de Fisher à (1; T 2) degrés de liberté. Si la statistique
calculée Fc est supérieure à la statistique théorique F (1; T 2) au seuil de %,
alors on rejette l’hypothèse H0 contre l’hypothèse alternative H1 au seuil de %.
Cette procédure est appelée analyse de la variance (ANOVA25 ). Les résultats sont
généralement présentés dans un tableau.
Source de variation SC dl CM Fc
SCE SCE (T 2) CM S C E
x SCE 1 CMSCE = 1 SCR 1 = CM S C R
SCR
Résidu SCR T 2 CMSCR = T 2
SCT
Total SCT T 1 CMSCT = T 1
Remarques :
On peut montrer que ce test est équivalent au test de Student bilatéral. En e¤et,
T
X
SCE = (b
yt y)2
t=1
XT
= (y + b
a (xt x) y)2
t=1
T
X
= b
a 2
(xt x)2
t=1
25
«ANalysis Of VAriance».
Introduction aux méthodes de l’économétrie 82
Or, on a :
SCE
Fc =
SCR/ (T 2)
P
T
a2 (xt x)2
b
t=1
=
SCR/ (T 2)
P
T
a2 (xt
b x)2
t=1
=
b2u
P
T
D’après l’équation (2.22), b2u = bb2a (xt x)2 , donc
t=1
2
a
b
Fc = = t2c (2.38)
bba
La statistique tc est équivalente à la statistique de Student calculée sous l’hypothèse
nulle H0 . L’équivalence entre les deux tests est donc :
Fc = t2c
On peut également mettre en évidence un lien avec le coe¢cient de détermination.
p
tc = Fc
s
SCE
=
SCR/ (T 2)
s
R2 (T 2)
=
(1 R2 )
p
R T 2
= p (2.39)
1 R2
Or comme R2 = 2
, donc
p
T 2
tc = p (2.40)
1 2
2.9 Prévision
Puisque E[~
uT +1 ] = 0, la variance de u~T +1 est donnée par :
uT +1 ] =
V [~ E[(~
yT +1 yT +1 )2 ]
= E[(~
yT +1 axT +1 b uT +1 )2 ]
= E[(~
yT +1 axT +1 b)2 ] + E[u2T +1 ] 2Cov[~
yT +1 axT +1 buT +1 ]
= E[(~
yT +1 axT +1 b)2 ] + 2u
car la covariance est nulle. En e¤et y^T +1 ne dépend que des observations (y1 ,...,
yT ) et est donc sans corrélation avec uT +1 si les perturbations (u1 ,..., uT ) sont non
corrélées avec uT +1 . D’autre part, la variance de la perturbation en T + 1 est égale
à V [uT +1 ] = 2u .
Par conséquent, le problème posé est de trouver le prédicteur linéaire sans biais de
E[yT +1 ] = axT +1 + b qui minimise l’expression E[(~
yT +1 axT +1 b)2 ]. D’après le
théorème de Gauss-Markov, ce prédicteur est donné par :
^xT +1 + ^b
y^T +1 = a
Compte tenu du caractère aléatoire de yT +1 , la précision de y^T +1 est fournie par :
E[(^
yT +1 axT +1 + ^b
yT +1 )2 ] = E[(^ axT +1 b uT +1 )2 ]
= E[((^
a a)xT +1 + ^b b)2 ] + 2 u
dès lors que V [uT +1 ] = 2u et que uT +1 n’est pas corrélé avec (u1 ,...,uT ). En e¤et, on
a uT +1 ] = E[^b uT +1 ] = 0. Ainsi :
a alors E[^
E[(^
yT +1 a] + V [^b] + 2xT +1 Cov[^
yT +1 )2 ] = x2T +1 V [^ a; ^b] + 2u
" #
2 2
x 1 x
= 2u PT T +1 + 2u + PT
t=1 (x t x) 2 T t=1 (xt x)2
xT +1 x
2 2u PT + 2u
2
t=1 (xt x)
" #
2
1 (x T +1 x)
= 2u 1 + + PT
T t=1 (xt x)2
" #
2
1 (x T +1 x)
E[(^
yT +1 yT +1 )2 ] = 2u + 2u + PT (2.42)
T t=1 (x t x) 2
cette incertitude;
le second terme est lié à la précision de l’estimation de a et b ainsi qu’à l’écart
entre la valeur xT +1 et la moyenne des observations.
On peut constater que la variance de la prévision est d’autant plus faible que :
u est faible;
2
T est grand;
la dispersion des xt sur l’échantillon ayant servi de base à l’estimation de a et b
est grande;
l’écart entre xT +1 et x est faible.
Les trois premiers points peuvent être considérés comme liés à la précision de
l’estimation de a et b. Le dernier montre que le modèle fonctionne d’autant mieux
en prévision que la valeur de xT +1 utilisée dans la prédiction n’est pas trop éloignée
de la moyenne de l’échantillon28 .
Sous l’hypothèse de normalité des perturbations, on a :
!!
2
2 1 (xT +1 x)
y^T +1 yT +1 N 0; u 1+ + PT
T t=1 (xt x)2
et l’intervalle de con…ance de la prévision de yT +1 est donné par29 :
" s #
1 (xT +1 x)2
IyT +1 = y^T +1 ^ u t1 =2 (T 2) 1 + + PT (2.43)
T t=1 (xt x)2
ou asymptotiquement par :
" s #
1 (xT +1 x)2
IyT +1 = y^T +1 ^ u N1 =2 1 + + PT (2.44)
T t=1 (xt x)2
28
Il résulte du dernier point que si la variable xt suit une tendance, l’observation xT +1 a toutes les chances
d’être assez éloignée de x. La précision de la prévision dans un modèle où les variables explicatives suivent
une tendance peut donc être assez mauvaise.
29
Se reporter à la …gure 2.8.
Introduction aux méthodes de l’économétrie 86
Figure 2.8
Chapitre 3
——————————————————————————
avec x0t = 1, 8t. Le modèle comporte k variables explicatives (hors constante), xjt ,
j = 1; : : : ; k. Par analogie au modèle de régression simple, cinq hypothèses sont
faites :
H1 : E[ut ] = 0 8t
H21 : V [ut ] = E (ut E[ut ])2 = E[u2t ] = 2u 8t
H2 : 0
H22 : Cov[ut ; ut0 ] = E[ut ut0 ] = 0 8t 6= t
Autrement dit, les perturbations sont supposées homoscédastiques (H21 , variance
constante) et non autocorrélées (H22 , covariances nulles).
H3 : les variables explicatives xjt sont non aléatoires, pour j = 1; : : : ; k
H4 : le modèle est correctement spéci…é
H5 : les variables explicatives xjt ne sont pas colinéaires (constante comprise).
118
3. Le modèle de régression multiple 119
soit,
y = X b + u (3.3)
(T;1) (T;k+1)(k+1;1) (T;1)
3.1.1 Dé…nition
Soit, matriciellement
or b> X> y est un scalaire. Par dé…nition, sa transposée est égale à ce scalaire, donc
b> X> y = y> Xb, il vient :
min S = min y> y 2y> Xb + b> X> Xb
b> b>
PX = X;
rg(P) = tr(P) = k + 1.
Par ailleurs, on a :
b = y
u b
y
= y Xbb
= y Py
= (IT P) y
= My (3.10)
e>
Tub=0 (3.12)
soit
u
b=0 (3.13)
donc avec un terme constant la moyenne des résidus est nulle. À partir de ce résultat,
Introduction aux méthodes de l’économétrie 122
il vient :
yb = y (3.14)
puisque l’on a :
b = X> Py = X> y
X> y (3.15)
car X> P = X> , et donc si le modèle comporte un terme constant :
e>
Tyb = e>
Ty
yb = y
En…n, on a :
b> u
y b=0 (3.16)
car y b = y> PMy = 0 puisque PM = 0. Il n’y a donc aucun lien systématique
b> u
entre les valeurs ajustées par le modèle et les résidus.
3.1.3 Équation d’analyse de la variance, coe¢cients de détermination
et théorème de Frisch-Waugh
32
On parle également de théorème de Frisch-Waugh-Lowell. En 1963, Lowell a redonné une nouvelle vie
au théorème de Frisch-Waugh un peu oublié.
Introduction aux méthodes de l’économétrie 124
1
avec MX2 = IT X2 X>
2 X2 2 , et,
X>
y b = X2 b + u
X1 b (3.23)
1 2
1
b = X > MX X 1
b X> (3.24)
1 1 2 1 MX2 y
1
b = X> X2
b X> y b
X1 b (3.25)
2 2 2 1
Les expressions de b b et de b
b sont équivalentes aux (k + 1) composantes du
1 2
b
vecteur b (éq. 3.8).
L’estimateur b b des MCO est aléatoire car il est dé…ni comme une fonction du
vecteur de la variable aléatoire y. Il est donc logique de s’intéresser à ses propriétés
statistiques. Ici, on raisonne à distance …nie (T …xé), plus tard le cas asymptotique
(T ! 1) sera envisagé. On va voir que les hypothèses initialement posées servent
dans la démonstration des propriétés de cet estimateur. Il est donc important de
bien mémoriser où chaque hypothèse intervient. Cela permet de se rendre compte
à quel niveau l’estimateur des MCO est a¤ecté (biais et/ou matrice de variances-
covariances) par le non respect de telle ou telle hypothèse.
3.2.1 b est un estimateur sans biais de b
b
h i
b des MCO de b est sans biais si : E b
L’estimateur b b = b. En calculant cette
3. Le modèle de régression multiple 125
espérance, il vient :
h i h 1
i
b
E b = E X X >
X y or y = Xb + u H4 et H5
>
h 1 1
i
= E X> X X> Xb + X> X X> u
h 1
i
= E b + X> X X> u
1
= b + X> X X> E [u] H3
h i
b = b
E b H1 (3.26)
h i h i h i >
b = E
V b b
b b
E b b
b b
E b b est sans biais
or b
>
= E b
b b b
b b
En utilisant le résultat selon lequel l’estimateur des MCO est sans biais, on se sert
implicitement des hypothèses H1 , H3 , H4 et H5 . Par ailleurs, comme
1
b
b b = X> X X> y b or y = Xb + u (H4 )
1
= b + X> X X> u b
1
b
b b = X> X X> u
Introduction aux méthodes de l’économétrie 126
donc
h i 1 1 >
b = E
V b X> X X> u X> X X> u
h 1 1
i
= E X> X X> uu> X X> X
1 1
= X> X X> E uu> X X> X H3
2 1 1
= u X> X X> X X> X H2
h i 1
b =
V b 2
X> X (3.27)
u
b = Hy (3.28)
avec :
1
H = X> X X> + C
où C est une matrice non aléatoire. En remplaçant y (= Xb + u) par son expression
dans (3.28), il vient :
b = Hy = HXb + Hu (3.29)
En calculant l’espérance de l’estimateur :
E [b ] = HXb (3.30)
HX = Ik+1 (3.31)
3. Le modèle de régression multiple 127
Or,
1
HX = X> X X> X + CX
= Ik+1 + CX
où CC> est une matrice semi-dé…nie positive. Ainsi, tout estimateur linéaire et
sans biais b a une matrice de variances-covariances supérieure ou égale à celle de
b des MCO.
l’estimateur b
En e¤et, une condition su¢sante pour que l’estimateur bb des MCO converge en
probabilité vers b est qu’il converge en moyenne quadratique. Pour cela, il faut
avoir :
b =b
lim E[b]
T !1
b =0
lim V [b]
T !1
or, on a :
b =b
E[b] 8t
2 1
b = lim
lim V [b] u X> X
=0 Q 1
=0
T !1 T !1 T T
1
b
b N b; 2
X> X (3.37)
u
Introduction aux méthodes de l’économétrie 130
2
E[yt ] = b0 + b1 x1t + + bk xkt et V [yt ] = u
2
yt N (b0 + b1 x1t + + bk xkt ; u)
ou
2
yt N X>
t b; u
avec X>
t = (1 x1t x2t : : : xkt ). Soit, matriciellement
2
y N (Xb; u IT )
Xt b)2
2 1 (yt
2 2
f (yt ; b; u) = p exp u
u 2
t=1 u 2
(y Xb)> (y Xb)
1 2 2
= T exp u
(2 2) 2
u
b>u
u b
^ 2uM V = (3.41)
T
b>u
u b
6= = ^ 2uM CO
T (k + 1)
(T (k + 1)) 2
E[^ 2uM V ] = E ^ uM CO
T
(T (k + 1))
= E ^ 2uM CO
T
puisque E ^ 2uM CO = u,
2
il vient :
(T (k + 1))
E[^ 2uM V ] = 2
u 6= 2
u
T
Propriété 3.2 : Lorsque le nombre T d’observations tend vers l’in…ni, les esti-
mateurs de la variance des perturbations ^ 2uM V et ^ 2uM CO sont approximativement
identiques.
avec = (b; u) .
2 >
Après quelques calculs, on obtient :
!
2 1
1 X> X 0
I( ) = u
2 4u (3.42)
0> T
h i
b b = 1
L’estimateur b des MCO est e¢cace puisque V b 2
u X> X .
X T
1
b2u = b2
u (3.43)
T (k + 1) t=1 t
Soit, matriciellement
b>u
u b
b2u = (3.44)
T (k + 1)
avec u
b=y b
Xb.
3.6.2 b2u est un estimateur sans biais de 2
u
E b2u = 2
u
3. Le modèle de régression multiple 135
3.7.1 L’estimateur b2u des MCO suit, à une constante près, une loi du
khi-deux à T (k + 1) degrés de liberté
Sous les hypothèses H1 à H5 et H8 , l’estimateur b2u des MCO suit, à une constante
près, une loi du khi-deux à T (k + 1) degrés de liberté :
^ 2u 2
(T (k + 1)) 2
(T (k + 1))
u
Par ailleurs, on a vu qu’il est sans biais. En revanche, la section 3.5 a montré que
l’estimateur du MV de cette même variance est donné par :
b>u
u b
^ 2uM V =
T
et qu’il est biaisé vers le bas puisque :
(k + 1)
E ^ 2uM V = 2
u
2
u
T
Cependant, asymptotiquement (T ! 1), l’estimateur du MV est convergent car le
(k+1) 2
biais T u tend vers zéro.
La logique adoptée ici est identique à celle retenue pour le modèle de régression
simple. Il est donc important d’évaluer le degré de con…ance que l’on peut accorder
35
Se reporter à la section 3.1.2.
3. Le modèle de régression multiple 137
aux estimations obtenues. Plus précisément, on cherche à savoir dans quelle mesure
la vraie valeur des paramètres est proche ou non des estimations.
3.8.1 Intervalles de con…ance
Par ailleurs, on sait que la variance des perturbations suit, à une constante près,
une loi du khi-deux à (T (k + 1)) degrés de liberté. Ceci implique que :
bbj bj
t (T (k + 1))
bbbj
Il vient alors :
h i
Ibj = bbj bbbj t1 =2 (T (k + 1)) (3.45)
h i b
bbj 2 bj b0j
2- 1;b0j + ^bbj t1 (T (k + 1)) ou tc = ^ bb 2 [ 1;t1 (T (k + 1))]
j
h i b
bbj 2 b0 bj b0j
3- j ^bbj t1 (T (k + 1)) ; + 1 ou tc = ^ bb 2 [ t1 (T (k + 1)) ; + 1]
j
i h
2- bbj 2 b0 + ^b t1 (T (k + 1)) ; + 1
j bj
b
bj b0j
ou tc = ^ bb 2 ]t1 (T (k + 1)) ; + 1[
j
i h
3- bbj 2 1;b0j ^bbj t1 (T (k + 1))
b
bj b0j
ou tc = ^ bb 2 ] 1; t1 (T (k + 1))[
j
Remarque : Lorsque le nombre d’observations tend vers l’in…ni alors la loi de Student converge vers une
loi normale. Les valeurs des statistiques théoriques sont alors celles données par la loi normale.
Introduction aux méthodes de l’économétrie 140
b
bj b0j b
bj b0j
1- jtc j = ^ bb t1 =2 (T (k + 1)) jtc j = ^ bb > t1 =2 (T (k + 1))
j j
b
bj b0j b
bj b0j
2- tc = ^ bb t1 (T (k + 1)) tc = ^ bb > t1 (T (k + 1))
j j
b
bj b0j b
bj b0j
3- tc = ^ bb t1 (T (k + 1)) tc = ^ bb < t1 (T (k + 1))
j j
Comme pour le modèle de régression simple, sur la base des sommes des carrés
(SCT, SCE et SCR), il est possible de réaliser le test suivant :
H0 : b1 = b 2 = = bk = 0 contre H1 : 9bj 6= 0; j = 1:::; k
Sous l’hypothèse H0 , le modèle (3.1) s’écrit :
y t = b0 + u t t = 1; :::; T
On peut alors montrer que les espérances des sommes SCT, SCE et SCR sont égales
à:
E [SCT] = (T 1) 2u ) E SCT
T 1
= 2u
E [SCE] = k 2u ) E h SCE
k i = u
2
2 SCR 2
E [SCR] = (T (k + 1)) u )E T (k+1)
= u
3. Le modèle de régression multiple 141
P
T P
T P
T
(yt y)2 (b
yt y)2 u2t
t=1 t=1 t=1
CMSCT = , CMSCE = et CMSCR = (3.50)
T 1 k T (k + 1)
Cette statistique suit une loi de Fisher à (k; T (k + 1)) degrés de liberté. Si la
statistique calculée Fc est supérieure à la statistique théorique F (k; T (k + 1)) au
seuil de %, alors on rejette l’hypothèse H0 contre l’hypothèse alternative H1 au
seuil de %. Cette procédure est appelée analyse de la variance. Les résultats sont
généralement présentés dans un tableau.
Source de variation SC dl CM Fc
CM S C E
X SCE k CMSCE = SCE
k
SCE
SCR
T (k+1)
k = CM S C R
Résidu SCR T (k + 1) CMSCR = T SCR
(k+1)
Total SCT T 1 CMSCT = TSCT1
SCR SCE
R2 = 1 =
SCT SCT
il vient
SCR
1 R2 =
SCT
Introduction aux méthodes de l’économétrie 142
3.9 Prévision
Après avoir estimé le modèle (3.3), on peut souhaiter l’utiliser pour faire de la
prévision. En supposant qu’il reste valide en T + 1, que la perturbation uT +1 ait les
mêmes propriétés que les perturbations u1 ; : : : ; uT et que l’on connaisse le vecteur
des valeurs des variables explicatives en T + 1, X> T +1 , on peut prévoir y
bT +1 par :
h i
E [b
yT +1 yT +1 ] = E X> b X> uT +1
T +1 b T +1 b
h i
= X> b
T +1 E b b E [uT +1 ]
= 0
h i h i
b
puisque E b b = b) et E [uT +1 ] = 0.
b = 0 (car E b
et asymptotiquement par :
q
1
IyT +1 = ybT +1 b u N1 =2 X> >
T +1 (X X) XT +1 + 1 (3.55)
/
WWWWWWWWWWWWWWWWWWWWWWWWWW
( #
* $
0 1 & 0
! $ $ & % "! ! % O % ! +
6 6 $ $ O
(4(
$
% & +
%
! $
! + & % $
0 1
5 # 1 . &7 0 (
( # #
5 5 ! &7
* 0 1 ", .# *
& %
& '
& "#$ % "/ 2#
1 $ $ & % !
0 1 * "#$
5 5 ! ( &7
# " 1(
= G !
& %
%
( "/ 4#
* ! 6 ! "#$
& '
' "#$ ( "/ -#
& '
' "#$ (
> $ & 0 1 $
$ O ! 6
! C "/ -#
$ $
! + O
! = G
! ! ! 6 ! "#$
> + & % D $
0 1
5 5 ! &7 #
= G & & ! + 3
0 1
5 # , # 0 &7
5 5 "#$ "
&
%
$
= G C $ 0 1 !
! $ ! $ $ 1
& "#$
' "#$
3 $ "#$ ! ! $
"#$
5 5 "#$ , # 0
; 6 0 1 ! !
"#$ (
! ! 6 ! $
& '
' "#$ (
> + & 0 1 !
$ <
N ! !
! 6 ! $
5 ! &7 # 0 1 >
= G $ 6! & "/ /#
( 1 (
(
"/ .#
$
= ! $
$ 0 1/4 ", .#
5 # ( &7
5 5 ! &7 (
= G $ ( "#$ !
0 1
& ( "#$ ( (
5 : % # $ ' ( "#$
&! D # +
(
& ( "#$
( (
?# " 0 3 &#
+
& ( "#$ (
> $ ! 6 ! "#$
( "#$
/7
$$
! 6 !
$
& '
' "#$ ( "#$ "/ 7#
! (
!
5 ! " 6 &A8
* $ ! $
! & " O
# 0 1
5 5 9 .
= $ $ & &
"#$ T*B= ! & "/ /#
$ & + ! + & > !
$
"/ (:#
! + &
% &
% ' (
%
% & +
%
* $
' " # <
% & &
% ' ' (
%
% & +
%
E! $ $'
3 & % $
"/ ((#
$ + !
"/ ()#
1 $ ! +
= K "/ (:# !
"/ (,#
"/ (/#
! 9
& "/ (/# ! + & & <
0 1 $ & "/ (/#
"0 9#
1 $ Y 0 1
& "/ (/#
= $ 0 9
" #
.
.
"/ (4#
= $ & ! (2
!
.
"#& "/ (-#
& $ 3
0 1 $ $
$)
5 5 # 0 &A
* ! A & "/ (/#
"/ ):#
! $
! + !
I
I
< ! A
! ! ! !
! " # A A $
0 1
/-
& "/ /#
& "/ (/# = G
$ !
.
M $ ! !
!
$-
"/ )(#
= + C A $
1 ! $ & "/ (/#
$ $ 0 1" $ 0 9#
$ & < '
& C
$ ! $
&
5$ # 1 . &A
* "#& + !
! $ $
+ " + # $
! 0 1 ! ! $ &
!
P $ & !
$ ! 0 9 G " O
! 6 ! # &
'+
5$5 ! &A
& '
* 0 9 & "#& =
!
& ' & '
& "#& & %
& '
& %
& %
& '
& "#& % "/ ))#
* "#& 5
0 1 $ & % !
5$5 ! ( &A
# (
3 + ! 6 !
& ' ) *
' "#& &
& '
&
& %
%
'
(
( "/ ),#
5'
5 & & ! +
0 9 <
=
$ 0 1/.
5) # , # 0 &A
% "/ )/#
= G C $ "#& !
! $ ! $ $ 1
& "#&
' "#&
3 $ "#& ! ! $
"#&
5)5 "#& , # 0
& % % % !
$
5- # &A ,#
#
* $ 0 9 &
$ $ $
0
$ !
& $ 0 9 !
% ( "/ )4#
5-5 ! &A
& % % % 0 9
. "/ ).#
.
.
(
.
. . "/ )7#
( .
.
( .
(
.
.
(
.
( ." ."
/7
* 08 ! .
(
(
5-5 ! "#& :
= G ! 6 ! @< ? $
+ !
) *
&
! ( > & $ $
& '
* "#& C $ ' "#& (
5 + ! # ( #
&A
* ! 6 ! 0 9 !
( $ !
!
5 +5 9 .
* ( "#& ! (
( "#&
/ (: !
'
"#& "#&
"#& "#&
. .
"/ ,:#
! . "#&
5 +5 ( "#& (
2:
1 R $
5 +5 ( "#& " (
& % % % !
$ ( "#& !
(
( "#& (
5 +5 ! ( "#& 1 # 2 1
"
& % % % ( "#& &
2
( "#&
2
(
!
(
' ( "#& "/ ,)#
/(
'
5 +5 ! "#& ( "#& #
5 ! 0 " 6 &BA8
< 0
$
1 * ! 6
! $ &
; ; ; &
; &
' (
;
; &
$ &
F $ !
& & " &
+ # >+ C
$ A $ 1 ! $
!
& ! '
"/ ,,#
! ' K !
9 & - ' !
! 6 !
"/ ,/#
$ 0 ;9 ( ! $
1 ! /,
'$
5 5 9 .
> & ! !
0 ;9 (
.
. .
.
( "# & "/ ,4#
P.
. "# & 0 1 $
&
"/ ,-#
$ !
!
5 5 ! ,#
#
* 0 ;9
5 # 1 . "# &
E! $ ''
) *
& &
= G $ " # 0 1
"
# 3 $
) *
&
& '
& "# & "/ ,.#
& ' ) *
' "# & '
) *
' "/ ,7#
&
+ ! 6 !
0 ;9
5 5 ! "# & &BA #
0' !
% "/ /:#
% "/ /(#
* "# & !
"# &
5 5 ! "
& % % % % &
% "/ /)#
! $
'-
* 0 ;9 $ $ !
0 9 $ $ C
&
% "/ //#
* ( "# & ( !
> ! 6 !
! 0 9
+ =
$ 0 ;9 $ 0 1 =
! 6 ! 0 ;9 +
+ N !
! +
= $ $ $ &
2)
" ! C # <
C
! = + $ $ !
0 ;9 & !
? 0 1 0 9 0 ;9
0 1 0 9 0 ;9
+ T " #
F C =C 8
! ! !
> C > C > C
3 G "(74)# - "(7-4#
)+
5
= & "/ /# $
! ' & !
"/ /2#
!
& "/ /4#
' ( "/ /-#
$ !
)* ( "/ /.#
* & !
B '
. "/ /7#
P 3 !
!
(
! !
$
.
)
< $ !
A "#& !
! '
& .
&
&
&
$
!
& '
' . & . & . . & .
& '
& . .
& '
&
& '
&
&
& & & &
( ( ( (
' . ( ( ( "/ 2(#
Chapitre 5
——————————————————————————
où "t i:i:d: (0; 2" ), E ["t "s ] = 0; 8t 6= s et E ["t ut 1 ] = 0, 8t. On parle de processus
AR(1). La condition j j < 1 permet au processus d’être stationnaire au second
ordre. En développant l’équation (5.3) de façon récursive, il vient :
1
X
j
ut = "t j (5.4)
j=0
comme j j < 1, les perturbations "t j ont un poids décroissant dans le temps.
2
" 2
V [ut ] = 2
= u (5.5)
1
2
s " s 2
Cov [ut ; ut s ] = 2
= u (5.6)
1
2 Cov [ut ; ut 1 ]
Cov [ut ; ut 1 ] = u ) =q q
E [ut ] E u2t 1
2
| {z }| {z }
u u
0 1
E [u21 ] E [u1 u2 ] E [u1 uT ]
B E [u22 ] C
E [u2 uT ]
B .. C
B .. C
V [u] = B . . C
B .. C
@ . E [uT 1 uT ] A
E [u2T ]
0 T 1
1
1
B .. C
B 1 . T 2 C
B
2B .. .. .. .. .. C
= uB . . . . . C= 2
(5.7)
C u
B .. .. .. C
@ . . . A
T 1 T 2
1
D’après l’expression de cette matrice, on constate que les corrélations sont d’autant
plus faibles qu’elles sont éloignées dans le temps.
5.1.2 Autocorrélation à l’ordre deux des perturbations
Dans ce cas, le processus engendrant les perturbations exprime une dépendance à
deux étapes, soit :
ut = 1 ut 1 + 2 ut 2 + "t t = 1; : : : ; T (5.8)
où "t i:i:d: (0; 2" ), E ["t "s ] = 0; 8t 6= s et E ["t ut 1 ] = E ["t ut 2 ] = 0, 8t. On parle
de processus AR(2). Ici, les conditions de stationnarité sont données par :
1 + 2 < 1
2 1 < 1
1 < 2<1
Introduction aux méthodes de l’économétrie 192
où les u
bt sont les résidus des MCO du modèle (4.4). L’intérêt de cette statistique
est qu’elle est liée asymptotiquement au coe¢cient de corrélation du modèle (5.3),
par la relation suivante :
plimDW = 2 (1 )
T !1
En e¤et :
2 3
P
T
6 t=2 (b
ut bt 1 )2 7
u
plimDW = plim 6
4
7
5
T !1 T !1 P
T
b2t
u
t=1
2 3
1
P
T
1
P
T
2
P
T
6T b2t
u + T
b2t 1
u T
u
bt u
bt 1
7
= plim 6
4
t=2 t=2 t=2 7
5
T !1 1
P
T
T
b2t
u
t=1
5. Autocorrélation des perturbations 195
or
T T T
1X 2 1X 2 1X 2
plim bt = plim
u u
bt 1 = plim u
bt
T !1 T t=2 T !1 T
t=2
T !1 T
t=1
ce qui revient à dire que la variance des perturbations est constante 8t (processus
stationnaire au second ordre), et :
2 T 3
1
P
u
b u
b
6 T t=2 t t 1 7
plim 6
4
7=
5
T !1 1
P
T
2
T
u
b t
t=1
b = 0, donc :
car u
plimDW = 1 + 1 2
T !1
= 2 (1 )
À partir de cette expression, on peut en déduire un estimateur convergent du
coe¢cient de corrélation , soit :
DW
b=1 (5.17)
2
Plusieurs cas extrêmes sont possibles :
b = 0 ! DW = 2, absence d’autocorrélation des perturbations;
b ' 1 ! DW ' 0, autocorrélation positive des perturbations;
b ' 1 ! DW ' 4, autocorrélation négative des perturbations.
Plus généralement, a priori, trois cas sont à distinguer :
DW < 2, autocorrélation positive des perturbations;
DW > 2, autocorrélation négative des perturbations;
DW ' 2, absence d’autocorrélation des perturbations.
La di¢culté de ce test provient du fait que la statistique de test DW repose sur
les résidus u
bt des MCO et non sur les perturbations ut . Ceci a pour conséquence que
la loi de probabilité de la statistique DW dépend des valeurs prises par les variables
explicatives du modèle. En e¤et, on peut écrire :
b > Ab
u u
DW = (5.18)
b u
u > b
Introduction aux méthodes de l’économétrie 196
u> MAMu
DW = (5.20)
u> Mu
puisque la matrice M est idempotente. On constate que, A et M étant symétriques,
MAM est symétrique. De plus, M étant idempotente, MAM et M commutent.
En appliquant des résultats de la bidiagonalisation, on peut …nalement écrire :
w> w
DW =
w> w
où
0 1
1 0 0
B ... .. C
B 0 2 . C
B .. ... ... ... .. C
=B
B . . C
C
B .. ... ... C
@ . 0 A
0 0 T (k+1)
dl d ds
47
De nombreuses procédures ont été proposées pour surmonter le problème de la zone inconclusive, se
reporter à Fomby, Hill et Johnson (1984).
Introduction aux méthodes de l’économétrie 198
0 dl ds 2 4 ds 4 dl 4
1 - H0 : = 0 contre H1 : 6= 0 au seuil %
2 - H0 : = 0 contre H1 : > 0 au seuil %
3 - H0 : = 0 contre H1 : < 0 au seuil %
où bj (b
ut ) est le coe¢cient d’autocorrélation d’ordre j des résidus des MCO :
P
T
u
bt u
bt j
t=j+1
bj (b
ut ) =
P
T
b2t
u
t=1
Cette statistique présente l’avantage d’être plus proche, à distance …nie, de la loi
du khi-deux. La règle de décision est identique à celle énoncée pour le test de
Introduction aux méthodes de l’économétrie 200
Box-Pierce.
Ces tests permettent la détection de l’autocorrélation, s’il en découle que les
perturbations sont autocorrélées. Il faut mettre en œuvre la procédure d’estimation
adéquate pour pouvoir par la suite réaliser une inférence statistique correcte.
Autrement dit, il est nécessaire de recourir à un estimateur de type MCG.
5.4 Estimateurs des MCG et des MCQG lorsque les perturbations suiv-
ent un processus AR(1)
L’estimateur du MV
Les méthodes précédentes ne supposent aucune hypothèse particulière sur la loi
suivie par les perturbations. Sous l’hypothèse de normalité des perturbations,
on peut estimer le modèle (4.4) et le modèle (5.23) par la méthode du
MV. Les estimations des paramètres b; b b et b2 sont alors convergentes et
u
asymptotiquement e¢caces.
La log-vraisemblance associée au modèle (4.4) sous l’hypothèse H2 s’écrit :
2 T T 2
log L(y1 ; y2 ; :::; yT ; b; u; ) = log 2 log u
2 2
1
(y X b)> (y X b) (5.25)
2 2u
Lorsque les perturbations suivent un processus AR(1), la log-vraisemblance peut
également s’écrire :
2 T T 2 1 2
log L(y1 ; y2 ; :::; yT ; b; "; ) = log 2 log " + log 1
2 2 2
1
(y X b)> (y X b) (5.26)
2 2"
Si le paramètre est connu, l’estimateur du MV de b est égal à celui des MCG. Le
problème ici est qu’il est inconnu. Finalement, on cherche à obtenir les estimateurs
e
e e 2 e
du MV b, e et e
e . Dans un premier temps, on détermine, en fonction de b
"
e et e
e,
Introduction aux méthodes de l’économétrie 204
l’estimateur du MV de ".
2
On obtient cet estimateur à partir de la condition du
premier ordre :
2
@ log L(y1 ; y2 ; :::; yT ; b; "; )
e
e
=0
@ 2" b=b
=ee
2 e2
" = e"
soit :
>
e 2 1 e
e e
e
e" = y X b y X b (5.27)
T
e
e et e
Par dé…nition, b e sont les solutions de :
5.5 Prévision
Dans le chapitre précédent, on a montré que le meilleur prédicteur linéaire sans biais
de yT +1 est donné par :
50
Elle se véri…e aussi lorsque l’on travaille sur données de panel puisque l’on combine les dimensions
tranversale (individuelle) et longitudinale (temporelle). Dans ce cas, on a d’ailleurs souvent non seulement
des problèmes d’hétéroscédasticité mais également d’autocorrélation des perturbations. Pour les surmonter,
il est nécessaire de les gérer simultanément (Baltagi (2001)).
51
Se reporter à l’exercice 6.1.
214
6. Hétéroscédasticité des perturbations 215
au lieu de
h i 1
V bb M CO = 2
X> X
u
les deux sous-échantillons ont été constitués, on e¤ectue une régression sur chacun
d’entre eux et on calcule la statistique :
b2u;g2
G= F (N2 (k + 1) ; N1 (k + 1)) (6.7)
b2u;g1
où F (N2 (k + 1) ; N1 (k + 1)) correspond à une loi de Fisher à (N2
(k + 1),N1 (k + 1)) degrés de liberté et où
P
N1 P
N2
b21;i
u b22;i
u
i=1 i=1
b2u;g1 = et b2u;g2 = (6.8)
N1 (k + 1) N2 (k + 1)
où u b1;i et ub2;i correspondent aux résidus des MCO des régressions e¤ectuées
respectivement sur le premier sous-échantillon et sur le deuxième sous-échantillon.
Si la statistique G est supérieure (>) à la statistique théorique, on rejette l’hypothèse
H0 d’homoscédasticité, les variances sont trop di¤érentes. Il est nécessaire de
recourir à un estimateur de type MCQG.
La validité du test de Goldfeld et Quandt repose sur l’hypothèse selon laquelle
le classement des observations par ordre croissant (resp. par ordre décroissant)
des valeurs prises par une variable de l’échantillon correspond e¤ectivement au
classement qui serait obtenu en fonction des variances des perturbations. Si cette
hypothèse n’est pas véri…ée alors il est probable que ce test fonctionne assez mal.
Des tests plus généraux (moins contraints) ont été élaborés.
6.2.2 Le test de Breusch et Pagan
Ce test répond en partie à cette objection puisqu’il permet de tester
l’homoscédasticité contre l’hypothèse alternative que la variance est une fonction
quelconque d’une ou plusieurs variables. Son principe consiste à tester :
2 2 2
H0 : i = u contre H1 : i = h (Zi a) i = 1; : : : ; N
où h est une fonction indépendante de i, deux fois dérivable, et où les variables Zi
sont dé…nies par :
Zi = (1; Z1i ; Z2i ; : : : ; Zpi ) i = 1; : : : ; N
En pratique, les variables Z1i ; Z2i ; : : : ; ZpN sont les variables explicatives du modèle.
On peut alors écrire l’hypothèse alternative comme :
2
H1 : i = h (a0 + a1 Z1i + a2 Z2i + + ap Zpi )
Introduction aux méthodes de l’économétrie 218
u
bi = yi X> b
i bM CO
Ce test est une généralisation du test de Breusch et Pagan. Il est souvent utilisé
car il ne fait pas d’hypothèse particulière sur la forme de l’hétéroscédasticité. A
priori, on suppose qu’elle est de forme inconnue. Auparavant, on a vu que White
(1980) a proposé une estimation convergente de la matrice de variances-covariances
de l’estimateur des MCO :
h i
Vb bb M CO = X> X 1 V b X> X 1
6. Hétéroscédasticité des perturbations 219
avec
N
X
b =
V b2i Xi X>
u i
i=1
qui n’est pas convergente sous hypothèse alternative, permet de détecter la présence
d’hétéroscédasticité. L’idée serait donc de raisonner sur la di¤érence de ces deux
matrices. Néanmoins, une approche plus simple et équivalente consiste à e¤ectuer
la régression53 suivante :
k
X k X
X k
b2i
u = a0 + aj xij + ajl xij xil + "i
j=1 j=1 l j
et à calculer la statistique
(k + 1) (k + 2)
QW = N R2 2
1 (6.10)
2
(k+1)(k+2)
La statistique calculée QW suit une loi du khi-deux à 2
1 degrés de
2
liberté. Si le produit N R est supérieur (>) à la statistique théorique, les matrices
de variances-covariances di¤èrent trop pour pouvoir ne pas rejeter l’hypothèse
d’homoscédasticité. Il est nécessaire de recourir à un estimateur de type MCQG.
L’inconvénient du test de White est qu’il a une puissance limitée au regard de la
multiplicité des hypothèses alternatives possibles sur la forme de l’hétéroscédasticité.
En particulier, lorsque la taille de l’échantillon est faible.
53
Autrement dit, ce modèle de régression multiple comprend une constante, les variables explicatives du
modèle d’origine, leurs carrés ainsi que les produits croisés.
Introduction aux méthodes de l’économétrie 220
Les variances des perturbations étant inconnues, il n’est pas possible de mettre
en œuvre l’estimateur des MCG. Il convient donc d’estimer ces variances ce qui
permettra d’obtenir la matrice de variances-covariances des perturbations estimée
b . Ensuite, il su¢t de raisonner par rapport au modèle transformé :
b 1=2
y= b 1=2
Xb + b 1=2
u (6.11)
avec
0 1
1=b1 0 0
B .. .. .. C
b 1=2 B 0 . . . C
=B .. .. .. C (6.12)
@ . . . 0 A
0 0 1=bN
Moyennant une estimation correcte des variances des perturbations, il est alors
possible d’estimer b de façon convergente et asymptotiquement e¢cace, en
appliquant les MCO au modèle transformé :
yi X> ui
= i b+ i = 1; : : : ; N (6.13)
bi bi bi
On obtient ainsi l’estimateur des MCQG. On parle encore d’estimateur des moindres
carrés pondérés (MCP). En e¤et, d’après (6.13), on remarque qu’aux observations
initiales est appliquée une pondération54 . Ce modèle transformé ne comporte plus de
terme constant ce qui n’est pas neutre pour le calcul du coe¢cient de détermination.
En pratique, comme cela a déjà été évoqué, les variances 2i sont inconnues.
Pour les estimer, il est nécessaire de poser a priori, une structure particulière pour
l’hétéroscédasticité des perturbations. Les hypothèses les plus souvent retenues
54
Alors que pour gérer l’autocorrélation des perturbations, on raisonnait en termes de quasi di¤érences.
6. Hétéroscédasticité des perturbations 221
sont :
2 2
i = u (Zi a) (hétéroscédasticité additive) (6.14)
2
i = 2
u (Zi a)2 (hétéroscédasticité multiplicative) (6.15)
2 2
i = u exp (Zi a) (hétéroscédasticité multiplicative) (6.16)
Le choix d’une fonction suppose que l’on ne se trompe pas sur la forme de
l’hétéroscédasticité, sinon la correction qui sera adoptée par l’intermédiaire de la
matrice b 1=2 ne constituera pas une solution satisfaisante. L’estimateur des MCQG
n’aura pas les bonnes propriétés asymptotiques.
Pour prendre un exemple, on retient la forme multiplicative (6.16) de
l’hétéroscédasticité55 , qui peut s’écrire en linéarisant :
2 2
log i = log u + Zi a (6.17)
ou encore
b2i = log
log u 2
u + Zi a+"i (6.18)
b2
u
avec "i = log i2 comme terme d’erreur. Ce terme est asymptotiquement
i
homoscédastique et non corrélé avec les Zi . Le problème est qu’il n’est pas
d’espérance nulle (même asymptotiquement). Cependant, cela a¤ecte seulement
l’estimation de la constante log 2u , qui est de peu d’importance. Pour résumer,
l’estimateur des MCQG est obtenu selon les étapes suivantes :
estimer le modèle (6.1) par les MCO;
b2i à partir des résidus u
calculer log u bi des MCO;
estimer le modèle (6.18) par les MCO. Cela permet d’obtenir un estimateur b a
convergent de a;
calculer56 b2i = exp (Zi b
a) puis transformer les observations et en…n appliquer les
MCO au modèle transformé (6.11) pour obtenir l’estimateur des MCQG.
la variance b2u peut être estimée de façon convergente par :
2
N yi X> b
1 X i bM CQG
b2u = (6.19)
N (k + 1) i=1 b2i
une estimation convergente de la matrice de variances-covariances de l’estimateur
55
On renvoie à Harvey (1976).
56
La non convergence du coe¢cient de la constante a¤ecte toutes les variables équi-proportionnellement.
Cela n’a donc pas de conséquence sur les résultats d’estimation du modèle transformé (6.11).
Introduction aux méthodes de l’économétrie 222
228
7. Estimation sous contraintes linéaires et tests d’hypothèses 229
économique) :
b1 + b2 + b3 = 1 b1 + b2 + b3 = 1
,
bk = bk 1 bk 1 + bk = 0
R b = r (7.3)
(p;k+1)(k+1;1) (p;1)
On constate immédiatement que l’estimateur des MCC di¤ère d’autant plus de celui
b M CO r 6= 0 .
des MCO que ce dernier ne véri…e pas a priori les contraintes Rb
h i 1 1 1 1 1
b
V bM CC = 2
X> X X> X R> R X > X R> R X> X
u
(7.7)
L’expression de la matrice de variances-covariances de l’estimateur des MCC est
indépendante de la validité des contraintes posées a priori.
Si les contraintes sont justi…ées, l’estimateur des MCC est le meilleur estimateur
linéaire sans biais.
7. Estimation sous contraintes linéaires et tests d’hypothèses 231
avec
1 1 1
D = X X> X R> R X > X R> (Rb r)
1
M = IT X X > X X>
1 1 1 1
Pc = X X> X R> R X > X R> R X> X X>
d’où
2
b>
E u bc =
c u u (T (k + 1) + p) + D> D
donc :
61
La démonstration est similaire à celle du théorème de Gauss-Markov.
62
Ce théroème est établi à partir d’une nouvelle borne (di¤érente de celle FDCR) qui prend en compte
la présence des contraintes Rb = r (Rothenberg (1973)).
Introduction aux méthodes de l’économétrie 232
si les contraintes sont valides, cet estimateur est sans biais (puisque D = 0);
si les contraintes sont non justi…ées, cet estimateur est biaisé(puisque D 6= 0).
Dans ce cas Rb r = 0, on a :
h i
E bb M CC = b
h i 1
b 1 1 1 1
V bM CC = 2u X> X X> X R> R X > X R> R X> X
et
h i
E bb M CO = b
h i
b 1
V bM CO = 2u X> X
h i 1
b M CC = b 1 1
E b X> X R> R X > X R> (Rb r)
h i 1
b M CC = 2 1 1 1 1
V b u X> X X> X R> R X > X R> R X> X
7. Estimation sous contraintes linéaires et tests d’hypothèses 233
et
h i
b
E bM CO = b
h i
b M CO = 2 X> X 1
V b u
Pour élaborer ce test, outre les hypothèses H1 à H5 , il faut supposer que les
perturbations sont indépendantes et normalement distribuées (H8 ). Dans ce cas,
l’estimateur des MCO suit une loi normale
1
b
b N b; 2
X> X
u
d’où
1
b
Rb N Rb; 2
X> X R>
uR
63
Se reporter au chapitre 16.
Introduction aux méthodes de l’économétrie 234
et
> 1 1
b
Qc = Rb Rb 2
X> X R> b 2
(p)
uR Rb Rb
b>u
u b
b2u =
T (k + 1)
b sont indépendants
De plus, on sait que sous les hypothèses H1 à H5 et H8 , b2u et b
et que :
b2u 2
(T (k + 1)) 2
(T (k + 1))
u
0 > 1
1
b > 1 > b
B Rb r R X X R Rb r C
Qc = @ A F (p; T (k + 1)) (7.9)
pb2u
où SCRc est la somme des carrés des résidus contraints u b> b c , SCR la somme des
c u
carrés des résidus non contraints u >
b ub et p le nombre de contraintes. Le principe de
ce test peut être étendu à plusieurs types de contraintes linéaires sur les coe¢cients.
64
Cette statistique est obtenue par le rapport de deux khi-deux indépendants, chacun divisé par son degré
de liberté. Ce rapport aboutit à une loi de Fisher, ce qui donne la relation (8.9).
7. Estimation sous contraintes linéaires et tests d’hypothèses 235
R = 0 0 1 0 0 , r = b0j
(1;k+1)
z }| {
j ieme
composante
En e¤et, on rappelle que le carré d’une statistique suivant une loi de Student à
(T (k + 1)) degrés de liberté suit une loi de Fisher à (1; T (k + 1)) degrés de
liberté.
7.8.3 Test de l’égalité à une valeur donnée de plusieurs coe¢cients
Ici, on cherche à tester :
b1 = b01
b2 = b02
H0 : .. contre H1 : H0c
.
bj = b0j
H0 : b1 = b 2 = = bk = 0 contre H1 : H0c
y t = b0 + ut t = 1; :::; T
Introduction aux méthodes de l’économétrie 236
Il vient immédiatement :
bb0 = y et u
bc;t = yt y
On en déduit la somme des carrés des résidus contraints :
T
X
SCRc = u
b> bc =
c u (yt y)2
t=1
Sous l’hypothèse H1 (modèle non contraint), la somme des carrés des résidus non
contraints est donnée par :
T
X 2
SCR = u >
b=
b u bt
u b
u
t=1
? À quali…cation égale, les salaires des hommes sont-ils plus élevés que ceux des
femmes ?
Soit le modèle de régression multiple
y = Xb + u
L’échantillon initial comprend T observations. On partage cet échantillon en deux
sous-échantillons (y1 ; X1 ) et (y2 ; X2 ) de tailles respectives T1 et T2 . Ces échantillons
concernent deux groupes d’observations di¤érents (par exemple deux périodes, ou
deux catégories de ménages, de secteurs...). On considère deux modèles associés à
chacun des deux groupes :
y 1 = X1 b 1 + u 1 rg (X1 ) = k + 1 (T1 > k + 1) (7.13)
et
y 2 = X2 b 2 + u 2 rg (X2 ) = k + 1 (T2 > k + 1) (7.14)
avec
2
u1 N 0; u IT1
2
u2 N 0; u IT2
et
Cov [u1 ; u2 ] = 0
Ici, on veut tester
H0 : b1 = b2 contre H1 : b1 6= b2 (7.15)
ou encore
y 1 = X1 b 1 + u 1
H0 : y = Xb + u contre H1 : (7.16)
y 2 = X2 b 2 + u 2
Sous l’hypothèse alternative H1 , on a deux modèles di¤érents, un pour chaque sous-
période (ou chaque catégories de ménages). En fait, ce test n’est rien d’autre qu’un
test de r contraintes linéaires sur les paramètres (test de Fisher). En e¤et, on peut
toujours réécrire les hypothèses (8.15) sous la forme :
H0 : Rb = r contre H1 : Rb 6= r
On en déduit immédiatement la statistique de test :
SCRc SCR T1 + T2 2 (k + 1)
Qc = F (k + 1; T1 + T2 2 (k + 1)) (7.17)
SCR k+1
Introduction aux méthodes de l’économétrie 238
où SCRc est la somme des carrés des résidus sous l’hypothèse H0 (stabilité ou
homogénéité), SCR=SCR1 +SCR2 (SCR1 est la somme des carrés des résidus
associée à la régression (8.13), SCR2 est la somme des carrés des résidus associée à
la régression (8.14)). Les sommes des carrés des résidus sont obtenues en appliquant
les MCO à chaque modèle. Si la statistique calculée Qc est supérieure (>) à la
valeur critique, on rejette H0 . Autrement dit, on rejette l’hypothèse de stabilité ou
d’homogénéité.
Remarques :
Le test de Chow peut être notamment adapté aux cas d’échantillons sous-
dimensionnés, ou encore au cas où les perturbations sont autocorrélées ou
hétéroscédastiques (Dormont (1999)).