Académique Documents
Professionnel Documents
Culture Documents
INTRODUCTION A L’ECONOMETRIE
2012 2011 2012
Introduction à
l’économétrie
[Tapez le sous-titre du document]
H34VEN
Cours pour Licence 3, Semestre 5 Année 2011-2012
INTRODUCTION A L’ECONOMETRIE 2011 2012
Cours magistral
d’introduction à l’économétrie
Merci de les signaler sur le forum de la faculté de sciences économiques de l'UM1, à cette
adresse :
Sommaire
Historique de l’économétrie P.005
Chapitre I P.009
Chapitre II P.031
Historique de l’econometrie
(A ne pas zapper, peut tomber en examen !)
1°) 1980 : Lawrence KLEIN (Premiers modèles macro-économétriques, analyse des fluctuations et
croissance)
5°) 2003 : Robert GRANGER & Clive ENGLE (Co-intégration & Volatilité des séries temporelles et des
modèles ARCH)
Bibliographie :
En Allemagne se met en place la Statistique descriptive qui se situe dans une description globale des
états. C’est le cas d’Hermann CONRING (1606 – 1681) qui conçoit la statistique comme un moyen de
classer des savoirs.
En Angleterre se met en place l’Arithmétique politique (Dépouillement des registres et des paroisses
des baptêmes, des mariages et des décès). On construit des tables de mortalités et on calcule des
espérances de vie.
Karl PEARSON développe le coefficient multiple et montre le lien avec les coefficients de corrélation
simple
George YULE étudie la corrélation entre le Paupérisme et l’accès à des mesures d’assistance.
Evelyn HOCKER est le premier à étudier des variables retardées dans les modèles de régression.
Marcel LENOIR est le premier à tenter d’expliquer les lois d’offre et de demande. Son approche étant
d’imbriquer l’économie mathématique, la statistique descriptive et la statistique mathématique.
L’économétrie « moderne » débute réellement avec l’analyse du marché du travail américain : Henry
MOORE s’intéresse au problème de détermination des salaires, des fonctions de demande et des
cycles de périodicité. Sa démarche consiste à prouver que les mathématiques et la statistique
peuvent servir de révélateur empirique et autoriser une interprétation concrète des phénomènes
économiques.
Début de la description de la conjoncture avec l’analyse des cycles. Ce sont les conjoncturistes
américains qui jouent un rôle essentiel dans la détection statistique des cycles. Il faut observer,
analyser, systématiser les phénomènes de prospérité, de crise et de dépression.
En 1920 apparait le premier institut de conjoncture. A la même époque est créé le National Bureau
of Economics Research (NBER). Son rôle étant basé sur la recherche économique empirique.
Avec le début du XXème siècle, l’analyse économique prend une nouvelle dimension : Des
économistes, des hommes d’affaires et des ingénieurs contribuent à lier l’économie, les
mathématiques et la statistique. L’économie devient reconnue comme une discipline à part entière.
INTRODUCTION A L’ECONOMETRIE Page 6
INTRODUCTION A L’ECONOMETRIE 2011 2012
Le 29 décembre 1930, l’économie va prendre un nouvel essor avec Jan TINBERGEN et Ragnar FRISCH.
FRISCH est à l’origine de la Société d’économétrie. Le premier colloque se fait 1931 à Lausanne. A la
même époque, Alfred COWLES, conseiller financier et spécialiste en prévision boursière, rentre en
contact avec la Société d’économétrie et propose 2 projets :
Dans les années 1930, la revue Econometrica est créée, le premier numéro sort en Janvier 1933, son
rédacteur de l’époque étant Ragnar FRISCH.
L’organisme de recherche, la COWLES Commission, voit aussi le jour à cette époque. Elle s’installe à
Chicago et s’intéresse à la mesure directe des phénomènes laissant de côté l’inférence sur les
mesures statistiques et prend par la suite de nouvelles mesures d’orientation (obtient des
subventions de la part des universités).
Apparait à ce moment-là les premiers modèles à équations simultanées, du fait de l’apparition dans
les équations de termes « aléatoires » qui reflètent des causes multiples.
A. Les années 70
Les années 70 marquent la fin de l’âge d’or de la macro-économétrie, le choc pétrolier contredit tous
les précédents modèles macro-économétriques.
Cela ouvre cependant la voie à de nouveaux modèles, notamment les modèles Vecteurs Auto
Régressifs (VAR). Se développent en même temps les analyses de la Causalité.
Les Tests de racine unitaire de MICKEY-FULLER, les modèles ARMA, la modélisation ARCH, les
modèles LOGIT-PROBIT, les modèles de BOOSTRAP et les modèles bayésiens apparaissent dans les
années 1980.
Chapitre I
Modèles linéaires simples : Le modèle à 2 variables
Le modèle économétrique est une représentation simplifiée mais la plus exhaustive possible
d’une entité économique donnée. Sous sa forme la plus courante, un modèle économétrique est
représenté par des équations, le plus souvent linéaire. Dans ces équations, nous avons 2 types de
variables :
La fonction peut avoir plusieurs formes, elle peut être linéaire, exponentiel, fonction puissance,
mais il faut savoir que tout modèle non linéaire peut se ramener au cas non linéaire par
transformation par anamorphose.
Soit
( )
( )
⏟
Comme il n’y a pas de variable explicative en économie, on en ajoutera une qui l’on appellera
aléa ou erreur. On dit que cette variable synthétise l’ensemble des influences sur que ne peut
expliquer.
N’étant pas de même valeur, l’écart de valeur entre et ̂ est appelé écart ou résidu, notée
L’utilisation de ces 2 méthodes doit mener à des valeurs estimées d’alpha et beta, ce qui
implique qu’un certain nombre d’hypothèses de base soit vérifié.
-
-
- , la variance de l’aléa
∑ ∑( ̂) ∑( (̂ ̂ )) ( ̂ , ̂)
̂
{ Équations normales
̂
2∑ ̂ ̂ ̅ ̂ ̂ ̅
̂
̂ ̅ ̂̅
2 ∑( ̂ ̂ )
̂
∑ ̂∑ ̅ ̅∑ ̂
̂ ̅̅ ̅ ̅
̅̅
̂
̅
̅̅ ,
̅
,
̂
2
̂
2 ∑
̂
{
( ̂, ̂ )
̂ ̅ ̂̅
̅
{ ̅
̂ ̂ ̂
̂ ̂ ̅
̂ ̂ ̅ ̂ ̅ ̂ ̂ ̅
̂ ̅ ̂ ̂ ̂̅
̅ (̅ ̂ ̅) ̂ ̂̅
̂ ̂
̂ ̂
MCO ( ̂ )
2∑ ( ̂ )
̂
∑ ̂∑
∑ ̂∑ ̂
̂ ̅ ̂̅
Valeurs centrées : { ̂
A. Hypothèses :
1) Les estimateurs des MCO sont des fonctions linéaires des estimateurs de Y. Pour
conséquence, comme dépend de , est une variable aléatoire. De ce fait, ̂ et ̂ sont
aussi des variables aléatoires. Ainsi, ̂ et ̂ obéiront à une loi Normale
∑ ∑ ̅ ̅ ̅
̂ ∑
Propriétés de
̅ ̅
∑ ∑
̂ ̅ ̂̅ ∑ ̅∑
̂ ∑ ̅
Comme dépend de , est une variable aléatoire. De ce fait, ̂ ̂ sont des variables
aléatoires. Les sont des constantes fixés dans les échantillons.
̂ ∑ , avec
[ ̂] [∑ ] [∑ ]
∑ ∑ ∑
⏟ ⏟
[ ]
[ ∑ ]
̂ ∑
[ ] [∑ ]
∑ ⏟[ ]
[ ̂]
[ ̂] [∑ ( ̅ ) ]
[∑ ( ̅ ) ]
∑ ∑ ∑ ̅∑ ̅∑ ̅∑
⏟ ⏟
[ ]
[ ̅ ̅ ∑( ̅ ) ]
̂ ∑( ̅ )
[∑ ( ̅ ) ⏟[ ]
[ ̂]
- Calcul de variance de ̂
[ ̂] [̂ [ ̂ ]] , ̂ ∑ ∑ [ ] 2∑∑ ⏟[ ]
[̂ ]
[∑ ]
[∑ 2∑∑ ]
̂ ∑
[ ̂]
- Calcul de la variance de ̂
[ ̂] [̂ [ ̂]] , ̂ ∑( ̅ )
[̂ ] [∑ ( ̅ ) ]
[∑ ( ̅ ) 2∑∑( ̅ ) ( ̅ ) ]
∑( ̅ ) [ ] 2∑∑( ̅ )( ̅ ) ⏟[ ]
∑( ̅ )
2̅
(∑ ̅ )
̅
( 2 ∑ ̅ ∑ )
⏟
̅
( )
̅
( )
∑ ∑ ̅ ∑ ∑̅ 2∑ ̅
∑ ̅ 2̅ ̅
∑ ∑ ̅
- Calcul de la covariance de ̂ ̂
( ̂, ̂ ) [ ̂ (̂ )]
̂ ∑( ̅ )
̂ ∑
( ̂, ̂ ) [∑ ∑ ( ̅ ) ]
, [ ]
∑∑( ̅ ) [ ], {
, [ ] [ ]
( ̂, ̂ ) ∑( ̅ ) ⏟[ ]
(∑ ̅∑ )
̅
( ̂, ̂ )
[ ̃]
̃ ∑ ∑
[ ̃] [∑ ∑ ∑
∑ ∑ ∑ ⏟[ ]
{∑
̃ ∑
[ ̃] [̃ [ ̃ ]] [̃ ]
[∑ ] [∑ ∑ 2∑∑ ]
∑ ⏟[ ] 2∑∑ ⏟[ ]
[ ̃] ∑
Si est minimal, la variance est elle aussi minimale. On a donc un problème de minimisation
sous contrainte.
∑
min ∑ sc. {
∑
∑ ∑ (∑ )
2
2
∑ ∑
(∑ ) ∑
{
̅ ̅
Or ̅ ̅ ̅
∑ ̅∑ ∑
⏟
B. Propriétés
̂, ̂ S
[ ̂] ⏟ , [ ̂]
[ ̂] ⏟
̅
[ ̂] ⏟
̂, ̂ Estimateur convergent
̂ ̂ sont des estimateurs linéaires de , ils sont aussi sans biais, convergents, de variance
minimale. On dit qu’on a affaire à des estimateurs Best Linear Unbiased Estimator (BLUE)
̂ ⏟̂ ⏟̂
̂̂ ̂̂
[ ̂]
[ ̂]
̂
[ ̂]
̂
[ ̂]
̂
2
Comme les estimateurs sont des estimateurs linéaires de , qui dépendent de l'aléa … alors les
estimateurs sont aléatoires et obéissent à une loi normale
√
̂ ( , )
√
̂ ( , )
√
[ ]
̂ ( , √ ), inconnu
̂
2 2
√
,
2
2 ̂
√ 2
(̂ )√
2
̂
[ 2 2 ]
(̂ )√
[ ]
̂
̂ ̂
[̂ ̂ ]
(̂ )√ (̂ )√
̂
[ [̂ ]]
(̂ )√
̂ ( , √ )
̂
2 2
√
2
2 ̂
√(
2)
̂ √
2
̂√
[ 2 ]
̂ √
[ ]
̂√
√
[ [̂ { ̂ ]]
√
Test sur
Problème : , [ ]
̂
2 ( ) 2
[ 2 ]
̂
[ 2 ( ) ]
[ ]
2 ̂ 2 ̂
Test sur
(̂ )√
2
̂
[ 2 ]
̂√
[ ]
̂
̂
[̂ [ { ]]
√
RDD :
Il faut rejeter pour avoir une relation linéaire cela revient à tester la validité du modèle.
[ 2 ]
̂√
[ ]
̂
̂
[ ]
̂ √
̂ ̂
[ ] , pour ̂̂
̂̂ √
̂
[| | ]
̂̂
̂
2
̂̂
RDD :
- Si | | 2 , acceptée au risque
- Si | | 2 , rejetée au risque
̂ √
2
̂ √
[ 2 ]
[ 2 ]
̂ √
[ ] , Si vraie
̂ √
√
[̂ [ { ̂ ]] Et de ̂ orté disparu
√
RDD :
- Si ̂ , acceptée au risque
- Si ̂ , rejetée au risque p
̂ √
2 , pour ̂̂ ̂
̂̂ √
RDD :
- Si | | 2 , acceptée au risque
- Si | | 2 , rejetée au risque
Test de :
̂
2 2
[ 2 ]
̂
[ 2 ]
[̂ [ ]]
2 2
RDD :
- Si ̂ , acceptée au risque
- Si ̂ , rejetée au risque
C. Etude de la corrélation
Le coefficient de corrélation est le coefficient qui mesure le degré de covariation linéaire entre
et , c’est-à-dire la manière dont varient ensemble les variables linéaires
-
- sans dimension
Relation entre ̂
√ √ ̅
̂ ̂ ̂
√ √ √ ̅
̂ ̂ ̂
∑ ∑ ∑̂ 2∑ ̂
∑ ̂ ∑ ̂ ∑ ̂ ̂
̂ (∑( ̂ ) ) ̂ (∑ ̂∑ ) , or ̂
̂ (∑ ∑ )
∑ ∑ ∑̂
∑ ̅ ∑ ∑ ̂ ̅
- La Variance Expliquée est la variation des valeurs de ̂ autour de leur moyenne, c’est la
somme des carrées expliquées par l’influence linéaire de la variable .
- La Variance Résiduelle est la variation résiduelle des valeurs de autour de la droite des
moindre carrés. lus la variance résiduelle que l’on peut considérer comme l’erreur est
faible, plus le modèle sera précis et exact.
Calcul de :
∑ ∑̂ ∑
̂√
( )
√
résiduelle
totale
expliquée
totale
√ 2
2
√
(̂ )√
2
̂
√
̂ , ̂
√ 2
∑ ∑
̂
2
̂√
2 , si vraie
̂
√ √ √ 2
2
√ √ √
√ 2
2
√
Cette hypothèse revient à tester la validité globale du modèle et donc tester la corrélation de
type linéaire entre et .
√ 2 √ 2
[ ] [| | ]
√ √
RDD :
√
Si | | 2 , acceptée au risque de première espèce
√
√
Si | | 2 , rejetée au risque de première espèce
√
Origine des variances Somme des carrées des écarts DDL Carrés moyens
Variance expliquée ∑̂ ̂ ∑ 1
Variance résiduelle ∑ 2
2
Variance totale ∑
On calcule séparément, on montre que
√ 2
2
√
, 2 2
,
2
√ 2
2
F 2 , 2
RDD :
Prévoir la valeur moyenne de la variable expliquée pour une valeur donnée de la variable
explicative : c’est l’espérance mathématique des valeurs possibles de connaissant la valeur .
On construit un intervalle de confiance de cette valeur
1
Rho
INTRODUCTION A L’ECONOMETRIE Page 26
INTRODUCTION A L’ECONOMETRIE 2011 2012
our faire une prévision ponctuelle, on définit d’abord une fonction de prévision linéaire des :
̂ ∑
Il s’agit donc de calculer les de telle sorte que ̂ soit la meilleure prévision linéaire
sans biais, c’est-à-dire, il faut que ̂ soit un estimateur BLUE ; On doit calculer son espérance
mathématique et montrer que l’estimateur est sans biais et montrer que ̂ est de variance
minimale.
[ 2 ] [ ] ⏟[ ]
[ ]
̂ ∑ ∑
̂ ∑ ∑ ∑
[̂ ] [ ∑ ∑ ∑ ]
∑ ∑ ∑ ⏟[ ]
∑ ∑
- Calcul de variance de ̂
2
: Sachant que
INTRODUCTION A L’ECONOMETRIE Page 27
INTRODUCTION A L’ECONOMETRIE 2011 2012
[̂ ] [̂ ̂ ]
[ ̂] [̂ ] 2 ( ̂, ̂ )
[ ̂] [ ̂] 2 ( ̂, ̂ )
̅
[ ̂] ( )
[ ̂]
̅
( ̂, ̂ )
{
̅ ̅
[̂ ] ( ) 2
̅ 2̅
( )
̅
[̂ ] ( )
̅
̂ (⏟ √ )
[̂ ]
̂
2 2
̂
̅
√
2
2 ̂
√
2
̂
2
̅
̂√
[ 2 ]
̅
̂√
[ ]
̅
[ [̂ { ̂√ ]]
B. Comparaison d’une prévision ponctuelle à la droite des moindres carrés : Test d’hypothèse
Supposons que la relation estimée soit valable pour trouver sachant que l’on a
̂ ̂ ̂
̂ ̂ (̂ )
Il convient donc de chercher la loi de : Comme ̂ obéit à une loi normale, obéit à
une loi normale aussi.
[ ] [ ̂] [ ̂ ̂ ] [ ]
Les estimateurs sont biais, donc ils disparaissent quand ils sont soustraits aux
paramètres.
[ ] [ ̂] [⏟ ⏟̂ ̂ ]
̂
[ ] [̂ ] 2⏟ ( ̂)
[ ] [̂ ]
̅ ̅
( ) ( )
̂
2
̅
̂√
⏟[ ] constante
compatibilité entre la prévision et la droite estimée
̅
̂√
[ ]
̅
[̂ [ { ̂√ ]]
RDD :
Chapitre II
Modèle linéaire générale simple
Dans le chapitre précédent, l’estimation des paramètres du modèle linéaire simple, par
les MCO, nécessitait qu’un certain nombre d’hypothèse de base sur l’aléa soit vérifié : l’hypothèse
de normalité, d’homoscédacticité et de non autocorrélation. Ici, on va lever toutes ces
hypothèses et on va les tester.
- Le test de Skewness-Kurtosis
- Le test de Jarque-Bera
A. Test de Skewness-Kurtosis
Test de Skewness
Symétrie normale
( , √ ) (6 et pas !!)
,
√
RDD :
- Si | | , acceptée au risque
√
- Si | | , rejetée au risque
√
Test de Kurtosis :
pplatissement normale
( , √2 )
,
√2
RDD :
- Si | | , accepté au risque
√
- Si | | , rejetée au risque
√
our avoir normalité de l’aléa, il faut avoir donc la symétrie normale et l’aplatissement normal.
B. Test de Jarque-Bera
2
2
Normalité de l’aléa
RDD :
- Si 2 , accepté au risque
- Si JB 2 , rejetée au risque
2 ,
A. Détection de l’autocorrélation
Les erreurs sont inconnues. Seuls les résidus apportent une information sur les
erreurs. L’autocorrélation concernent donc les résidus.
Exemple :
Si les résidus sont une bonne représentation de l’aléa, ils doivent vérifier l’hypothèse de
non autocorrélation. Cela signifie que toutes les autocorrélations successives doivent être
significativement proches de 0 (barres courtes).
Autocorrélation positive
Autocorrélation négative
D. Le test d’autocorrélation
où | |
Absence d’autocorrélation
0 2 4
Autocorrélation Autocorrélation acceptée Autocorrélation Autocorrélation
positive négative bsence d’autocorrélation positive négative
Si ,D 2 ̂
stat
, , { ,2, … , }
RDD :
A. Glejser
| | ,
homoscédacticité
̂
2
̂
RDD :
- Si | | 2 , acceptée au risque
- Si | | 2 , rejetée au risque
B. (processus) ARCH
, , { ,…, }
Multiplicateur de Lagrange
RDD :
C. White
C’est une régression entre le carré des résidus et chacune des variables explicatives à
niveau ( ) et avec aussi le carré de ces variables.
(Homoscédacticité)
, { , ,2}
RDD :
- Si 2 , acceptée au risque
- Si 2 , rejetée au risque
Il existe une deuxième façon de faire le test : on utilise la statistique de Fisher, comme
pour le test du , mais c’est la statistique de Fisher relative à paramètres.
D. Goldfeld-Quandt
√ [ ]
[ ]
Homoscédacticité
Hétéroscédacticité
2 2
( ) , avec
2 2
le nombre de paramètres
RDD :
- Si ( ), acceptée au risque
omoscédacticité
- Si ( ), rejetée au risque
étéroscédacticité
Un modèle est dit « robuste » lorsqu’il est valide dans les circonstances différentes. Dans
ce cas, il nous faut étudier le modèle sous plusieurs sous-périodes. Par exemple, la relation
« prix/récolte du vin » est-elle restée identique après l’introduction de la viticulture dans le
marché commun en 1970 ?
stabilité
̂ ̂ ̂
[̂ ] [̂ ] [ ̂] [̂ ̂ ]
[ ̂] [̂ ̂ ] [̂ ] [ ̂ ] Indépendant
̂ ̂ ̂
2 ,
̂
√ [̂ ] [̂ ]
RDD :
- Si | | 2 , acceptée au risque
- Si | | 2 , rejetée au risque
B. Test d’ANACOVA
On appelle la somme des carrés des résidus du modèle sur toute la période, la
somme des carrés des résidus de la régression sur chaque sous-période ( s’il y a 2
sous-périodes).
et
2
, 2
2
RDD :
d’expression simple autour de son espérance mathématique parce que la distribution est
fortement asymétrique pour des valeurs éloignées de 0.
Comme on ne peut pas comparer les deux coefficients de corrélation, Fisher a proposé
d’utiliser l’argument tangente hyperbolique de r, noté : ln
ln
2
ln
{ 2
respectivement
[ ] [ ] [ ] [ ]
[ ] [ ] [ ] [ ]
, sous
√
2 ln 2 ln
( 2 ) ⏟ ,
√ DDL
RDD :
Signé par :
(^)(^)
^ ^
(= - =)
(‘’) (‘’)
POOKIPOOKI votre fidèle serviteur …
Introduction à
l’économétrie