Vous êtes sur la page 1sur 74

2011

2012
ECONOMETRIE 2011 2012

LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. MICHEL TERRAZA

Economtrie
[Tapez le sous-titre du document]

ECONOMETRIE Page 1

H34VEN
Cours pour Licence 3, Semestre 6 Anne 2011-2012
ECONOMETRIE 2011 2012

LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. MICHEL TERRAZA

Cours magistral
dconomtrie

Ecrit pour les tudiants de troisime anne de licence en sciences conomiques

Pour toutes incomprhensions, imperfections ou erreurs ventuelles,

Merci de les signaler sur le forum de la facult de sciences conomiques de l'UM1, cette
adresse :

http://www.forum-sceco.fr (Connexion partir de http://gide-co.fr/forum ), dfaut de ne


pouvoir me contacter directement...

PRISE DE NOTE PAR : PLASMAN SYLVAIN ANNEE 2011 2012

ECONOMETRIE Page 2
ECONOMETRIE 2011 2012

Bibliographie :

Cours de Stat 2-3 (L2S3 & L2S4) + Intro lconomtrie (Cours de Franoise Seyte)

Johnston & Dinardo, 1999, Mthodes conomtrique, Economica (voir les annexes)

Bourbonnais, Economtrie, Dunod

Labrousse, 1978, Introduction lconomtrie, Dunod

Dor, 2004, Economtrie, Pierson Education

Giraud & Shaiks, 1989, Economtrie, Puf

Raffin, 1993, Economtrie, Flash

Cohen & Pradel, 1993, Economtrie, Litec Economie

Dormont, 1998, Introduction lconomtrie, Monchrtien

Densart, Rys, Vaneecloo, 2009, Economtrie, Presse universitaire de France (Livre de gestion
sous SAS)

Greene, 2005, Economtrie, Pierson Education (5me dition)

Stock & Watson, 2007, Introduction to econometrics, Pierson Education

Ericour & Reynaud, 2007, TD dEconomtrie, Dunod

? , 2008, Exercice pdagogique dconomtrie, Economica

Mignon, 2008, Economtrie, Economica

ECONOMETRIE Page 3
ECONOMETRIE 2011 2012

Introduction

Lconomtrie signifie la mesure des phnomnes conomiques, cest la science qui


utilise la thorie conomique, la mathmatique, la statistique, linformation et, plus rcemment,
linformatique pour analyser, vrifier et parfois prvoir les phnomnes conomiques.
Lconomtrie a t cre dans les annes 1930 aux Etats Unis par Frisch et la socit
dconomtrie avec Fischer et Ross, qui publieront Econometrica.

Lconomtrie se divise ensuite plus tard en dveloppement des mthodes et


dveloppement de la thorie conomique. Le dveloppement des mthodes passe par la
mthode des moindres carrs, avec lintroduction des probabilits grce Haavelmo et les
doubles moindres carrs. On appelle lheure actuelle lconomtrie, qui associe la thorie avec
la mthodologie, pour vrifier les hypothses conomiques, on a appel cette conomtrie,
Economtrie structurelle. Cette conomtrie sest beaucoup dvelopp jusquen 1980 et ces
aboutissements sont des modles complexes qui ont t crs par diffrents organismes, comme
lINSEE, des universits. Elle a connu ensuite une concurrence du une rivalit entre 2 grands
organismes amricains, la Cowles Commission (approche structurel) et le NBER. En effet, le
NBER utilise une approche conomtrique, plus empirique, qui ne fait pas particulirement
appel la thorie conomique, elle utilise la thorie des processus alatoires, utilis par Yule et
aussi par Bochner, Box & Jenkins, Le NBER utilise lanalyse multidimensionnel des processus
alatoire, initi par Granger de luniversit de Princeton et Sims, qui propose une nouvelle
modlisation du modle, la modlisation VAR (Vecteur Auto Rgressif).

Ces deux approches sont devenues complmentaires lheure actuelle. Dans ce cours de
licence, il est prsent lconomtrie structurelle, et lconomtrie non-structurelle est prsente
en M1 puis M2.

Le modle est linstrument privilgi de lconomtrie structurelle, cest une


reprsentation simplifi mais la plus exhaustive possible dune entit conomique quelconque.
Un phnomne conomique peut concerner un modle, un secteur dactivit ou gographique.
Le modle est construit partir de prsupposs thoriques qui vont en indiquer le contenu. Le
modle se prsente sous la forme de systme dquations, la plupart du temps linaire, mais pas
obligatoirement, reliant entre elles, 2 grands types de variables, des variables endognes,
expliquer, et des variables exognes explicatives. Formellement, si on appelle , le vecteur des
variables endognes, la matrice des coefficients de ces variables, le vecteur des variables
exognes, la matrice des coefficients de ces exognes, si on suppose que le modle est
parfaitement dtermin, cest--dire, quil possde autant dquations que de variables
endognes, et si est un vecteur contenant des variables alatoires, appel vecteur de lerreur, le
modle scrit comme a :

+
( , ) ( , 1) ( , ) ( , 1) ( , 1)

ECONOMETRIE Page 4
ECONOMETRIE 2011 2012

Ecrit sous cette forme, le modle porte le nom de forme structurelle, cest cette forme qui
dcoule de la thorie conomique, ce qui explique lappellation dconomie structurelle. Dans un
tel modle, les variables endognes et exognes jouent un rle identique

On utilise parfois la forme rduite du modle et un modle ou la variable endogne


sexprime en fonction des seuls exognes :

+
( .) [ ]

On constate que le passage de la forme structurelle la forme rduite est pratiquement


toujours possible condition que la matrice B soit inversible. Dans certains cas, on na que la
forme rduite du modle. Dans certains cas, on ne dispose que de la forme rduite. Or ce modle
intressant est celui de la forme structurelle qui possde la matrice des coefficients des
endognes qui va leur indiquer la manire dont ils peuvent orienter leurs politiques
conomique. Le passage de la forme rduite la forme structurelle porte le nom didentification
du modle. On considre alors 3 cas, le modle juste identifi une forme rduite correspond
une forme structurelle, le modle sous-identifi, que lon ne considre pas en conomtrie, et le
modle sur-identifi, o une forme rduite correspond plusieurs formes structurelles. En
conomie, la plupart des modles sont sur-identifis, ce sont des modles qui ont comme base la
thorie conomique de Keynes. Il existe des thormes permettant de vrifier lidentification des
thormes conomiques.

Une fois le modle construit, il peut se prsenter sous diffrentes formes. Ces formes
sont obtenues aprs avoir analyser un arrangement des variables endognes dans les quations
de la matrice . Lorsque lon a affaire la reprsentation Bloc Diagonale, cela signifie que le
modle de dpart est en fait constitu de plusieurs sous modles indpendants les uns et des
autres, il est prfrable de traiter chacun dentre eux sparment. La deuxime reprsentation,
le Bloc Triangulaire, est la construction de modles rcursifs, cest--dire que certaines
quations dpendent des rsultats dquations prcdentes. Et la dernire matrice est un
modle quations simultanes, ce sont des modles interactions gnrales entre les variables
entre les diverses quations : une variable est endogne mais peut tre exogne dans une autre
quation. Les modles conomtriques sont gnralement sur-identifis et quations
simultanes.

Premire mthode destimation : On applique la mthode des moindres carrs ordinaires


et du maximum de vraisemblance ; cest la plus mauvaise des mthodes car les variables
exognes des modles sont des variables certaines, indpendantes de lala, incompatible avec le
modle quations simultanes.

Deuxime mthode destimation : Utilis seulement en cas de modle JUSTE identifi,


cest la mthode des moindres carrs indirects. On estime les paramtres de la forme rduite,
quations par quations, par la mthode des MCO puis on calcule les paramtres du modle
structurelle.

ECONOMETRIE Page 5
ECONOMETRIE 2011 2012

Troisime mthode destimation : Mthode des doubles moindres carrs, construite par
Haavelmo, est une mthode pour modle quations simultanes sur-identifie. Cest une
mthode en deux tapes. La premire tape consiste estimer les paramtres de la forme
rduite, ce qui permet dobtenir des variables endognes calcules. Deuxime tape : on reporte
dans la forme structurelle les valeurs des endognes en position dexognes, par leur valeurs
calcules dans ltape prcdente ; on estime ensuite les paramtres de la forme structurelle par
les MCO, quations par quations.

Quatrime mthode destimation : Mthode des triples moindres carrs. Les deux
premires tapes sont identiques la mthode prcdente, et la troisime tape est en fait
destimer simultanment par un algorithme les paramtres de la forme structurelle, et dans cet
algorithme, les rsultats des DMC servent dmarrer cet algorithme.

Modle exemple :

+ +
{ ( )+

, ariables endognes

Modle parfaitement dtermin

, , ariables exognes

1 1 1 1 +0 +0 0
{ {
+1 0 +0 + 0
Endognes Exognes

1 1 1 1 0 0 0
[ ][ ] + [ ][ ] [ ]
1 0 0 0

1 1 1 1 0 0
Forme rduite [ ] [ ] [ ][ ]
1 0 0

1 1
[ ] 1 0, 1
1
1
( + + )
{ 1 , propension marginale consommer
1
( + + )
1

Dans le cadre de ce cours, on tudie essentiellement le modle structurel le plus simple,


cest celui qui possde une quation et plusieurs variables explicatives, on lappelle le modle
linaire gnrale simple (MLGS). Le premier chapitre de ce cours est consacr ce modle et
ses extensions pratiques. Le second chapitre prote sur le modle dautres types mais o
certaines hypothses ne sont plus vrifies. Le 3me chapitre concerne des modles une
quation particulires que lon appelle, modle retard chelonn, qui sont des reprsentations

ECONOMETRIE Page 6
ECONOMETRIE 2011 2012

de la thorie des anticipations conomiques, enfin le dernier chapitre de ce cours est consacr
aux modles plusieurs quations.

ECONOMETRIE Page 7
ECONOMETRIE 2011 2012

Partie I
Modle linaire gnrale simple

Section A. Rappels et complments en algbres matricielles

A. Dfinitions :

Proprits des transposs :

- La matrice symtrique :
- Le produit matriciel : ( )

Proprit de la matrice inverse, proprits du rang

Proprits des Matrices orthogonal

Diagonalisation et produits scalaires

Trace dune matrice carre : oprateur linaire

Idempotence Carr dune matrice est gale elle-mme

Formes quadratiques et matrices dfinies positive

Drive matricielle, driv dune forme quadratique

Section B. Estimations par les MCO et par le MV

I. Spcification du MLGS

Le MLGS examine le cas o une variable endogne est lie 1 variables


explicatives, , , . . , est un ala de faon linaire. Les diffrentes variables dun modle
peuvent tre de nature diffrente. Il peut sagir de variables observs un moment donn pour
des chantillons, cest un modle en coupe instantan, ou au cours du temps en srie temporel,
do le nom de modle en srie temporel, ou les variables peuvent tre observ pour des
chantillons au cours du temps, cest un modle de Panel.

ECONOMETRIE Page 8
ECONOMETRIE 2011 2012

Coupe instantan : + + + + , (Economtrie urbaine)

Srie temporelle : + + + +

Panel: + + + +

Dans ce cours, on ne va considrer que la seconde criture

1 +

[ ] [ 1 ][ ] [ ]

+ ( , 1)
( , 1) ( , )( , 1)

II. Hypothse :

1) constantes,
[ ] [ ]
et indpendantes
2) , vecteur de variables alatoires
+ vecteur de variables alatoires
3) , , , Valeur finies quand +

4) , 1, , Processus alatoire stationnaire de type Bruit Blanc

[]
Formule de
Processus alatoire stationnaire dordre 2 : variables caractrises que par les 2
premiers moments (esprance et variance)
Bruit blanc : Covariance = 0
, (0, ) (Indpendamment et identiquement distribu)
BB [ ] 0,
[ ] [ ] ,
[ , ] [ ] 0, homoscdactique ,
(0, )

[ ] [[ ] [ ]]
( , 1)(1, )
( , )

ECONOMETRIE Page 9
ECONOMETRIE 2011 2012

Symtrie

Symtrie
[ ]
[ ] ( , ) 0 0
[ ] [0 0]
( , ) [ ] 0 0
[ ] [ ]
( , ) [ ] 0

Ce quil y a retenir de lhypothse 4 :

[ ]
[ ] 0
(0, )

[ ] 0
[ ] [ + ]
[ ]+ [ ]

[ ]
[ ]

[ ]
5) Pour grand,
6) Rang
( , )
Absence de colinarit ou de multi-colinarit entre les variables explicatives

Application des MCO (Moindres carrs ordinaires) et du MV (Maximum de vraisemblance)


Mme rsultat

III. Estimation du modle

a) Les estimateurs des MCO

Soit + ( , 1)
( , ) ( , )( , 1)


( , 1) ( , 1) ( , 1)

ECONOMETRIE Page 10
ECONOMETRIE 2011 2012

Rsidu, cest un chantillon de donc il doit possder les caractristiques de lala, cest
pourquoi ( ) 0 & ( ) constante et les rsidus sont non-corrls

Permet de vrifier les proprits de lala

La mthode des MCO consiste trouver min min

( ) ( ) ( )( )


+
scalaire scalaire

Nous voyons que ( )

Soit

Soit (la transpos dun scalaire est lui-mme)

Donc 2 +

Cherchons 0

2 ( ) ( ( ) )
0 +

+ + +

( )
donc [ ; ; ;; ]

Le produit ( ) est une formule quadratique en avec une matrice de


dimension x qui est symtrique. Cest une matrice dfinie positive puisque le rang de est
gal, au minimum, ( , 1) cest--dire 1.

( ( ) )
est un scalaire et 2( )

Donc 2 + 2( ) 0

( )

( )

Cela est possible si le dterminant de 0

ECONOMETRIE Page 11
ECONOMETRIE 2011 2012

Or par hypothse, rg( ) donc rg( ) et donc linverse de existe.

On constate limportance de lhypothse de rg( )

b) Les caractristiques des estimateurs

est un estimateur linaire de

( )

( ) ( + )

(
) +( )

+( )

Donc dpend de . La variable est lala, donc est un vecteur ala (sans avoir savoir la loi
de probabilit)

Lesprance mathmatique de

[ ] + [( ) ]

Sachant que est une valeur certaine

[ ] +( ) [ ]

Donc [ ] et [ ]

[ ] Donc est un estimateur sans biais de

Construction de la matrice des variances-covariances de

[ ] (; )
[ ]
( ; )
[ ]

(; ) [( [ ])( [ ])]

[( )( )]

si []

[( )( )]

[( + ( ) )( + ( ) )]
ECONOMETRIE Page 12
ECONOMETRIE 2011 2012

[(( ) )( ( ) )]

Le transpos de ( ) est gal : ( ) car est une matrice symtrique

[( ) ( ) ]

( ) [ ] ( )

( ) ( )

( )

Les variances des quon utilise pour effectuer les tests de signification de
paramtres se calculent en multipliant par les lments de la diagonale de ( )

est de variance minimale

Pour dmontrer cette proprit ; considrons un autre estimateur et quon suppose linaire

tant de dim( , )

On constate que si est lestimateur recherch, alors ( ) + , en supposant 0

Dmonstration : 0

Pour que soit bon, il doit tre sans biais, cest--dire [ ]

( + )

+ [ ]

Soit

Soit [( ) + ]

( ) +

[( [ ]) ( [ ])]

ECONOMETRIE Page 13
ECONOMETRIE 2011 2012

[ ] + [ ] +

[[ ][ ]]

[ ]

[ ]

Avec ( ) +

[[( ) + ][( ) + ]]

[[( ) + ][( ) + ]

[( ) ( )( ) +( ) + ( ) + ]

[( ) +( ) ( ) + ( ) + ]

[( ) + ] +

Nous cherchons min (Termes de la diagonale de )

Entraine : 0 car on doit alors avoir 0 pour ,

Donc et est bien estimateur MCO de variance minimale

Conclusion :

Lestimateur est linaire, sans biais et de variance minimale (convergent). On dit que
cest un estimateur BLUE (Best Linear Unbiased Estimator), cest dire quil sagit du meilleur
estimateur linaire, celui qui a la plus petite variance parmi tous les estimateurs possibles de .

Enfin est convergent, il faut pour cela que ( ) 0 lorsque

On considre que dans la pratique cette hypothse est vrifie.

ECONOMETRIE Page 14
ECONOMETRIE 2011 2012

c) Estimateur de la variance des erreurs :

La seule info dont nous disposons sur lala est le rsidu de la rgression.

+ [( ) ]

+ ( ) ( + )

+ (
) ( )

+ ( )

[
( ) ]
Par soucis de simplification
nous appellerons cet
encadrement
Toutefois, il est
diffrent du
de tout l heure

Donc [ ][ ] , or ( )

( ( ) )

( )

Donc

est une matrice idempotente

Et donc

Calculons [ ]

[ ; ; ][ ][ ]
(1, )
( , )
( , 1)

+2

Donc [ ] [ ] + 2 [ ]

ECONOMETRIE Page 15
ECONOMETRIE 2011 2012

[ ]

= trace( )

trace [ ( ) ]
trace [( ) ( )]

[ ] ( )

[ ]

On va donc choisir :

Or nous savons : ( )

Donc les variances sont gales (Les lments de la diagonale de ( ) )

Cette diagonale devient un vecteur appel diag( )

Soit [ ] diag( )

IV. Les Test des estimateurs

A. Les estimateurs et la maximum de vraisemblance

Lautre mthode destimation des paramtres est le maximum de vraisemblance. Il faut rajouter
une hypothse concernant lala pour lutiliser chacune des variables alatoires obit une loi
normale centre 0 et dcart type .

(0, )

(0, )

La fonction de M sous forme matricielle scrit :


ECONOMETRIE Page 16
ECONOMETRIE 2011 2012

1 1 1
exp( ( )( ))
2 2

log
Ou 0

[( ) ( )]
0 (Mthode des MCO)

( )( )

M MCO

Lestimateur des MCO, cest aussi lestimateur du maximum de vraisemblance, limportant dans
cette mthode, cest lhypothse de normalit des alas qui va permettre dintroduire les lois des
paramtres inconnus de dfinir des intervalles de confiance et deffecteur des test de
significations de ces paramtres.

B. Le test du coefficient de rgression

+( )

Epsilon obit une loi normale dimensions, daprs cette relation est un estimateur
linaire de et obit une loi normale multi dimensionnelle mais la dimension de cette loi est
cette fois .

En supposant sans biais et que lon connait sa variance :

( , diag( ) )

Dans cette expression, est inconnu mais on pourrait le remplacer par :

Mais cette mthode ne suffit pas pour trouver

[ ( ) ]
Forme
Quadratique

ECONOMETRIE Page 17
ECONOMETRIE 2011 2012

Dans cette expression, est une matrice symtrique (idempotente) de trace( ) et


donc son rang est aussi ( ). Les valeurs propres sont donc soit nul soit gale 1. Il est donc
possible de trouver une matrice orthogonale, not qui diagonalise .

Par cet intermdiaire, il est alors possible de dterminer la loi de partir de en


faisant subir une transformation, on utilise pour cela la matrice . La matrice
orthogonale transforme le vecteur en un vecteur de telle sorte que soit gale

, o ala et vecteurs propres

Dans cette expression est la matrice qui diagonalise et cest une matrice orthogonal,
alors dans ce cas, est une matrice diagonale qui est form de chiffres 1 sur la
diagonale des premires colonnes et de 0 partout ailleurs.

De ce fait :

Avec = composantes non-nulles prcdentes, celles qui sont gales 1 du


produit

Comme est une variable normale dimensions, qui est obtenu de par une
transformation linaire est aussi une variable alatoire normale. Par ailleurs, les sont
indpendants puisque les vecteurs propres, associs aux valeurs propres dune matrice
symtrique forment un systme indpendant (groupe orthogonal).

(n k)

Il est alors possible deffectuer un test pour . Par ailleurs, on peut vrifier quelle est la
relation entre le rsidu et le vecteur .

IC et test de

[ , ] [[ [ ]][ ]]

( ) 0

( )

[ , ] [( ( ) ) ]

[ ] [ ] 0

Dans ces conditions, il va tre possible de considrer un test concernant

ECONOMETRIE Page 18
ECONOMETRIE 2011 2012

Consquence :

( )
( )
diag( )

Si Matrices ( )

diag( )


( )

Intervalle dacceptation :


+ 1

[ ]

Si lintervalle, accept ( )

Soit 0

| | lu , accept

| | lu , rejett

C. Principe du test dun ensemble de coefficient de rgression

La signification dun seul coefficient de rgression peut tre teste en utilisant la loi de Student

Lorsque lon veut tester tous les coefficients de rgression, il faut pouvoir dterminer la
contribution des variables explicatives correspondantes dans lexplication de la variance totale
de . Il faut donc dcomposer la variance de , cest--dire raliser une analyse de la variance.
Pour cela on recourt au modle crit avec variables centres.

ECONOMETRIE Page 19
ECONOMETRIE 2011 2012

1. Ecriture du MLGS avec variables centres

Soit , les variables centres.

MLGS linstant

+ + + + (1)


( )

+ + + + (2)

(1) - (2) = + + +

avec 1, ,

Dans cette criture, il est vident que ne comporte plus et et na plus de 1re colonne ne
contenant que des 1. Sur ce nouveau modle, on peut appliquer la mthode des MCO :

( )
Mme rsultat MLGS ( ) { [ ] ,
[ ] diag( )

2. Dcomposition de la variance totale de la variable endogne

ECONOMETRIE Page 20
ECONOMETRIE 2011 2012

( ) ( )

MCO 0

0 2 +2 0

2 +

( )

ariance totale ariance explique + ariance rsiduelle

3. Coefficients de rgression sur variables orthogonales

Pour pouvoir tester un groupe de coefficients de rgression, on peut utiliser comme


prcdemment, une transformation qui exprime la variable endogne en fonction de variables
orthogonales. On va appeler , , ( 1) nouvelles variables que lon va dfinir de la faon
suivante :

+
{ 1, 2, ,
+ +

0, , 2, ,

ECONOMETRIE Page 21
ECONOMETRIE 2011 2012

+ +

+
{ +

MCO

( )

[ ]

[ ]

4. Test de signification ou de lensemble ou dun groupe de coefficients de rgression

est une combi linaire de VA normale , ils obissent donc par construction la loi
normale :

( , )


(0,1)

( )
( 1)


( )
{

( ) ( 1)
( 1, )
( )

ECONOMETRIE Page 22
ECONOMETRIE 2011 2012

( ) ( 1)
Si vraie
( )

Forme matricielle :

( 1)
( 1, )
( )

Variance de explique par ,,

Variance rsiduelle

Si , accepte

0 0


(1, )
( )


( )

V. Le coefficient de dtermination

A.

Considrons lquation de la variance prcdente :

Par dfinition, le coefficient de dtermination, cest la part de la variance explique dans la


variance totale de , il scrit donc :

Par construction, ce coefficient de dtermination na pas dunit, compris entre 0 et 1.

( )

ECONOMETRIE Page 23
ECONOMETRIE 2011 2012

Matrices des coefficients des variables exognes


( 1, 1) [ ]

B. Test du coefficient de dtermination

( 1)
On a vu que ( 1, )
( )

et 1 ; donc

( 1; )
1 1

Test :

0; 0

Si , alors accepte

VI. La prvision (prdiction)

Na de sens que si le modle de rgression prcdent est correct. On ralise deux types de
prdictions :

, prdicteur de la valeur moyenne de la variable explique :

On cherche un prdicteur de la valeur moyenne de la variable endogne pour des


variables explicatives donnes.

,,

Un individu quelconque

+ + + +

ECONOMETRIE Page 24
ECONOMETRIE 2011 2012

1
[ ]

+
+

[ ]
{
[ ] ( )

( , ( ) )


( )
{

( )( )
( )

Test:

( )
1 [ ]

Comparaison dune prvision ponctuelle lquation des moindres carres

( , ,, )

La prvision est-elle compatible avec lestimation par les moindres carrs ?


aleur
fixe
recherche

( )

[ ] [ ] [ ] [ ]

0 0

ECONOMETRIE Page 25
ECONOMETRIE 2011 2012

[ ] [ ] + [ ] 2 [ , ]+ [ ]

= [ ] +

[1 + ( ) ]

(0, [1 + ( ) ]

{ (n k)

1 + ( )
[ ] 1

. ., accepte
Si
. ., rejete

Le vecteur ( ; ) appartient ( ) ou non ( ) au modle de rgression

Section C. Extension

I. Les variables indicatrices

A. Dfinitions et spcifications

On appelle variables indicatrices (ou variables tampons / auxiliaires / binaires /


dichotomiques / dummy variables ), traduisant la prsence ou labsence dun phnomne
explicative. On leur attribue la valeur 1 ou 0, selon que lvnement est prsent ou absent dans
lobservation considre. La spcification du modle conomtrique ne pose, en gnral, aucun
problme lorsque lon prend en compte ce type de variable. Pour illustrer cette spcification,
expliquons un modle simple 3 variables dont une variable exogne est indicatrice mais
uniquement pour une observation de 1, , . Cest, par exemple, le cas de la rgression linaire
simple o pour laquelle la variable explicative, prsente pour une raison quelconque, un point,
une valeur aberrante (exceptionnel).

ECONOMETRIE Page 26
ECONOMETRIE 2011 2012

+ + , 1,

On va supposer qua un moment donne , une variable exceptionnel modifie la


rgression de tel sorte que la valeur soit considre comme aberrante dans la rgression. On va
considrer que cette perturbation ce produit au moment

+ + +
{ 0, ,
avec
1,

, + +
Si
, ( + )+ +

On constate que ces deux modles ne se diffrencient que par leur ordonne lorigine
qui est dans le premier et + dans le second. B3 est la modification de lordonne
lorigine, d la perturbation. On constate que dans cette exemple, linfluence linaire de sur
nest pas modifier par cette perturbation, seul lordonne lorigine va changer. On peut aussi
envisager un modle o la perturbation va modifier la relation. Cest par exemple le modle
suivante :

+ + + +
{ 0, ,
avec
1,

, + +
Si
, ( + )+( + ) +

Ces deux modles se gnralisent au MLGS avec une variable dichotomique mais aussi au
MLGS avec plusieurs variables dichotomiques. Le problme statistique ne prsente aucune
difficult, il faut simplement vrifier que la matrice du MLGS ne prsente pas de colinarit

B. Quelques applications courantes

ECONOMETRIE Page 27
ECONOMETRIE 2011 2012

Les variables indicatrices peuvent traduire plusieurs origines outre celles des valeurs
aberrantes : effets temporels, spatiaux, dus aux variables qualitatives.

- Leffet temporel est lun des plus courantes en conomtrie. Il concerne les
modifications entre 2 priodes spars par des vnements exceptionnels (guerre,
etc)
Lexemple le plus cit dans les cours dconomtrie est celui emprunt louvrage de
Johnston cest le cas de la fonction de consommation en tat de guerre et en tat de
paix.

+ + , en tat de guerre

+ + , en tat de paix

+ + +
{ 1, 0, en tat de guerre
0, 1, en tat de paix

Dans ces quations de consommations ne se diffrencient que par lordonne lorigine.


Si ce ntait pas le cas, on ne procderait pas avec des variables dichotomiques, on ferait des
ajustements spars sur les deux priodes.

Les effets spatiaux concernent, par exemple, la modification des ordonnes lorigine de
relations construites partir de rgions ou de pays diffrents.

Les variables qualitatives jouent un rle de plus en plus important en conomie et


peuvent tre prise en compte par des variables de types dichotomiques.

Il convient de distinguer 2 cas dans les variables qualitatives :

- Celui o la variable qualitative est exogne :


On procde comme prcdemment. Soit une variable exogne, le genre. 0 pour le
genre fminin et 1 pour le genre masculin.

- Celui o la variable qualitative est endogne :


On fait alors appel des modles plus complexes qui portent des noms comme
LOGYT ou PROBYT. Il sagit dune branche particulire de lconomtrie,
lconomtrie des variables qualitatives. (Pas trait en L3)

C. Utilisation des variables dichotomiques

Rappel : Soit une chronique, lobservation dun phnomne au cours du temps

1, avec un pas de temps constant 1

ECONOMETRIE Page 28
ECONOMETRIE 2011 2012

On considre, un instant de cette srie chronologique, lextra saisonnier , le


saisonnier et le rsiduel

Ces 3 composantes sont orthogonales ou lis entre elles pour former la valeur . Si elles
sont orthogonales, le modle est additif, si elles sont lies entre elles, le modle est multiplicatif :

+ + dditif
{
Multiplicatif

Pour dsaisonnaliser, on utilise deux mthodes de rgression :

- Les fonctions trigonomtriques


- Les variables dichotomiques

, annuelle
{ est linaire
fonction trigonomtrique, modle additif

+ +

+ + cos( + ) +

2
2

La saisonnalit est modlis par une somme de cosinusodes avec :

- lamplitude
- Radian (pulsation) 2
o Unit de temps (priode)
o Hertz (frquence)
- Dphasage

ECONOMETRIE Page 29
ECONOMETRIE 2011 2012

La cosinusode nest pas une forme linaire, il faut utiliser la formule cos( + )
cos( ) cos( ) sin( ) sin( ), donc :

cos cos sin sin

cos + sin

avec cos et sin

Il y a 5 harmoniques car ensuite nous passons soit 2 points, ce qui est insuffisant pour
reprsenter un cycle.

2 2 2 2 2 2
cos + cos + cos + cos + cos + sin +
12 4 3 2.4 12
12
1 1
2 2

10 + 2 12 coefficients (variables explicatives)

2
12
2

2 2
1, ,
12 4
2
3
2
{ 2.4

+ + cos etc
C S
( )

2 2
[ cos + + sin + ]
12 12

Dessaisonalisation par variables dichotomiques

Chronique Trim. modle additif


modle linaire

+ +

+ + [ ]+ , avec variables dichotomiques

ECONOMETRIE Page 30
ECONOMETRIE 2011 2012

1 1 0 0 0
2 0 1 0 0
3 0 0 1 0
4 0 0 0 1
1 0 0 0

[ etc ]

Donc + + +

(Rappel + , , )

1 1 1 0 0 0
1 2 0 1 0 0
1 3 0 0 1 0
1 4 0 0 0 1 +
1 1 0 0 0

[ ] [1 ][ ] [ ]

On ne peut pas utiliser directement la mthode des MCO parce que le rang de la
matrice nest plus maximal. Il y a colinarit entre les valeurs.

2 Solutions :

- On utilise les variables centres


- On utilise le principe de conservation des aires (Somme des coefficients = 0)
donc ( + + )(Par exemple)

Solution :

1 1 1 0 0
1 2 0 1 0
1 3 0 0 1
1 4 1 1 1
1 1 0 0
[ ]
[1 ]
C S
( )

II. La slection de sous ensemble de variables

ECONOMETRIE Page 31
ECONOMETRIE 2011 2012

A. Lvaluation de la qualit dune rgression

Lvaluation dune qualit dune rgression est entendue dans ce paragraphe comme
tant le choix pertinent de la combinaison linaire de variables explicatives en nombre le plus
restreint possible qui va contribuer le mieux expliquer la variable endogne. Considrons par
exemple une rgression effectue partir de variables explicatives puis une autre rgression,
effectue partir dun sous ensemble de cardinal de ces variables explicatives.

Ny a-t-il pas, parmi les variables de dparts, variables qui nauraient quune
explication ngligeables pour ?

Pour rpondre, on dispose, en dehors des tests du MLGS, de plusieurs critres


dvaluation de la qualit dune rgression.

- Le carr moyen rsiduel

SCE
, SCE Somme des carrs des carts ( ou )

- Coefficient de dtermination

ST SCE SCE
1
ST ST

ST

( )
1

On peut, partir du prcdent, calculer un autre pour un gain de variance que lon appelle
coefficient de dtermination ajust qui a pour formule :

( 1)
1
ST

- Statistique de Mallows

Mesure du biais + (2 )

[ ]

Quand on augmente le nombre de variables, la SCE naugmente pas :

SCE SCE

ECONOMETRIE Page 32
ECONOMETRIE 2011 2012

Par contre comme SCE est divis par cette ingalit nest pas vrai entre et , cest la
raison pour laquelle on prfre utiliser le second critre qui induit le rsultat suivante :

Dans un modle de rgression, le coefficient de dtermination saccrot avec le nombre de


variables explicatives, cest souvent pour cette raison que lon construit des modles non
parcimonieux.

1
1 (1 )

On peut aussi calculer la statistique suivante , qui scrit :

(SCE SCE ) ( )
SCE ( )

Cette statistique permet de slectionner le sous ensemble de cardinal en maximisant la valeur


de . On peut montrer :

max

( )( 1)

De faon plus rcente, les conomtres utilisent des statistiques diffrentes pour valuer la
qualit de leur rgression, ces statistiques sont issus de lanalyse des sries temporelles et
seront revus en M1. Elles portent le nom de critres dinformations, et le premier en avoir
Akaike en 1970 et son critre prend le nom de Akaike Information Criterium, le meilleur modle
est celui qui minimise ce critre.

B. La mthode dvaluation de toutes les rgressions possibles

On considre lensemble de toutes les rgressions possibles entre la variable endogne et


les combinaisons des variables exognes. La mthode consiste :

- A calculer les 2 rgressions possibles


- De rpartir ces rgressions en 1 groupes correspondant chacun un nombre
diffrent de variables explicatives, et pour chacun de ces groupes, de retenir comme
critre, le meilleur , on obtient alors la rpartition des pour chacun des groupes
et la mthode consiste retenir le le meilleur de tel sorte que les autres ne soit
pas significativement diffrent de lui

Avec 10 variables explicatives, on obtient 1023 (2 1) rgressions

Les statisticiens prfrent les mthodes pas pas

La rgression pas pas descendante


ECONOMETRIE Page 33
ECONOMETRIE 2011 2012

Cette procdure considre dabord la rgression complte puis limine la variable qui
correspond au le plus petit ou la variable qui accrot le moins le carr des rsidus. Cette
mthode et les suivantes possdent des critres darrts, sinon, elles se poursuivent jusqu
limination ou rcupration de toutes les variables. Cette mthode est une mthode en 4 tapes :

- Estimation de la rgression complte


- Calcul des , pour chaque variables explicatives
- On retient la valeur la plus petit du , on la note et on la compare un pour un
seuil choisi. Si correspond au on conserve la variable et a fortiori toutes les
autres. Si est infrieur au , alors on limine la variable
- On recalcule la rgression avec les 2 variables explicatives restantes, et on
ritre lalgorithme partir de la deuxime tape.

Sil ny a pas de critre darrt, la mthode peut liminer toutes les variables.

Slection ascendante des variables explicatives

Mthode symtrique la prcdente, elle consiste introduire pas pas les variables
explicatives. Les tapes de calculs sont donc les suivantes.

- Calcul des coefficients de corrlation simple entre et toutes les variables exognes.
On retient lexogne qui a le plus fort coefficient de corrlation
- On calcule le rsidu de la rgression prcdente, puis les coefficients de corrlation
avec les variables explicatives restantes. On slectionne celle qui possde le plus fort
coefficient de corrlation
- chaque pas de lalgorithme, on peut calculer par exemple le coefficient de
dtermination du modle correspondant. On peut aussi le . Cela permet de
construire un critre darrt, par exemple, la nouvelle variable introduite un non
significatif, ou encore, considrer un critre (par exemple 10 ) et si le du
modle nest pas suprieur dans son accroissement ce critre, lalgorithme sarrte.

Cette procdure est souvent utilise, car, avec un critre darrt, elle peut tre trs
rapide. Mais cette procdure nindique pas leffet que peut produire lintroduction dune
nouvelle variable sur les variables antrieurement introduites.

La slection progressive avec possibilit dlimination

Cette procdure fonctionne comme la prcdente mais chaque pas elle sinterroge sur
la signification de la variable prcdente introduite. Cest donc une version amliore de la
rgression pas pas, ascendante ou progressive. Les tapes de calcul sont donc entirement
identiques au prcdente et possde aussi un critre darrt. La diffrence vient du fait qu

ECONOMETRIE Page 34
ECONOMETRIE 2011 2012

partir du second pas (et au suivant ensuite) on teste la signification le coefficient de rgression
de la seconde et de la premire variable.

Si le coefficient de la seconde variable nest pas significatif, on sarrte la premire. Si le


coefficient de la premire variable nest pas significatif alors que la seconde lest, on limine la
premire variable et la procdure se poursuit avec une troisime variable.

Ces procdures sont commodes lors des tudes qui comportent beaucoup de variances
explicatives mais elles peuvent tre dcevantes sur le plan du rsultat. Cela tient de
lautomaticit de la technique qui en effet slectionne un ensemble de variable mais qui ne
garantit pas quils soient le meilleur, surtout sur un plan conomique. Parmi toutes ces
mthodes de slection, y compris dautres, rien ne permet daffirmer que lune dentre elles est
meilleure quune autre.

III. Les moindres carrs contraints

A. Le MLGS contraint

Dans le MLGS, le vecteur est constitu dlment constant inconnu. Il peut arriver des
cas o lon souhaite que ce vecteur appartienne un sous espace du corps des rels. Le cas le
plus simple trait ici tant celui dune varit linaire. Ce cas est celui de lintroduction au
problme, plus difficile, de lestimation de paramtres sous contrainte.

Supposons que les lments de sous soumis contraintes compatibles.

Avec , une matrice ( , )

et , un vecteur donne lments

Le modle contraint scrit comme ceci

+ ( , 1)
( , 1) ( , )( , 1)
{ , rg( )
( , )( , 1) ( , 1)

Ecrire que le rang de soit gale revient supposer que les contraintes sont linairement
indpendants. Si le rang de tait gale , on pourrait trouver en rsolvant le systme
dquation linaire, la mthode de Cramer :

B. Les estimateurs des MCC

ECONOMETRIE Page 35
ECONOMETRIE 2011 2012

La condition sur le rang de assure que le systme des contraintes admet une infinit de
solutions en . Les MCC choisissent parmi lensemble des solutions, celle qui minimise la somme
des carrs des rsidus. Le problme mathmatique scrit donc de la faon suivante :

min
{
min( )( )

( )( ) 2 ( )

2 +2 2 0

{ 2( ) 0

0
{
0

( ) ( ) [ ( ) ] [ ( ) ]

+ {( ) ( ) [. . ] ( ) }

[ ]

[ ] {( ) ( ) [. . ] ( ) }

On constate que [ ] [ ] est une matrice dfinie positive qui montre que
lintroduction dinformations a priori sur rduit ncessairement la variance des estimateurs
qui prennent en compte cette info.

Exemple :

+ + +
{
+ 1

+ + +

+ ( )+

MCO : (( );( ))

, , 1

ECONOMETRIE Page 36
ECONOMETRIE 2011 2012

Section D. Robustesse du MLGS

Un modle est robuste lorsquil est valide dans des circonstances diffrentes, par
exemple, lestimation de la fonction de consommation avant et aprs la seconde guerre
mondiale, la relation prix/rcolte de vin cette relation sest-elle modifi aprs lintroduction en
1970 de ce march dans la CEE, Dans ces cas, on les appelle des cas de robustesse
structurelle , ltude porte sur des temps conscutifs, mais elle peut concerner des priodes de
temps qui se chevauche, par exemple, la courbe de Philips au cours de diffrentes phases de
conjoncture. Elle peut tre lie des problmes dhomognit spatiale, comme la loi rang-
dimension, tel quannonce par Zipf. Cette relation peut aussi concerne des problmes
sectorielles, comme la fonction dinvestissement dans la sidrurgie. Enfin, ltude de la
robustesse peut concerner le sens de la causalit entre les variables, par exemple, les prix sont-
ils toujours la cause des salaires, ou le contraire ?

On va considrer que lordre causal nest pas remis en question.

Considrons le MLGS suivant :

+ +

On dira que ce modle est robuste si quelque soit les sous-ensembles constitu partir
dobservations conscutives sur la priode 1, , les estimations du mme modle sur chacun de
ces sous-ensembles sont :

- Valides
La rgression passe les tests
- Stables
Les paramtres estims ne sont pas significativement diffrents des
paramtres & de la rgression complte. Si on considre deux sous-ensembles
disjoints, on dispose de 3 estimations :
+ , [1, . . ]
+ , [1, ]
+ , [ + 1, ]

On dit que le modle estim sur la priode 1, si les 3 modles prcdents passent les
tests et si ne sont pas significativement diffrents de & et de &

Cette dfinition de la robustesse amne ltude de la comparaison statistique de 2


coefficients de rgression et par l celle de la comparaison entre 2 coefficients de corrlation
linaire simple.

ECONOMETRIE Page 37
ECONOMETRIE 2011 2012

Test de 2 coefficients de corrlation

Supposons que lon dispose de 2 sous-ensembles indpendants de taille , 1 et , 2. On va


appeler et les coefficients de corrlations linaires simple de chacun des deux sous-
chantillons. On peut montrer pour de petits chantillons que le coefficient de corrlation
nobit pas une distribution dexpression simple autour de son esprance mathmatique . On
constate que la distribution est fortement asymtrique pour les valeurs de qui sont loigns de
0. Pour cette raison, Fisher a propos une transformation non-linaire du coefficient de
corrlation : cette transformation est la suivante.

1 1+
argtan log
2 1

En utilisant cette transformation, on considre que la loi de probabilit obit une loi
normale, mme pour des valeurs loignes de 0, les caractristiques, les moments, de cette loi
normale sont :

[ ] argtan

1
[ ]
3

argtan

argtan

[ ] [ ] [ ] [ ]

1 1
[ ] +
3 3

(0,1)
[ ]

RDD : 1,9 , accepte

ECONOMETRIE Page 38
ECONOMETRIE 2011 2012

Test de comparaison de 2 coefficients de rgression

On dispose des mmes sous-ensembles.

[ ] & [ ]

[ ] [ ] [ ] 0

[ ] [ ]+ [ ]


RDD : [ ]
( + 4), accepte

Tests gnraux de stabilit du modle de rgression

Il existe de nombreux tests de stabilit des coefficients dun modle de rgression.


Certains de ces tests sont de conceptions simples ou intuitives, ce sont les rgressions
roulantes ou des rgressions CUSUM . Dautres sont plus labors sur un plan purement
stat : test Chow et le test de la covariance. Enfin il existe des tests de constructions plus
complexes, comme la rgression paramtres variables, bien que lobjectif recherch soit
diffrents, ou les modles Espace dtats , associs au filtre de Kalman.

Les rgressions roulantes :

Les rgressions roulantes consistent estimer les paramtres de modles successifs au


pas de 1 ou de plusieurs observations sur la priode de ltude dans le sens dbut vers la fin
(rgression forward) soit dans le sens contraire, de la fin vers le dbut (rgression backward).

Les paramtres ainsi que les caractristiques de ces rgressions ( de Student,


, Durbin-Watson) sont alors reprsentes graphiquement. Dans le cas de fortes instabilits,
ces graphiques font alors apparaitre des ruptures.

Mthode du CUSUM :

ECONOMETRIE Page 39
ECONOMETRIE 2011 2012

Cette mthode du CUSUM est un moyen de dtecter les changements de tendance, la


forme analytique dune tendance, dans une chronique. Pour cela considrons une chronique
quelconque prenant ces valeurs dans la priode 1, . La fonction CUSUM (j) associ au
temps , scrit de la manire suivant e :

CUSUM(j) ( )

( , ), ,
est une valeur compris en 2 que lon choisit le plus souvent car lon peut vrifier que
les CUSUM pour les diffrentes valeurs de ne sont pas trs diffrentes.

Si la moyenne des premires valeurs est constante, quelque soit et alors


on peut montrer que le CUSUM( ) 0. Sur ce constat, si la moyenne augmente (respectivement
diminue) brusquement pour alors on peut vrifier que la fonction CUSUM devient
linairement croissante (respectivement dcroissante) pour . De mme si la moyenne
augmente (respectivement diminue) progressivement aprs , la fonction CUSUM devient
quadratique croissante (respectivement dcroissante) pour . On utilise don ce principe sur
les rsidus du modle de rgression, qui par dfinition, ne possde pas de tendance. Si le CUSUM
en dtecte une [de tendance], cela signifie effectivement que le modle est instable au cours du
temps, et le CUSUM peut tre un instrument pour dtecter les ruptures dans les rsidus, et, de ce
fait, les ruptures dans les rgressions.

Test de Chow :

Considrons les 3 modles suivants :

Modle (1) + , [1, . . ]


Modle (2) + , [1, ]
Modle (3) + , [ + 1, ]

Lauteur montre que ces 3 modles peuvent tre rcrites sous la forme unique suivante :

+ + , [1, ]

1, 1, ,

2, + 1, ,

ECONOMETRIE Page 40
ECONOMETRIE 2011 2012

1 0 0

1 0 0
Modle (4) +
+1 0 0 1
[ ]
[ ] [0 0 1 ] [ ]

4 SCR SCR
(2, 4)
2 SCR

= Somme des carrs des rsidus du modle complet

= Somme des carrs des rsidus du modle 4, le signifie alternatif

On peut dailleurs vrifier que cette SCR = SCR du modle 2 + SCR du modle 3

Le test de Chow ne sapplique que dans le cas o le modle 3 ne concerne quun petit
nombre dobservation, infrieur au nombre de variables explicatives du modle : dans le cas
SRC est la somme des carrs des rsidus du modle 2. Il porte souvent le nom de Test de la
covariance et la quantit F est crite dans la littrature ANACOVA.

SCR SCR 2
N CO
SCR

Sous N CO ( , 2 )

Le test de Chow est une prsentation un peu diffrente du test de comparaison de 2


coefficient de rgression, il est souvent en conomtrie car ces formules sintgre facilement
dans un logiciel de rgression. Ce test ne sapplique pas uniquement des priodes de temps
mais aussi des groupes dindividus. Dans les 2 cas, lobjet est souvent la recherche des points
de rupture et, pour cela, on peut utiliser les procdures suivantes :

- Calculer les statistiques ANACOVA, par des rgressions roulantes


La plus grande valeur trouve d N CO peut tre la valeur recherche
- Calculer les statistiques ANACOVA, par la mthode du Stepwise Chow
Mthode qui permet de dceler lexistence de plusieurs sous-priodes, ce qui ne
permet pas l N CO roulant. On calcule une statistique N CO ( ), o
+ 1, ,

ECONOMETRIE Page 41
ECONOMETRIE 2011 2012

Si ANACOVA( ) nest pas significatif, on conclue quil ny a pas de changement de


structure important sur la priode. Il est recommand dans cette premire procdure de choisir
le le plus petit possible pour que la premire estimation est un sens.

Si ANACOVA( ) est significatif quelque soit , dans ce cas on conserve, pour , qui
maximise ANACOVA. La priode 1, est alors dcoupe en 2 sous priodes, de 1 et de
+ 1 , et sur ces 2 sous priodes, on recalcule ANACOVA( ). On ritre tous ces calculs
jusqu ce qu N CO ( ) ne soit plus significatif.

Mthode de la rgression paramtres variables RPV de Cooley et Prescott :

Il sagit dune mthode destimation dun modle linaire pour lequel les paramtres ne
sont plus des constantes, comme dans le MLGS, mais soumis des variations de type alatoire.

, 1, ,

CP +

pour permanent : Composante permanente

Ce modle RP peut tre utilise ici, car il fournit aprs estimation lvolution (et leur
stabilit) des paramtres au cours du temps.

Il est galement possible dutiliser des mthodes plus rcentes, mais aussi beaucoup plus
compltes, et qui sont rassembl dans lappellation modle dEspaces dtat. Ces modles sont
estims par un algorithme informatique, complexes, du type algorithme non-linaire. Ce filtre
est utilis actuellement dans les recherches rcentes pour vrifier la stabilit des modles qui
calculent les ratios permettant de grer les portefeuilles.

ECONOMETRIE Page 42
ECONOMETRIE 2011 2012

Chapitre II
La discussion des hypothses du MLGS

Section 1 utocorrlation et Homoscdasticit de lala

Dans lestimation du MLGS, + par la mthode des MCO ou du MV, un certain


nombre dhypothses au dpart ont t formules, en particulier, lhypothse concernant lala
qui est homoscdastique et non auto-corrl. Dans ce chapitre nous dtruisons cette hypothse
et fournissons des tests pour les dtecter mais aussi des solutions pour les contourner. Une
mthode gnrale destimation peut tre propose dans le cas de lhtroscdasticit et/ou
dautocorrlation des estimateurs. Cette mthode a t propos par Aitken et la mthode porte
le nom de Moindre Carrs Gnraliss et le modle de rgression dans ce contexte est appel
Modle Linaire Gnrale. En fait, dans ce cours, nous mettrons laccent sur 2 grandes
hypothses, celle qui porte sur lala mais aussi celle qui concerne le rang de la matrice , cest-
-dire la colinarit.

A. La mthode des Moindres Carrs Gnraliss, la Mthode d itken et MLG.

Cette mthode est une solution lestimation des paramtres du modle de rgression
dans le cas o lala est htroscdastique et/ou auto-corrl. Considrons le modle
+ , de mme dimension que dans le MLGS. Toutes les hypothses du MLGS concernent
ce modle sauf pour lala.

[ ] 0

[ ]

Les alas peuvent tre htroscdastique et/ou auto-corrl.

Considrons un nouvel estimateur linaire gale

( + )

doit tre sans biais :

[ ]

[ ] [ + ]

[ ]+ [ ]

ECONOMETRIE Page 43
ECONOMETRIE 2011 2012

[ ]+ [ ]

[ ]

{[ [ ]] [ [ ]] }

[ ] si

Lestimateur doit tre de variance minimale

+ [ ] +

[ ]

{[ ][ ]}

{ } [ ]

Il faut maintenant diagonaliser les lments sur

{[ [ ]] [ [ ]]}

{[ ][ ]}

[ ]

symtrique

( ) scalaire
Matrice carr
symtrique

tr( ) + 2

( ) tr( )

[ ( ) ] [tr( )]

tr[ ( )]

tr[ ( )]

ECONOMETRIE Page 44
ECONOMETRIE 2011 2012

tr[ ]

tr[ ]

Lagrangien :

tr[ ] tr[ ( )]

tr[ ] tr[ ] + tr[ ]

Or tr[ ] tr[( )] tr[ ] tr[ ]

Donc tr[ ] tr[ ] + tr[ ]

tr[2 0] 0

Donc :

2 ( )

2( )

Donc 2 2( )

( ) et [( ) ]

Est-ce un estimateur de variance minimale ?

Soit ( + ) , avec [ ] , , 0

On a [[ [ ]] [ [ ]] ]

Nous devons montrer : + [ ]


Fonction quadratique
dfinie positive

Donc est toujours suprieur ,donc correspond au minimum de la variance.

Lestimateur d itken scrit donc de la faon suivante :

ECONOMETRIE Page 45
ECONOMETRIE 2011 2012

( )

[( ) ] [( ) ]

( ) ( )

(
) ( )( )

( )

( )

(MLGS)

( )

( ) (
)

( )

B. Le problme de lAutocorrlation

Pour vrifier les hypothses concernant lala, on utilise le rsidu du modle estim.
Lala est un processus alatoire particulier dans la rgression puisqu chacun des instants ,
il est centr desprance nulle, homoscdastique, et non-auto corrl, la covariance entre deux
variables alatoires est gale 0.

Ce processus alatoire est thorique, et pour les conomistes, sauf si on ralise des
simulations, il est inconnu. On fait alors lhypothse que le rsidu du modle de rgression
est un chantillon (trajectoire/ralisation) du processus alatoire. En dautres termes,
un instant o on ralise une exprience qui est ritr, pour obtenir une variable alatoire, on
fait lhypothse que le rsidu linstant est un tat, un des rsultats de lexprience.

Avec cette hypothse, [ ] 0 se traduira par 0. Cette hypothse nest pas, en


gnral, teste, puisque par construction, on dmontre que la moyenne des rsidus du MLG est
gale 0. On dit que cest une hypothse ad hoc. [ ] [ ] & [ ] 0, cest deux
hypothse seront vrifis et tests partir de lchantillon , il faut donc dfinir par la suite, ce
que lon entend par variance, et covariance du rsidu , sachant que cest lobservation du
rsidu du modle pour chacun des instants , cest--dire une srie temporelle.

ECONOMETRIE Page 46
ECONOMETRIE 2011 2012

Dans ce paragraphe, on sintresse au problme de lautocorrlation dans les rsidus. La


prsence dune autocorrlation se manifeste par des volutions des rsidus qui prsentent plus
de rgularits quune srie qui serait purement alatoire. insi on dira quil y a autocorrlation
positive si une valeur est frquemment suivie par une valeur plus lev, et rciproquement.
On dira quil y a autocorrlation ngative si une valeur lev est frquemment suivi par une
valeur plus faible et rciproquement. Pour mettre en vidence cette autocorrlation, on fait
appel au coefficient de corrlation linaire simple que lon appelle, le coefficient
dautocorrlation. Cest le coefficient de corrlation linaire simple entre la chronique et elle-
mme, dcale sur laxe du temps. Si le dcalage est dun pas de temps, on calcule le coefficient
de corrlation dordre 1, sil est de deux pas de temps, il sera dordre 2, etc

Il est possible de calculer ces autocorrlations avec diffrents dcalages sur laxe du
temps, si on choisit des dcalages un pas de temps croissant, on pourra donc calculer,
construire, une succession de coefficient dautocorrlation , , , , . est le retard
maximal entre les deux chronique des rsidus dcals qui fournit une intersection suffisante
pour calculer le coefficient de corrlation. Lorsque ces calculs sont raliss, on peut alors mettre
en correspondance les dcalages 1, 2 avec les coefficients , . Cette correspondance
est une fonction des dcalages [1, ], dans [ 1; +1], cette correspondance est la
fonction dautocorrlation not F C, sa reprsentation graphique est un diagramme en bton
rpondant au nom de corrlogramme.

Lorsque lon peut constater une autocorrlation des rsidus, on peut vrifier les points
suivants qui peuvent tre lorigine de cette autocorrlation :

- Un facteur, une variable qui influence la variable endogne, de faon systmatique, a


t oubli dans la rgression. Il faut dans ce cas repenser la thorie et rcrire le
modle.
- La tendance dans les variables ou encore la saisonnalit dans les variables nont pas
t correctement limin, cest bien une source dautocorrlation.
- Le profil saisonnier varie au cours du temps et produit aprs son limination des
fluctuations parasites, cest aussi un cas classique menant de lautocorrlation.
- Des perturbations, telles que les guerres, les grves, les accidents climatiques, qui se
produisent plusieurs priodes, peuvent aussi crer des autocorrlations. Leurs
liminations (leurs prises en compte) par des mthodes de types extrapolation
linaire peuvent aussi tre sources dautocorrlation.
- Les erreurs de mesures sont aussi sources dautocorrlation.

Il peut cependant aussi exister de lautocorrlation dans les rsidus pour des raisons non
voques prcdemment, ou encore, on souhaite conserver cette autocorrlation parce que lon
considre que les raisons prcdentes doivent tre conserves. Tous ces cas reviennent
considrer lautocorrlation des rsidus, dans lestimation du MLGS, et donc, de faire appel
dutiliser le MLG sa place.

ECONOMETRIE Page 47
ECONOMETRIE 2011 2012

1. Les effets et la dtection de lautocorrlation

Pour montrer les effets de lautocorrlation des erreurs sur lestimation des paramtres,
on va utiliser le modle de rgression linaire

+ , Hypothse

R(1) | | 1

On va donc appliquer la mthode des moindres carrs ordinaires :

( )

Rappel :

( + + )

+ +

[ ] + [ ]

[ ] 0
{
0

ECONOMETRIE Page 48
ECONOMETRIE 2011 2012

[ + ]+

Etc

+ + +

R(1) M ( )( , Moyenne mobile)

[ ] [ ] 0

reste donc sans biais

[ ]

[ ] [ ]

[ ]+ [ ( )] + [ ]+ +2 [ ]+

+ +

(1 + + + )(Suite gomtrique d ordre infrieur 1)

[ ] [ ]

1
[ ]
1

1
[ ]
1

Comme le paramtre en valeur absolu est infrieur 1, on constate que si tend vers 0
(non-autocorrlation) alors on retrouve les rsultats de la rgression. Donc si tend vers 1
(forte autocorrlation), alors [ ]

En dfinitive, quand il y a autocorrlation

- Les estimateurs des paramtres du modle restent sans biais


- Les variances dchantillons des coefficients de rgression ne sont plus minimales, la
mthode des MCO nest plus la meilleure parmi toutes les mthodes destimations
linaires. Cette mthode sous-estime les variances vraies dans le cas
dautocorrlation positive, par exemple, ce qui a pour consquence une

ECONOMETRIE Page 49
ECONOMETRIE 2011 2012

surestimation de la prcision de lestimation. Dans le cas dune prvision, on obtient


alors des valeurs de lendogne qui ne sont pas les meilleures possibles.

Lexistence dune autocorrlation des rsidus remet en cause lajustement du modle par
les moindres carrs. Il est donc indispensable de disposer des tests permettant de dtecter
lautocorrlation des rsidus.

La dtection des tests dautocorrlation des rsidus

On peut les regrouper selon 2 catgories : ceux qui sont bass sur une distribution
quelconque des rsidus et ceux qui sont bas sur une distribution thorique des rsidus.

- Le test Geary

Il fait partie de ces tests construits partir dune distribution quelconque des rsidus. Il
consiste comptabiliser les changements de signes des rsidus. Le nombre de rsultats trouvs
est compar au nombre de valeurs maximales et minimales d dans des tables de
valeurs critiques labores pour des seuils de 1 et de 5% en fonction du nombre
dobservations.

Si il y a autocorrlation positive, parce quil y a un petit nombre de changement


de signe, par contre, si il y a autocorrlation ngative, parce quil y a un grand nombre de
changement de signe. Ce test nest pas trs fiable pour de petits chantillons ( 20)

- Le test de Durbin-Watson

Texte manquant

( )
D-

On peut supposer :


Alors : D-

+ +

Avec les MCO, on trouve : D- 2(1 )

On constate avec cette expression que lorsque les erreurs ne sont pas auto corrles (
0) alors le Durbin-Watson approche les 2. Au contraire, si le 1, le D- 0 et si 1,
le D- 4.

ECONOMETRIE Page 50
ECONOMETRIE 2011 2012

On constate donc que le Durbin-Watson est compris entre 0 et 4 et que la non-autocorrlation


passe par la valeur 2 de la statistique.

La statistique de Durbin-Watson dpend de .Or, , donc :

+ + ( ) + ( ) +

Test Non-autocorrlation dordre 1

dpend aussi de , dans ces conditions, il est difficile de trouver le niveau de signification
exactes pour .

Pour tant le nombre de variables exognes, la statistique de Durbin-Watson est


comprises entre et indpendantes des . et sont des variables alatoires fonctions
de et sous les hypothses classiques de rgressions, les auteurs ont proposs les tables.

Le test se droule ainsi : On calcule le Durbin-Watson puis on construit le tableau


suivant :

0 2 4 4 4
Autocorrlation Doute tendant accepte Doute tendant Autocorrlation
positive vers l C 0 bsence dautocorrlation vers l C 0 ngative

Les tables de Durbin-Watson permettent de trouver et aux seuils de 1 et 5%,


pour 1 (si 1 , on interpole en arrire)
( )
D
Pour 100

Utilisation de la fonction dautocorrlation :

[ 1; 1]

est le coefficient de corrlation linaire simple, calcule entre une variable et elle-mme,
dcale sur l'axe du temps. Le dcalage seffectue un pas de temps. Si on effectue un dcalage
de 1 sur la partie commune des deux rsidus, on calcule un coefficient de corrlation que lon
appelle , avec un dcalage de 2, un coefficient , etc

0 1
1

Dcalage maximal

ECONOMETRIE Page 51
ECONOMETRIE 2011 2012

+1

On peut tester le corrlogramme :

On peut effectuer des tests individuels de ,

Test de Student

Ou des tests joints (tests du porte-manteau)

Les tests ont t conus par un statisticien du nom de Quenouille, lauteur dmontre que
la somme des carrs cumuls des autocorrlations successives obit un chi degr de
libert. Sur ce constat, un premier test a t construit par 2 auteurs Box-Pierce, puis plus tard
par Ljung-Box, en montrant que la statistique de Box-Pierce tait insuffisante et propose une
nouvelle statistique, et le test est alors le suivant :

0, [1, ]

( )
( + 1) , en supposant l homoscdasticit

Si il y htroscdasticit, on utilise la statistique de Box-Pierce corrige

( ), accepte

2. Solutions

Lorsquil y a autocorrlation des rsidus, on essaie dabord de dtecter quel est lorigine
de cette autocorrlation. Cest ce qui a t indiqu dans lintroduction de ce paragraphe. Souvent,
lautocorrlation est le rsultat dune forme inadapte du modle de rgression. Il est alors
conseill de reprsenter graphiquement la rgression entre le rsidu et les diffrentes
variables explicatives du modle. Si ce graphe, le nuage de rgression rvle pour la plupart des

ECONOMETRIE Page 52
ECONOMETRIE 2011 2012

formes non linaires, cela peut tre une indication pour transformer le MLGS de dpart (on
utilisera par exemple le logarithme des variables).

Dans certains cas, pour des raisons de thories conomiques, on souhaite conserver dans
le modle de rgression, avec lautocorrlation des rsidus. Pour cela, plusieurs techniques on
tait propos :

- On peut utiliser, par exemple, le modle autorgressif des rsidus pour transformer
les variables du modle.

Si le modle autorgressif des rsidus est de retard, on transformera le modle en


utilisant lestimation de du modle autorgressif, et les variables transformes seront donc :
, , pour toutes les variables rgressives. Certains auteurs, comme Stone,
proposent dutiliser pour , la valeur 1, la transformation porte alors le nom de diffrences
premires, et scrit , , etc

En ralit cette transformation est inadquate a priori puisquelle est contraire lune
des hypothses du MLGS, celle qui concerne la stationnarit des variables (cf. Cours du M1).
Cette faon de procd partir de lestimation du modle autorgressif des rsidus, porte le nom
de mthodes des pseudo-moindres carrs gnraliss. Il existe dans la littrature deux versions
plus complte de ces transformations que lon appelle la mthode de Hildreth-Lu et Cochrane-
Orcutt

La mthode de Hildreth-Lu considre les paramtres , et du modle de


rgression suivant :

(1 )+ ( )+

Si 1{

] 1; +1[ ] 1; 0[ ; ][0; 1[

Hildreth-Lu utilise une mthode dichotomique. Il prend une valeur de au milieu des
deux intervalles prcdemment dcoups (-0,5 et 0.5), et pour chacune des deux valeurs de , il
calcule du modle de rgression, et en dduit, la somme des carrs des rsidus et conserve
lintervalle o la somme est la plus petite. Il ritre lopration jusqu ce que lintervalle trouv
soit infrieure une distance dfini au pralable.

La mthode de Cochrane-Orcutt, qui est plus populaire que la prcdente, procde de la


faon suivante :

On estime la valeur de au dpart par les MCO, sur le modle autorgressif des rsidus.
On transforme alors les variables en et , et on ritre la rgression de
dpart sur les variables transformes et . Ce que Cochrane-Orcutt, cest de recommencer
toute lopration en estimant nouveau le partir des rsidus de la nouvelle rgression , et
de retransformer les variable prcdente en et et les auteurs

ECONOMETRIE Page 53
ECONOMETRIE 2011 2012

proposent de recommencer cette procdure jusqu ce que les estimateurs de la rgression


convergent, cest--dire, jusqu ce quil ne se modifie plus. On peut vrifier que les 2 mthodes
donnent peu prs le mme rsultat.

C. Htroscdasticit

1. Dtection-effets

On considre prsent que scrit :

0
[ ]
0

Nous pouvons comparer le graphique des individus avec celui du processus de Bruit
Blanc, cest--dire avec un chantillon de Bruit Blanc centr, homoscdastique et non auto
corrl.

Cas dhomoscdasticit

Cas dhtroscdasticit

Il existe des tests plus prcis qui permettent de dtecter cette htroscdasticit.

ECONOMETRIE Page 54
ECONOMETRIE 2011 2012

Test de Goldfeld-Quandt

Ce test sappuie sur lhypothse suivante il y a htroscdasticit parce que lcart type
du modle de lerreur augmente proportionnellement avec lune des variables explicatives du
modle : par exemple la variable . Cette hypothse scrit donc :

[ ]
{
[ ]

Le test se droule de la faon suivante :

- On ordonne les observations de toutes les variables du MLGS en fonction des valeurs
croissantes de la variable .
- On nglige les observations centrales du rsultat obtenu et on appelle le nombre
de ces variables ngligs. Comme est diffrent , on prend pour 30,
8, pour 0, 1 , etc

On obtient ainsi 2 sous chantillons de cardinal , lun qui correspond aux petites
observations de et lautre aux plus fortes observations de . On ralise alors la rgression et
on estime le MLGS sur ces deux sous chantillons, et on appelle SCR la somme des carrs des
rsidus du premier sous chantillon et SCR la somme des carrs des rsidus du second sous
chantillon.

Les auteurs ont alors montr que sil y a htroscdasticit, alors le rapport obit une
loi de Fisher avec un degr de libert prcis. Le test se droule donc de la faon suivante :
lhypothse , cest quil y a homoscdasticit et , htroscdasticit. On calcule le rapport :

SCR 2 2
( ; )
SCR 2 2

Test de Glejser

Les hypothses de ce test sont identiques la prcdente. Lauteur proposer de rgresser la


valeur absolu du rsidu en fonction de et propose aussi diffrents types de relations pour
cette relation.

| | + , rgression linaire

| | +

| | +

ECONOMETRIE Page 55
ECONOMETRIE 2011 2012

On estime lun de ces modles par les MCO, et si les paramtres ne sont pas
significativement diffrents de 0 on considre quil y a homoscdasticit. Considrons par
exemple le premier modle :

| | + +

( + )

[ ] 0

[ ]

[ ] 0

[ ] [ + ]

[ + + ]

[ ] ( + )
, { [ ]
[ ] 0,

Dans la pratique :

| | + +

La matrice des variances-covariances indique une absence d'autocorrlation et


une prsence dhtroscdasticit avec lhypothse prcdemment dcrite. On applique
donc la mthode des MCO sur le modle qui conduit au modle estim :

| | +

Les hypothses sont les suivantes :

homoscdasticit, htroscdasticit

Ce test de Glejser est un test intressant parce quil permet de rsoudre le problme
de lestimation MLG. En effet, puisque lon connait et on peut construit matrice de
variance covariance des erreurs :

( + ) 0
[ ]
0 ( + )

Estimateur d itken : ( )

1
0
( + )

[ 0 ]

ECONOMETRIE Page 56
ECONOMETRIE 2011 2012

Dautres tests existent, le premier dentre eux est le test RCH ( utorgressif
Conditionnellement Htroscdastique), cr par Engle, en 82, pour modliser la volatilit
des cours boursiers.

On applique la mthode des MCO au modle, on estime les paramtres

cst + + + +

cst +


[ ] cst + homoscdasticit

H 0 homoscdasticit

MCO :

(p)

( ), accepte

Le test de Breusch-Pagan est un test similaire l RCH mais prend comme critre la SCR

Le test de White

cst + + + + + + + + (ventuellement)
+ +

0, [1, ]

2. Solutions

Lhtroscdasticit est un cas particulier de lautocorrlation on peut en conclure que


les effets de lhtroscdacticit sont identique ceux de lautocorrlation, savoir que les
estimateurs du MLGS restent sans biais mais ne sont plus de variance minimale. Comme
prcdemment, il faut proposer diffrentes propositions.

Utilisation du MLG des estimateurs d itken

ECONOMETRIE Page 57
ECONOMETRIE 2011 2012

0
[ ] htroscdasticit non auto corrl permet d estimer
0

( tant en fait )

Aitken : ( )

[ ]

[ ] ( )

(0, )

On peut utiliser aussi les MCO sur le modle transform au dpart :

+ (htroscdasticit)

[ ] , (homoscdasticit)

[ ] , (homoscdasticit non auto corrl)

MCO au modle transform

( )

[ ] ( )

On fait comme si on connaissait le modle transform pour arriver au rsultat suivant :

( )

et (( )( )) ( )

( )

( )
[ ] ( ) ( )

Nous voulons : soit [ ] [ ]

Or [ ] ( )

ECONOMETRIE Page 58
ECONOMETRIE 2011 2012

Donc nous devons avoir :

Si cela est possible, on obtient alors des estimateurs avec et

Exemple :

, [1, ]

0
[ ] Htroscdasticit car les sont diffrents
0

1
0
1
1
0
[ ]

1 0
Essayons [ ]
0 1

Donc :

Autre exemple :

+ +

, ( est reli linairement )

1 1
0 0

1 1
0 0
[ ] [ ]

1
0
1 1 1
[ ]; [ ] [ ]
1 1 1 1
0
[ ]

[ ]

ECONOMETRIE Page 59
ECONOMETRIE 2011 2012

+ +

Donc par les MCO :

1
( ; ) ( ; )

Conclusion (Rcapitulatif) :

0
[ ] Matrice diagonale, rgulire et dfinie positive
0

Nous avons vu les 2 cas :

- est connue (on lestime via 2 mthodes diffrentes : soit par le MLG, soit par une
transformation, puis par les MCO)
- nest pas connue, on ne peut pas lestimer, on ne connait pas

Les travaux dEngle ont montr la solution par la conception du modle RCH

Soit un modle (1) centr : ) +

[ ] 0; [ ] 0

[ ]

| | 1 (Sinon la variance deviendrait infinie)

Explication : Modle de

[ ] 0 Esprance non conditionnelle

Appelons { ,}

[ ] Moyenne conditionnelle

Donc si 0 alors [ ] [ ]

Dans le cadre du test ARCH :

+
(0; ), {
0 et 0

Dautres modles existent tels que le modle GARCH, ARCH-M, etc

ECONOMETRIE Page 60
ECONOMETRIE 2011 2012

Section II : La multi-colinarit et la relation variable explique avec le rsidu

A. Introduction

Dans cette section, nous allons tudier 2 hypothses du MLGS, qui ne concernent pas
directement lala comme dans la section prcdente (le MLG). Il sagit de lhypothse de la
relation entre la variable explicative et lala. Jusqu prsent, le MLG et le MLGS, on fait
lhypothse que les variables explicatives sont certaines et que la covariance entre lala et ces
variables est gale 0. Cette hypothse a servi pour effectuer toutes les dmonstrations
concernant le MLGS et le MLG. Nous tudions aussi dans cette section lhypothse concernant le
rang de , qui est lhypothse de la possibilit de calculer le vecteur
du MLGS et le vecteur du MLG

B. Hypothse de la relation entre la variable explicative et lala

Dans le cas o il y a dpendance entre les variables explicatives et lala, on peut


dmontrer que lestimation par les MCO ne conduit pas des estimateurs convergents, mme
si , le nombre dobservations, devient grand. Pour contourner cette difficult, on recherche des
variables qui sont non corrles avec , que lon appelle variable instrumentale, mais qui sont
corrles avec les variables explicatives, et cette faon de procd conduit la recherche dun
estimateur des variables instrumentales. Il est donc important, comme pour les autres
hypothses de la section 1 de ce chapitre, de pouvoir dtecter lexistence dune corrlation entre
les variables explicatives et cest justement lobjet du test de Hausman, de 1978, qui utilise cet
estimateur des variables instrumentales.

a. Lestimateur des variables instrumentales ( .I)

+ ( , 1)
( , 1) ( , )( , 1)

On va considrer variables, constante comprise :

, ,,

Matrice des variables instrumentales, non corrles avec

( ) 0 ou [ ] 0, 1, , et 1, ,

ECONOMETRIE Page 61
ECONOMETRIE 2011 2012

Pr-multiplions le MLGS par la matrice

Par hypothse :

Si | | 0 I ( )

I converge vers

La matrice contient les variables instrumentales qui peuvent tre des variables
contenues dans . Par construction, ces variables instrumentales doivent tre corrles avec
celles de .

( ) 0

Si tel nest pas le cas, lestimateur prcdent nexisterait pas. Si on pose que est le
produit matriciel suivant :

( )

lors I ( ) ( )

On peut montrer alors I ( )

De ce fait, on peut nouveau raliser des tests. Cette mthode convient par exemple
lorsquil y a des erreurs de mesures sur les variables (comme dans les donnes denqutes,
comme dans les donnes agrges, etc). Est-ce quil y a indpendance entre les variables
explicatives et lala ?

b. Le test dHausman

Ce test a pour hypothse :

non corrlation entre et

corrlation entre et

Sous lhypothse , la mthode des variables instrumentales et la mthode des MCO du


chapitre 1, conduisent des estimateurs convergents. Sous cette hypothse, on retient la
mthode des MCO qui est plus prcise. Sous lhypothse , les estimateurs des MCO ne sont
plus convergents ; dans ce cas, on retient la mthode des variables instrumentales.

ECONOMETRIE Page 62
ECONOMETRIE 2011 2012

On utilisera lestimateur de ald :

( I
) [ [( ) ( ) ]]

, +1
1

Nombre de variables explicatives

Nombre de variables explicatives + la constante

1 + 1 si et n ont pas de variables communes

si et ont variables communes

C. La colinarit

Dans le MLGS, lutilisation des MCO ou du maximum de vraisemblance suppose que les
variables sont linairement indpendantes, variant de1 . On dit quil y a colinarit
parfaites si ces variables sont relies entre elles par des variables de types linaires. Ces cas de
colinarits strictes sont rares (exemple : la dessaisonalisation sur variables dichotomiques) ;
lorsquils se produisent, il faut alors modifier le modle de dpart, comme nous lavons fait pour
la dessaisonalisation. On peut aussi supprimer dans un modle de rgression lune des variables
responsables de cette colinarit stricte. Dans la majorit des cas, il nexiste pas de colinarit
stricte mais il existe des quasi-colinarits, cest dire des relations dont le coefficient de
corrlation est proche de 1 sans tre gale 1. Dans ces cas de colinarits les calculs des
estimateurs peuvent tre entirement errons.

1. Effets de la quasi-colinarit

Premier effet : Les estimateurs des MCO tendent tre trs grands en valeur absolu.

( )

orthogonal

1 Lettre grecque nu
ECONOMETRIE Page 63
ECONOMETRIE 2011 2012

On choisit la matrice diagonale des valeurs propres laquelle on associe la matrice des
vecteurs propres qui est une matrice orthogonale, on peut alors crire :

| |

Si | | 0 0

Il y a alors colinarit entre les variables explicatives de dpart.

( )

( )

Si quasi-colinarit stricte, une ou plusieurs 0, alors la quantit et grandes


valeurs.

Deuxime effet : les variances covariances des estimateurs tendent tre trs grandes

Pour montrer ce rsultat, considrons :

, centres et rduites

( )
{
( ) [ ]

Elments diagonaux. On peut dmontrer quils sont gaux 1 (1 )

Sil y a colinarit entre 2 ou plusieurs variables explicatives :

[ ] grande

Troisime effet : On peut montrer que la variance totale des devient grande.

( )

ariance totale des tr( ) tr( )

ECONOMETRIE Page 64
ECONOMETRIE 2011 2012

Si les variables sont orthogonales (donc non-colinarit), alors :

1 ( 1)
tr( )

Exemple :

tr( ) tr (Somme des valeurs propres)

1
tr( )

tr( ) ariance Total des

Il existe dautres effets, mais moins rcurrents :

- Il est possible que la colinarit amne quun estimateur puisse disposer du mauvais
signe (- au lieu de +).
- La sensibilit quil peut exister la variation dune variable explicative : quand on
rentre une autre variable explicative au modle, il peut y avoir colinarit.
- La variance/covariance peut tre grande avec un test de Student indiquant que
lestimateur est ngligeable.

2. Dtections de la colinarit

Cette dtection peut tre ralise par des ratios ou par des tests.

a. Le calcul de (dj vu)


b. Le test de Klein (1962)

1
; coefficient de dtermination du modle

On calcul la matrice des coefficients de corrlations entre variables explicatives :

Si Prsomption de colinarit

ECONOMETRIE Page 65
ECONOMETRIE 2011 2012

c. Le test VIF (Variance Inflation Factor), de Marquardt (1960)

1
IF
1

Soit , ,

,
,
sont tous des IF
, ,
,

Il y a colinarit si IF

d. Le test de Farrar et Glauber (1967)

sont des variables explicatives orthogonales ou 1

ex 1 0 1, orthogonal , non colinarit


| |
0 1

La matrice ici est la matrice des coefficients de corrlation

Prsomption de colinarit | | 1

1
FG ( 1 [2( + 1) + ]) ln

Nombre de variables explicatives sans la constante

Si FG ( + 1), lhypothse dorthogonalit est rejete

1
FG ( 1 (2 + )) ln 1 2 ( 1)

e. Le test de Haitovsky (1969)

| | 0 | | 0 (colinarit)

| | 0 | | 0 (orthogonalit)

toujours gale +1

1
( 1 (2 + )) ln(1 | |)

ECONOMETRIE Page 66
ECONOMETRIE 2011 2012

Si 1 2 ( 1), accepte

f. Le test de Belsley - Kuh - Welsch (1980)

Colinarit si petites ou 0

(| | )

max

min

normalise

1 si les colonnes ( ariances) sont orthogonales

1 sil y a colinarit

3. Solutions

Ridge Regression (Hoerl, Kennard ; 1962)

( + )

[ + ( ) ]

Ridge-Trace

Le but tant de faire varier une valeur de telle manire que les , estimateurs ridge se
stabilise.

ECONOMETRIE Page 67
ECONOMETRIE 2011 2012

lgorithme doptimisation

min

Ridge-Regression gnralise

[( )( )+ ) ( )

Inverses gnralises de Marquardt

(1 )

Rgression sur composantes principales :

Base

L CP est toujours ralisable

Si Objectif lire linfo dans lespace donne par alors l CP ralisable si cette info est
lisible partir des axes de . tant constitue de vecteurs colonnes indpendants.

fonde la mthode de la rgression sur composantes principales.

Soit : + MCO

Par CP + , orthogonal

Puis par les MCO

ECONOMETRIE Page 68
ECONOMETRIE 2011 2012

Comment passe-t-on de ?

( )
1 Base
[ ] [ ]
[ ] [ ]

Avec orthogonal, orthogonal

Pour un nuage de points.


[ ]

[ ] [ ]

perpendiculaire ,

max [ ], 1 Diagonaliser

Pour B :

- Soit :

0 0
[0 0]
0 0

[ ]

70
, 1,2,3, alors 1
1,2,3 T

- Soit :

[ ]

Donc :

[ ]

ECONOMETRIE Page 69
ECONOMETRIE 2011 2012

[ ] [ ]
perpendiculaire
[ ]max
{

Base

pplication par l CP

D. Conclusion Hypothses de normalit de lala

Soit lala un processus alatoire, indpendamment et identiquement distribu (IID). Le


rsidu est considr comme une trajectoire du processus alatoire.

Le rsidu est une partie du processus alatoire il est aussi desprance nulle

Si lala est suppos normal alors : (0, ).

ECONOMETRIE Page 70
ECONOMETRIE 2011 2012

Question : Est-ce que lhistogramme constitu des rsidus du modle suit une loi
normale ?

- Test du

Test de Skewness

Symtrie normale ( )

( )( coefficient d asymtrie de Pearson)

(0, )

0
(0,1)

RDD :

- Si | | , accepte au risque

- Si | | , rejete au risque

Test de Kurtosis :

platissement normal

ECONOMETRIE Page 71
ECONOMETRIE 2011 2012

(3, 24 )

3
(0,1)
24

RDD :

- Si | | , accept au risque

- Si | | , rejete au risque

Jarque-Bera

( 3)
JB + (2)
24

Normalit de lala

RDD :

- Si JB (2), accept au risque


- Si JB (2), rejete au risque

(2) ,99

ECONOMETRIE Page 72
ECONOMETRIE 2011 2012

Fin du cours dconomtrie

Sign par :

(^)(^)
^ ^
(= - =)
() ()
POOKIPOOKI Votre fidle serviteur
ECONOMETRIE Page 73
2010
ECONOMETRIE 2011 2011 2012

Economtrie

ECONOMETRIE
H34VEN Page 74
Cours pour Licence 3, Semestre 6 Anne 2012

Vous aimerez peut-être aussi