Vous êtes sur la page 1sur 16

INTRODUCTION A LECONOMETRIE I

1.

En guise dintroduction

a) Economie et conomtrie
Pour tudier un phnomne conomique, on essaie de reprsenter celui-ci par le comportement dune
variable. Cette variable conomique dpend elle-mme dautres variables que lon relie entre elles par une
relation mathmatique. Cette relation dfinit ce quon appelle un modle thorique. Par exemple, si on se
propose dtudier la consommation dun certain bien par les mnages, la thorique conomique postule que
C f (R) .
Toutefois, la thorie conomique se contente en gnral dindiquer les variables conomiques qui permettent
dexpliquer le phnomne et suggre le signe probable des drives partielles. Elle ne nous renseigne pas sur un
certain nombre de choses dont la forme exacte des fonctions (f) intervenant dans le modle (spcification du
modle), et la dfinition et la mesure des variables qui la composent.
Lobjet de lconomtrie est de tester la validit empirique des modles thoriques noncs. Pour cela elle doit
postuler dabord une forme pour les fonction intervenant dans le modle. Cette fonction mathmatique restant
bien entendu compatible avec les hypothses a priori du modle thorique. Ensuite, elle doit disposer dun
chantillon dunits sur lesquelles ont t observes les variables du modles. Enfin, elle a recours aux tests
statistiques afin de juger de la validit du modle qui a t spcifi. Ces tests portent entre autres sur la forme
fonctionnelle du modle, test sur les paramtres, test sur les hypothses thoriques etc.
b) Exemple de spcification et vocabulaires
La thorie conomique postule une relation linaire entre la consommation et le revenu. Cette relation
peut scrire C c o aR (fonction de consommation Keynsienne).
Dans cette relation, C (la consommation) est la variable explique. On dit aussi variable endogne.
R (le revenu) est la variable qui permet dexpliquer le niveau de la consommation. On dit que cest une variable
explicatives ou encore variable exogne.
Les paramtres c o et a sont des coefficients interprtables appels coefficients de rgression. c o et a
reprsentent respectivement la consommation incompressible et la propension marginale consommer.
Lobjectif du cours dconomtrie est de fournir des estimations de ces paramtres partir dun chantillon
dobservations.
Il existe en gnral deux types dchantillons en conomtrie
- Echantillon en donnes temporelles ou sries chronologiques : les variables reprsentent des phnomnes
observs intervalle rguliers
C t c o aRt t 1,...., T
- Echantillon en coupe instantane ou coupes transversales : les variables reprsentent des phnomnes
observs au mme instant sur plusieurs individus (au sens statistique)
C i co aRi i 1,...., N
c)

Introduction dun terme alatoire

La relation prcdente suppose que le nuage des couples (C,R) saligne parfaitement sur une droite de pente a et
dordonne lorigine gale c o . Or en pratique, cette forme parfaitement linaire nest pas observe ; la
consommation scarte lgrement de la droite. Autrement dit il y a une diffrence entre les valeurs rellement
observes de la consommation et les valeurs qui auraient t rigoureusement observes si la relation linaire
avait t rigoureusement exacte. Cette diffrence peut provenir de trois sources : soit la relation qui lie C et R
nest pas linaire, on parle dans ce cas derreur de spcification , soit dune erreur de mesure sur les variables C
et R, soit enfin dune erreur dans la constitution mme de lchantillon, on parle alors derreur
dchantillonnage.
Ces diffrentes erreurs peuvent alors tre prises en compte travers une variable alatoire et le modle scrit
C i co aRi i i 1,.., N .
Consquence : la prsence dun terme alatoire implique que les estimations des paramtres c o et
aussi des variables alatoires.

a seront

2.

Le modle linaire multiple

a) Motivation ?
Le modle prcdent est un modle de rgression simple parce quil permet dexpliquer les variations dune
variable (la consommation) en fonction des variations dune autre variable (le revenu). Or, il est rare, dans la
ralit conomique, que lon puisse expliquer correctement les fluctuations dune variable par celles dune seule
autre variable. En gnral, une ralit conomique met en jeu plusieurs variables explicatives dun phnomne
donn. Par exemple, si lon considre notre fonction de consommation ci-dessus, il semble naturelle de rajouter,
comme variable explicative de la consommation, le prix. En effet, si le revenu peut largement influencer le
niveau de la consommation dun individu ou dun mnage, celui-ci nen reste pas moins influenc par le niveau
du prix.
On peut mme penser que le nombre denfants influence considrablement le niveau de consommation des
mnages. Dans ces conditions, la relation devient C t c o aRt bPt cnenf t u t t 1,.., T .
Pourquoi u t au lieu de t ?
En effet, puisque la relation conomtrique change, alors lerreur que lon fait nest plus la mme que celle faite
dans la spcification prcdente. Cependant, elle nest pas forcement plus petite : elle est tout simplement
diffrente !
Cependant il nest pas possible de disposer de faon exhaustive de tous les facteurs dterminant la variable
endogne. Lessentiel en conomtrie est de construire partir des variables disponibles une approximation
acceptable de la ralit conomique tudie.
b) Le modle linaire multiple
Le modle linaire multiple gnralise le modle linaire simple en augmentant le nombre de variables
explicatives.
De faon gnrale, le modle linaire multiple scrit :
Yi a o a1 X 1i a 2 X 2i ... a K X Ki u i i 1;...; N (Eq3)
La variable endogne est matrialise ici par Y, et les variables explicatives, au nombre de K, sont
X 1 ; X 2 ;.....; X K .
On entend ici par modle linaire un modle dans lequel la variable endogne sexprime comme fonction
linaire des paramtres estimer.
On fait les hypothses suivantes :
Hypothses sur les variables :
(H0)
1. les toutes les variables X 1 ; X 2 ;.....; X K , Y, sont observes sans erreur. Les variables explicatives ne sont
pas alatoires (mais Y est alatoire travers le terme derreur).
2. lim X ' X / N Q matrice finie et non singulire.
3.
Rang (1; X 1 , X 2 ,..., X K ) K 1 N : il ny a pas de colinarit parfaite ou forte entre les variables
explicatives. En dautres termes, certaines variables explicatives ne sont pas redondantes. Cela permet en effet
dinverser facilement la matrice XX.
On peut en pratique contrler cette hypothse. En cas de colinarit entre un groupe de variables, on prend une
seule variable du groupe, celle-ci tant cens reprsente les autres. On peut utiliser cet effet efficacement
lACP.
Hypothse sur le terme derreur :

( H 1)

E ( u i ) 0i

Cela signifie que tous ce qui a t omis de lexplication de Y est desprance nulle. Donc, en moyenne, on ne se
trompe pas.
( H 2) E (u i . X ki ) 0i, k : les erreurs sont non corrles aux variables explicatives.

. ( H 4)

Var (u i ) E (u i2 ) u2 i : les perturbations ont la mme variance. On dit quelles sont

homoscedastiques (c--d distribues de la mme faon autour de leur moyenne


commune). On parle aussi de perturbations sphriques.
( H 5) Cov (u i , u i ' ) E (u i u i ' ) 0 les termes derreurs sont indpendantes ou non corrles les unes aux
autres.

( H 6) u i (0, u2 )
3.

Estimation du modle par la mthode des Moindres Carres Ordinaires (MCO)

Estimer le modle (Eq3) cest donner une estimation des paramtres du modles i.e. a o ; a1 ;...; a K . (On
rappelle quun estimateur est une formule mathmatique qui permet de calculer une approximation (estimation)
dune grandeur partir des donnes observes).
La mthode destimation par les MCO cherche minimiser la moyenne des carrs des erreurs. Ceci revient donc
rsoudre le programme suivant :

Min

( ao , a1 ,..., a K )

a o a1 X 1i ... a K X Ki ( PMCO )
2

Il sagit dun programme doptimisation simple. La rsolution de ce programme donne des estimateurs des
o ; a1 ;...; a K . Ces estimateurs sont bien videmment
paramtres a o ; a1 ;...; a K , que nous notons a
fonction de Y et des X k ( k 1..K ) .
Lexpression analytique des estimateurs est cependant plus aise donner si lon prsente au pralable lquation
(Eq3) sous forme matricielle.
a) Ecrire matricielle du modle
Lquation (Eq3) peut scrire facilement sous forme matricielle en empilant les N observations de Y dans un
vecteur colonne.

Y1

.
Ainsi, en posant Y Yi
.

YN

1
1

X 11
X 12

X 21
X 22

.... X K 1
.... X K 2

.
X
X 1i
.

1 X 1N

.
X 2i
.

, vecteur (N,1) ;

ao

a1

.
a
, vecteur (K+1,1) ; et u

a
k

a
K

X 2N

X Ki

, matrice (N, K+1) ;.

... .

.... X KN

u1

.
u i , vecteur (N,1)

.
u N

Lquation (Eq3) scrit matriciellement

Y Xa u (Eq.3)
Les hypothses (H1), (H4) et (H5) se ramnent aux deux hypothses suivantes :

( H 1' )

E (u ) 0 ; ( H 4' )

E (uu ' ) Var (u ) u2 I N .(homoscdacticit et non autocorrlation

rsiduelle)

b) Rsolution du programme et estimateurs des MCO


Le programme des Moindres Carres Ordinaire ( PMCO ) se repose ainsi

Min Y Xa ' Y Xa ( P ' MCO )


a

Il est plus facile de manipuler ce programme.


Posons f ( a ) Y Xa ' Y Xa
En dveloppant cette expression, il vient que f (a )
Les conditions de premier ordre pour le programme ( P ' MCO ) scrivent

f ( a )
0 , ce qui donne pour
a

mco .
solution a ( X ' X ) 1 ( X ' Y ) . Cette solution est lestimateur des MCO du vecteur a. On le notera a

a mco (a 0 mco , a1mco ,..., a K mco )'

a mco ( X ' X ) 1 ( X ' Y )

A retenir
4.

on a alors les rsidus estims qui scrivent u Y Y Y Xa mco

Estimation par la mthode du maximum de vraisemblance. Comparaison avec les MCO

La vraisemblance en conomtrie est dfinie comme la probabilit dobserver un chantillon, tant donn les
paramtres du processus ayant engendr les donnes. Si on observe un vecteur de variables alatoires
x ( x1, x 2,.., xk ) indpendantes et identiquement distribues suivant une loi
f ( x, ) , alors la
probabilit de lchantillon est le produit des probabilits associes chaque variable :

f ( x, ) .

L ( x, )

i 1.. N

Lestimation par la mthode du maximum de vraisemblance cherche trouver les valeurs du paramtre vectoriel
qui rendent lobservation de lchantillon le plus vraisemblable. Intituvement, puisque lon a effectivement
observ lchantillon, cest que sa probabilit dapparition tait forte. Son on maximise la vraisemblance
associe lchantillon, on peut remonter au processus gnrateur des donnes.
Toutefois, deux conditions limitent le sens pratique de cette mthode. En effet le principe du maximum de
vraisemblance suppose dabord de bien spcifier la forme fonctionnelle de la distribution f des observations. Si
la loi des variables est mal choisie, alors le processus gnrateur des donnes ne correspondra pas celui choisi
par lconomtre. on parle de biais de spcification et des choix alternatifs devront tre recherchs (mthodes des
moments par exemple).Ensuite, il, faut quun seul paramtre 0 maximise la vraisemblance.
2
Si on suppose donc que les termes derreurs suivent une loi normale Yi N ( X i a, u ) et la vraisemblance de

lchantillon scrit f (Y , a )
On

f (Y , a )

(Y X a) u
2

f (Y ,
i

1
(

2 )

2
u

) avec f (Y , 2 )
i
u

1
exp
2 2

(Y

1
exp
(Yi X i a) 2 .
2
2
2 u

X i a) 2 .

En

remarquant

que

u ' u (Y Xa)' (Y Xa) alors la log-vraisemblance du modle scrit

l (a, 2 , Y ) N ln(2 ) / 2 N ln (Y Xa)' (Y Xa ) .


On constate que la mthode de vraisemblance donne le mme estimateur que celle des MCO : a mco a MV .
5.

Juger de la qualit dajsutement du modle

Une fois estims les paramtres du modle, lon doit se poser la question de savoir si notre regression est assez
bonne ou non. Il existe une faon simple de repondre cette proccupation: cest de comparer les Yi leurs

valeurs estimes Yi ( Xa mco ) i . En pratque on compare plutot la variance des Yi ( Xa mco ) i celle des

Yi . Plus explicitement on tablit que

On dfinit alors le rapport R

Yi 2 u i2 .
i

u
1
Y

2
i

. Ce coefficient est appl coefficient de detrmenination

ou encore coefficienr de correlation multiple. Il determine la part de la variance des Yi explique par les Yi .
(Ecrire le r2 sans les sigma, c--d avec les matrices, faire ressorte SCR et SCE)
Un mauvais R2 peut venir de loublie de variables explicatives, mauvaise spcification du modle (Box-Cox),
ces m^mes causes peuvent etre lorigine de lautocorrelation de sresidus.
Interprtation gomtrique de R2
Remarque:
le R2 na pas une bonne interprtation si le modle ne comporte pas de terme constant. Le R2 nest pas
vraiement un critre suffisant pour juger de la qualit dune rgression. En effet il est aisment manipulable et
augmente artificiellement avec K et avec la forme sous laquelle les variables sont introduites dans le modle.
Donc R2 ne permet pas de comparer des modles avec un nombre diffrents dexplicatives ou spcifies
diffrement.
2
Solution : on corrige le R2 des degrs de liberts. On obtient un R2 ajust tel que (1 R )

N 1
(1 R 2 )
N K

Le R2 ajsut tient compte du nombre dobservation (N) et du nombre de variables (K)


Dfaut du R2 ajust: il peut tre ngatif, il est aussi manipulable par une transformation de y (on entre y en taux
de croissance au lieu de lentrer en niveau). Il peut dimunuer lors de lintroduction dune nouvelle variable
exogne dans le modle.
6.

Proprits des estimateurs des MCO.

Comme les estimateurs des paramtres du modle sont des variables alatoires, il peut alors tre intressant
dtudier certaines de leurs proprits distance finie et distance infinie.
6.1 Proprits distance finie
a) Estimateur sans biais de a.
mco est un estimateur sans biais de
On vrifie facilement que a

: E (a mco ) a

mco est gal la grandeur quon cherche


Cela signifie donc quen moyenne le rsultat fourni par lestimateur a
estimer,a.
mco
c) Variance de a

Var ( a mco ) E (( a mco a )( a mco a )' )

avec

a mco a ( X ' X ) 1 X ' u

do

V (a mco ) 2 u ( X ' X ) 1
Si

2u

nest pas connu, ce qui est le cas en gnral, on lestime par

u' u
SCR

comme un estimateur sans biais de


N K 1 N K 1

2u

2
Si on fait MCO alors on a mco

dmontrer)
2
Si on fait MV, alors on obtient directement un estimateur de 2 : MV SCR / N . Mais on voit que cet
2
estimateur est biais, car E ( uMV )

(a

N K
E ( MV ) (1 K / N ) u2 u2 . La mthode du MV sousN

2
2
estime la variance u Cependant, asymptotiquement, MV SCR / N est un estimateur sans biais de

u2 ( le biais gale K/N tend vers o).

u2 ( X ' X ) 1 est la matrice de variance covariance estime de a mco , et les termes diagonaux de cette
2
2
1
matrices sont les variances estimes des paramtres ; soit ak ( u ( X ' X ) ) kk
c)

Efficacit de lestimateur des MCO

Thorme de Gauss-Markov
a mco est le meilleur (de variance minimale )estimateurs linaire sans biais de a. on dit que a mco est BLUE
(Best Linear Unbiased Estimator)
c.2 Proprits distance infinie
a). Etude de la convergence des estimateurs des MCO

a mco ( X ' X ) 1 ( X ' Y ) a (

1
1
X ' X ) 1 ( X ' u )
n
n

si lim( X ' X ) / n V X matrice finie et dfinie positive ou lim( X ' X ) 1 0 (cette hypothse est moins
forte que la premire puisque la premire exclut que une Variable gale au temps figure dans les explicatives), ,
mco tend en probabilit vers a. plim( a mco )=a.
alors a

a mco est donc un estimateur convergent de a.


d) Normalit asymptotique
Laplication du theorme central limite de Linsdberg- montre que sous les hypothses du modle lestimateur
(0, u2V X1 )
centr dilat N ( a mco a )

Mots cls: test unilateral, test bilateral, region de confiance, estimation par maximum de vrais, notion de
covariance, coeff de corelation, independance entre variable, existence de la racine carr dune matrice
definie positive, drive de fonction crite sous forme matricielle. estimateur sans biais, estimateur
convergent, efficace. Matrice de variance covariance dun vecteur alatoire. Loi normale, loi de Student, loi
de Fisher.
d) Test sur les paramtres
Rappel sur les tests paramtriques dhypothses: procdure et remarques
Un test statistique est une procdure de dcision sur une hypothse contre une autre (son alternative) partir
dun chantillon exprimental de taille connu. Cest nest pas une dmonstration proprement dit. Un test
statistique est, par nature, ngatif. Accepter lhypothse nulle (H0) ne signifie pas quelle est vraie, mais
seulement que les observations disponibles ne sont pas compatibles avec cette hypothse et que lon na pas de
raison suffisante de lui prfrer lhypothse lalternative compte tenu des rsultats exprimentaux obtenus sur
lchantillon
Lhypothse de normalt des residus permet deffectuer un certain nombre de tests statistiques sur les paramtres

2
2
1
du modles. En effet, si u (0, u I N ) alors a mco (a, u ( X ' X ) ) . Mme si cette hypothse de
normalit savrait viole en pratique, les tests restent valables asymptotiquement grce au thorme central
limite!
On a

a k (a k , a2k ) donc

a k a k
(0,1) avec a2 ( u2 ( X ' X ) 1 ) kk inconnue
k
a k

( N K ) u2
2 ( N K ) , a mco et 2 u sont des variables indpendantes. Pour le montrer, il suffit de
2
u
mco et u sont non corrles (i.e. Cov( a mco , u ) 0) (deux variables
montrer que les variables gaussiennes a
gaussiennes indpendantes sont non corrles). Et de remarquer que les deux statistiques sont fonction de ces
variables
indpendantes.
On
a
donc

(a k a k )
u (( X ' X )) 1 kk )1 / 2
( N K ) u2 / u2
N K

a k a k

u (( X ' X ) 1 ) kk

a k a k
St ( N K 1)

a k

a) Test de significativit (significativit golbale du modle (test de Fisher: crire Le F de Fisher avec les
R2, , et signficativi des coeffocient)
i)

Siginficativit dun coefficient

Tester la siginficativement dun coefficient a k revient poser la stratgie de test H 0

a k 0 contre

ak 0 .

H1

On sait que sous H 0 , t k

a k
St ( N K 1) . t k est couramment appl t de Student.
k

On choisit un niveau de risque de prmire espce (cest la proba de rejeter Ho alors quelle est vrai). est
encore appl seuil de significativit dans le cas des test de significativit. On peut donc construire un intervalle

a k

t 1 , t se lit dans une table de student (N-K-1) dgr de


u

de confiance pour a k : Pr ob

liberts. t est apple valeur critique. Exemple pour 0.05 , St(13)=2.16


Ainsi si t k t

on accepte lhypothse nulle: le coefficient a k nest pas signifiactif, ou encore la variable

X k nest pas explicative , cest--dire quelle na pas dinfluence sur Y.


Si t k t on rejette lhypthse nulle: le coefficient a k est signifiactivement diffrent de zero.
Rq : Lunit de mesure dun variable explicative naffecte sa siginficativit
ii)

Test de significativit globale du modle

Aprs avoir estimer les paramtres du modle on peut se demander si tous les coefficient sauf la constante
peuvent tre considrs comme nuls. Cela reveint se demander si aucuen des variables explicatives du modle
nexplique Y. On dira que le modle est globalement significatif sil existe au moins une variable qui soit
significative. Pour tester cela, on test H 0 a1 a 2 ... a K 0
contre H 1 i / ai 0
- Test de fisher

R2
N K 1
F ( K , N K 1)
2
K
(1 R )

on compare ce F au F tabul.
-

Test du ratio de vraisemblance (Likelihood Ratio)

Ce test compare au fait le modle estim avec lensemble des K variables explicatives au modle estim avec la
constante seule. Cela permet de voir si les explicatives apportent quelque chose de significatif lexplication de
Y.

2
La statistqiue de est est donne par LR 2(l 0 l1 ) ( K ) l 0 est la log-vraisemblance du modle sous
H0.

b) Test dgalit un valeur donne

H0
c)

a k sous H0, on sait que t

a k contre H 1

a k
St ( N K 1)

a k

Test de r contraines

Lhypthse de nulit de lensemble des coefficients nest pas toujours la plus intrssante. On peut en effet tre
amner tester, par exemple, dans une fonction de production si les rendement dchelle sont constants. Cela
revient effectuer un test de contrainte linaire sur les paramtres.
De faon gnrale, on peut tester lexistence de r contraintes linaires indpendantes sur les K paramtres du
modle en posant

( r , K 1) ( K 1,1)

c avec Rang (C ) r (on suppose que les r contraintes linaires sont


( r ,1)

indpendantes: il faut liminer toutes les quations redondantes) et r K 1 (si r=K+1alors lestimation na
plus son sens puisque les contraintes permetternt dobtenir les paramtres: a C 1c )
Exemple : on se demande si

a1 a 2 et

a3 a 4 1 on a

a0

a1

0 1 1 0. . . .0 a2 0


0 0 1 1. . . . 0 . 0

.
a
K
( R12 R02 ) T k 1
F (r , T K 1)
On afit un test de Wald W
r
(1 R12 )
R02 et R12 dsigne respectivement le coefficient de determination des estimations sous H 0 et H 1 .
Rq: le test de Fisher est un cas particulier du test de Wald. Donner lexpression de C et c et retrouver la
statistique de Fisher.
e)

Test sur les Hypothses de Base du modle

a) Test de moyenne nulle des rsidus


On fait un test de student classique
b)

Test de normalit de residu

Tests graphques: Histogrammes, Q-Q plot


Test non paramtriques (Shapiro-Wilks, Shapiro-Francia, Kolmogorov-Smirnov
)
Tests paramtriques : ils sont bass sur les caractristiques de la distribution normale) (Jarque-Bera, AndersonDarling
Le Jarque-Bera est calcul partir skewnesset du kurtosis . JB

N k
6

1
2
2
2
S 4 K 3 ( 2) 5.99

5%.
o S est le coefficient de skewness, K le kurtosis, and k represente le nombre de coefficients.
cest pas trop grave sielle nest vrifie, on fait des tests asymptotqes de Wald si N est grand. Dans ce cas, le t
de student suit asymptotiquement une loi centre-rduite!
c)

Test dHomoscedasticie rsiduelle

Phnomne courant en coupe instantane et sur des donnes groupes.

H 0 Var (u i ) i2 u2 i
Test de White (1980)
On estime le modle (*)

u 2 i a 0 a1 X 1i ...a K X Ki b1 X 12i ... bK X Ki2 i

LM NR 2 2 ( p 2 K ) quand N , p et R2 sont respectivement le nombre de variable explicatives


et le R2 du modle (*)
A cette statistqiue du LM on peut associer un test de Fisher de nullit des coefficients (sauf la constante).

R 2 / 2K
F ( 2 K , N 2 K 1) .
(1 R 2 ) /( N 2 K 1)

Ce test est disponlible sur Eviews.


Test ARCH (pour des sries temporelles)
Les modles classiques de prvision de type ARMA supposent des series temporelles de variance constante
(hypothse dhomoscdascticit). Cette modelisation nglige donc, eventuellement, linformation contenue dans
le facteur residuel de la chronique. Les modles ARCH (AutoRegressive Conditional Heteroskedasticity )
permettent de modliser des chroniques qui ont une volatilit (ou variance ou variablit) instantane qui depend
2
du pass. u t ARCH ( p ) u t t xht , t N (0,1) et ht 0 1 t 1 2 t 2 .. p t p
Soit H 0 : 1 2 .. p 0
Si Ho est accepte, alors la variance de u t est constante, dans le cas contarire u t suit un ARCH(p). Le test est
fond soit sur un test de Fisher classique, soit sur le test du Multiplicateur de Lagrange (LM). De manire
2
2
2
pratique, on procde comme suit: on regresse le modle u i a 0 a1u i 1 ....a p u i p i (soit

u t2 AR( p ) ). La statistique de test est LM TR 2 2 ( p) quand T .


Ce test est disponlible sur Eviews.
Test de Chow
Ce test consiste effectuer un un test de comparaison des variances des rsidus des sous-priodes de la srie.
Ce test est disponlible sur Eviews.

Test de Goldfeld-Quandt (1965)


Applicable si on connat la variable responsable de lhetroscedacticit . on test alors H 0

i2 2 f ( X ji )

o X j est la variable qui introduit lhtroscdacticit. pour dectecter cette variable on regresse le rsidu sur
chaque variable explicative.
Une fois la varaible responsable trouve on effectue les tapes suivantes:
- on classe les observations par ordre croissant des X j ;
- on divise lchantillon en 3 sous chantillons
- on effectue la regression sur les 2 sous chantillon extrmes
-

on forme F

SCR 2 /( N 2 K )
F ( N 2 K , N 1 K ) SCR2 est la somme des carres des rsidus sur
SCR1 /( N 1 K )

le sous-chantillon 2, on calcul F en mettent le plus grand de SCR1 et SCR2 au numrateur.


Limite de ce test: nest plus applicable si plusieurs variables sont responsables de lhtroscdasticit.
Ce test nest pas disponlible sur Eviews. Mais est facile mettre en uvre.
Test de Breusch et Pagan (1979)
2
2
On test H 0 i f ( 0 Z i ) o Z est la matrice des explicatives. Homoscdasticit 0
Si f(x)= x i.e on adopte une forme linaire.
Pour metter en uvre ce test, on regresse u 2 i sur les Z j , et on utilse la statistique NR 2 2 (l ) quand

N . R 2 est celui du modle de regression des

u 2 i sur les

Zj.

Ce test nest pas disponlible sur Eviews.


Test de Glejer
Cest un test trs simple qui permet de detecter lhtroscedacticit des residus. Son principe est de regresser la
valeur absolue ou le carrs des residus sur lensemble des explicatives. On sinterrsesse alors la significativit
globale des coefficients. Si les coefficients sont tous significativement nuls, il y a homoscedasticit; sinon il y a
htroscedasticit, et les coefficients significatifs indiqueront les variables explicatives qui sont responsables de
lhtroscdasticit. Ainsi le test de Glejer permet de detecter lhtroscedasticit ainsi que la cause de cette
htroscedasticit.
RQ: Les resultats du test de Glejer peuvent etre le contraire de ce que donne un autre test (White par exmple).
En effet le test de Glejer ne detecte que les forme linaires de lhtroscedasticit. Si cette htroscedasticit
nest pas linaire (i.e. f non linaire) alors le test de Glejer concluera lhomoscedasticit.
d) Test dautocorrealtion rsiduelle lordre p
phnomne courant en srie temporelle
Definition de lautocorrlation
On

appele

coefficient

cov(u t , u t p )
var(u t ) var(u t p )

dautocorrlation

cov(u t , u t p )
var(u t )

dordre

p,

le

coefficient

p dfinit

par

avec cov(u t , u t p ) E ((u t m)(u t p m))

(fonction dautocovariance), m tant la moyenne de u t . On a suppos ici que le procesus u est stationnaire ( la
moyenne et la variance de u t existent et sont constantes, (independante de t), et les autocovarinces ne dependent
pas du du nombre dedecalage, i.e. cov(u t , u t p ) cov(u t l , u t l p ) p ). On montre que lorsque le
procesus est stationaire, les coefficients dautocorrlation diminue assez rapidement et tendent vers 0 et

10

reciproquement. On peut tester cette decroissante rapide des coefficients.


et Box.

test de Box et Pierce, test de Ljung

1 0 il n y a pas dautocorrlation lordre 1

p 0 il n y a pas dautocorrlation lordre p.

Lensemble 1 , 2 ,..., p ..
sexprime en fonction de p.

est appl fonction dautocorrlation ou corrlogramme. Cette fonction

Defintion de lautocorrelation partielle


On definit le coefficient dautocorrelation partielle dordre p (PAC en anglais) de la serie u t comme tant le
coefficient de u t p dans la regression de u t sur 1, u t 1 ,....; u t p 1 , u t p .
Test graphique partir du corrlogramme, test de Bartlett

Un estimateur de p est p

(u

t p 1

(u
t 1

u )(u t p u )
t

cov(u t , u t p ) E ((u t m)(u t p m)) ,est

estimateur de 0 var(u t ) est 0

( car un estimateur de lautocovarince dordre p,

u )2

1
(u t u )(u t p u )
T 1 t p 1

et

un

1
(u t u ) 2 )

T 1 t 1

Bartlett a cherch tester si les coefficients dautocorrlation successifs sont significativement diffrent de 0.

H0

p 0p

Si le processus est stationnaire et de moyenne nulle (ce qui une hypothse faite sur les rsidus) alors sous H 0 ,
Bartlett montre que p N (0,1 / T ) quand T devient grand.
Ainsi on rejette lhypothse de non autocorrlation des erreurs au seuil de 5 % ds que p 2 / T . Si on
trace le corrlagramme (cest--dire les k pou k=1.p) on doit observer que les k ne sortent pas de la bande
Horizontale de largeur 2 / T autour de 0.
Test de Box-Pierce
Box et pierce testent la significativit des p premiers coefficients dautocorrlation. Le test est le suivant
H 0 1 2 .... p 0 .
La statistique de test tablit partir de la statistique de Quenouille Q BP ( p ) T

k 1. p

2
k

. Sous H0,

QBP ( p ) 2 ( p*) quand T . P*=p-nombre de est le nombre de paramtres estims. Accepter H0


cest dire que les coefficients dautocorrlation ne sont pas significativement diffrents de 0.
Rq: Ce test ne pose pas de condition sur la moyenne des u t . Mais il est peu performant sur ptits chantillons.
Test de Ljung-Box (1979)
Ljung et Box ont constat que la distribution de Q BP deviait sensiblement de celle dun 2 . Ils ont attribu
ces carts lapproximation retenue pour claculer la variance des autocorrlations. Sur ce constat, ils proposent
la statistique de ce test :

11

2
k
Q JB ( p) T (T 2)
1 k p T k

2
sous H0: non autocorrlation des erreurs, Q JB ( p ) ( p*) quand

T .
Sil ny a aucune autoccorlation des erreurs lordre p, les k sont proches de 0 et les Q-stat de Ljung-Box
sont non significatifs avec des probabilits lves ( suprieures 0.05).
Ce test sert tester si un processus est un bruit blanc (i.e. un processus stationnaire de moyenne nulle et dont les
autocovariances sont nulles (sauf la variance)).
En pratique, on prend p Min T / 2;
3 T .

Remarque : L examen des PAC permet de detecter si la serie est autocorrle et lordre de cette autocorrelation.
En effet les PAC sont les coefficients de la relation u t a 0 a1u t 1 .. a p u t p t . Cest lcriture
formelle dun AR(p). Donc PAC (k ) significativement non nul signifie quil y a autocorrlation lodre k. Un
PAC nulle indique quil ny a pas dautocorrlation. Tester la nullit des PAC sest aussi tester la nullit des .
Pour un AR(p), les PAC (k) sont significativment nuls pour k p . Les k sont gometriquement decroisants
au dl de k p , (on a une exponentielle et/ou une sinusoidale amortie); mais les k restent differents de 0

k . Autrement dit un AR(p) a une memoire infinie.

t est un bruit blanc), les


Pour un MA(q)(i.e. u t a0 t a1 t 1 ... a q t q ,o
signicativement nuls partir de k q . Un MA a une memoire dodre q.

k sont

Remarque ( propos dEview)


Tous ces tests sont disponibles sur Eview. Mais la formule du coefficient de corrlation qui est utilise est

u u

t p 1..T

t p

t 1..T

/(T p )

2
t

/T

. Ainsi en petits chantillon, cette formule sur estime le coefficient de

corrlation, mais le biais svanouit pour de grands chantillons.


Test de Durbin-Watson
On suppose que les explicative ne sont pas alatoires, donc la variable endogne retarde ne figure pas dans les
explicatives (sinon elle serait corrle u i ) . Le modle doit tre spcifi avec un terme constant
(**) u t u t 1 t
on test H 0 0 contre H 1

u u
on estime par MCO le modle (**), on obtient
u
t 2

t 2

t 1

2
t 1

(u u
, on a DW
u
t 2

t 1

)2
2(1 )

t 1

les valeurs limites de cette statistique de Durbin-Watson sont tabules.


Si DW d l on rejette H0, il y a corrralion positive ( 0)
Si DW 4 d l , on rejet H0, il y a corrralion ngative ( 0)
Si d u DW 4 d u on accepte H0
Dans les autres cas, il y adoute , mais il vaut mieux rejetter H0.
La statistqiue de Durbin-Watson est disponible sour Eviews. Mais ce test nest pas applicable si le modle ne
comporte pas de terme constant.

12

Si

la

variable

y t 1 figure

dans

les

explicatives,

on

utilise

le

de

Durbin

definit

par:

DW
T
)
o b est le coefficient de y t 1 dans le modle initial. Sous H0, h suit
2
1 T var .est (b)
une loi normale centre reduite.
h (1

Test de Breusch-Godfrey (1978) (Serial correlation test- LM)


Ce test permet de detecter une autocorration dordre p, quelconque.
On regresse les residus sur les variables explicatives et le p variables retardes de ce residu
u t a 0 aX 1u t 1 2 u 2 ... p u t p soit R 2 le R2 associ. LM NR 2 2 ( p )
On peut aussi faire un test de nullit des i (Wald ou Fisher).
Ce test est disponible sur Eviews.
f)

Estimation en prsence dautocoorelation ou dhtroscdasticit rsiduelle: les Moindres Carres


Gnralises (MCG)

Eviter de recourir au R2 sil ya autocorrelation.


2
En prsence d heteroscdasticit ou dautocorrlation residuelle, on a E (u ' u ) var(u ) u avec

IN
En effet: si u t AR (1) ( u t u t 1 t ) et les u t sont stationnaires (i.e. E (u t ) et var(u t ) existent et
sont indpendantes de t)
2
2
Alors on monte que E (u t ) u

)
Dans ce cas, on a

2
p 2
et cov(u t , u t p ) E (u t .u t p )
. (Ecrire la forme de
1
1

2
V (a mco ) u ( X ' X ) 1 X ' X ( X ' X ) 1 ,

ce qui diffre de lexpression habituelle

V (a mco ) 2 u ( X ' X ) 1 .
Donc en prsence dheteroscdasticit ou dautocorrlation residuelle, les MCO donnent des estimateurs non
efficaces, mais toujours sans biais. Les tests dhypothse, les intervalles de confiances utilisant les erreurs sont
alors biaiss (on surestime le test de student c--d on accepte des coefficient qui ne sont pas significatifs).
Solution ?

y* X * a u *

On fait les MCG cest--dire on fait les MCO sur le modle

avec

X * 1 / 2 X et

y* 1 / 2 y .

1
1
1
Ainsi a mcg va minimser f ( a ) u ' 1u . On a amcg ( X ' X ) X ' y

V ( a mcg ) u2 ( X ' 1 X ) 1

u * ' u *
est un estimateur sans biais de
N K 1
2
1
1
est V ( a mcg ) mcg ( X ' X ) .

2
Comme dans le modle transform, V (u*) u I alors 2 mcg

u2 . Et lestimateur de la matrice de variance-covariance de a mcg

Remarque: Les MCG en prsence dhtroscedasticit sont les Moindres Carrs Pondrs (MCP).
En effet en prsence dhtroscdasticit, le modle transform
observations

par

zi * zi / i

de

sorte

y* X * a u *

que

le

modle

sobtient en divisant les


scrit

en

instantane

y i / i a0 / i a1 ( X 1i / i ) ... a k ( X ki / i ) ... u i / i

Tout ceci supose que est connu!!.


13

Cas particuliers:
1) Htroscedasticit du type

i 02 X ki2 ( seule la variable

X k est responsable de lhtroscedasticit, on

peut detecter cette forme par une simple regression des carrs des residus sur les carrs des explicatives)
-

On divivise les observations par X ki suivant le principe des MCP.

2) Autocorrlation dordre 1

Yt X t a b u t (1) et u AR (1) u t u t 1 t (2)


Alors

on

cherche

liminer

le

terme

Yt Yt 1 a ( X t X t 1 ) b(1 ) t (3)

derreur

du

modle(1)

on

obtient

Mthode simple destimation


-

on estime par MCO le model initial (1) sans tenir compte de lautocorrelation des erreurs u mco

on recupre les u mco et on estime le modle (2). On obtient


on remplace par dans (3) et on estime par MCO le modle (3).

Mthode de Durbin (2 tapes)


- on crit le modle (3) sous la forme (4) Yt Yt 1 aX t aX t 1 b(1 ) t
- on estime par lquation (4) par MCO et on obtient les estimations des paramtres , a , a et b.
ces estimateurs sont lis entre et rien ne nous garantit que ces contraintes sont cohrentes entre elles. On ne peut
donc pas retenir tous ces estimateurs. On retient un seul: lestimateur de .

dans
- on
remplace
par
(3)
et
on
estime
par
MCO
le
modle

Yt Yt 1 a ( X t X t 1 ) b(1 ) t
Notes finales
1) La prise en compte de phonmne non linaires par le modle linaire
Le modle linaire permet de traiter une diversit de situations de non linarit. Il suffit dans certains cas
dintroduire une variable supplmantaire.
Exemple 1: Estimation dune fonction de Cout moyen
On veut estimer le cout moyen (C.M) de la production (Q). On sait daprs la thorie conomique que cette
relation nest pas linaire en Q, la courbe a une forme en U.
Pour prendre en compte ce caractre non linaire de la rlation on pose que CM a bQ cQ 2 .

Exemple 2: Fonction de gains


On veut tudier la rlation entre le salaire dun individu et ses caractristiques individuelles, comme le nombre
dannes dtudes ( Ai ) et l exprience professionnelle ( Ep i ) . Il est clair quune rlation du type

S i a 0 a1 Ai a 2 Epi u i ne donnera pas de resualts satisfaisants. En effet, ce modle revient considrer


que, toutes choses gales par ailleurs, une anne dexprience supplmentaire a le mme effet sur le salaire dun
individu en debut de carrire que sur celui dun autre qui a dj fait 20 annes dexprience. Or la thorie
conomique nous suggre que le rendement marginal de lexprience professionnelle est decroissant. Autrement
dit, les salaires croissent rapidement avec lexprience en dbut de carrire, et beaucoup plus lentement par la
suite ( faire graphique).

14

Ainsi la rlation raliste entre le salaire et lexprience est loin dtre linaire. Pour tenir compte de cette non
2
linarit on peut crire le modle sous la forme S i a 0 a1 Ai a 2 Ep i a3 Ep i u i . On sattend ce que le
paramtre a 3 soit significatif et ngatif.
2) les variables indicatrices
Les variables indicatrices jouent un grand rle dans les modlisations conmtriques. En particuleir, elles
permettent de prendre en compte dans les changements de comportements ou les changements structurels dans
lvolution dun phnomne.
Exemple 1: Estimation dune fonction de consommation en donnes temporelles
On dispose de la consommation des mnages de la CI sur la priode 1975-2000.
Un modle simple de consommation serait C t a 0 a1 Rt u t .
On peut se demander si la devaluation a eu un effet sur la consommation. Autrement est-ce quil ya eu
changement de la consommation des mnages depuis la dvaluation.
Le modle tel quil est spcifi ne nous permet pas de donner une rponse cette question.
On va donc introduire une variable qui capte le changement conjoncturel.

0 si t 1994

1 sin on

Dt

Le modle de consommation scrit donc C t a 0 a1 Rt a 2 Dt u t


On sattend ce que le coefficient a 2 soit significatif et positif. Dans ce cas on peut dire que la devaluation a
un effet sur la consommation.
Exemple 2:Fonction de consommation en coupe instantane
Considrons la fonction de consommation des mnages C i a 0 a1 Ri u i . Il y a bien des raisons de penser
que le nombre denfants du mnage influence considrablement le niveau de la consoamation du mnage. On
peut alors penser estimer un modle du type C i a 0 a1 Ri a 2 Nenf i u i .
Mais un tel modle est insatisfaisant. Il suppose en effet que limpact sur la consommation dun mnage dun
enfant supplmantaire est identique que le mnage comporte 1 ou 6 enfants! Ce modle ne prend pas en compte
lconomie dchelle. La relation ne peut pas etre linaire. Peut-elle etre quadratique?
En effet on peut penser comme la rlation est linaire que le modle scrirait
C i a 0 a1 Ri a 2 Nenf i a 2 Nenf i 2 u i .
Toutefois, cette forme ne prend pas en compte la discontinuit dans leffet marginal dun enfant supplmantaire.
En effet on sait par exemple que la naissance dun troisime enfants apporte un changement important dans les
depenses: il faut dmnager, acheter une voiture plus grande etc.
Pour tenir compte de la non linarit et de la discontinuit dans leffet du nombre denfants, on transforme la
variable nombre denfants en trois variable indicatrices.

1 si le..mnage..n' a.. pas..d ' enfant


1 si...le...mnage..a.2..ou..3enfants
N 2i
N1i
0
0 sin on
1 si..lemnage..a. plus.de..3..enfants.
N 3i
0 sin on
15

(A completer; probleme de multicolinrait:soit on estime sans la constante et on garde les 3 Variable


indicatrice, soit on estime avec la constante, mais on limine lune des 3 varaiables indicatrices)
Exemple 3: Comparaisons de deux fonction de gains
2
On dispose sur un chantillon dindividus dun modle de gains du type S i a 0 a1 Ai a 2 Ep i a3 Epi u i .

On se demande si le fait dtre homme ou femme a un effet sur le salaire. Pour cela on va introduire dans le
modle la variable sexe valant 1 pour un sexe et 0 pour lautre. On sattend ce que le coefficient de cette
variable soit significatif.
On peut aller plus loin et se demander, si exprience professionnelles gales, les femmes ont les mmes salaires
que les hommes. On ajoutes aux variables explicatives, la variable Sexe * Ep .
On peut aussi faire un test de CHOW.
Le problme de la multicolinarit
Pour detecter la multocolinarit entre les explicatives on peut rgresser chaque explicative sur les autres. Si le
R2 est bon alors il ya multicolinarit. La matrice de coorlation ne permet devoir que les corrlation entre les
Variable deux deux, la colinarit nest pas transitive.
Sil ya colinarit entre X1 et X2,on choisit le bon des deux. Pour cela on regresse le modle sans X1, puis sans
X2, et on retient le modle qui a le plus ptit AIC.
Pour detecter la multicolinarit, on peut penser une ACP.
Choix du nombre dexplicatives: la mthode de rgression pas pas (mthode descendante/ mthode
ascendante)

Test de SHOW
Le test de Show permet dexaminer si les coefficients dune rgression sont stables par rapport aux observations
utilises. Il compare donc les estimations deux sous-chantillons dobservation afin dexaminer si les coefficients
sont significativement diffrents.
Sur des donnes temporelles, ce test est appel test de stabilit temporelle. Sur des donnes en coupe le test de
show est qualifi de test dhomognit des comportements.
Le test de Show permet donc de rpondre des question du genre : la productivit du capital sest-elle amliore
dans la priode rcente ? Est-elle la mme en Cte dIvoire quau Gabon ? A qualification gale, les femmes ontelles des salaires infrieurs aux hommes ? etc.
CE TEST UTILISE EN FAIT LES DUMMY VARIABLES.

16