Vous êtes sur la page 1sur 16

INTRODUCTION A LECONOMETRIE I 1.

En guise dintroduction

a) Economie et conomtrie Pour tudier un phnomne conomique, on essaie de reprsenter celui-ci par le comportement dune variable. Cette variable conomique dpend elle-mme dautres variables que lon relie entre elles par une relation mathmatique. Cette relation dfinit ce quon appelle un modle thorique. Par exemple, si on se propose dtudier la consommation dun certain bien par les mnages, la thorique conomique postule que C = f (R) . Toutefois, la thorie conomique se contente en gnral dindiquer les variables conomiques qui permettent dexpliquer le phnomne et suggre le signe probable des drives partielles. Elle ne nous renseigne pas sur un certain nombre de choses dont la forme exacte des fonctions (f) intervenant dans le modle (spcification du modle), et la dfinition et la mesure des variables qui la composent. Lobjet de lconomtrie est de tester la validit empirique des modles thoriques noncs. Pour cela elle doit postuler dabord une forme pour les fonction intervenant dans le modle. Cette fonction mathmatique restant bien entendu compatible avec les hypothses a priori du modle thorique. Ensuite, elle doit disposer dun chantillon dunits sur lesquelles ont t observes les variables du modles. Enfin, elle a recours aux tests statistiques afin de juger de la validit du modle qui a t spcifi. Ces tests portent entre autres sur la forme fonctionnelle du modle, test sur les paramtres, test sur les hypothses thoriques etc. b) Exemple de spcification et vocabulaires La thorie conomique postule une relation linaire entre la consommation et le revenu. Cette relation peut scrire C = c o + aR (fonction de consommation Keynsienne). Dans cette relation, C (la consommation) est la variable explique. On dit aussi variable endogne. R (le revenu) est la variable qui permet dexpliquer le niveau de la consommation. On dit que cest une variable explicatives ou encore variable exogne. Les paramtres c o et a sont des coefficients interprtables appels coefficients de rgression. c o et a reprsentent respectivement la consommation incompressible et la propension marginale consommer. Lobjectif du cours dconomtrie est de fournir des estimations de ces paramtres partir dun chantillon dobservations. Il existe en gnral deux types dchantillons en conomtrie - Echantillon en donnes temporelles ou sries chronologiques : les variables reprsentent des phnomnes observs intervalle rguliers

C t = co + aRt t = 1,...., T
Echantillon en coupe instantane ou coupes transversales : les variables reprsentent des phnomnes observs au mme instant sur plusieurs individus (au sens statistique)

C i = co + aRi i = 1,...., N

c)

Introduction dun terme alatoire

La relation prcdente suppose que le nuage des couples (C,R) saligne parfaitement sur une droite de pente a et dordonne lorigine gale c o . Or en pratique, cette forme parfaitement linaire nest pas observe ; la consommation scarte lgrement de la droite. Autrement dit il y a une diffrence entre les valeurs rellement observes de la consommation et les valeurs qui auraient t rigoureusement observes si la relation linaire avait t rigoureusement exacte. Cette diffrence peut provenir de trois sources : soit la relation qui lie C et R nest pas linaire, on parle dans ce cas derreur de spcification , soit dune erreur de mesure sur les variables C et R, soit enfin dune erreur dans la constitution mme de lchantillon, on parle alors derreur dchantillonnage. Ces diffrentes erreurs peuvent alors tre prises en compte travers une variable alatoire et le modle scrit

C i = co + aRi + i i = 1,.., N .

Consquence : la prsence dun terme alatoire implique que les estimations des paramtres c o et a seront aussi des variables alatoires. 2. Le modle linaire multiple

a) Motivation ? Le modle prcdent est un modle de rgression simple parce quil permet dexpliquer les variations dune variable (la consommation) en fonction des variations dune autre variable (le revenu). Or, il est rare, dans la ralit conomique, que lon puisse expliquer correctement les fluctuations dune variable par celles dune seule autre variable. En gnral, une ralit conomique met en jeu plusieurs variables explicatives dun phnomne donn. Par exemple, si lon considre notre fonction de consommation ci-dessus, il semble naturelle de rajouter, comme variable explicative de la consommation, le prix. En effet, si le revenu peut largement influencer le niveau de la consommation dun individu ou dun mnage, celui-ci nen reste pas moins influenc par le niveau du prix. On peut mme penser que le nombre denfants influence considrablement le niveau de consommation des mnages. Dans ces conditions, la relation devient C t = c o + aRt + bPt + cnenf t + u t t = 1,.., T . Pourquoi u t au lieu de

En effet, puisque la relation conomtrique change, alors lerreur que lon fait nest plus la mme que celle faite dans la spcification prcdente. Cependant, elle nest pas forcement plus petite : elle est tout simplement diffrente ! Cependant il nest pas possible de disposer de faon exhaustive de tous les facteurs dterminant la variable endogne. Lessentiel en conomtrie est de construire partir des variables disponibles une approximation acceptable de la ralit conomique tudie. b) Le modle linaire multiple Le modle linaire multiple gnralise le modle linaire simple en augmentant le nombre de variables explicatives. De faon gnrale, le modle linaire multiple scrit : Yi = a o + a1 X 1i + a 2 X 2i + ... + a K X Ki + u i i = 1;...; N (Eq3) La variable endogne est matrialise ici par Y, et les variables explicatives, au nombre de K, sont X 1 ; X 2 ;.....; X K . On entend ici par modle linaire un modle dans lequel la variable endogne sexprime comme fonction linaire des paramtres estimer. On fait les hypothses suivantes : Hypothses sur les variables : (H0) 1. les toutes les variables X 1 ; X 2 ;.....; X K , Y, sont observes sans erreur. Les variables explicatives ne sont pas alatoires (mais Y est alatoire travers le terme derreur). 2. lim X ' X / N = Q matrice finie et non singulire. 3. Rang (1; X 1 , X 2 ,..., X K ) = K + 1 N : il ny a pas de colinarit parfaite ou forte entre les variables explicatives. En dautres termes, certaines variables explicatives ne sont pas redondantes. Cela permet en effet dinverser facilement la matrice XX. On peut en pratique contrler cette hypothse. En cas de colinarit entre un groupe de variables, on prend une seule variable du groupe, celle-ci tant cens reprsente les autres. On peut utiliser cet effet efficacement lACP. Hypothse sur le terme derreur :

( H 1) E ( u i ) = 0i
Cela signifie que tous ce qui a t omis de lexplication de Y est desprance nulle. Donc, en moyenne, on ne se trompe pas.

( H 2) E (u i . X ki ) = 0i, k : les erreurs sont non corrles aux variables explicatives.


. ( H 4)
2 Var (u i ) = E (u i2 ) = u i : les perturbations ont la mme variance. On dit quelles sont

homoscedastiques (c--d distribues de la mme faon autour de leur moyenne commune). On parle aussi de perturbations sphriques.

( H 5) Cov(u i , u i ' ) = E (u i u i ' ) = 0 les termes derreurs sont indpendantes ou non corrles les unes aux
autres.
2 ( H 6) u i (0, u )

3.

Estimation du modle par la mthode des Moindres Carres Ordinaires (MCO)

Estimer le modle (Eq3) cest donner une estimation des paramtres du modles i.e. a o ; a1 ;...; a K . (On rappelle quun estimateur est une formule mathmatique qui permet de calculer une approximation (estimation) dune grandeur partir des donnes observes). La mthode destimation par les MCO cherche minimiser la moyenne des carrs des erreurs. Ceci revient donc rsoudre le programme suivant :
( ao , a1 ,..., a K )

Min

(Y
i

a o a1 X 1i ... a K X Ki ) ( PMCO )
2

Il sagit dun programme doptimisation simple. La rsolution de ce programme donne des estimateurs des paramtres a o ; a1 ;...; a K , que nous notons a o ; a1 ;...; a K . Ces estimateurs sont bien videmment fonction de Y et des

X k (k = 1..K ) .

Lexpression analytique des estimateurs est cependant plus aise donner si lon prsente au pralable lquation (Eq3) sous forme matricielle.

a) Ecrire matricielle du modle Lquation (Eq3) peut scrire facilement sous forme matricielle en empilant les N observations de Y dans un vecteur colonne.

X 11 1 Y1 1 X 12 . . Ainsi, en posant Y = Yi , vecteur (N,1) ; X = X 1i . . YN X 1N 1


ao 1 . a1 . , vecteur (K+1,1) ; et u = u i a = ak . . u N a K Lquation (Eq3) scrit matriciellement

X 21 X 22 . X 2i . X 2N

.... X K 1 .... X K 2 . , matrice (N, K+1) ;. X Ki ... . .... X KN

u , vecteur (N,1)

Y = Xa + u (Eq.3)
Les hypothses (H1), (H4) et (H5) se ramnent aux deux hypothses suivantes :

( H 1' ) E (u ) = 0 ;
rsiduelle)

2 ( H 4' ) E (uu ' ) = Var (u ) = u I N .(homoscdacticit et non autocorrlation

b) Rsolution du programme et estimateurs des MCO

Le programme des Moindres Carres Ordinaire ( PMCO ) se repose ainsi

Min[(Y Xa )' (Y Xa )] ( P' MCO )


a

Il est plus facile de manipuler ce programme. Posons f ( a ) = (Y Xa )' (Y Xa ) En dveloppant cette expression, il vient que

f (a) =

Les conditions de premier ordre pour le programme ( P ' MCO ) scrivent

f (a) = 0 , ce qui donne pour solution a a = ( X ' X ) 1 ( X ' Y ) . Cette solution est lestimateur des MCO du vecteur a. On le notera a mco . a = (a , a ,..., a )' on a alors les rsidus estims qui scrivent u = Y Y = Y Xa
mco 0 mco 1mco K mco
mco

A retenir
4.

a mco = ( X ' X ) 1 ( X ' Y )

Estimation par la mthode du maximum de vraisemblance. Comparaison avec les MCO

La vraisemblance en conomtrie est dfinie comme la probabilit dobserver un chantillon, tant donn les paramtres du processus ayant engendr les donnes. Si on observe un vecteur de variables alatoires x = ( x1, x 2,.., xk ) indpendantes et identiquement distribues suivant une loi f ( x, ) , alors la probabilit de lchantillon est le produit des probabilits associes chaque variable : L( x, ) =
i =1.. N

f ( x, ) .

Lestimation par la mthode du maximum de vraisemblance cherche trouver les valeurs du paramtre vectoriel qui rendent lobservation de lchantillon le plus vraisemblable. Intuitivement, puisque lon a effectivement observ lchantillon, cest que sa probabilit dapparition tait forte. Son on maximise la vraisemblance associe lchantillon, on peut remonter au processus gnrateur des donnes. Toutefois, deux conditions limitent le sens pratique de cette mthode. En effet le principe du maximum de vraisemblance suppose dabord de bien spcifier la forme fonctionnelle de la distribution f des observations. Si la loi des variables est mal choisie, alors le processus gnrateur des donnes ne correspondra pas celui choisi par lconomtre. on parle de biais de spcification et des choix alternatifs devront tre recherchs (mthodes des moments par exemple).Ensuite, il, faut quun seul paramtre 0 maximise la vraisemblance. Si on suppose donc que les termes derreurs suivent une loi normale Yi N ( X i a, u ) et la vraisemblance de
2

1 exp (Yi X i a ) 2 . 2 2 i 2 u 1 1 f (Y , a) = exp (Yi X i a) 2 . En remarquant que On a 2 N ( 2 ) 2 (Yi X i a) 2 = u 2 i = u ' u = (Y Xa)' (Y Xa) alors la log-vraisemblance du modle scrit
lchantillon scrit f (Y , a ) =

f (Y ,
i

2 u

2 ) avec f (Yi , u ) =

l (a, 2 , Y ) = N ln(2 ) / 2 N ln (Y Xa)' (Y Xa) . On constate que la mthode de vraisemblance donne le mme estimateur que celle des MCO : a mco = a MV .

5.

Juger de la qualit dajsutement du modle

Une fois estims les paramtres du modle, lon doit se poser la question de savoir si notre regression est assez bonne ou non. Il existe une faon simple de repondre cette proccupation: cest de comparer les Yi leurs

valeurs estimes Yi = ( Xa mco ) i . En pratque on compare plutot la variance des Yi = ( Xa mco ) i celle des Yi .
Plus explicitement on tablit que

Y
i
i

= Yi 2 + u i2 .
i i

On dfinit alors le rapport R =


2

Yi 2 Yi 2
i

u = 1 Y
i i

2 i 2

. Ce coefficient est appl coefficient de detrmenination

ou encore coefficienr de correlation multiple. Il determine la part de la variance des Yi explique par les Yi .
(Ecrire le r2 sans les sigma, c--d avec les matrices, faire ressorte SCR et SCE) Un mauvais R2 peut venir de loublie de variables explicatives, mauvaise spcification du modle (Box-Cox), ces m^mes causes peuvent etre lorigine de lautocorrelation de sresidus. Interprtation gomtrique de R2 Remarque: le R2 na pas une bonne interprtation si le modle ne comporte pas de terme constant. Le R2 nest pas vraiement un critre suffisant pour juger de la qualit dune rgression. En effet il est aisment manipulable et augmente artificiellement avec K et avec la forme sous laquelle les variables sont introduites dans le modle. Donc R2 ne permet pas de comparer des modles avec un nombre diffrents dexplicatives ou spcifies diffrement. Solution : on corrige le R2 des degrs de liberts. On obtient un R2 ajust tel que (1 R ) =
2

N 1 (1 R 2 ) N K

Le R2 ajsut tient compte du nombre dobservation (N) et du nombre de variables (K) Dfaut du R2 ajust: il peut tre ngatif, il est aussi manipulable par une transformation de y (on entre y en taux de croissance au lieu de lentrer en niveau). Il peut dimunuer lors de lintroduction dune nouvelle variable exogne dans le modle.
6. Proprits des estimateurs des MCO.

Comme les estimateurs des paramtres du modle sont des variables alatoires, il peut alors tre intressant dtudier certaines de leurs proprits distance finie et distance infinie.
6.1 Proprits distance finie a) Estimateur sans biais de a. On vrifie facilement que a mco est un estimateur sans biais de a : E ( a mco ) = a

Cela signifie donc quen moyenne le rsultat fourni par lestimateur a mco est gal la grandeur quon cherche
estimer,a. c) Variance de a mco

Var (a mco ) = E ((a mco a )(a mco a )' ) avec a mco a = ( X ' X ) 1 X ' u do V (a mco ) = 2 u ( X ' X ) 1
Si -

2u

nest pas connu, ce qui est le cas en gnral, on lestime par

2 Si on fait MCO alors on a mco =


dmontrer)

u' u SCR 2 comme un estimateur sans biais de u ( a = N K 1 N K 1

Si on fait MV, alors on obtient directement un estimateur de

2 2 : MV = SCR / N . Mais on voit que cet

estimateur est biais, car E ( uMV ) =


2

sous-estime la variance de

u2

N K 2 2 E ( MV ) = (1 K / N ) u u . La mthode du MV N 2 Cependant, asymptotiquement, MV = SCR / N est un estimateur sans biais

u2 ( le biais gale K/N tend vers o).

u2 ( X ' X ) 1 est la matrice de variance covariance estime de a mco , et les termes diagonaux de cette matrices 2 1 2 sont les variances estimes des paramtres ; soit a = ( u ( X ' X ) ) kk
k

c)

Efficacit de lestimateur des MCO

Thorme de Gauss-Markov a mco est le meilleur (de variance minimale )estimateurs linaire sans biais de a. on dit que

a mco est BLUE (Best

Linear Unbiased Estimator)

3.2 Proprits distance infinie a). Etude de la convergence des estimateurs des MCO

1 1 a mco = ( X ' X ) 1 ( X ' Y ) = a + ( X ' X ) 1 ( X ' u ) n n 1 si lim( X ' X ) / n = V X matrice finie et dfinie positive ou lim( X ' X ) = 0 (cette hypothse est moins forte
que la premire puisque la premire exclut que une Variable gale au temps figure dans les explicatives), , alors a mco tend en probabilit vers a. plim( a mco )=a.

a mco est donc un estimateur convergent de a.


d) Normalit asymptotique

Lapplication du thorme central limite de Linsdberg- montre que sous les hypothses du modle lestimateur centr dilat
2 N (a mco a) (0, u V X1 )

Mots cls: test unilateral, test bilateral, region de confiance, estimation par maximum de vrais, notion de covariance, coeff de corelation, independance entre variable, existence de la racine carr dune matrice definie positive, drive de fonction crite sous forme matricielle. estimateur sans biais, estimateur convergent, efficace. Matrice de variance covariance dun vecteur alatoire. Loi normale, loi de Student, loi de Fisher. d) Test sur les paramtres Rappel sur les tests paramtriques dhypothses: procdure et remarques

Un test statistique est une procdure de dcision sur une hypothse contre une autre (son alternative) partir dun chantillon exprimental de taille connu. Cest nest pas une dmonstration proprement dit. Un test statistique est, par nature, ngatif. Accepter lhypothse nulle (H0) ne signifie pas quelle est vraie, mais seulement que les observations disponibles ne sont pas compatibles avec cette hypothse et que lon na pas de raison suffisante de lui prfrer lhypothse lalternative compte tenu des rsultats exprimentaux obtenus sur lchantillon

Lhypothse de normalt des residus permet deffectuer un certain nombre de tests statistiques sur les paramtres du modles. En effet, si u (0, u I N ) alors a mco ( a, u ( X ' X ) ) . Mme si cette hypothse de
2 2

normalit savrait viole en pratique, les tests restent valables asymptotiquement grce au thorme central limite!

On a a k ( a k ,

2 ak

) donc

ak ak

2 2 (0,1) avec ak = ( u ( X ' X ) 1 ) kk inconnue

2 ( N K ) u

2 u

2 ( N K ) , a mco et 2 u sont des variables indpendantes. Pour le montrer, il suffit de

montrer que les variables gaussiennes a mco et u sont non corrles (i.e. Cov ( a mco , u ) = 0) (deux variables
gaussiennes indpendantes sont non corrles). Et de remarquer que les deux statistiques sont fonction de ces variables indpendantes. On a donc

t=

(a k a k ) u (( X ' X )) 1 kk )1 / 2 ( N K ) / N K
2 u 2 u

ak ak u (( X ' X ) ) kk
1

ak ak

St ( N K 1)

a) Test de significativit (significativit golbale du modle (test de Fisher: crire Le F de Fisher avec les R2, , et signficativi des coeffocient) i) Siginficativit dun coefficient

Tester la siginficativement dun coefficient a k revient poser la stratgie de test H 0

a k = 0 contre

H1

ak 0 .

ak St ( N K 1) . t k est couramment appl t de Student. k On choisit un niveau de risque de prmire espce (cest la proba de rejeter Ho alors quelle est vrai). est
On sait que sous H 0 , t k = encore appl seuil de significativit dans le cas des test de significativit. On peut donc construire un intervalle

ak t = 1 , t se lit dans une table de student (N-K-1) dgr de u liberts. t est apple valeur critique. Exemple pour = 0.05 , St(13)=2.16
de confiance pour a k : Pr ob Ainsi si t k t on accepte lhypothse nulle: le coefficient a k nest pas signifiactif, ou encore la variable

X k nest pas explicative , cest--dire quelle na pas dinfluence sur Y.


Si t k

t on rejette lhypthse nulle: le coefficient a k est signifiactivement diffrent de zero.

Rq : Lunit de mesure dun variable explicative naffecte sa siginficativit


ii) Test de significativit globale du modle

Aprs avoir estimer les paramtres du modle on peut se demander si tous les coefficient sauf la constante peuvent tre considrs comme nuls. Cela reveint se demander si aucuen des variables explicatives du modle nexplique Y. On dira que le modle est globalement significatif sil existe au moins une variable qui soit contre H 1 i / ai 0 significative. Pour tester cela, on test H 0 a1 = a 2 = ... = a K = 0
- Test de fisher

F=

R2 N K 1 F ( K , N K 1) K (1 R 2 )

on compare ce F au F tabul.

Test du ratio de vraisemblance (Likelihood Ratio)

Ce test compare au fait le modle estim avec lensemble des K variables explicatives au modle estim avec la constante seule. Cela permet de voir si les explicatives apportent quelque chose de significatif lexplication de Y. La statistqiue de est est donne par LR = 2(l 0 l1 ) H0.

2 ( K ) l 0 est la log-vraisemblance du modle sous

b) Test dgalit un valeur donne

H0
c)

a k = contre H 1
Test de r contraines

a k sous H0, on sait que t =

ak

St ( N K 1)

Lhypthse de nulit de lensemble des coefficients nest pas toujours la plus intrssante. On peut en effet tre amner tester, par exemple, dans une fonction de production si les rendement dchelle sont constants. Cela revient effectuer un test de contrainte linaire sur les paramtres. De faon gnrale, on peut tester lexistence de r contraintes linaires indpendantes sur les K paramtres du modle en posant C a = c avec Rang (C ) = r (on suppose que les r contraintes linaires sont
( r , K +1) ( K +1,1) ( r ,1)

indpendantes: il faut liminer toutes les quations redondantes) et

r K + 1 (si r=K+1alors lestimation na 1 plus son sens puisque les contraintes permetternt dobtenir les paramtres: a = C c )
et a3 + a 4 = 1 on a

Exemple : on se demande si a1 = a 2

a0 a1 0 1 1 0.......0 a 2 0 0 0 1 1........0 . = 0 . a K
On afit un test de Wald W =

( R12 R02 ) T k 1 F (r , T K 1) r (1 R12 )

R02 et R12 dsigne respectivement le coefficient de determination des estimations sous H 0 et H 1 .


Rq: le test de Fisher est un cas particulier du test de Wald. Donner lexpression de C et c et retrouver la statistique de Fisher.
e) Test sur les Hypothses de Base du modle

a) Test de moyenne nulle des rsidus On fait un test de student classique b) Test de normalit de residu

Tests graphques: Histogrammes, Q-Q plot Test non paramtriques (Shapiro-Wilks, Shapiro-Francia, Kolmogorov-Smirnov ) Tests paramtriques : ils sont bass sur les caractristiques de la distribution normale) (Jarque-Bera, AndersonDarling

Le

Jarque-Bera

est

calcul

partir

skewnesset

du

kurtosis

N k . JB = 6

2 1 2 2 S + 4 (K 3) (2) = 5.99 5%.

o S est le coefficient de skewness, K le kurtosis, and k represente le nombre de coefficients. cest pas trop grave sielle nest vrifie, on fait des tests asymptotqes de Wald si N est grand. Dans ce cas, le t de student suit asymptotiquement une loi centre-rduite!
c) Test dHomoscedasticie rsiduelle

Phnomne courant en coupe instantane et sur des donnes groupes.


2 H 0 Var (u i ) = i2 = u i

Test de White (1980)

On estime le modle (*) u

2 = a 0 + a1 X 1i + ...a K X Ki + b1 X 12i + ... + bK X Ki + i

LM = NR 2 2 ( p = 2 K ) quand N , p et R2 sont respectivement le nombre de variable


explicatives et le R2 du modle (*) A cette statistqiue du LM on peut associer un test de Fisher de nullit des coefficients (sauf la constante). F =

R 2 / 2K F (2 K , N 2 K 1) . (1 R 2 ) /( N 2 K 1)

Ce test est disponlible sur Eviews.


Test ARCH (pour des sries temporelles)

Les modles classiques de prvision de type ARMA supposent des series temporelles de variance constante (hypothse dhomoscdascticit). Cette modelisation nglige donc, eventuellement, linformation contenue dans le facteur residuel de la chronique. Les modles ARCH (AutoRegressive Conditional Heteroskedasticity ) permettent de modliser des chroniques qui ont une volatilit (ou variance ou variablit) instantane qui depend du pass. u t ARCH ( p ) u t = t xht , Soit H 0 : 1 = 2 = .. = p = 0 Si Ho est accepte, alors la variance de u t est constante, dans le cas contarire u t suit un ARCH(p). Le test est fond soit sur un test de Fisher classique, soit sur le test du Multiplicateur de Lagrange (LM). De manire pratique, on procde comme suit: on regresse le modle

t N (0,1) et ht2 = 0 + 1 t 1 + 2 t 2 + .. + p t p

u i2 = a 0 + a1u i21 + ....a p u i2 p + i (soit

u t2 AR( p) ). La statistique de test est LM = TR 2 2 ( p) quand T .


Ce test est disponlible sur Eviews.
Test de Chow

Ce test consiste effectuer un un test de comparaison des variances des rsidus des sous-priodes de la srie. Ce test est disponlible sur Eviews.
Test de Goldfeld-Quandt (1965)

Applicable si on connat la variable responsable de lhetroscedacticit . on test alors H 0 o X


j

i2 = 2 f ( X ji )

est la variable qui introduit lhtroscdacticit. pour dectecter cette variable on regresse le rsidu sur

chaque variable explicative. Une fois la varaible responsable trouve on effectue les tapes suivantes: - on classe les observations par ordre croissant des X j ;

on divise lchantillon en 3 sous chantillons on effectue la regression sur les 2 sous chantillon extrmes on forme F =

SCR2 /( N 2 K ) F ( N 2 K , N 1 K ) SCR2 est la somme des carres des rsidus SCR1 /( N 1 K )

sur le sous-chantillon 2, on calcul F en mettent le plus grand de SCR1 et SCR2 au numrateur. Limite de ce test: nest plus applicable si plusieurs variables sont responsables de lhtroscdasticit. Ce test nest pas disponlible sur Eviews. Mais est facile mettre en uvre.
Test de Breusch et Pagan (1979)

On test H 0

i2 = 2 f ( 0 + Z i ) o Z est la matrice des explicatives. Homoscdasticit = 0


2

Si f(x)= x i.e on adopte une forme linaire.

Pour metter en uvre ce test, on regresse u


Ce test nest pas disponlible sur Eviews.

sur les Z j , et on utilse la statistique

= NR 2 2 (l ) quand

N . R 2 est celui du modle de regression des u 2 i sur les Z j .

Test de Glejer

Cest un test trs simple qui permet de detecter lhtroscedacticit des residus. Son principe est de regresser la valeur absolue ou le carrs des residus sur lensemble des explicatives. On sinterrsesse alors la significativit globale des coefficients. Si les coefficients sont tous significativement nuls, il y a homoscedasticit; sinon il y a htroscedasticit, et les coefficients significatifs indiqueront les variables explicatives qui sont responsables de lhtroscdasticit. Ainsi le test de Glejer permet de detecter lhtroscedasticit ainsi que la cause de cette htroscedasticit.

RQ: Les resultats du test de Glejer peuvent etre le contraire de ce que donne un autre test (White par exmple). En effet le test de Glejer ne detecte que les forme linaires de lhtroscedasticit. Si cette htroscedasticit nest pas linaire (i.e. f non linaire) alors le test de Glejer concluera lhomoscedasticit.
d) Test dautocorrealtion rsiduelle lordre p

phnomne courant en srie temporelle


Definition de lautocorrlation

On

appele

coefficient

dautocorrlation

dordre

p,

le

coefficient

p dfinit

par avec

p =

cov(u t , u t p ) var(u t ) var(u t p )

cov(u t , u t p ) var(u t )

cov(u t , u t p ) = E ((u t m)(u t p m)) = p (fonction dautocovariance), m tant la moyenne de u t . On a


suppos ici que le procesus u est stationnaire ( la moyenne et la variance de u t existent et sont constantes, (independante de t), et les autocovarinces ne dependent pas du du nombre dedecalage, i.e. cov(u t , u t p ) = cov(u t +l , u t +l p ) = p ). On montre que lorsque le procesus est stationaire, les coefficients dautocorrlation diminue assez rapidement et tendent vers 0 et reciproquement. On peut tester cette decroissante rapide des coefficients. test de Box et Pierce, test de Ljung et Box.

1 = 0 il n y a pas dautocorrlation lordre 1 p = 0 il n y a pas dautocorrlation lordre p.

10

Lensemble

{ ,
1

,..., p ..} est appl fonction dautocorrlation ou corrlogramme. Cette fonction

sexprime en fonction de p.
Defintion de lautocorrelation partielle

On definit le coefficient dautocorrelation partielle dordre p (PAC en anglais) de la serie u t comme tant le coefficient de u t p dans la regression de u t sur 1, u t 1 ,....; u t p +1 , u t p .

Test graphique partir du corrlogramme, test de Bartlett

Un estimateur de

p est p =

t = p +1

(u

u )(u t p u )
t

(u
t =1

u )2

( car un estimateur de lautocovarince dordre p,

p = cov(u t , u t p ) = E ((u t m)(u t p m)) ,est p =


0 = var(u t ) est 0 =
H 0 p = 0p 1 (ut u ) 2 ) T 1 t =1

1 (ut u )(ut p u ) et un estimateur de T 1 t = p +1

Bartlett a cherch tester si les coefficients dautocorrlation successifs sont significativement diffrent de 0.

Si le processus est stationnaire et de moyenne nulle (ce qui une hypothse faite sur les rsidus) alors sous H 0 ,

Bartlett montre que p N (0,1 / T ) quand T devient grand. Ainsi on rejette lhypothse de non autocorrlation des erreurs au seuil de 5 % ds que p 2 / T . Si on trace le corrlagramme (cest--dire les k pou k=1.p) on doit observer que les k ne sortent pas de la bande
Horizontale de largeur 2 / T autour de 0.
Test de Box-Pierce

Box et pierce testent la significativit des p premiers coefficients dautocorrlation. Le test est le suivant H 0 1 = 2 = .... = p = 0 . La statistique de test tablit partir de la statistique de Quenouille Q BP ( p ) = T
k =1. p

2 k

. Sous H0,

QBP ( p ) 2 ( p*) quand T . P*=p-nombre de est le nombre de paramtres estims. Accepter H0


cest dire que les coefficients dautocorrlation ne sont pas significativement diffrents de 0. Rq: Ce test ne pose pas de condition sur la moyenne des u t . Mais il est peu performant sur ptits chantillons.

Test de Ljung-Box (1979)

Ljung et Box ont constat que la distribution de Q BP deviait sensiblement de celle dun . Ils ont attribu ces carts lapproximation retenue pour claculer la variance des autocorrlations. Sur ce constat, ils proposent la statistique de ce test :
2

Q JB ( p) = T (T + 2)
T .

1 k p

T k

k 2

sous H0: non autocorrlation des erreurs, Q JB ( p )

2 ( p*) quand

11

Sil ny a aucune autoccorlation des erreurs lordre p, les k sont proches de 0 et les Q-stat de Ljung-Box
sont non significatifs avec des probabilits lves ( suprieures 0.05). Ce test sert tester si un processus est un bruit blanc (i.e. un processus stationnaire de moyenne nulle et dont les autocovariances sont nulles (sauf la variance)). En pratique, on prend p = Min T / 2;

3 T .

Remarque : L examen des PAC permet de detecter si la serie est autocorrle et lordre de cette autocorrelation. En effet les PAC sont les coefficients de la relation

ut = a0 + a1ut 1 + .. + a p ut p + t . Cest lcriture

formelle dun AR(p). Donc PAC ( k ) significativement non nul signifie quil y a autocorrlation lodre k. Un PAC nulle indique quil ny a pas dautocorrlation. Tester la nullit des PAC sest aussi tester la nullit des .

p . Les k sont gometriquement decroisants au dl de k = p , (on a une exponentielle et/ou une sinusoidale amortie); mais les k restent differents de 0 k . Autrement dit un AR(p) a une memoire infinie.
Pour un AR(p), les PAC (k) sont significativment nuls pour k Pour un MA(q)(i.e. u t = a 0 + t a1 t 1 ... a q t q ,o nuls partir de k

t est un bruit blanc), les k sont signicativement

q . Un MA a une memoire dodre q.

Remarque ( propos dEview) Tous ces tests sont disponibles sur Eview. Mais la formule du coefficient de corrlation qui est utilise est

p =

t = p +1..T

u u
t

t p 2 t

/(T p ) /T
. Ainsi en petits chantillon, cette formule sur estime le coefficient de corrlation,

t =1..T

mais le biais svanouit pour de grands chantillons.


Test de Durbin-Watson

On suppose que les explicative ne sont pas alatoires, donc la variable endogne retarde ne figure pas dans les explicatives (sinon elle serait corrle u i ) . Le modle doit tre spcifi avec un terme constant (**) u t = on test

u t 1 + t H 0 = 0 contre H 1 0
t =2 t t 1 2 t 1

u u on estime par MCO le modle (**), on obtient = u


t =2

(u u , on a DW = u
t =2 t 2 t =1

t 1

)2 2(1 )

les valeurs limites de cette statistique de Durbin-Watson sont tabules. Si DW < d l on rejette H0, il y a corrralion positive ( > 0) Si DW > 4 d l , on rejet H0, il y a corrralion ngative ( < 0) Si d u < DW < 4 d u on accepte H0 Dans les autres cas, il y adoute , mais il vaut mieux rejetter H0. La statistqiue de Durbin-Watson est disponible sour Eviews. Mais ce test nest pas applicable si le modle ne comporte pas de terme constant.

12

Si

la

variable

y t 1 figure dans les explicatives, on utilise le h de Durbin definit par:

h = (1

DW T ) o b est le coefficient de y t 1 dans le modle initial. Sous H0, h suit une ) 2 1 T var .est (b

loi normale centre reduite.


Test de Breusch-Godfrey (1978) (Serial correlation test- LM)

Ce test permet de detecter une autocorration dordre p, quelconque. On regresse les residus sur les variables explicatives et le p variables retardes de ce residu

u t = a0 + aX + 1u t 1 + 2 u 2 + ... + p u t p soit R 2 le R2 associ. LM = NR 2 2 ( p)


On peut aussi faire un test de nullit des Ce test est disponible sur Eviews.
f) Estimation en prsence dautocoorelation ou dhtroscdasticit rsiduelle: les Moindres Carres Gnralises (MCG)

(Wald ou Fisher).

Eviter de recourir au R2 sil ya autocorrelation. En prsence d heteroscdasticit ou dautocorrlation residuelle, on a E (u ' u ) = var(u ) = u avec
2

IN
En effet: si u t AR (1) ( u t = indpendantes de t) Alors on monte que E (u t ) = u =
2 2

u t 1 + t ) et les u t sont stationnaires (i.e. E (u t ) et var(u t ) existent et sont


2 1
et cov(u t , u t + p ) = E (u t .u t + p ) =
1

p 2 1

. (Ecrire la forme de

)
Dans ce cas, on a V (a mco ) = u ( X ' X )
2

X ' X ( X ' X ) 1 , ce qui diffre de lexpression habituelle

V (a mco ) = 2 u ( X ' X ) 1 .
Donc en prsence dheteroscdasticit ou dautocorrlation residuelle, les MCO donnent des estimateurs non efficaces, mais toujours sans biais. Les tests dhypothse, les intervalles de confiances utilisant les erreurs sont alors biaiss (on surestime le test de student c--d on accepte des coefficient qui ne sont pas significatifs). Solution ? On fait les MCG cest--dire on fait les MCO sur le modle y* = X * a + u * avec X * =
1 / 2

X et

y* =

1 / 2

y.
1

Ainsi a mcg va minimser f ( a ) = u ' u . On a


2 V (a mcg ) = u ( X ' 1 X ) 1

amcg = ( X ' 1 X ) 1 X ' 1 y

2 2 Comme dans le modle transform, V (u*) = u I alors mcg =

u* 'u* est un estimateur sans biais de N K 1 2 u2 . Et lestimateur de la matrice de variance-covariance de a mcg est V (a mcg ) = mcg ( X ' 1 X ) 1 .

Remarque: Les MCG en prsence dhtroscedasticit sont les Moindres Carrs Pondrs (MCP). En effet en prsence dhtroscdasticit, le modle transform y* = X * a + u * sobtient en divisant les observations par

zi * = zi / i

de

sorte

que

le

modle

scrit

en

instantane

y i / i = a 0 / i + a1 ( X 1i / i ) + ... + a k ( X ki / i ) + ... + u i / i

13

Tout ceci supose que est connu!!.


Cas particuliers: 1) Htroscedasticit du type
2 2 i 2 = 0 X ki ( seule la variable X k

est responsable de lhtroscedasticit, on

peut detecter cette forme par une simple regression des carrs des residus sur les carrs des explicatives) On divivise les observations par X ki suivant le principe des MCP.

2) Autocorrlation dordre 1

Yt = X t a + b + u t (1) et u AR(1) u t = u t 1 + t (2)


Alors

Yt Yt 1 = a( X t X t 1 ) + b(1 ) + t (3)

on

cherche

liminer

le

terme

derreur

du

modle(1)

on

obtient

Mthode simple destimation -

on estime par MCO le model initial (1) sans tenir compte de lautocorrelation des erreurs u mco
on recupre les u mco et on estime le modle (2). On obtient
on remplace

par dans (3) et on estime par MCO le modle (3).

Mthode de Durbin (2 tapes) -

ces estimateurs sont lis entre et rien ne nous garantit que ces contraintes sont cohrentes entre elles. On ne peut donc pas retenir tous ces estimateurs. On retient un seul: lestimateur de . on remplace

Yt 1 + aX t aX t 1 + b(1 ) + t on estime par lquation (4) par MCO et on obtient les estimations des paramtres , a , a et b.
on crit le modle (3) sous la forme (4) Yt =

Yt Yt 1
Notes finales

dans (3) = a( X t X t 1 ) + b(1 ) + t


par

et

on

estime

par

MCO

le

modle

1) La prise en compte de phonmne non linaires par le modle linaire

Le modle linaire permet de traiter une diversit de situations de non linarit. Il suffit dans certains cas dintroduire une variable supplmantaire. Exemple 1: Estimation dune fonction de Cout moyen On veut estimer le cout moyen (C.M) de la production (Q). On sait daprs la thorie conomique que cette relation nest pas linaire en Q, la courbe a une forme en U. Pour prendre en compte ce caractre non linaire de la rlation on pose que CM = a + bQ + cQ .
2

Exemple 2: Fonction de gains On veut tudier la rlation entre le salaire dun individu et ses caractristiques individuelles, comme le nombre dannes dtudes ( Ai ) et l exprience professionnelle ( Epi ) . Il est clair quune rlation du type

S i = a 0 + a1 Ai + a 2 Epi + u i ne donnera pas de resualts satisfaisants. En effet, ce modle revient


considrer que, toutes choses gales par ailleurs, une anne dexprience supplmentaire a le mme effet sur le

14

salaire dun individu en debut de carrire que sur celui dun autre qui a dj fait 20 annes dexprience. Or la thorie conomique nous suggre que le rendement marginal de lexprience professionnelle est decroissant. Autrement dit, les salaires croissent rapidement avec lexprience en dbut de carrire, et beaucoup plus lentement par la suite ( faire graphique). Ainsi la rlation raliste entre le salaire et lexprience est loin dtre linaire. Pour tenir compte de cette non linarit on peut crire le modle sous la forme S i = a 0 + a1 Ai + a 2 Epi + a3 Epi + u i . On sattend ce
2

que le paramtre a3 soit significatif et ngatif.

2) les variables indicatrices

Les variables indicatrices jouent un grand rle dans les modlisations conmtriques. En particuleir, elles permettent de prendre en compte dans les changements de comportements ou les changements structurels dans lvolution dun phnomne. Exemple 1: Estimation dune fonction de consommation en donnes temporelles On dispose de la consommation des mnages de la CI sur la priode 1975-2000. Un modle simple de consommation serait C t = a 0 + a1 Rt + u t . On peut se demander si la devaluation a eu un effet sur la consommation. Autrement est-ce quil ya eu changement de la consommation des mnages depuis la dvaluation. Le modle tel quil est spcifi ne nous permet pas de donner une rponse cette question. On va donc introduire une variable qui capte le changement conjoncturel.

0 si t 1994 Dt = 1 sin on
Le modle de consommation scrit donc C t = a 0 + a1 Rt + a 2 Dt + u t On sattend ce que le coefficient a 2 soit significatif et positif. Dans ce cas on peut dire que la devaluation a un effet sur la consommation. Exemple 2:Fonction de consommation en coupe instantane Considrons la fonction de consommation des mnages C i = a 0 + a1 Ri + u i . Il y a bien des raisons de penser que le nombre denfants du mnage influence considrablement le niveau de la consoamation du mnage. On peut alors penser estimer un modle du type C i = a 0 + a1 Ri + a 2 Nenf i + u i . Mais un tel modle est insatisfaisant. Il suppose en effet que limpact sur la consommation dun mnage dun enfant supplmantaire est identique que le mnage comporte 1 ou 6 enfants! Ce modle ne prend pas en compte lconomie dchelle. La relation ne peut pas etre linaire. Peut-elle etre quadratique? En effet on peut penser comme la rlation est linaire que le modle scrirait

C i = a0 + a1 Ri + a 2 Nenf i + a 2 Nenf i 2 + u i .
Toutefois, cette forme ne prend pas en compte la discontinuit dans leffet marginal dun enfant supplmantaire. En effet on sait par exemple que la naissance dun troisime enfants apporte un changement important dans les depenses: il faut dmnager, acheter une voiture plus grande etc. Pour tenir compte de la non linarit et de la discontinuit dans leffet du nombre denfants, on transforme la variable nombre denfants en trois variable indicatrices.

1 si le..mnage..n' a.. pas..d ' enfant 1 si...le...mnage..a.2..ou..3enfants N 2i = N1i = 0 sin on 0 1 si..lemnage..a. plus.de..3..enfants. N 3i = 0 sin on

15

(A completer; probleme de multicolinrait:soit on estime sans la constante et on garde les 3 Variable indicatrice, soit on estime avec la constante, mais on limine lune des 3 varaiables indicatrices) Exemple 3: Comparaisons de deux fonction de gains On dispose sur un chantillon
2 i

dindividus

dun

modle

de

gains

du

type S i = a 0 + a1 Ai + a 2 Epi + a3 Ep + u i . On se demande si le fait dtre homme ou femme a un effet sur le salaire. Pour cela on va introduire dans le modle la variable sexe valant 1 pour un sexe et 0 pour lautre. On sattend ce que le coefficient de cette variable soit significatif. On peut aller plus loin et se demander, si exprience professionnelles gales, les femmes ont les mmes salaires que les hommes. On ajoutes aux variables explicatives, la variable Sexe * Ep . On peut aussi faire un test de CHOW.

Le problme de la multicolinarit

Pour detecter la multocolinarit entre les explicatives on peut rgresser chaque explicative sur les autres. Si le R2 est bon alors il ya multicolinarit. La matrice de coorlation ne permet devoir que les corrlation entre les Variable deux deux, la colinarit nest pas transitive. Sil ya colinarit entre X1 et X2,on choisit le bon des deux. Pour cela on regresse le modle sans X1, puis sans X2, et on retient le modle qui a le plus ptit AIC. Pour detecter la multicolinarit, on peut penser une ACP.
Choix du nombre dexplicatives: la mthode de rgression pas pas (mthode descendante/ mthode ascendante)

Test de SHOW

Le test de Show permet dexaminer si les coefficients dune rgression sont stables par rapport aux observations utilises. Il compare donc les estimations deux sous-chantillons dobservation afin dexaminer si les coefficients sont significativement diffrents. Sur des donnes temporelles, ce test est appel test de stabilit temporelle. Sur des donnes en coupe le test de show est qualifi de test dhomognit des comportements. Le test de Show permet donc de rpondre des question du genre : la productivit du capital sest-elle amliore dans la priode rcente ? Est-elle la mme en Cte dIvoire quau Gabon ? A qualification gale, les femmes ontelles des salaires infrieurs aux hommes ? etc.
CE TEST UTILISE EN FAIT LES DUMMY VARIABLES.

16

Vous aimerez peut-être aussi