Vous êtes sur la page 1sur 64

Cours dconomtrie 2003

Grard Grellet

ECONOMETRIE

Grard GRELLET

Cours dconomtrie 2003

Grard Grellet

L'conomtrie peut tre dfinie comme l'application des mthodes statistiques l'tude des phnomnes conomiques .Plus prcisment la dmarche conomtrique comporte trois tapes : 1) Construire un modle testable qui soit justifi par la thorie conomique et qui puisse tre vrifi statistiquement ; 2) Estimer les paramtres du modle ; 3) Vrifier que les carts entre les observations et les rsultats thoriques du modle ne sont pas systmatiques .

Historique

Premiers dveloppements Les tentatives de modlisation partir de donnes empiriques ont une longue histoire que l'on peut faire remonter aux " Political Arithmeticians " anglais du XVII me sicle et auxquels sont attachs les noms de William Petty , Gregory King et Charles Devenant . Gregory King chercha par exemple tablir une loi entre d'une part les dficits des rcoltes de bl et d'autre part les variations du prix du bl . A partir du XVIII me et surtout du XIX me sicle les conomistes tentrent d' tablir des lois conomiques l'instar des lois de la physique newtonnienne . Ce projet fut men en termes scientifiques par Moore puis par Schultz , Lenoir , Tinbergen et Frisch entre 1914 et 1938 . Les deux grands axes de recherche furent alors l'estimation d'une loi de demande ( ce qui conduisit au problme de l'identification ) et celle des cycles conomiques . Clment Juglar ( 1819 - 1905) fut le premier utiliser les sries temporelles pour analyser les cycles et fut suivit par Kuznets et Kondratieff . Toutefois les thoriciens du cycle se limitrent l'tude de la priodicit du cycle et ne s'attachrent gure celle de la quantification des relations causales sous jacentes. Leur apport l'conomtrie est donc rest marginal.

La naissance de l'conomtrie moderne L'conomtrie moderne est ne la fin des annes 30 et pendant les annes 40. Elle est la rsultante de trois phnomnes :le dveloppement de la thorie de l'infrence statistique la fin du XIX me sicle ; la thorie macroconomique et la comptabilit nationale qui offrent des agrgats objectivement mesurables ( contrairement la microconomie fonde sur l'utilit subjective ) ; enfin, et surtout , la forte demande de travaux conomtriques, soit de la part d'organismes publics de prvision et de planification , soit de la part dentreprises qui ont de plus en plus besoin de modliser la demande et leur environnement conomique gnral. A partir des annes 60 l'introduction de l'informatique et des logiciels standardiss va rendre presque routinire l'utilisation de l'conomtrie .

Cours dconomtrie 2003

Grard Grellet

En simplifiant de faon sans doute abusive l'on peut distinguer deux grandes priodes de la recherche conomtrique moderne . Jusqu' la fin des annes 70 l'conomtrie va tudier la spcification et la solvabilit de modles macroconomiques quations simultanes . Puis la suite de ce que l'on a appel la rvolution des anticipations rationnelles et de la critique de Lucas, la recherche se tournera davantage vers la microconomie et l'analyse des sries temporelles . Les modles conomtriques d'quations simultanes La plus grande partie de la recherche conomtrique amricaine ( effectue pour une large part au sein de la Cowles Commission ) entre 1944 et 1960 porta sur les conditions d'estimation des modles macroconomiques d'quations simultanes comportant un lment alatoire . En 1939 Tinbergen construisait un modle des cycles conomiques comportant 31 quations de comportement de 17 identits . Chacune des quations tait estime au moyen de la mthode des moindres carrs , ce qui , nous le verrons ne pouvait conduire qu' des estimations inconsistentes . En 1944 Haavelmo posait les conditions gnrales de solvabilit . Entre 1945 et 1950 Klein prsentait ses premiers modles dont la solution tait obtenue par la mthode du maximum de vraisemblance . En 1949 Koopmans dterminait les conditions de solvabilit dans le cas d'un modle linaire . En 1954 Theil introduisait la mthode des doubles moindres carrs permettant des calculs effectifs . Toutefois la gnralisation des modles conomtriques quations simultanes utilise pour des modles prvisionnels se heurta pendant longtemps au manque de moyens informatiques . Le premier modle utilis des fins prvisionnelles fut celui de Klein - Goldberger en 1955. D'autres modles suivirent la fin des annes 50 , en particulier celui de la Brookings Institution. Avec l'avance des techniques informatiques les annes 60 et le dbut des annes 70 virent une closion de modles macroconomiques jouant un rle important dans la prvision . Le modle dit de Brookings comprenait ainsi 400 quations . Aprs 1970 furent commercialiss des modles standards comme celui dit de Wharton . La stabilit relative de l'environnement conomique jusqu'en 1974 leur assura un certain succs .

L'analyse de la rgression L'importance des moyens consacrs la rsolution des problmes d'identification laissa quelque peu dans l'ombre la recherche sur la corrlation . Le principal obstacle thorique tait le traitement de l'autocorrlation des rsidus alatoires . En 1950 Durbin et Watson laboraient leur clbre test . Les annes 50 virent d'autre part l'apparition de modles retards chelonns avec les travaux de Koyck , d'Almon , de Cagan et de Friedman .

La rvolution des anticipations rationnelles et la remise en cause des modles macroconomtriques Les annes 70 furent celles de la remise en cause radicale des modles macroconomtriques labors pendant les annes 60 . Une des raisons vient de ce que l'abandon du systme de Bretton Woods puis le quadruplement du prix du ptrole conduisirent des bouleversements qui ne pouvaient tre anticips par les modles conomtriques . Au niveau thorique il apparut rapidement que les modles macroconomtriques ne possdaient pas de fondations microconomiques suffisamment solides . En particulier Lucas montra ds 1972 que si les agents forment leurs anticipations

Cours dconomtrie 2003

Grard Grellet

sur une base endogne partir de leur exprience il n'est plus possible de considrer que les coefficients structurels des modles macroconomtriques restent inchangs . Ainsi toute mesure de politique conomique doit conduire un changement dans le comportement des agents tant au niveau de la consommation que de l'investissement . Ceci remet bien videmment en cause les modles macroconomtriques traditionnels qui ne distinguaient pas les paramtres expliqus par des causes structurelles de ceux expliqus par la rponse aux mesures de politiques conomique . Une estimation de ces deux types de paramtres a t effectue par Lucas et Sargent qui les obtinrent directement comme solutions de modles d'optimisation dynamique . Sur cette base la recherche conomtrique des annes 80 porta sur les problmes d'agrgation des prfrences des agents , d'ingalit dans la rpartition de l'information et sur le processus d'apprentissage . Vers une conomtrie sans thorie ? La critique de Lucas a ouvert la voie des critiques plus radicales et a conduit certains conomtres comme Sims dnier la thorie toute pertinence dans l'estimation des modles . L'approche mme en termes d'anticipations rationnelles est alors rejete dans la mesure o elle ncessite une connaissance priori des dlais. Plus fondamentalement les modles macroconomtriques reposaient sur une distinction entre variables "endognes" et "exognes" . Cette distinction qui suppose une connaissance thorique priori est rejete. Cette critique a conduit retenir des modles autorgressifs o n'existe pas priori une classification entre variables endognes et exognes . La question de l'utilit de tels modles reste toutefois controverse dans la mesure o ils ne fournissent pas une explication structurelle de l'activit conomique .

Cours dconomtrie 2003

Grard Grellet

CHAPITRE I

LE MODELE CLASSIQUE DE REGRESSION LINEAIRE

Cours dconomtrie 2003

Grard Grellet

I - 1 ) La droite de rgression Dans ce chapitre nous chercherons dterminer une relation linaire entre une ou plusieurs variables explicatives (ou exognes) et une variable dtermine ( ou endogne) partir d'un ensemble de n observations temporelles . Nos observations sont partielles et constituent un chantillon (que nous supposerons ici reprsentatif) de l'ensemble des observations. Il s'agit donc d'estimer des coefficients partir d'un chantillon alatoire. Par exemple si nous avons une seule variable explique Y(t) et une seule variable explicative, X(t), nous chercherons dterminer si la relation entre ces deux variables peut tre estime par une relation linaire de type: (1-0) Y(t) = c(1) + c(2)* X(t) , t= 1, , n

o le signe * est signe de multiplication. les coefficients c(1) et c(2) devant tre estims partir de n observations (voir graphique 1-1).Cette droite est dite " droite de rgression".Remarquons que sur le graphique 1-1 les 10 observations peuvent tre considres comme un chantillon reprsentatif du nombre infini des observations possibles dans la mesure o nos observations sont effectues intervalles rguliers dans le temps. Les coefficients c(1) et c(2) sont dtermins de faon ce que la relation (1-1) minimise la somme des carts entre les valeurs observes Y(t) et les valeurs Y(t) donnes par la droite de rgression. La droite de rgression passe donc par le "milieu " des points observs ( voir annexe 1). Les carts entre les observations et la relation (1-1) peuvent tre expliqus par : des erreurs dobservation des variables explicatives qui ne sont pas inclues dans la relation (1-1) . Par exemple si Y(t) reprsente la consommation et X(t) le revenu, l'on sait que d'autres variables peuvent expliquer la consommation comme le temps quil fait , les modes , les possibilits demprunt. Il faut supposer que ces autres variables explicatives ont chacune une influence trs faible car sinon il faudrait les inclure explicitement dans la relation (1-1). Nous verrons dans le chapitre suivant comment dterminer si des variables explicatives importantes ont t oublies dans une fonction . des erreurs qui viennent de ce que la vraie relation n'est pas en fait linaire .

Dans ces deux derniers cas lon dit que la relation a t mal spcifie.

Ces trois sources d'cart sont considres ici comme alatoires ( cette hypothse sera examine au chapitre suivant). Nous dsignerons leur somme par e(t) au temps t.

Cours dconomtrie 2003

Grard Grellet

Nos observations seront donc considres comme la somme de c(1) + c(2)*X(t) et de llment alatoire e(t). L'analyse de la rgression peut tre facilement gnralise n variables.

Cours dconomtrie 2003

Grard Grellet

I - 2 ) Le problme des observations aberrantes L'on observe quelquefois des observations "aberrantes" dues soit une erreur grossire ( par exemple une erreur de virgule ) soit l'incorporation dans les donnes de cas exceptionnels . Considrons par exemple le cas du graphique 1 2 . Sur ce graphique lon constate deux observations aberrantes , celles des annes 1996 et 1997. Si nous les incluons dans nos observations nous obtenons une droite de rgression : Y = 0.7 + 0.62 X Par contre si nous ne les incluons pas notre droite de rgression devient : Y = 1.13 + 0.46 X Linclusion ou la non inclusion de certaines variables peut conduire des rsultats significativement diffrents. Dans ce cas il convient de s'assurer que les observations "aberrantes " ne proviennent pas d'une erreur de mesure . Si tel n'est pas le cas l'on peut chercher comprendre les raisons de l'apparition de ces cas exceptionnels et faire deux rgressions, l'une sans , l'autre avec ces observations.

Cours dconomtrie 2003

Grard Grellet

I 3 ) La prise en compte des variables qualitatives explicatives Par donnes qualitatives il faut entendre les donnes qui n'ont pas d'chelle de mesure mais que l'on peut classer en catgories. Certaines de ces donnes sont sans ambigut comme le lieu de naissance ou le sexe mais d'autres doivent tre considres avec prcaution comme les critres sociaux souvent arbitraires . Nous supposerons ici que toutes les variables qualitatives peuvent tre classes en deux catgories comme par exemple le fait de voter oui ou non une lection ,d'tre franais ou non, d'appartenir ou non aux moins de vingt ans, etc.. Lon peut alors tester si l'appartenance un groupe "qualitatif" entrane une diffrence objective sur la variable dtermine.

Cours dconomtrie 2003

10

Grard Grellet

Une variable qualitative qui peut prendre deux valeurs est appele variable binaire ( ou quelquefois variable muette ou encore variable auxiliaire ). Par exemple l'on peut chercher savoir si l'appartenance l'un ou l'autre sexe entrane une diffrence significative de salaire . L'on cre alors une variable binaire qui prend la valeur 1 pour les salaris masculins et 0 pour les salaris fminins . L'on aura donc le modle suivant : Y(i) = c(1) + c(2)*X(i) + e(i) o Y(i) est le revenu du nime salari et o X(i) est une variable binaire . Dans cet exemple simple c(1) mesure lesprance mathmatique du revenu fminin et c(2) lesprance mathmatique de la diffrence de salaire entre hommes et femmes . En effet : E ( Y (i)) = c(1) si X(i) = 0 et c(1) + c(2) si X(i) = 1 Pour savoir s'il existe une diffrence significative entre salaris masculins et fminins il suffit donc de tester si c(2) est significativement diffrent de 0. En fait les estimations de c(1) et de c(2) obtenues par rgression sont respectivement les revenus moyens des salaris fminins et la diffrence entre les revenus moyens des salaris masculins et fminins . Une autre application est d'tudier s'il existe une diffrence significative des paramtres d'une fonction conomique entre diffrentes priodes .Par exemple si nous considrons le graphique (1-3) l'on peut : - soit effectuer une rgression gnrale sur les dix observations et l'on obtiendra une estimation : Y = c(1) + c(2)* X , t = 1, ...., 10 soit considrer que les paramtres des cinq premires observations sont diffrents des paramtres des cinq dernires observations .Dans ce cas l'on procdera deux estimations : Y = c(1)' + c(2)'* X , t = 1, ..., 5

Cours dconomtrie 2003

11

Grard Grellet

= c(1)" + c(2)" *X

, t = 6, ..., 10

et l'on testera si c (1)' est significativement diffrent de c (1)" et si c (2)' est significativement diffrent de c(2)" Si tel tait le cas il ne serait pas lgitime d'effectuer une rgression sur l'ensemble des variables .

Cours dconomtrie 2003

12

Grard Grellet

I - 4 ) La rgression log log La rgression log log prsente deux avantages: elle permet de rendre linaire une relation non linaire; elle permet de faire apparatre les coefficients de la droite de rgression comme des coefficients d'lasticit puisque : dlog y / dlog x = dy/dx / x/y

I - 5 ) L'intervalle de confiance des coefficients

Dans la relation 1 - 1 nous avons estim un coefficient c(2) sur la base de n observations. La question p tre pose si ce coefficient est significativement diffrent de 0. Si tel n'tait pas le cas il n'existerait pas relation certaine entre les y(t) et les x(t). Pour dire si c(2) est significativement diffrent de 0 il faut que la valeur 0 ne soit pas comprise l'intri de l'intervalle de confiance construit autour de c(2) avec une probabilit d'erreur donne. Il n'est toutefois pas possible de calculer directement l'intervalle de confiance autour de c(2) puisque no ne connaissons pas directement l'cart type de c(2). L'on peut toutefois estimer celui ci mais il faut alors utiliser une loi de Student n-2 degrs de libert pour les valeurs tabulaires t associes des probabilit donnes. L'on peut ainsi montrer que l'intervalle de confiance autour de c(2) est :

( y yi ) /(n 2) 2 c(2) t ou c(2) t s 2 ( xi x )


o t est la valeur donne par la table de Student avec n-2 degrs de libert et une probabilit d'erreur donne. Si la valeur 0 n'est pas comprise dans l'intervalle de confiance construit avec une probabilit donne que relation entre les x(t) et les y(t) peut tre considre comme significative, ce qui ne signifie toutefois pa que les x(t) "dterminent" les y(t) ( voir p. ) L'on peut de faon quivalente calculer le t partir duquel la valeur 0 serait incluse dans l'intervalle de confiance soit c(2) +|t* s| = 0 ou c(2) / s = t Si t > t alors la relation entre les x(t) et les y(t) peut tre considre comme significative une probab donne . En pratique l'on peut considrer que t = 2 pour n > 20.

I 6 ) La rgression dans E-view 1) Crer un fichier pour rentrer les donnes File / New / Workfile Quick / Empty group

Cours dconomtrie 2003

13

Grard Grellet

Ou Importer les donnes d'un tableur Excel ( auquel l'on a donn un nom ): Procs / Import / Read Text / Excel / nom du tableur Ou Faire un copier coller dans le workfile avec le mme nombre de lignes et de colonnes que dans le tableur 2) Estimer les coefficients de la rgression Quick / estimate equation Ou Object/ equation L'on crit le nom de la variable dpendante suivie de c ( la constante) et du nom des variables explicatives. Les variables suivies de (1 ) , (-2) , (-3) etc sont les variables retards. Exemple : fbcf(-1) Pour crire les logarithmes des donnes l'on fait prcder log du nom de la variable . Exemple : log(fbcf) . Rappelons que les coefficients d'une quation logarithmique sont les coefficients d'lasticit Cliquer sur OK dans la bote de dialogue . L'estimation se fait en ajustant l'chantillon de faon ne pas tenir compte des donnes manquantes . E-views donne le choix entre plusieurs techniques d'estimation . Dans une premire approche l'on peut se contenter de la mthode des moindres carrs ( "LS") Rsultats L'on se bornera ne considrer que les t de Student des diffrents coefficients ( significatifs si t>2 )et le Durbin Watson ( qui doit tre proche de 2 ) Exemple :

Lon cherche estimer la relation , que lon suppose linaire , entre la consommation des mnages franais(CM) et le revenu national franais (R) entre 1989 et 1998. Ces donnes sont prsentes dans le tableau suivant construit partir de : new / workfile ( indiquer que le tableau va de 1989 1998) quick / empty group

Cours dconomtrie 2003

14

Grard Grellet

Pour estimer la droite de rgression lon clique sur : quick/estimate equation Lon demande alors destimer la relation CM=c(1)+c(2)*R Lon obtient alors :

Cours dconomtrie 2003

15

Grard Grellet

La droite de rgression est donc : CM = 1316 + 0.33R Remarquons que le Durbin Watson est trs faible (0.8) ce qui signifie ici que la spcification linaire de la fonction nest pas bonne ( voir chapitre suivant).

Cours dconomtrie 2003

16

Grard Grellet

Annexe 1

La droite de rgression

Soit un ensemble de n observations ( X(i) , Y(i)) , i = 1, , n L'analyse de la rgression consiste estimer les coefficients c(0) et c(1) d'une fonction linaire : Y(i) = c(1) + c(2)* X(i) + e(i) qui passe par le "milieu" des observations . La mthode la plus couramment utilise est la mthode dite des moindres carrs . Les coefficients c(1) et c(2) sont dfinis en minimisant la somme des carts e(i)_. L'on obtient alors : _ _ c'(2) = E ( x(i) x ) ( y (i) y ) _ E ( x (i) x ) _ _ _ c'(1) = Y c*(1) X La droite de rgression s'crira donc : Y = c'(1) + c'(2) X

Cours dconomtrie 2003

17

Grard Grellet

CHAPITRE II

LA REMISE EN CAUSE DES HYPOTHESES

DU MODELE LINEAIRE CLASSIQUE

Cours dconomtrie 2003

18

Grard Grellet

II 1) Les hypothses du modle classique de rgression linaire Le modle classique de rgression linaire est fond sur les quatre hypothses suivantes : 1) La relation entre la variable endogne et la variable exogne est linaire ; 2) Les variables endognes observes possdent un lment alatoire e . Cet lment alatoire peut provenir par exemple de l'existence d'erreurs non systmatiques d'observations ou du fait de la non prise en compte de certaines variables, en particulier de variables dont l'influence sur la variable endogne n'est pas systmatique . Dans le modle classique de rgression linaire l'on suppose de plus que : i) l'esprance mathmatique des lments alatoires est nulle : E(e)=0 ii) la variance de l'lment alatoire est constante ( hypothse d'homoscdasticit) iii) les lments alatoires sont statistiquement indpendants soit E ( e (i). e ( j ) ) = 0 , i et j iv) les lments alatoires sont distribus suivant une loi normale . Cette dernire hypothse est justifie par le thorme central limite . Ce caractre alatoire des erreurs constitue une hypothse fondamentale du modle classique . Elle est justifie si les erreurs n'ont pas un caractre systmatique . Ceci suppose que le modle de rgression n'ait pas oubli une variable explicative importante . C'est cette hypothse d'une loi de distribution statistique autour des vraies valeurs estimes qui va permettre de faire des estimations des paramtres du modle d'ajustement . 3) Les variables exognes sont certaines . Elles ne comportent donc pas d'lment alatoire. 4) Les variables exognes sont non corrles entre elles .

Nous examinerons dans ce chapitre la remise en cause de cinq de ces hypothses du modle classique de rgression linaire : 1) l'indpendance dans le temps des lments alatoires ; 2) la constance dans le temps de la variance des lments alatoires ; 3) le caractre non stochastique des variables exognes ;

Cours dconomtrie 2003

19

Grard Grellet

4) la non corrlation des diffrentes variables exognes; 5) la constance des coefficients du modle

II - 2 ) La remise en cause de la premire hypothse : Les rsidus sont auto - corrls Quand les lments alatoires sont corrls entre eux l'on a : e (t) = z e(t-1) + u(t) o u(t) est un lment alatoire d'esprance statistique nulle mais o z est significativement diffrent de 0 . Graphiquement le problme de l'auto-corrlation des lments alatoires peut tre reprsent sur le graphique (2-1) . Si les observations sont reprsentes par des croix le modle de rgression peut conduire l'estimation de la fonction Y = c(1) + c(2)* X . Or cette relation peut tre fausse si les e suivent la loi suivante : pour X< a , e >0 a <X < b , e < 0 X > b , e> 0 Pour mesurer l'auto - corrlation des lments alatoires l'on peut effectuer un test visuel soit utiliser le test de Durbin Watson Pour une taille d'chantillon donne et pour un nombre donn de variables explicatives la table des d du test de Durbin Watson donne deux valeurs critiques d (l) et d (v). - si d (l) < d < d (v) le test n'est pas concluant - si d < d (l) il existe une auto - corrlation positive entre les lments alatoires - si d > d (v) l'on peut considrer que n'existe pas d'auto - corrlation positive Ce test est inapplicable au modle retards chelonns. En pratique l'on peut considrer que n'existe pas d'auto-corrlation positive entre les rsidus si d> 2 . En cas de doute l'on peut chercher visualiser le comportement des e(t).

Cours dconomtrie 2003

20

Grard Grellet

D'o vient l'autocorrlation entre les lments rsiduels ? Elle peut natre de deux causes : - la mauvaise spcification de la fonction - l'omission d'une variable significative . a) La mauvaise spcification de la fonction . Supposons comme sur le graphique (2-1) que nous ayons estim une relation FF non linaire par une relation ff linaire . L'on constate alors que les carts sont distribus systmatiquement au dessus puis en dessous puis nouveau au dessus de la relation linaire b) L'omission d'une variable significative ou l'inclusion d'une variable non significative

Cours dconomtrie 2003

21

Grard Grellet

Supposons que le "bon" modle soit : Y' = c(0) + c(1)*X + c(2) *Z + u mais qu'il soit estim par une fonction de type: Y = c(0)+ c(1)* X + v Dans ce cas les rsidus ne sont plus distribus de faon alatoire autour de Y mais refltent le comportement de Z. Les consquences de l'omission de Z sont alors : 1) un biais dans l'estimation des paramtres 2) des erreurs dans l'estimation de la variance de X Comment dcle-t-on l'omission d'une variable significative ? L'auto - corrlation des rsidus n'est pas une preuve suffisante puisque nous venons de voir qu'elle peut provenir de la mauvaise spcification de la fonction . C'est pourquoi l'on l'on comparera les taux de rgression avant et aprs l'inclusion d'une nouvelle variable soit Ra(ncien) et Rn(ouveau) . L'on calculera alors : (Rn - Ra ) / nombre de paramtres de l'ancien modle (m) F = -----------------------------------------------------------------------( 1 - Rn) / nbr d'observations (N)- nbr de paramtres dans le nouveau modle (k) F est donn par la table de Fisher Sndcor . Si la valeur de F est suprieure la valeur de F tabulaire au niveau de signification de 5% avec pour degrs de libert m au numrateur et ( N - k ) au dnominateur l'on peut retenir l'hypothse que le modle originel est mal spcifi.

Cours dconomtrie 2003

22

Grard Grellet

Cours dconomtrie 2003

23

Grard Grellet

II - 2 La remise en cause de la seconde hypothse : l'htroscdasticit L'on dira que l'lment alatoire connat une htroscdasticit quand sa variance prsente de larges carts dans le temps. Il existe alors un biais important dans l'estimation des paramtres puisque toutes les observations n'ont pas le mme poids dans l'estimation de Y. Les observations dans les priodes o la variance est leve ont davantage de poids que les observations dans les priodes o la variance est faible. L'htroscdasticit peut tre forte dans le cas de phnomnes d'apprentissage . Pour dceler l'existence de l'htroscdasticit l'on utilisera soit un test visuel soit le test de Goldfield - Quandt . a) Le test visuel Sur le graphique (2-2) l'on constate une variance dcroissante avec le temps . Ce test doit tre utilis avec prcaution dans la mesure o la srie est courte . b) Le test de Goldfield - Quandt Dans le cas d'une rgression de Y par rapport X on calcule les rgressions pour le premier et le dernier quart de la srie soit : Y = c (1) + c (1)* X pour le premier quart Y = c(2) + c (2)*X pour le dernier quart On calcule ensuite la somme des carrs des rsidus pour les deux rgressions soit : 2 2 S C R (1) = e1 et S C R (2) = e 2 or S C R (1) / S C R (2) obit une loi de Fisher n - 2 degrs de libert . n = nombre total d'observations - nombre d'observations omises - 2 ( nombre de paramtres estims )

Si F dpasse le F tabulaire au niveau de signification de 5% alors l'hypothse d'htroscdasticit peut tre retenue.` Ce test suppose toutefois que nous puissions sparer la srie en deux parties : l'une avec une variance faible et l'autre avec une variance leve . c) Que faire en cas d'htroscdasticit ? L'on peut diviser les observations de Y par leur cart type de sorte que quand l'cart type est lev la pondration est faible. Cette procdure est disponible sous E view .

Cours dconomtrie 2003

24

Grard Grellet

II - 4 : Le non respect de la troisime hypothse : la multicolinarit La multicolinarit peut tre dfinie comme l'existence d'une relation linaire entre les variables indpendantes. Elle suppose donc l'existence d'une relation linaire telle que : c(1) *X(1) + c(2)* X(2) +...... + c(n)* X(n) = 0

Cours dconomtrie 2003

25

Grard Grellet

Quand n'existent que deux variables exognes la multicolinarit peut tre dcele en calculant directement les coefficients de corrlation entre les deux variables .L'on peut ainsi considrer qu'un coefficient de corrlation suprieur 0.9 ou 0.8 indique une trs forte association linaire et donc une colinarit . Dans le cas o le modle comporte plus de deux variables , par exemple si : Y= c(0)+ c(1)*X (1) + c(2)*X(2) + ... + c(n)* X(n) l'on testera n quations : X (1)= - c(2)/c(1)* X (2) - ... - c(n)/c(1)* X (n) X (2)= - c(1)/c(2)* X (1) - ... - c(n)/c(2) *X (n) ........................................................................................... X (n)= - c(1)/c(n) X (n)- .... - c(n-1)/c(n)* X (n-1) Si les variables sont fortement corrles il devient trs difficile de dterminer leur influence respective sur la variable dpendante . En d'autres termes pour que celle ci soit dcelable il faut que dans l'chantillon chaque variable indpendante ait un comportement indpendant. Statistiquement la multicolinarit conduit une trs large indtermination des paramtres et donc de trs grands intervalles de confiance. Elle se traduit par la non robustesse des coefficients estims en ajoutant ou en retirant une variable l'on modifie considrablement les coefficients des autres variables explicatives. Toutefois la multicolinarit n'entrane en elle mme aucun biais dans l'estimation des coefficients. Elle a les mmes consquences qu'un petit nombre d'observations. Elle n'est donc pas trs gnante pour effectuer des prdictions globales. Pour viter la multicolinarit il est ncessaire de ne travailler qu'avec un nombre rduit de variables explicatives que nous savons indpendantes les unes par rapport aux autres ce qui , malheureusement , appauvri le modle .

II - 5 Le non respect de la quatrime hypothse : Les variables indpendantes sont elles mmes des variables stochastiques Les variables explicatives peuvent tre elles mmes des variables stochastiques soit parce que la mesure de la variable est sujette erreur soit parce que la variable est elle mme dpendante d'une variable alatoire . Par exemple dans le cas de la relation Y=c(0)+c(1)*X + e X peut tre stochastique parce que sa mesure repose sur une estimation statistique sujette des erreurs non systmatiques . Deux estimations diffrentes effectues simultanment peuvent alors donner des rsultats diffrents . Mais X peut galement tre stochastique parce :

Cours dconomtrie 2003

26

Grard Grellet

qu'il dpend d'un lment alatoire : X = c'(0) + c'(1)* Y + e' Dans ces diffrents cas l'on ne peut savoir dans quelle mesure la diffrence entre la valeur observe de la variable endogne et la valeur donne de cette variable par la rgression est due une erreur sur la variable explicative ou au caractre alatoire de la variable dpendante. L'on constate sur le graphique (2- 3) que les valeurs possibles de Y sont comprises dans une ellipse et non sur une droite. Il est facile de comprendre que si une variable explicative est stochastique, les estimations de c(0) et de c(1) vont souffrir d'une large indtermination. Pour aussi frquent que soit le problme des variables explicatives stochastiques l'conomtre reste mal arm pour le rsoudre de sorte qu'il a souvent tendance passer le problme sous silence . Ce n'est que dans les cas les plus graves qu'il utilise la mthode des variables instrumentales . La mthode des variables instrumentales est simple dans son principe et difficile dans son application . Le principe est de remplacer une variable stochastique par une variable non stochastique dite "instrumentale" fortement corrle avec la variable . Par exemple si la rcolte de bl peut tre considre comme une variable stochastique l'on peut chercher la remplacer par un indicateur pluviomtrique si l'on sait par ailleurs que la corrlation est forte entre les fluctuations de la production cralire et celles de la mto. Plus prcisment l'on dira qu'une variable Z est instrumentale si : 1) la corrlation entre Z et e est nulle quand la taille de l'chantillon augmente ; 1) la corrlation entre Z et X n'est pas nulle quand la taille de l'chantillon augmente .

Cours dconomtrie 2003

27

Grard Grellet

Une telle procdure pose toutefois deux problmes . En premier lieu il nest pas toujours possible de trouver une telle variable instrumentale ; En second lieu l'utilisation des variables instrumentales conduit des estimations consistantes mais ne garantit pas des estimations non biaises.

Cours dconomtrie 2003

28

Grard Grellet

Nous reprendrons le problme des variables instrumentales au chapitre III.

II-6 Le non respect de la cinquime hypothse : les coefficients du modle ne sont pas invariants dans le temps Sur le graphique 1-3 l'on peut penser que la relation Y = c(1) + c(2)*X(t) recouvre en fait deux relations diffrentes: une relation :Y = c (1) + c(2)*X ( t ) pour t < t * et une relation Y = c(1)'' + c(2) *X ( t ) pour t > t * . Afin de tester une telle possibilit l'on utilisera soit des variables muettes soit le test de Chow . Ce dernier est effectu en calculant : F = SRC (5) / k SRC (4) / (N(1) + N(2) - 2 k ) Si SRC(1) est la somme des rsidus au carr de la rgression sur l'ensemble de la priode ; SRC(2) celle sur la premire priode ; SRC(3) celle sur la seconde priode , alors SRC(4) est dfini comme la somme de SRC(2) et SRC(3) et SRC(5) comme la diffrence entre SRC(1) et SRC(4) ; k est le nombre de paramtres estimer ; N(1) est le nombre d'observations de la premire priode ; N (2) le nombre d'observations de la seconde priode . L'on compare alors le F ainsi obtenu avec le F tabulaire , calcul avec un degr de confiance donn , un degr de libert gal k au numrateur et gal N(1) + N(2) - 2k au dnominateur . Si le F calcul excde le F tabulaire l'on peut rejeter l'hypothse que les deux rgressions sont identiques .

II 6 ) La pche miraculeuse la bonne rgression La pratique conomtrique se borne trop souvent tester diffrents modles partir d'un ensemble de donnes et slectionner celui qui possde le meilleur t de Student , le meilleur R et le meilleur coefficient de Durbin Watson . Nous allons tenter de montrer pourquoi une telle pratique est en fait trs insatisfaisante . Prenons par exemple la recherche d'un modle permettant d'expliquer la consommation macroconomique . Plusieurs modles thoriques s'offrent l'conomtre comme : - une explication par le revenu courant et une constante soit : (1) C(t) = c(1) + c(2) *Y(t) + e(t)

- une explication par le revenu courant et la valeur de la consommation de la priode prcdente soit : (2) C(t) = c(1) + c(2)*Y(t) + c(3)*C(t-1) + e(t)

Cours dconomtrie 2003

29

Grard Grellet

- une explication par la valeur moyenne du revenu courant sur les quatre dernires priodes d'observation soit : (3) C(t) = c(1) + c(2)*(( Y(t) + Y(t-1) + Y(t-2) + Y(t-3) )/4)) + e(t)

- une explication par le revenu courant et la valeur des actifs financiers soit : (4) C(t) = c(1) + c(2) *Y(t) + c(3) *A(t) +e(t)

Supposons que nous testions ces quatre modles et que nous trouvions : (1) C(t) = 10.5 + 0.82 *Y(t) (3.2) (2.2) R_= 0.71

(2)

C(t) = 12.2 + 0.78 *Y(t) + 0.31 * C(t-1) (2.3) (3.1) (1.8) C(t) = 12.8 + 0.68*( Y(t) + Y(t-1) + Y(t-2) + Y(t-3) ) / 4 ) (4.2) (4.1) C(t) = 14 + 0.61*Y(t) + 0.2 *A (t) (3.1) (3.05) (2.1)

R_= 0.81

(3)

R_ = 0.85

(4)

R_= 0.66

Nous serions tents de choisir le troisime modle comme le meilleur . En fait une telle procdure reste trs ambigu . Considrons tout d'abord le critre du R_ . Nous avons vu que la mthode des moindres carrs permet de fournir des estimations des paramtres en minimisant la somme des rsidus au carr . Il en rsulte que l'introduction d'une nouvelle variable explicative rduit la somme des rsidus au carr mme si cette nouvelle variable est faiblement corrle avec la variable explique L'on peut corriger partiellement cette difficult en calculant le coefficient de corrlation ajust (CCA) avec : CCA 2 = 1 - N - 1 ( 1 - R 2 ) ----------------------N-n o N est le nombre d'observations et n le nombre de variables . Toutefois mme CCA 2 ne peut tre utilis pour effectuer une slection entre diffrentes rgressions . En effet supposons que nous voulions tester si l'addition d'une variable supplmentaire X ( k + 1 ) donne un CCA 2 (k +1) significativement meilleur que CCA 2 ( k ) . Ceci revient tester si : F = CCA 2 ( k + 1 ) - CCA 2 ( k ) .( N - n - 1 ) ---------------------------------------------------1 - CCA 2 ( k + 1 ) est significativement suprieur au F tabulaire . L'on constate qu'en manipulant N et n l'on peut toujours obtenir un F significatif mme si l'augmentation de CCA 2 n'est pas elle mme

Cours dconomtrie 2003

30

Grard Grellet

significative . D'autre part le test F suppose ici que le coefficient de corrlation est une variable stochastique. Or nous ne connaissons pas priori la distribution des R 2 qui de toute faon ne peuvent tre supposs identiques pour des modles diffrents . Considrons maintenant le critre du t de Student . Supposons que nous fassions la rgression d'une variable Y(t) sur des sries de n valeurs arbitraires d'une variable X(t) , soit Y(t) = c(1) +c (2)* X (t) . L'on peut s'attendre ce que le t de Student associ c(2) ne soit pas significatif . Toutefois si nous rgressons Y(t) sur un grand nombre de sries X (t) prises au hasard il existe une probabilit qu'un certain pourcentage de ces sries prsente un coefficient c(2) avec un t significatif , par exemple 5 sur 100 sries . Or il serait parfaitement absurde de slectionner parmi ces cinq rsultats le coefficient qui a le t de Student le plus lev . En d'autres termes plus le nombre de variables potentielles rejetes est lev par rapport au nombre de variables pralablement slectionnes , moins le rsultat est significatif . Ce biais est quelquefois appel " biais de Lovell " . . Le t de Student n'a donc pas la mme signification selon qu'il rsulte du test d'un seul modle ou de la slection d'un modle parmi beaucoup d'autres ... ce qu'omettent gnralement de mentionner les auteurs des modles conomtriques .

Cours dconomtrie 2003

31

Grard Grellet

CHAPITRE III

L ESTIMATION ECONOMETRIQUE DES MODELES STRUCTURAUX

Cours dconomtrie 2003

32

Grard Grellet

Nous dfinirons ici les modles structuraux comme les modles quations simultanes dans lesquels une variable peut tre exogne dans une quation et endogne dans une autre. Par exemple le modle dit de Phillips peut tre dcrit par les deux quations suivantes 3- 1 3-2 avec Ch r M p w dw /dt = c(1) + c(2) dp / dt + c(3) dCh/ dt + u (t) dp / dt = c(4) + c(5) dw / dt + c(6) dr / dt + c(7) dM / dt + e (t) : niveau de chmage : cot du capital : prix des matires premires importes : niveau des prix : niveau du taux de salaire

Un autre exemple est celui du modle utilis par le professeur Lawrence Klein au dbut des annes 50 pour tudier les fluctuations de lactivit conomique amricaine : 3 -3 3 -4 C(t) = c(1) + c(2) P(t) + c(3) (W(t) + W(t)) + c(4) P(t-1)+u(1) I(t) = c(5) + c(6) P(t) + c(7) P (t-1)+ c(8) K(t-1) + u(2)

3 -5 W(t) = c(9) + c(10) (Y(t) + T(t) - W(t) ) + c(11) (Y(t - 1) + T (t-1) - W(t-1) ) + c(12) + u(3) 3 -6 3-7 3 -8 Y(t) + T(t) = C(t) + I(t) + G(t) Y(t) = W(t) + W(t) + P(t) K(t) = K(t-1) + I(t)

o C reprsente la consommation , I linvestissement , G les dpenses publiques , P les profits , W la masse salariale du secteur priv , W la masse salariale du secteur public , K le stock de capital , T le montant des impts , Y le revenu net , t le temps et o u(1) , u(2) et u(3) sont des lments stochastiques . c(1) ...c(12) sont des coefficients dterminer partir des rgressions . Dans ce modle existent six variables endognes : C , I , W ,W , P et K et trois variables prdtermines :P(t-1) , K(t-1) et Y(t-1). Lon remarque que des variables qui apparaissent exognes dans une quation apparaissent endognes dans une autre quation et sont donc soumises des variations stochastiques . Par exemple dp/dt , exogne dans lquation (3-1), est en fait une variable dtermine par un lment stochastique dans lquation (3-2) . De mme dans lquation (3-3),W apparat tre une variable exogne alors que daprs lquation (3-4) elle est en fait une variable stochastique .Dans chacun de ces exemples est viole une des conditions fondamentales du modle classique , savoir que les variables explicatives ne doivent pas tre alatoires.

Cours dconomtrie 2003

33

Grard Grellet

Pour rsoudre ce problme nous utiliserons la mthode dite des doubles moindres carrs III 1 ) La mthode des doubles moindres carrs Dans cette procdure lon remplace les variables explicatives stochastiques par leur rgression sur des variables non stochastiques dites variables instrumentales . Par exemple dans notre exemple prcdent lon peut chercher remplacer dp/dt dans lquation 3-1 par sa rgression sur dr/dt et dM/dt qui joueront alors le rle de variables instrumentales . Lon aura alors : dw/dt = c(1)+ c(2)( c(4)+c(5)(dr/dt)+c(6)(dM/dt))+ c(3)dCh / dt + u(t) (n.b. : remarquez que les coefficients c(1) , c(2) , c(3) , c(5) , c(6) sont diffrents de c(1), c(2),c(3),c(5)et c(6)). Les variables retards peuvent tre utilises comme variables instrumentales. Rsoudre un systme dquations simultanes avec la mthode des doubles moindres carrs suppose de plus que soient respectes certaines rgles : le systme ne doit pas inclure didentits : dans le modle de Klein lon ne considrera que les quations 3-3, 3-4 et 3-5 . les quations doivent tre indpendantes pour chaque quation la somme des variables instrumentales et des constantes doit tre au moins gale au nombre de variables endognes figurant droite de lquation . Lestimation simultane si elle rsout le problme des variables explicatives stochastiques nest pas sans crer de nouveaux problmes. Tout dabord il nexiste pas toujours de variables instrumentales disponibles qui rpondent la double exigence dtre la fois non stochastiques et fortement corrles avec la variable explicative stochastique. Lon peut mme dire quil sagit dexigences contradictoires. En second lieu toute erreur destimation dans une quation se transmet aux autres quations puisque celles ci sont interdpendantes. Dans ces conditions lon peut tre en droit deffectuer des estimations quation par quation ou tout au moins comparer les rsultats de celles ci avec celles de la mthode des doubles moindres carrs. III-2 ) Estimer un systme dquations par la mthode des doubles moindres carres avec Eview . Object/ new object : system Ecrire les quations . Si les variables instrumentales sont les mmes pour toutes les quations lon ajoute une ligne dbutant par inst suivie du nom des variables instrumentales : Exemple : inst dM/dt dr/dt Si les variables instrumentales sont diffrentes pour chaque quation lon fait suivre chaque quation de @ et du nom des variables instrumentales pour lquation .

Cours dconomtrie 2003

34

Grard Grellet

Donner un nom au systme en cliquant sur name Estimer en cliquant sur estimate equation .Lon choisira ici la mthode des doubles moindres carrs ( TSLS ) Exemple Lon cherche estimer le systme suivant afin de modliser la conjoncture algrienne : ctr = c(1)+c(2)*rr rr = c(3) + c(4)*fbcfr(-1) +c(5)*xr xr = c(6) + c(7)*pp fbcfr = c(8) + c(9)* (rr rr(-1)) o ctr reprsente la consommation totale relle rr le revenu total rel fbcf la formation brute de capital fixe relle xr les exportations relles pp le prix du ptrole sur le march mondial partir des donnes suivantes ( source : FMI)

Pour rsoudre ce systme dans Eviews partir de ces donnes et en considrant que pp , fbcfr(-1) et rr(-1) sont variables instrumentales lon ouvre : objects/ new object/ system puis lon crit le systme

Cours dconomtrie 2003

35

Grard Grellet

inst pp fbcfr(-1) rr(-1) ctr=c(1)+c(2)*rr rr=c(3)+c(4)*xr xr=c(5)+c(6)*pp fbcfr=c(7)+c(8)*(rr-rr(-1)) ( lon vrifiera que les conditions destimation de ce systme sont remplies) lon clique alors sur estimate puis sur two stages least squares et lon obtient :

( voir tableau page suivante)

Si les coefficients sont tous significatifs les statistiques de Durbin Watson ne sont pas bonnesce qui nest gure surprenant du fait du faible nombre de nos variables explicatives.

Une fois le systme estim il faut lui donner un nom ( ici sysalgeria ). Lon clique sur Procs/Make Model/Solve/OK puis sur View / endogeneous table et lon obtient :

__
_

Cours dconomtrie 2003

36

Grard Grellet

Cours dconomtrie 2003

37

Grard Grellet

Remarquons ici que ce tableau fait suivre chaque variable de F afin de ne pas confondre la valeur de ces variables, solutions du modle avec les valeurs historiques observes. Lon comparera alors les variables solutions du modle avec les variables observes afin destimer la pertinence du modle.

III - 3) Le modle VAR Dans un modle VAR lon ne se donne pas de modle thorique priori . Tout modle peut en effet tre arbitraire si les variables apparaissent la fois la droite et gauche des quations et si nous navons pas de causalit . Dans ce cas lon peut chercher rgresser chaque variable endogne sur lensemble des autres variables , endognes et exognes . Le modle sera dtermin en ne retenant que les coefficients significatifs . Dans un tel modle nous navons donc effectuer aucune hypothse thorique . Nous devons seulement : choisir les variables endognes et exognes ; choisir le nombre de dlais considrer . Par exemple si nous avons deux variables endognes X et Y et une variable exogne Z et deux dlais notre modle pourra scrire : X = c(0) + c(1)X(-1)+c(2)X(-2)+c(3)Y+c(4)Y(-1)+c(5)Y(-2)+c(6)Z+c(7)Z(-1)+c(8)Z(-2) Y=c(9)+c(10)Y(-1)+c(11)Y(-2)+c(12)X+c(13)X(-1)+c(14)X(-2)+c(15)Z+c(16)Z(1)+c(17)Z(-2) Estimer un systme VAR avec E-views Quick/ Estimate Var Pour crer un model partir des coefficients estims Procs / make model Exemple A partir de nos donnes algriennes lon obtient le modle suivant en considrant que les variables endognes sont fbcfr et xr , que les variables exognes sont pp et une constante et quil existe deux retards :

III-5 ) La simulation Une fois estims les coefficients structuraux du systme d'quations lon obtient un modle . Dans la mesure o ce modle comporte n quations indpendantes il permet de dterminer n variables endognes partir des variables prdtermines .

Cours dconomtrie 2003

38

Grard Grellet

Lon peut alors comparer les n variables endognes ainsi obtenues leurs valeurs historiques . Lestimation des coefficients dun modle structural permet galement deffectuer des exercices de simulation .

III-6) La simulation dans E-view

1) 1)

System / Procs / Make model ( enregistrer sous un nom Name Ecrire le modle . Ajouter une ligne ASSIGN @ all F . Cette commande assure que toutes les solutions du modle apparaissent sous leur nom suivi de F afin de ne pas les confondre avec les valeurs historiques . 1) Solve / choisir dynamic solution et ne pas cocher stop on missing data 1) View / endogeneous table : les solutions du modle apparaissent avec un F suivant leur nom . 1) View / endogeneous graphs Comparer les solutions du modle aux valeurs historiques NB . Le message Near singular matrix signifie que les quations du modle ne sont pas indpendantes.

Cours dconomtrie 2003

39

Grard Grellet

CHAPITRE IV

LA CAUSALITE

Cours dconomtrie 2003

40

Grard Grellet

Un des problmes soulevs par les modles structuraux est qu'ils ne nous donnent aucune indication sur les relations causales entre les variables . Or le sens de la causalit conomique est un lment essentiel pour laborer une politique conomique ou pour effectuer des prvisions .Ce chapitre sera consacr l'estimation conomtrique de la causalit. Il faut commencer par dfinir le terme de causalit .Littr dfinit la causalit comme " la vertu par laquelle une cause produit un effet " mais en ce sens il est impossible de mesurer la causalit . Les conomtres vont utiliser une autre dfinition plus spcifique de la causalit due Granger . L'on dira qu'une variable X(t) exerce une causalit au sens de Granger sur une variable Y(t) si l'ensemble des variables passes de X soit X(t-1), X(t-2) ...permet d'amliorer la prdiction de Y par rapport une rgression sur les valeurs passes de Y(t-1),Y(t-2),... En d'autres termes l'on peut conclure que X(t) exerce une causalit au sens de Granger sur Y(t) si dans la rgression : 4 1 Y (t) = c(1) Y ( t 1) + ..+ c(n)Y (t-n) + c(1)' X ( t 1) + .+c(n)' X ( t n) +e (t) les coefficients c'(i) , i = 1, , n , sont significativement diffrents de 0 , c'est dire si 4- 1 amliore la rgression par rapport 4-2 4-2 Y(t) = c(1)Y ( t 1 ) + + c(n) Y ( t n ) + e'(t)

Le test de Granger peut tre utilis pour tudier des relations entre deux variables X(t) et Y(t) par exemple la masse montaire et le P.N.B. nominal , l'investissement et le P.N.B. rels etc...) quand on s'interroge sur le sens de leur relation causale .L'on estime alors les deux rgressions suivantes : 4-3 : Y(t) = c(1)Y ( t 1 ) ++ c(n) Y (t n ) + c(1)'X ( t 1)+.+c(m)'X ( t m) + u (t) 4- 4 : X(t) = c(1)"X ( t 1)+ + c(m)"X(t m ) +c(1)'''Y ( t 1 ) + c ( n )"' Y ( t n ) +u'(t)

L'on choisit les valeurs de n et de m de faon ce que les rsidus alatoires u(t) et u'(t) ne soient pas corrls . Quatre cas sont alors possibles : - si les coefficients c(i) , c(i)', c(i)", c(i)''' sont tous significativement diffrents de 0 la causalit entre Y et X est bilatrale ; - si les coefficients c(i)' et c(i)'''sont tous non significativement diffrents de 0 il n'existe pas de lien de causalit entre X et Y ; - si les coefficients c(i)' sont significativement diffrents de 0 alors que les coefficients c(i)''' ne sont pas significativement diffrents de 0 la relation de causalit est de X Y;

Cours dconomtrie 2003

41

Grard Grellet

- si les coefficients c(i)' ne sont pas significativement diffrent de 0 alors que les coefficients c(i)''' sont significativement diffrents de 0 la relation de causalit est de Y X. L'on peut bien videmment prolonger l'analyse en distinguant la causalit instantane de la causalit retarde. Le test de Granger n'est pas sans poser trois problmes : Il n'est d'abord pratiquement utilisable que dans le cas de deux variables mme si thoriquement l'on peut envisager le cas de plusieurs variables . Il est possible que X et Y soient dtermins toutes deux par une troisime variable Z qui agit avec des dlais diffrents . L'observateur en conclura que X exerce une causalit au sens de Granger sur Y. Par exemple la vente de glaces en aot exerce une causalit au sens de Granger sur la date des vendanges en octobre. Ces deux phnomnes ne sont bien videmment pas lis entre eux par une relation de cause effet mais dpendent tout deux du degr d'ensoleillement au mois d'aot . Enfin le test de Granger ne peut nous donner que des indications sur la causalit ex post et non sur celle ex ante. En fait nous ne pouvons gure utiliser l'estimation de relations causales dans le pass comme guide par la politique future dans la mesure o un changement de politique peut produire un changement structurel et donc influer sur la nature des causalits . La causalit dans E-views Workfile/show/mettre le nom des variables Group/view/Granger causality

Cours dconomtrie 2003

42

Grard Grellet

CHAPITRE

LES SERIES TEMPORELLES

Cours dconomtrie 2003

43

Grard Grellet

Les sries temporelles peuvent tre dfinies comme un ensemble d'observations ordonnes dans le temps. En ajoutant une dimension temporelle il est possible d'expliquer les variables endognes non seulement par les variables explicatives prsentes mais galement par des variables explicatives passes , en particulier par des valeurs passes de la variable endogne. Il existe deux grandes classes de sries temporelles : les sries auto - rgressives et les sries moyenne mobile . Dans le cas des sries auto - rgressives (AR) les seules variables explicatives considres sont les valeurs passes de la variable endogne. Les sries moyenne mobile (MA) sont fondes sur une moyenne pondres des rsidus antrieurs. L'on peut bien videmment combiner ces deux approches (sries ARMA) . Les sries temporelles peuvent tre utilises pour rsoudre deux types de problmes : celui de l'auto-corrlation des rsidus et celui de la construction dun modle empirique sans modle thorique explicatif, soit parce que nous ne connaissons ou ne pouvons mesurer les variables explicatives, soit parce que les coefficients estims sont entachs d'un degr d'incertitude beaucoup trop lev pour tre utilisables des fins prvisionnelles . V- 1 L'utilisation d'une srie autorgressive quand existe une auto-corrlation des rsidus Nous avons vu que quand existe une auto-corrlation des rsidus ( DW << 2) les estimations des coefficients sont biaises . Si nous ne parvenons pas dterminer les raisons d'une telle auto-corrlation l'on peut chercher dcomposer le rsidu entre d'une part la relation d'auto-corrlation et d'autre part le rsidu vritablement alatoire soit : e = c(1) e(-1) + e' o e = c(1)e(-1) reprsente la relation d'auto-corrlation des rsidus et o e' est un rsidu alatoire d'esprance mathmatique nulle et tel que : E ( e' , e' (-k) ) = 0 pour tout k . L'on vrifiera que c(1) est significativement diffrent de 0 et que les e' ne sont pas autocorrls en calculant le DW. S'il n'en est pas ainsi l'on calculera une fonction auto- rgressive des rsidus d'un ordre suprieur par exemple : e=c(1)e(-1)+c(2)e(-2)+e' (ordre 2) (ordre3)

e=c(1)e(-1)+c(2)e(-2)+c(3)e(-3)+e' et plus gnralement e=c(1)e(-1) + +c(n)e(-n) +e'

(ordre n)

Pour calculer l'ordre n l'on peut recourir la fonction d'auto-corrlation partielle qui montre le

Cours dconomtrie 2003

44

Grard Grellet

gain obtenu sur le coefficient d'auto-corrlation en incluant la variable retard d'un ordre supplmentaire . n est obtenu quand cette fonction n'apporte pas de gain significatif pour n+1.

Procdure sous E-view View/ residual tests /correlogram Le corrlogramme nous permet de dterminer l'ordre n (voir V-2) L'on ajoute alors AR(n) dans les variables explicatives de la rgression .

V-2 La modlisation empirique des sries Il existe trois procdures courantes qui permettent de modliser partir d'un chantillon de taille T des sries dont on ne connat pas les variables explicatives mais dont on peut penser qu'elles suivent des lois temporelles : l'auto-rgression ( "autoregression" en abrg AR) , l'intgration ("integration" en abrg I)et la moyenne mobile ("moving average"en abrg MA). Nous ne considrerons ici que des sries stationnaires c'est dire des sries qui ont une moyenne constante et une covariance constante entre deux lments spars par k priodes quelque soit k . Le cas des sries non stationnaires sera examin au V-2 -4 Bien videmment toutes ces procdures peuvent tre utilises pour la modlisation des rsidus qui prsentent une auto-corrlation. V-2-1 : L'autoregression AR Considrons par exemple le modle : ( V-1 ) Y =c(1)+ c(2)* X + c(3)* Z

La prvision de Y va dpendre des estimations de c(0) , c(1) , c(2) et des valeurs donnes aux variables exognes X et Z ce qui peut conduire une multiplication des erreurs . Par contre avec une srie dite auto - rgressive l'on utilisera une rgression de type : ( V-2 ) Y = c(1) + c(2)*Y(-1) + c(3)*Y(-2) + ... + c(n-1)*Y(-n)

Dans l'quation (V-2) , Y(-1)...Y(-n) sont connus ce qui rduit considrablement les erreurs possibles sur les donnes. Ceci explique que si une quation comme celle (V-2) ne repose sur aucune explication conomique, elle peut souvent conduire de meilleures prdictions que celles de l'quation (V-1). L'on peut tre ainsi conduit utiliser un modle auto - rgressif quand : i) Il existe une relle incertitude sur les variables causales en particulier quand la thorie conomique ne permet pas de spcifier de faon suffisamment simple le modle structurel sous-jacent ii) L'on peut souponner l'existence d'un cycle conomique

Cours dconomtrie 2003

45

Grard Grellet

iii) L'objet du modle est d'effectuer une prvision court terme ; iv) Il existe une srie longue d'observations sur la variable prdire . L'on peut par exemple utiliser les modles auto- rgressifs pour l'tude du mouvement des prix rels des matires premires dans la mesure o les sries disponibles sont longues , o le nombre de variables explicatives est lev et o l'on cherche effectuer des prvisions court terme. Il serait par contre absurde d'utiliser de telles sries pour l'tude de l'inflation pour laquelle le nombre de variables explicative est faible et pour laquelle l'on sait qu' il n'existe pas de cycle . Pour estimer une fonction d'auto corrlation sous E view il suffit de taper AR(n) comme seule variable explicative d'une rgression . Il est toutefois ncessaire de connatre au pralable l'ordre n de la fonction AR(n).Pour cela l'on utilisera une fonction d'auto corrlation partielle ( ou corrlogramme) . Une telle fonction est construite partir de la squence des coefficients d'auto - corrlation partielle qui mesurent la corrlation entre y et y(-p) une fois pris en compte les effets de y(-1), y(-2),y(-p+1) . Par exemple dans la rgression : y = c(0) + c(1) y(-1) + e le paramtre c(1) est le premier coefficient d'auto-corrlation partielle Dans la rgression : y = c(0) + c(1)y(-1) + c(2) y(-2) + e Le paramtre c(2) est le second coefficient d'auto-corrlation partielle . Il mesure l'association entre y(-2) et y une fois "enlev" l'effet de y(-1) . Pour choisir l'ordre p d'une fonction AR l'on choisira donc c(p) tel que c(p) soit statistiquement diffrent de 0 mais ne soit pas statistiquement diffrent de 0 pour c(p+1) . Comme nos observations peuvent tre considres comme un chantillon de la srie nous ne pouvons faire que des estimations des coefficients d'auto-corrlation partielle . Nous pouvons toutefois faire l'hypothse que ces coefficients sont distribus suivant une loi normale de moyenne nulle et de variance 1/T si l'chantillon est suffisamment large . L'on peut alors comparer la valeur du test statistique t = c(n) / (1/ (T) exp 1/2 ) avec la valeur critique 1.96 ( approxime par 2) .L'on peut alors tester si le coefficient d'auto-corrlation l'hypothse que le coefficient d'auto-corrlation partielle est en fait nul. En pratique l'on retiendra cette hypothse si t est infrieur 2. Par exemple si nous estimons les trois modles AR suivants partir d'un chantillon de 100 observations . AR(1) : y = -0.166 + 0.464 y (-1) AR(2) : y = - 0.114 + 0.212 y (-1) + 0.493 y (-2)

Cours dconomtrie 2003

46

Grard Grellet

AR(3) : y = -0.115 + 0.212 y(-1) + 0.498 y(-2) 0.017 y (-3) Les trois coefficients estims d'auto-corrlation partielle sont : 0.464 , 0.493 , -0.017 ce qui donne des valeurs du t statistique de 4.64 , 4.93 et 0.17 Seuls les deux premiers coefficients d'auto-corrlation partielle sont suprieurs 2 de sorte que l'ordre de notre fonction est 2 . Exemple : Lon cherche modliser lvolution de lindice du prix mensuel du caf ( variable SERCAF) de janvier 1992 mai 2001. Notre srie de 113 observations est prsente dans le tableau V-1( source : FMI). Il est difficile de construire un modle thorique de cette srie car lvolution des cours du caf dpend dun grand nombre de facteurs ( apparition de nouveaux producteurs , variations climatiques, phnomnes spculatifs, accords entre producteurs) . Par contre lon sait que les cours du caf obissent des cycles de sorte que lon peut tester lhypothse que les prix sont auto-corrls. Pour tester cette hypothse lon estime tout dabord le modle AR(1) soit : SERCAF = c(1) + c(2)*SERCAF(-1) Lon obtient :

_
Le t de c(2) est excellent : il existe donc une forte auto-corrlation dun mois sur lautre du prix du caf. Celle-ci explique lexistence dune forte spculation : quand un mouvement la hausse ou la baisse se dclenche il existe une trs forte probabilit statistique quelle se prolonge le mois suivant . _ _

Cours dconomtrie 2003

47

Grard Grellet

__

Cours dconomtrie 2003

48

Grard Grellet

Lon peut tester une auto-corrlation dordre 2 suivant le modle : SERCAF = c(1) + c(2)*SERCAF(-1) + c(3)*SERCAF(-2)cv vc vc vc xwc<vv et lon obtient :

_lon constate que c(2) et c(3) sont trs significativement diffrents de 0.


Plus gnralement lon peut effectuer le corrlogramme de notre srie ( voir page suivante ) . Lon constate que lauto-corrlation est significative jusqu lordre 11 ( ce qui peut tre visualis par le dpassement des traits en pointill). En termes conomiques les mouvements de prix sont systmatiquement orients dans le sens de la hausse ou de la baisse sur des priodes de 11 mois celles qui sparent deux rcoltes : il nexiste en effet quune rcolte de caf par an et toutes les rcoltes se font dans la zone intertropicale. V-2 -3 Les modles moyenne mobile (MA) Dans une srie moyenne mobile d'ordre q chaque lment y est gnr par une moyenne pondre de l'ensemble des rsidus alatoires passs : y = c(1) + e + c(2)*e (-1) + c(3)*e (-2) + ... + c(q+1)* e (-q) A titre d'exemple l'on peut supposer que y reprsente la variation de prix journalire sur le march d'une matire premire soumis des chocs exognes dnots e soit : y(t)= c(1) + e(t) L'on peut toutefois penser que l'impact de ce choc exogne ne sera pas compltement absorb par le march en une seule journe de sorte que l'on aura : y(t+1) = c(1) +e(t+1) + c(2)* e(t)

Cours dconomtrie 2003

49

Grard Grellet

o e(t+1) reprsente l'impact du choc exogne e(t) au temps t+1 et c(2) e(t) l'impact au temps t+1 du choc exogne de la priode t.

_
Nous supposerons que chaque lment alatoire e(t), ..., e (t-q) a une esprance mathmatique nulle et une mme variance .Par exemple un modle moyenne mobile d'ordre 2 que l'on crira MA (2) a pour quation : y = e + c'(1) e(-1) + c'(2) e (-2) De mme que pour les modles auto - rgressifs il convient d' estimer l'ordre de la srie .

Cours dconomtrie 2003

50

Grard Grellet

Lordre de la srie L'on peut montrer que le coefficient d'auto - corrlation d'un processus MA(q) est nul aprs q dlais . Il est donc possible d'identifier l'ordre q d'un processus MA en dterminant le dlai partir duquel les auto - corrlations ne diffrent plus significativement de 0 . Toutefois nous ne connaissons pas la vritable fonction d'auto- corrlation et celle ci doit tre estime partir d'un chantillon de T observations .Si le nombre T est suffisamment large les auto corrlations de l'chantillon sont distribues suivant une loi Normale avec une moyenne nulle et un cart type moyen gal 1 / (T) exp 1/2 . L 'on peut donc tester un niveau de confiance donn , l'hypothse que l'auto corrlation d'un ordre q + 1 est nul en comparant l'auto - corrlation obtenue dans l'chantillon avec les limites de l'intervalle de confiance .Si cet intervalle de confiance ne comprend pas la valeur 0 alors l'on peut rejeter l'hypothse que ce coefficient d'auto corrlation est nul .

Estimation des paramtres d'un processus MA (q) sous E - views L'estimation des coefficients d'une fonction MA se fera en introduisant MA (q) comme seule variable explicative dans une rgression . Exemple : Lon cherche modliser un indice du prix du coton sur les dix principaux marchs amricains ( voir tableau page suivante ; source FMI) Lon estime lquation : coton = c(1)+c(2)ma(1)+c(3)ma(2)

_
c(2) et c(3) sont significativement diffrents de 0 Remarque : Le corrlogramme du coton montre quexiste un cycle du coton comme il existe un cycle du caf. Toutefois il est beaucoup moins marqu car : - le coton est plus facilement stockable que le caf

Cours dconomtrie 2003

51

Grard Grellet

- llasticit prix du coton est plus forte que pour le caf - le coton est produit dans les deux hmisphres. V 2 4 ) Les modles la fois autorgressifs et moyenne mobile ( ARMA) Il est possible de combiner les deux modles prcdents . Le modle est dit alors ARMA et a pour ordre ( p , q). Il peut tre dcrit par l'quation : y = c(1) + c(2)*y (-1) + ... + c(p+1)* y (-p) + e + c(1) *e(-1) + ... + c'(q)* e (-q) Par exemple un modle ARMA (1,1) sera dcrit par : y = c(1)+c(2)*y (-1) + e + c(3)*e (-1) Comme le processus ARMA est une combinaison des processus AR et MA , la fonction d'auto- corrlation reflte la fois les caractristiques des processus AR et MA.

E-views propose systmatiquement dinclure ARMA dans les rgressions

Cours dconomtrie 2003

52

Grard Grellet

Cours dconomtrie 2003

53

Grard Grellet

Cours dconomtrie 2003

54

Grard Grellet

CHAPITRE

VI

LA COINTEGRATION

Cours dconomtrie 2003

55

Grard Grellet

Dans une conomie en croissance ou soumise linflation la plupart des sries macroconomiques possdent un trend temporel. Elles sont dites non stationnaires car leur moyenne nest pas constante dans le temps. La corrlation entre deux sries non stationnaires savre souvent excellente sans quexiste pour autant une justification conomique de cette corrlation . Leur corrlation ne nat que parce quelles augmentent toutes deux dans le temps. Par exemple le PNB nominal de lInde et celui de la France ont sur une longue priode une trs bonne corrlation sans que lon puisse dire que lun dpend de lautre. Dans ce chapitre nous commencerons par dfinir et par tester la non stationnarit des sries temporelles. Nous tudierons ensuite lexistence de relations stables entre les sries non stationnaires. VI 1 ) Le test de stationnarit Une srie autorgressive : y = c(1) + c(2)*y(-1) + e est dite stationnaire si -1 < c(2) < 1 Si c(2) = 1 la srie est dite non stationnaire Si c(2) > 1 la srie est dite explosive . Ce type de srie nest pratiquement jamais rencontr par lconomiste. Pour savoir si une srie est stationnaire il faut donc tester si c(2) est significativement diffrent de 1 ou , en posant c(2) = 1 c(2) , si, dans : dy = c(1) + c(2) *y (-1) + e c(2) est significativement diffrent de 0 . Malheureusement lon peut montrer que la table de distribution du t de Student ne peut tre ici utilise. Il faut utiliser pour ce test une table dite de Dickey-Fuller. Le test de stationnarit peut tre gnralis une srie autorgressive dordre n . Lon utilise alors une table dite table de Dickey-Fuller augmente. Exemple : Lon cherche savoir si la production industrielle des pays de lOCDE est ou non stationnaire partir de la srie mensuelle suivante de janvier 1992 mai 2001 ( source : FMI)

Cours dconomtrie 2003

56

Grard Grellet

Cours dconomtrie 2003

57

Grard Grellet

Dans E-views lon rentre la srie puis lon clique sur : View/Unit root test/ Lon choisit alors comme test : Augmented Dickey Fuller Le tableau suivant apparat :

LADF de la premire ligne est de -1.373637 . Il est donc infrieur toutes les valeurs critiques. Lon ne peut donc rejeter lhypothse que les c(i) soient en fait nuls et donc que les c(i) soient en fait gaux 1 , c'est--dire que la srie soit en fait non stationnaire . La production industrielle des pays de lOCDE na donc pas stagne entre 1992 et 2001.

Cours dconomtrie 2003

58

Grard Grellet

VI 2 ) La cointgration

Ltude de la cointgration permet de tester lexistence dune relation stable de long terme entre deux variables non stationnaires , en incluant des variables retards et des variables exognes . Il existence plusieurs tests de la cointgration le plus gnral tant celui de Johanssen qui est celui utilis par E-views . Quelque soit le test retenu il na de signification que sur des sries non stationnaires longues , suprieures 100 observations. Nous ne prsenterons pas ici linterprtation du test dans la mesure o E-views prsente directement les rsultats sous forme normalise. Exemple : Nous cherchons savoir sil existe une relation stable de long terme entre les variations mensuelles de prix aux Etats-Unis et lles variations mensuelles de la masse montaire amricaine M1 entre janvier 1992 et mai 2001(voir tableau page suivante . Source FMI) Nous commenons par tester si les deux sries sont effectivement non stationnaires. Le test de Johanssen seffectue sous : View/cointegration test Le logiciel nous demande sil existe un trend dans chaque srie (nour rpondons oui car nous ne travaillons pas sur une srie de la masse montaire relle : il existe donc une drive inflationniste), dventuelles variables exognes (non) et le nombre de dlais prendre en considration (nous prenons six dlais car lon peut considrer que limpact de laugmentation de la masse montaire sur les prix seffectue dans les six mois). Les rsultats apparaissent sous la forme suivante :

Cours dconomtrie 2003

59

Grard Grellet

Cours dconomtrie 2003

60

Grard Grellet

Remarque : Les rsultats sont prsents en diffrences , non en valeurs absolues. Ces rsultats sinterprtent de la faon suivante : il existe une seule relation de cointgration dans lintervalle de confiance de 5% du test de vraisemblance la relation normalise est : dp = 0.33 dm + 7528 ( remarque : pour que la variable dpendante p soit normalise il faut quelle soit dans la premire colonne de gauche de notre tableau de donnes) En dautres termes une hausse de 10% de la masse montaire M1 conduit dans les six mois une hausse des prix de 3,3%.

Cours dconomtrie 2003

61

Grard Grellet

CONCLUSION

La thorie conomtrique a t labore dans les annes 40 en supposant d'une part que la thorie conomique est capable de fournir des modles directement testables et d'autre part que la confrontation avec les donnes nous permet de rejeter ou d'accepter sans ambigut une thorie. Il s'agit , nous l'avons vu , d'une double illusion . Tout d'abord les modles thoriques sont loin d'tre toujours utilisables par l'conomtre . En effet certaines variables ne sont ni directement observables ni directement mesurables .D'autre part de nombreux modles thoriques restent insuffisamment spcifis . Par exemple ils n'indiquent pas les dlais prendre en compte . Enfin les thories conomiques sont formalises de faon trop gnrale pour tre testables ( comme la thorie walrasienne) soit sont construites sous l'hypothse "Ceteris Paribus" . Dans ce dernier cas nous ne pouvons savoir si la non correspondance entre le modle thorique et les observations proviennent de la mauvaise spcification de la fonction ou bien d'un changement dans l'environnement du modle. Les difficults proprement statistiques ne sont pas moins relles . Trop souvent les donnes utilises par l'conomtre restent trs approximatives - pour ne pas dire fausses - ce qui rendent douteux les rsultats obtenus ; D'autre part les mthodes statistiques ne sont souvent justifies que pour des sries trs longues alors que l'conomiste ne dispose gnralement que de sries courtes. Au reste pour des sries trs longues l'homognit des variables pose souvent problme . Ces difficults ne doivent pas cacher l'importance de l'conomtrie dans l'analyse conomique contemporaine . S'il n'est souvent pas possible de rejeter une thorie conomique sur la seule base des rsultats conomtriques , les tests d'acceptabilit statistique sont devenus des procdures routinires, d'autant que les programmes informatiques sont aujourd'hui facilement disponibles. L'conomtrie a du reste contribu modifier la thorie conomique dans la mesure l'exigence de modles testables devient une condition d'acceptabilit dans les publications scientifiques .

Cours dconomtrie 2003

62

Grard Grellet

BIBLIOGRAPHIE

niveau facile ** niveau moyen *** niveau difficile

CHAREMZA W.W. et DEADMAN D.F. New Directions in Econometric Practice Edward Elgar , 1992 (***) CUTHBERTSON K. , HALL S.G. et TAYLOR M.P. Applied Econometric Techniques Philip Allan 1992 (***) DESAI M. Testing Monetarism Frances Pinter , Londres 1981(**) DODGE Y. Statistique . Dictionnaire Encyclopdique Dunod , 1993 (*) DOUGHERTY Introduction to Econometrics Oxford University Press 1992 (*) ENGLE R.F. et GRANGER C.W.J. (eds) Long Run Economic Relations : Readings in Cointegration Oxford University Press 1991 (***) GHOSH S.K. Econometrics Prentice Hall 1991 (**) GRANGER , C.W. J. et NEWBOLD P. Forecasting Economic Time Series Academic Press , 1986 (***) GRIFFITHS W.E. , HILL R.C. et JUDGE G.G. Learning and Practicing Econometrics John Wiley & Sons 1993 (**) GUJARATI D.N. Basic Econometrics Mac Graw Hill 1988 (*) HARVEY The Econometric Analysis of Time Series Philip Allan 1990 (**) JUDGE, G.G. , HILL, R.C. , GRIFFITHS W.E. , LUTKEPOHL H. et LEE , T.C. Introduction to the Theory and Practice of Econometrics John Wiley & Sons , 1988 (**) LUCAS R.E. Economic Policy Evaluation : A Critique in Brunner K. et Metzler A.M. (eds) The Phillips Curve and Labor Markets Carnegie Rochester Conference Series on Public Policy , vol. 1 , North Holland (1976) MACKINNON , J.G. Critical Values for Cointegration Tests in R.F. Engle et C.W.J Granger (eds) 1991. PINDYCK S.R. et RUBINFIELD D.L. Econometric Models & Econometric Forecasts Mc Graw Hill 1991 (**) SALVATORE Economtrie et Statistique Appliques Mc Graw Hill 1985 (*). SIMS Money Income and Causality American Economic Review 1972 (**) SIMS C.A. Macroeconomics and Reality Econometrica , vol .48, 1980 (***) WONNACOTT T.H et R . J Statistique Economica 1988 (*) WONNACOTT T.H et R.J Econometrics John Wiley 1979 (*)

Cours dconomtrie 2003

63

Grard Grellet

TABLE DES MATIERES

Chapitre 1 Le modle classique de rgression linaire I 1 ) La droite de rgression I 2 ) Le problme des observations aberrantes I 3 ) La prise en compte des variables qualitatives explicatives I 4 ) La rgression dans E views Annexe 1 Chapitre II La remise en cause des hypothses du modle linaire classique

II 1 ) Les hypothses du modle classique de rgression linaire II 2 ) La remise en cause de la premire hypothse : les rsidus sont auto-corrls II 3) La remise en cause de la seconde hypothse : lhtroscdasticit II 4 ) Le non respect de la troisime hypothse : la multicolinarit II 5 ) Le non respect de la quatrime hypothse : les variables explicatives sont elles mmes des variables stochastiques II 6 ) Le non respect de la cinquime hypothse : les coefficients du modle ne sont pas invariants dans le temps II 7 ) La pche miraculeuse la bonne rgression

Cours dconomtrie 2003

64

Grard Grellet

Chapitre III

Lestimation conomtrique des modles structuraux

III 1 ) La mthode des doubles moindres carrs III 2 ) Estimer un systme dquations par la mthode des doubles moindres carrs avec E views III 3 ) Le modle VAR

Chapitre IV

La causalit

Chapitre V

Les sries temporelles

V 1 ) Lutilisation dune srie auto-rgressive quand existe une auto-corrlation des rsidus V 2 ) La modlisation empirique des sries

Chapitre VI

La cointgration

VI 1 ) Le test de stationnarit VI 2 ) La cointgration

Conclusion

Bibliographie

Vous aimerez peut-être aussi