Académique Documents
Professionnel Documents
Culture Documents
Introduction Il est frquent en conomtrie quon ait composer avec des donnes deux dimensions : une dimension chronologique une dimension spatiale
Par exemple, on sintresse la relation qui existe entre le ROA dune banque et un certain nombre de ratios reprsentatifs soit de la structure de son bilan, soit de son activit au cours de lexercice coul. On a rassembl cet effet un certain nombre dinformations relatives aux valeurs prises par ces ratios pour un chantillon de 24 banques europennes (UK, France, Allemagne) sur la priode 1995 2000 (fichier ROA.xls). Cet chantillon est compos de 24 banques : cest la dimension spatiale de lchantillon. Ces banques tant de tailles et de nationalits diffrentes on comprend que la question de lhomognit / htrognit des donnes se pose avec acuit. Pour chaque banque on dispose dobservations dans le temps (de 1995 2000) : cest la dimension chronologique. Quel intrt peut-il y avoir traiter de lestimation dune relation avec ce genre de donnes ? Ce qui est intressant avec les donnes de panel, cest quelles vont nous permettre de rpondre certaines questions quil eut t impossible dlucider avec un simple chantillon chronologique ou un simple chantillon en cross section . Je mexplique : 1. Imaginons que la relation Ratios de structure ROA ait t estime sur un chantillon de banques en coupe instantane (par exemple, les observations relatives la seule anne 1995) et quon ait pu mettre en vidence le caractre effectif de cette relation. La question quon est en droit de se poser, lissue de cet ajustement est : quest-ce
Philippe ROUS Cours dEconomtrie des Donnes de Panel Master Economie et Finance Facult de Droit et des Sciences Economiques de Limoges
qui nous garantit que cette relation, effective pour lanne 1995, le sera aussi pour les annes ultrieures ? . Nous navons, ce stade l, aucun lment qui nous permette de nous prononcer sur la validit de cette relation dans le temps. 2. De faon un peu diffrente, supposons prsent que cette mme relation ait t estime sur un chantillon de nature chronologique... mais pour une seule banque. Quest-ce qui nous autorise extrapoler cette relation, propre la banque A, une autre banque B ? En dautres termes : la banque A tudie ne prsente-t-elle pas des spcificits telles quil devient difficile de gnraliser les rsultats. Seul un chantillon en donnes de panel est susceptible de nous aider nous prononcer quant la stabilit de la relation dans sa double dimension spatiale et temporelle. Illustration : FATALITY.WF1, FATALITY-1.DOC L'exemple trait ici est emprunt J.H. STOCK et M.W.WATSON 1. Il est destin illustrer justement tout l'intrt qu'on peut trouver exploiter un chantillon en donnes de panel. La problmatique est la suivante : tous les ans, aux USA on dnombre approximativement 40000 dcs par accidents de la route. Dans 1/3 des cas ces accidents impliquent un conducteur en tat d'brit. Une enqute a mme montr qu'entre 1 h et 3 h du matin, un quart des automobilistes dpasse le taux autoris d'alcoolmie. Des mesures de lutte contre l'alcool au volant ont t adoptes ici et l dans diffrents tats des USA. C'est sur l'efficacit de ces mesures au regard du nombre des dcs par accident de la route qu'on s'interroge ici. L'chantillon : pour 48 tats des USA on dispose d'observations annuelles sur la priode 1982 1988 pour ce qui concerne un certain nombre de variables et, notamment : le taux de mortalit par accident de la route MRALLit (nombre de dcs par accident de la route pour 10000 habitants dans l'tat i au cours de
On a reproduit ci-dessous la relation Taxe sur les Alcools Taux de Mortalit en utilisant, pour commencer, l'ensemble de toutes les observations dans le temps et dans l'espace, soit, au total, 48 7 = 336 couples observs :
3 2.5 MRALL 2 1.5 1 0.5 0 0 1 2 BEERTAX 3 4 5
Ce graphique suggre, paradoxalement, une relation positive (!) entre la taxe et le rtaux de mortalit, ce que confirme l'ajustement ralis sur donnes empiles :
Dependent Variable: MRALL_?*10000 Method: Pooled Least Squares Date: 14/05/04 Time: 09:04 Sample: 1982 1988 Included observations: 7 Cross-sections included: 48 Total pool (balanced) observations: 336 Variable C BEERTAX_? R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 1.853308 0.364605 0.093363 0.090648 0.543736 98.74685 -271.0387 0.132716 Std. Error 0.043567 0.062170 t-Statistic 42.53913 5.864668 Prob. 0.0000 0.0000 2.040444 0.570194 1.625230 1.647951 34.39433 0.000000
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
On retrouve ce mme rsultat paradoxal quand on se limite un simple chantillon en coupe instantane pour l'anne 1982 (on a, dans ce cas, 48 observations qui
1982
0.00045 0.0004 0.00035 0.0003 0.00025 0.0002 0.00015 0.0001 0.00005 0 0 0.5 1 1.5 BEERTAX 2 2.5 3
MRALL
1988
0.00035 0.0003 0.00025 MRALL 0.0002 0.00015 0.0001 0.00005 0 0 0.5 1 1.5 BEERTAX 2 2.5
Ajustement 1988
Sur la base de ces rsultats peut-on conclure une relation positive ou, pour le moins,
l'absence de relation entre le taux de taxe et le taux de mortalit ? On peut nourrir quelque soupon quant au sens de cette relation... A ce stade de nos investigations on doit se souvenir que la relation, telle qu'elle est ici spcifie (le taux de mortalit ne dpendrait que du taux de taxe) occulte un certain nombre de variables qui exercent, vraisemblablement, une certaine influence sur le taux de mortalit : l'tat des routes l'tat du parc automobile les habitudes socio-culturelles par rapport la consommation d'alcool la densit urbaine de l'tat considr
autant de variables qui sont susceptibles d'tre corrles la fois avec la variable explique et avec la variable explicative et dont l'omission induit ncessairement un biais sur la valeur estime du coefficient attach la taxe sur les alcools. Certaines de ces variables dont on sait bien qu'elles exercent une influence sur le taux de mortalit sont particulirement difficiles mesurer. Comment mesurer en particulier le niveau de tolrance culturelle dans un tat de l'union par rapport la consommation d'alcool ? Faut-il pour autant renoncer la prise en compte de ces variables en acceptant du mme coup les consquences de leur omission ? Pas ncessairement si certaines conditions sont vrifies. Imaginons que les valeurs prises par ces variables inobservables ou difficilement mesurables puissent tre considres comme constantes travers le temps pour un individu (tat) donn. Tel est par exemple le cas des variables socio-culturelles dont les caractristiques ne se dforment que trs lentement dans le temps. Le modle peut alors tre ainsi spcifi : MRALLit = + BEERTAXit + Zi + it En exprimant les variables en diffrences premires on voit qu'il est possible de se dbarrasser des variables inobservables et d'obtenir ainsi une estimation sans biais du coefficient attach la variable explicative : MRALLit = BEERTAXit + it - i t-1 Le graphique et le tableau ci-dessous reproduisent la relation qui unit la variation de la taxe sur les alcools entre 1982 et 1988 la variation du taux de mortalit sur cette
mme priode. On voit par consquent que, lorsqu'on prend la prcaution, par ce truchement, de composer avec la prsence de spcificits individuelles, la relation est conforme ce que dictait l'intuition : il y a bien un lien ngatif entre l'importance de la taxe et le taux de mortalit.
1 Variation 82 - 88 MRALL 0.5 0 0 -0.5 -1 -1.5 Variation 82 - 88 BEERTAX 20 40 60
Erreur-type
Statistique t
Probabilit
Avec cet exemple, on peroit dj un peu les bnfices qu'on peut retirer de l'utilisation de donnes de panel : l'estimation de la relation X Y sur donnes chronologiques pour un individu n'est pas toujours possible. Tel est ici le cas : on ne dispose que de 7 observations dans le temps, ce qui est videmment trop peu pour qu'on puisse estimer efficacement le coefficient . Quand bien mme disposerait-on d'un nombre d'observations dans le temps suffisamment grand se poserait ensuite la question du choix de l'individu "reprsentatif" et du caractre gnralisable des rsultats obtenus pour cet individu l'estimation en coupe instantane (envisageable ici puisque le nombre N des individus est suffisamment grand) ne permet pas de composer avec la prsence de spcificits individuelles... ce qui induit, dans ce contexte, un biais sur les coefficients estims Conscients de tout l'intrt qu'il peut y avoir travailler avec des donnes de panel, on
tudie prsent les techniques qui peuvent tre mises en oeuvre pour exploiter le plus efficacement possible toute l'information contenue dans ce type d'chantillon. Section I : structure gnrale et typologie des modles Paragraphe 1 : structure gnrale du modle Quand on travaille sur des donnes de panel, la structure gnrale du modle peut tre exprime, pour lindividu i et pour la date t, sous la forme : Yit = Xit + Zi + it o Yit est lobservation relative au ie individu la date t. it est lerreur du modle relative lindividu i et la date t. On fait sur ce terme derreur un certain nombre dhypothses sur le bien fond desquelles on pourra par la suite sinterroger. En attendant, on suppose que :
E it = E it | X = 0 i, t
E it2 = E it2| X = 2 i, t Le modle ci-dessus peut tre rcrit sous forme matricielle relative lindividu i : Yi = Xi + Zi + i Xi est une matrice T K (o K est le nombre de variables explicatives) 2
On notera Xk,it la ralisation de la ke variable pour lindividu i et la date t. est, lui, un vecteur colonne (vecteur des coefficients de pente). Dans tout ce qui suit, on supposera que le jeu des coefficients k est intangible dans le temps et dans lespace quoique cette hypothse puisse tre leve... au prix dun degr de complexit bien plus lev.
Llment Zi est incontestablement le plus intressant de ce modle en cela quil va permettre lutilisateur, en fonction de sa composition, de spcifier lhomognit ou lhtrognit de la relation dans sa dimension spatiale. Zi est une matrice dont la premire colonne Z1i est une constante (suppose gale 1) qui sera la mme dun individu lautre et quelle que soit la date considre. Les autres colonnes, sil y en a, sont les ralisations dun certain nombre de variables, 1. susceptibles de diffrer dun individu lautre 2. mais rputes constantes travers le temps pour un mme individu. Le modle ci-dessus peut donc tre rcrit sous une forme plus dveloppe :
Dans le cas de lexplication du ROA de la banque i la date t on retrouve au rang des composantes de Zi : . une variable indicatrice de lactivit (spcialise ou universelle) de cette banque . une variable indicatrice de sa nationalit . une variable indicatrice de la cotation de cette banque et c...
Paragraphe 2 : typologie des modles On peut imaginer trois grands types de modles : . le modle des MCO . le modle effet fixes connu aussi sous le nom de LSDV (Least Squares Dummy Variables) . le modle effet alatoire connu aussi sous le nom de modle composantes derreur
. le modle coefficients alatoires . le modle structure de covariance A - Le modle MCO Cest le plus simple. Il se fonde sur le postulat que les individus qui composent lchantillon sont rigoureusement homognes cest dire ne se dmarquent les uns des autres par aucune caractristique spcifique. Ds lors, il ny a quune composante au vecteur Zi : la constante, commune tous les individus. Le modle est ainsi spcifi : Yit = + Xit + it = + 1 X1,it + ... + K XK,it + it o les coefficients sont estims sur la base dun chantillon lintrieur duquel les donnes sont empiles sans gard par rapport aux individus non plus que par rapport aux dates. En termes matriciels et pour lindividu i on a encore : Yi = Xi + Zi + i mais avec une matrice Zi une seule colonne dont tous les lments sont gaux 1 de telle sorte que la constante est la mme pour tous les individus. A la condition que le postulat dhomognit soit fond dune part et que, dautre part, les proprits relatives it soient vrifies (en particulier labsence dautocorrlation) lestimateur MCO de est sans biais, convergent et de variance minimum. B - Le modle effets fixes (LSDV) Imaginons que chaque individu prsente des caractristiques propres susceptibles daffecter la relation tudie. Dans ce contexte dhtrognit des individus une spcification MCO sur donnes empiles qui postule une mme structure X Y quel que soit lindividu tudi induit un biais domission : lestimateur MCO des k est biais et non convergent (cf. cours Economtrie III). Deux cas de figure peuvent tre envisags : . toutes les caractristiques spcifiques sont observables et quantifiables
10
. certaines ne le sont pas... quoiquon sache quelles existent 1) Toutes les caractristiques spcifiques sont observables et quantifiables En admettant que les spcificits individuelles puissent tre mesures, de faon exhaustive, laune des ralisations de deux variables Z2 et Z3 (variables dans lespace mais constantes dans le temps pour un mme individu) 3, le modle peut alors tre rcrit sous la forme : Yi = Xi + Zi + it
avec :
1 = 2 3
o iT est un vecteur de dimension T dont toutes les composantes sont gales 1. Sous forme matricielle, on peut rcrire ce modle comme : Y=X+Z+
Y11 Y1T Y= YN1 Y NT X1,11 X1,1T X= X1, N1 X 1,NT X K,11 X K,1T X K,N1 X K, NT 1 Z2,1 1 Z2,1 Z = 1 Z2,N 1 Z 2,N Z3,1 Z3,1 Z3,N Z3,N
Tel quil est spcifi, ce modle peut, en principe, tre estim par les MCO. Il est peu vraisemblable cependant que les caractristiques qui dterminent les spcificits individuelles puissent tre recenses et mesures de manire exhaustive et, dans ce
Par exemple, dans le cas de lexplication du ROA de la banque i la date t on retrouve au rang des composantes de Zi : . une variable indicatrice de lactivit (spcialise ou universelle) de cette banque . une variable indicatrice de sa nationalit . une variable indicatrice de la cotation de cette banque et c...
11
cas, le risque dun biais domission demeure... sauf envisager une autre spcification du modle. 2) Certaines des caractristiques ne sont pas observables. Plus simplement, un moyen commode de composer avec la prsence de spcificits non observables consiste introduire dans la matrice Z autant de variables dummy quil y a dindividus. Par exemple, dans le cas N = 2 et T = 3 on a :
1 1 1 0 0 0 0 0 0 1 1 1
Z=
Les coefficients 1, 2 reprsentent alors une mesure synthtique de lensemble de toutes les caractristiques spcifiques observables ou non observables- susceptibles dinfluencer la relation tudie. Le risque de biais domission est ainsi considrablement rduit... sous rserve que lhypothse de constance dans le temps des spcificits individuelles ait un rel fondement. Bien sr, comme il sagit dsormais dune mesure synthtique, il devient ipso facto impossible disoler au sein de leffet spcifique ce qui peut tre attribu telle ou telle caractristique en particulier. On verra plus loin que lestimation de ce modle LSDV peut poser quelques problmes de faisabilit (lies la puissance des moyens de calcul) lorsque le nombre dindividus (et donc de variables dummy) est important. Dans ce contexte on verra que la mise en oeuvre de loprateur within peut tre une alternative intressante pour lestimation des coefficients du modle. C - Le modle effets alatoires (modle composantes derreur) Une autre manire daborder la question de lhtrognit des individus lintrieur dun chantillon en donnes de panel consiste interprter le terme derreur comme tant la somme de deux composantes (do la terminologie utilise de modle composantes derreur) : une premire composante it similaire celle qui apparaissait dj dans les modles prcits
12
une seconde, plus originale, postule que chaque individu se dmarque des autres par la ralisation dune variable alatoire ui dont les caractristiques (en particulier, moyenne et variance) sont identiques dun individu lautre.
Ce type de modle est ainsi spcifi : Yit = + Xit + ui + it avec ui ~ IID(0, u). Attention, contrairement ce qui se passe dans le cadre du modle effet fixe pour lequel les individus se dmarquent les uns des autres par un lment constant, la composante ui qui apparat ici nest pas une constante mais bien la ralisation dune variable alatoire. Bien sr, comme on sait que la prsence dune corrlation entre terme derreur et variables explicatives engendre des problmes de biais dans lestimation des coefficients du modle, lhypothse sous-jacente lusage dun modle composante derreur est que la composante alatoire spcifique ui nest pas corrle avec les variables explicatives du modle. Cette hypothse sous-jacente peut tre suspecte dans certaines circonstances. Imaginons par exemple quil sagisse dexpliquer le salaire dun individu. Au rang des variables explicatives on retrouvera sans surprise des variables reprsentatives de lanciennet dans lentreprise mais aussi, et de manire plus intressante, le nombre dannes dtudes ou encore le niveau de diplme. Llment spcifique alatoire est rput rendre compte des influences exerces par toutes les variables omises ou non observables... au rang desquelles figurent vraisemblablement les qualits innes de lindividu, dont on peut penser quelles ne sont sans doute pas totalement indpendantes du nombre dannes dtudes ou du niveau de diplme. Il est alors difficile de soutenir que cette composante alatoire est sans corrlation avec les variables explicatives retenues. D - Le modle coefficients alatoires. A vrai dire, le modle composante derreur se dmarque du modle MCO rapidement prsent au A en cela que ce qui est ncessairement constant dans le modle MCO :
13
Yit = + Xit + it devient alatoire dans le modle composante derreur : Yit = ( + ui) + Xit + it On peut gnraliser ce traitement rserv jusquici llment constant lensemble de tous les coefficients du modle qui devient alors : Yit = ( + ui) + Xit ( + hi) + it Lhypothse qui est faite dans ce cas est que les valeurs des coefficients peuvent diffrer alatoirement dun individu lautre quoiquen esprance ces coefficients soient identiques. Les modles hirarchiques compltent cette panoplie de modles coefficients alatoires en mnageant la possibilit de coefficients alatoires dont les esprances pourraient varier dun individu lautre. Le modle est alors ainsi spcifi : Yit = ( + ui ) + Xit ( + hi + zi) + it o zi est un vecteur de variables dont les ralisations sont spcifiques lindividu i (p. ex. le niveau de diplme pour reprendre lexemple prcdent) et un vecteur de coefficients. On voit que, dans ce cas, le coefficient attach chacune des variables reprsentes dans la matrice X est susceptible de varier dun individu lautre la fois en niveau et en esprance. E - Le modle structure de covariance Une autre faon (assez peu exploite jusquici) de modliser les spcificits individuelle consiste introduire llment dhtrognit non pas au niveau des coefficients du modle mais plutt celui de la matrice des variances covariances du terme derreur it en posant que le terme derreur prsente une proprit dhtroscdasticit dans la dimension des individus : Var it = i2
Exemple : prendre le fichier AIRLINE_COST_FUNCTION.WF1 (source Greene). Sous Eviews 5, il sera bon de structurer le fichier en fonction des individus
14
et des dates. On sintresse la modlisation de la fonction de cot laquelle serait confronte une compagnie arienne. A cet effet, on a collect un certain nombre dinformations relatives 6 compagnies ariennes sur une priode de 15 ans pour ce qui concerne : le cot total de production C apprci en milliers de US $ le niveau de la production Q (nombre de miles par passager transport) le prix du fuel P le taux dutilisation des capacits de production LF
La fonction de cot est spcifie sous la forme : Log C = + 1 Log Q + 2 Log P + 3 LF + Lestimation par les MCO sur donnes empiles (pooled data) a abouti au rsultat suivant :
Dependent Variable: LOGC Method: Least Squares Sample: 1 90 Variable LOGQ LOGP LF C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient 0.883 0.454 -1.628 9.517 0.988 0.988 0.125 1.335 61.770 0.383
Std. Error 0.013 0.020 0.345 0.229 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
Prob. 0.000 0.000 0.000 0.000 13.366 1.132 -1.284 -1.173 2419.341 0.000
On notera que les coefficients qui rsultent de cet ajustement sont significatifs et ont le signe attendu. Paragraphe 3 : Homognit des donnes et homognit des comportements A - Intrt de la question : consquences dune htrognit ou dune homognit mal spcifie La toute premire question laquelle on devrait normalement apporter une rponse avant mme de songer lestimation des coefficients du modle cest celle qui consiste se demander : les individus qui composent lchantillon prsentent-ils ou non des spcificits individuelles susceptibles dinduire des comportements diffrents pour ce qui concerne la relation tudie. La question est dimportance car elle va dterminer le choix entre deux grandes catgories de modles.
15
si on peut montrer (par un test appropri) que les individus ont des comportements homognes, il ny a pas lieu de tenir compte de spcificits individuelles... sauf accepter une perte defficience dans lestimation des coefficients attachs aux diffrentes variables explicatives. On privilgie dans ce cas une estimation par les MCO sur un chantillon pour lequel les donnes dans le temps et dans lespace sont finalement empiles les unes sur les autres.
si, en revanche, on peut montrer quil y a bien htrognit des comportements, lestimation MCO sur donnes empiles nest plus approprie puisquelle ignore les spcificits individuelles. On doit alors redouter lexistence dun biais probable domission.
Exemple : Hetero_Non_Specifiee.prg. On montre ici quune htrognit des comportements non prise en compte se traduit gnralement 4 par un estimateur biais des coefficients attachs aux diffrentes variables explicatives. B - Les tests dhomognit des comportements Il sagit ici de rpondre la question de lopportunit de la prise en compte dune htrognit des comportements. On sintresse uniquement la possibilit dune htrognit interindividuelle 5. En partant de l'hypothse nulle la plus contraignante celle d'une homognit complte des comportements- et en progressant vers des hypothses alternatives de moins en moins contraignantes pour s'acheminer vers celle d'une htrognit complte, on va construire pour chaque couple d'hypothse (H0 versus HA) une statistique de test de Fisher. C'est sur la base de ces statistiques que peut tre tabli, in fine, le type d'htrognit auquel on est confront. Cette stratgie de test peut tre prsente conformment au schma de la page suivante. La statistique de test est une statistique de Fisher construite sur la base des sommes
Dans le cas pour lequel la (les) variable(s) explicative nentretient aucun lien avec limportance de leffet fixe, lestimateur
MCO de obtenu sur donnes empiles est simplement inefficace quoique sans biais et convergent.
5
On peut en effet concevoir que lhtrognit des comportements puisse sexprimer non seulement dans la dimension
individuelle mais aussi dans la dimension temporelle. Cette htrognit se traduit alors par un modle pour lequel les coefficients sont susceptibles de prendre des valeurs diffrentes en fonction de la date laquelle la relation est apprcie.
16
des carrs des rsidus induites par lestimation des modles sous-jacents lhypothse nulle et lhypothse alternative faisant lobjet du test. Cest ainsi, par exemple, que, dans le cas du test dhomognit complte versus htrognit total, la statistique de test est ainsi calcule : ESS(H 0 ) ESS(H A ) (k + 1) (N 1) F= ESS(H A ) NT N (k + 1) o N est le nombre dindividus, T le nombre dobservations dans le temps, k le nombre de variables explicatives (hors constante).
17
OUI
REJET
NON
Yit = + Xit + it
OUI
REJET
NON
Yit = i + Xit + it
OUI
REJET
NON
Yit = i + i Xit + it
Yit = + i Xit + it
18
Remarque : pour la ralisation de ces diffrents tests dhypothse on utilise le plus souvent, pour des raisons de commodit, la mthode LSDV ce qui revient admettre que, si spcificits il y a, celles-ci seraient de type fixe. Comprenons bien que ces tests de spcification ont pour vocation de dceler la prsence dune possible htrognit des comportements mais quils ne nous renseignent en aucune faon sur la nature fixe ou alatoire- de ces effets spcifiques. Note : le plus souvent, on pourra se contenter dune procdure de test simplifie qui consiste confronter les sommes des carrs des rsidus de deux modles simplement : le modle qui postule lhomognit complte des comportements dun individu lautre (hypothse nulle H0) : Yit = + Xit + it celui qui intgre une htrognit partielle des comportements, cette htrognit prenant la forme de constantes spcifiques : Yit = i + Xit + it C - Homognit des donnes : la dcomposition de la variance Au del de la question de lhomognit des comportements, se pose aussi celle de lhomognit des donnes elles mmes. On dira que, pour une variable donne (quil sagisse au demeurant de la variable explique Y ou de lune des K variables explicatives Xj), il y a homognit des donnes si la distribution de cette variable dans le temps est trs proche dun individu lautre. Sur la base de cette dfinition, lune des conditions de lhomognit des donnes est que, pour la variable tudie, les moyennes individuelles soient identiques. Un bon indicateur du degr dhomognit des donnes peut tre construit partir de la dcomposition de la variabilit totale TSS de la variable tudie. On montre ici que la variabilit totale dune variable (par exemple Y) peut tre dcompose comme la somme de sa variabilit inter-individuelle (variabilit between BSS) de sa variabilit intra-individuelle (variabilit within WSS)
19
( Y
N T i =1 t =1
it
Y)
o Y est la moyenne gnrale de Y telle quelle peut tre calcule sur lensemble de lchantillon : Y = On montre que : TSSYY = WSSYY + BSSYY avec : WSSYY = 1 Yit T t 1 Yit NT i t
( Y
N T i =1 t =1
it Yio )
BSSYY = T
(Y
N i =1
io
Y)
avec Y io =
En effet, on a :
( Yit Y ) =
N T 2 i =1 t =1
( Y
N T i =1 t =1 2
it
Yio + Yio Y )
N T
=
N T
( Y
N T i =1 t =1 it
it Yio ) + ( Yio Y ) + 2 2 i =1 t =1
( Y
N T i =1 t =1
it
Yio )( Yio Y )
Or,
N
( Y
i =1 t =1 T it
( Y
i =1 t =1
Yio )( Yio Y )
( Y
i =1 N i =1
io
T Y ) ( Yit Yio ) t =1
CQFD
20
entre les moyennes individuelles et de la variabilit dans le temps des Y par rapport leurs moyennes individuelles. Ce qui est dit ici de la variabilit de Y peut l'tre tout aussi bien de n'importe quelle autre variable ou mme de la covariabilit de X et Y. On pourrait montrer de la mme faon que la variabilit totale de Y peut aussi tre interprte comme la somme de :
( Y
N T i =1 t =1
it
Y) =
2
( Y
N T i =1 t =1
it
Yot ) + ( Yot Y )
2 N T i =1 t =1
o
N
( Y
N T i =1 t =1 T ot
it
( Y
i =1 t =1
gnrale. Deux cas particuliers mritent dtre signals : 1. Sil y a parfaite homognit des donnes, les moyennes individuelles de Y (resp. de X) sont identiques entre elles et identiques la moyenne gnrale de Y (resp. de Y). Dans ce contexte, la variabilit inter-individuelle BSSYY de Y est nulle et la variabilit totale est gale la variabilit intra-individuelle WSSYY. Homognit parfaite des donnes TSSYY = WSSYY 2. Si, en revanche, pour un mme individu (et ceci quel que soit lindividu considr), la valeur de Y ne scarte jamais de sa moyenne individuelle (pas de variabilit dans le temps), la variabilit intra-individuelle est nulle et la variabilit totale est alors gale la variabilit inter-individuelle BSSYY Stabilit dans le temps de la valeur de Y pour un mme individu TSSYY = BSSYY Intrt de la dcomposition de la variabilit des X et des Y : si on peut montrer que la variabilit des X et des Y travers le temps (variabilit intra-individuelle) est trs faible pour un mme individu (quel que soit celui-ci), il nest pas trs utile de chercher exploiter la dimension temporelle du panel : dans ce cas on peut trs bien se contenter de travailler simplement sur les moyennes individuelles des X et des Y pour
21
estimer le modle en coupe instantane (cft infra lestimateur Between). Exercice : airline_cost_function.wf1 On se pose ici la question du degr dhomognit des observations relatives aux cots de production de 6 compagnies ariennes. Apprciez, sous Eviews 5, ce degr dhomognit en dcomposant la variabilit totale de LOGC. Slectionnez la variable LOGC puis cliquez sur VIEW - Tests for Descritive Statistics - Equality Test by Classification Choisissez la srie i comme variable classifiante et cochez le test dgalit des moyennes (individuelles)
Test for Equality of Means of LOGC Categorized by values of I Date: 14/05/04 Time: 19:18 Sample: 1 15 Included observations: 90
Method
df
Value
Probability
(5, 84)
31.87474
0.0000
Source of Variation
df
Sum of Sq.
Mean Sq.
5 84 89
I 1 2 3 4 5 6 All
Count 15 15 15 15 15 15 90
Std. Err. of Mean 0.127710 0.175714 0.134797 0.187810 0.183823 0.230249 0.119320
On rejette fortement lhypothse nulle dgalit des moyennes individuelles. La part de la variabilit inter-individuelle est forte au sein de la variabilit totale. Il y a htrognit des donnes relatives cette variable. Attention : lhtrognit des donnes et, en particulier le fait que les moyennes individuelles d'une mme variable soient significativement diffrentes les unes des
22
autres ne permet pas de prjuger de lhtrognit des comportements. Les moyennes individuelles des variables du modles peuvent tre trs diffrentes dun individu lautre sans que, pour autant ; les comportements soient fondamentalement diffrents (les paramtres de la fonction de consommation peuvent trs bien tre identiques dun individu lautre mme si ces individus ont des niveaux de revenu et des niveaux de consommation peuvent tre trs diffrents.
Section II : Le modle sur donnes empiles : estimateur MCO et estimateur Between Ce type de modlisation nest appropri que dans le cas pour lequel lhomognit des comportements a pu tre tabli. On passera assez rapidement sur cette premire classe de modle qui ne diffre pas des modles traditionnels. En admettant que lhomognit des comportements ait donc pu tre tablie, rien ne soppose ce que la relation X Y puisse tre spcifie sous la forme : Y = iNT + XNT,K + et estime directement par les MCO. Sous rserve que les bonnes proprits habituelles de lerreur soient ici encore vrifies et que lhypothse dhomognit des comportements soit fonde, lestimateur MCO de est sans biais, convergent et efficace. Dans le cas particulier pour lequel la variabilit intra-individuelle (within) de Y est ngligeable (en termes relatifs), on peut, sans grande perte dinformation, utiliser lestimateur Between ou estimateur sur les moyennes individuelles. Le principe en est relativement simple puisquil consiste, comme lindique son nom, conduire un ajustement MCO non plus sur les donnes brutes mais sur les moyennes individuelles :
Yio = + X io + io
Il est clair que ce type de modle ne peut tre envisag lorsque les observations sur Xk
23
et Y prsentent une forte variabilit dans le temps (within) : dans ce cas, le fait de ne travailler que sur les moyennes individuelles aboutit une perte importante dinformation (puisque, vrai dire, on remplace chaque Xk,it par sa moyenne individuelle X k,io) qui se paie en termes defficacit de lestimateur.
24
Section III : Le modle effets fixes Paragraphe 1 : Spcification et estimation. Estimateur LSDV et estimateur Within. Avec le modle effets fixes, on prend en compte lhtrognit des comportements des individus qui composent lchantillon en considrant que les quations qui rgissent les relations X Y se dmarquent, dun individu lautre, par un simple lment constant i de telle sorte que ce modle a pour expression : /2.1/ Yit = i + 1 X1,it + + K XK,it + it
de dimension T K
et =
de dimension K 1
A un niveau plus agrg encore (celui de lensemble des individus) le modle est rcrit :
1 2+D K 1 2 N
/2.2/
Y=X
25
D=
i T 0 0
0 iT 0 0 iT 0
et de dimension K 1 Dans un souci de concision on peut aussi concatner : les matrices X et D horizontalement : Z = [D : X] les vecteurs de coefficients et verticalement : = dimension K+N 1
et le modle peut tre rcrit plus simplement encore : Y=Z+ Comme on la dj dit, rien ne soppose, thoriquement ce que les coefficients du modle (les K coefficients du vecteur et les N coefficients du vecteur ) soient estims par les MCO :
26
Ces conditions du premier ordre constituent un systme de K + N quations K + N inconnues dont la rsolution fournit les estimations des coefficients. Ce systme qui peut tre trs volumineux peut tre considrablement simplifi dans le cas pour lequel N est grand. On note en effet que de la condition 2 on peut dduire :
= (DD)-1 [DY - D X ] En reportant cette expression de dans la premire quation il est possible de donner lexpression de la matrice des estimateurs des seuls coefficients k : X Y = XX + XD (DD)-1 [DY - D X ] = [XX XD (DD)-1 DX] + XD (DD)-1 DY
soit encore : X [I D (DD)-1 D] Y = X [I D (DD)-1 D] X ce qui peut scrire plus simplement : X W Y = X W X en posant W = I D (DD)-1 D. On tudiera par la suite les proprits intressantes de la matrice B = D (DD)-1 D (oprateur Between ) et de la matrice W = I - B (oprateur Within ). On en dduit lexpression de lestimateur within with : with = (X W X)-1 X W Y Munis des estimations des coefficients j il est ensuite possible, dans un deuxime temps, den dduire celles des coefficients i, cest dire des effets fixes. On sait en
27
et on montre que lestimateur qui vient dtre dfini est lestimateur des MCO dun modle Yit - Y i o = 1 (X1,it avec Y i o =
1 T Yit T t =1
Xk,i o = 1 X k,it T
t =1
o les variables, comme on le voit, sont exprimes en cart par rapport leurs moyennes individuelles. La matrice W = INT,NT D (DD)-1 D est de dimension NT NT. Elle a une structure et des proprits trs particulires.
i T 0 Rappelons que D = 0 0 0 de telle sorte que cette matrice peut aussi tre 0 iT 0
iT
28
(D D)N,N =
T 0 0 0 T 0 0 0 T
et (DD)-1N,N =
1 T 0 0
0 1 0 T 1 0 T 0
(D (DD)-1 D)NT,NT =
1 T 1 T 0 0 0 0
1 T 1 T
0 0
0 0 0 0 1 1 T T 1 1 T T 0 0 0 0
0 0 0 0
0 0 0 0 1 1 T T 1 1 T T
0 0
Au sein de cette matrice D (DD)-1 D : il y a en ligne comme en colonne N sous blocs de matrices o chaque bloc de matrice est lui-mme de dimension T T
Par exemple, dans le cas pour lequel N = 2 et T = 3 on a : -1 D (DD) D = 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33 0.00 0.00 0.00 0.33 0.33 0.33
Quest-ce qui se passe par consquent quand on multiplie, par exemple, cette matrice D (DD)-1 D par la matrice YNT,NT ? On obtient alors une matrice dont les
29
Y1 Y 1 -1 D (DD) D Y = B Y = YN YN
De la mme faon on a :
30
Between dailleurs) :
1/ la matrice W est symtrique 2/ la matrice W est idempotente De ces deux proprits il dcoule que : W W = W W = W En rsum, on peut crire que : B = D (DD)-1 D =
1 IN T 1 IN T JT
W = INT B = IN
IT -
JT
o JT est une matrice carre de dimension T dont toutes les composantes sont gales 1, IN et IT sont des matrices identit de dimensions N et T respectivement. Exercice : proprietes_mat_D.prg : ce programme autorise le calcul de D, B , W et dexprimenter les diffrentes proprits de loprateur Within.
Paragraphe 3 : variance de lerreur et variance de lestimateur within dans le modle effets fixes A - Lestimateur within de la variance de lerreur
On vient de voir quil est possible de simplifier la question de lestimation des coefficients j dans le modle effets fixes Yit = i + 1 X1,it + + K XK,it + it en travaillant sur des variables centres par rapport leurs moyennes individuelles. On aboutit ainsi lexpression de lestimateur within des K coefficients j
31
with = (X W X)-1 X W Y
et celle des N effets fixes i : with = (DD)-1 D (Y X with) de telle sorte que, pour chaque i on a : i = Y io - 1 X 1,i o - ... - K X K,i o Munis de ces estimations des pentes et des effets fixes, il est possible de calculer les rsidus de l'ajustement : it = Yit - i - 1 X1it - ... - K XKit ainsi que la somme des carrs de ces rsidus et la variance estime s2 de lerreur du modle (suppose homoscdastique). Cette variance estime de lerreur est donne par : s =
2
N T 1 Yit i 1 X1,it ... K X K,it NT N K i =1 t =1
Attention : on a vu que lestimateur within des j est lestimateur des MCO appliqu des variables centres sur leurs moyennes individuelles. Si, aprs avoir centr les variables, on utilise sans prcautions la mthode des MCO on va calculer (selon la procdure automatique) la variance de lerreur comme s2 =
N T 1 Yit i 1 X1,it ... K X K,it NT K i =1 t =1
en oubliant, tort, que les moyennes individuelles ont du, elles-mmes, faire lobjet dune estimation. On sous-estime alors la variance de lerreur... et donc celles des estimateurs des coefficients. B - Lestimateur within de la variance des estimateurs des coefficients La matrice des variances covariances estimes des estimateurs des coefficients se calcule comme dans le cas du modle de rgression multiple ceci prs quon travaille dsormais sur des variables centres sur leurs moyennes individuelles. La matrice des variances covariances est donc dtermine partir des matrices Y* et X* qui sont les matrices des valeurs centres de Y et des Xj sur leurs moyennes
32
= s2 (X W X)-1 puisque loprateur within W est symtrique et idempotent. Connaissant les variances estimes des estimateurs des coefficients j il est ensuite facile de retrouver celles des effets fixes en se servant du fait que les estimateurs des effets fixes sont des combinaisons linaires des j et de Y puisque :
1 2 K
Il est alors possible de montrer que lestimateur de la variance de i within est donn par : s V ( i within) = avec x io = x1,io
o, de faon plus gnrale : X1,1o X avec X N,K = 1,2o X1,No X 2,1o X 2,2o X 2,No X K,1o X K,2o X K,No
2
+ x io V() x io '
x 2,io x K,io
s V ( wit) =
+ X V() X '
Il est intressant de noter que la transformation des variables (et donc du modle) par le truchement de loprateur within cre automatiquement un phnomne dautocorrlation des erreurs l o, dans le modle sminal, il ny en avait pas. En effet, on passe du modle : Yit = i + 1 X1,it + + K XK,it + it un modle en variables dcarts aux moyennes individuelles : Yit - Y io = 1 (X1,it - X1,io) + + K (XK,it - XK,io) + (it - io)
33
Il est clair, dans ces conditions, que le nouveau terme derreur (it - io) est autocorrl puisque (it - io) et (is - io) ont un lment commun io. On note toutefois que cette autocorrlation ne peut jamais tre observe qu lintrieur du groupe dobservations relatives un mme individu. En dpit de cette autocorrlation artificielle, il est possible de montrer (sur la base du thorme de Kruskal qui sapplique ici et sous rserve que par ailleurs le terme derreur it prsente toutes les bonnes proprits nonces plus haut) que lestimateur des MCO sur donnes en carts aux moyennes individuelles est rigoureusement quivalent lestimateur MCG appliqu ces mmes donnes6. Exercice : airline_cost_function.wf1 et between_estimator.prg : donnez les estimateurs between du modle : LOGCit = + 1 LOGQit + 2 LOGPit + 3 LFit + it Calculez aussi les t de student et le R2.
Section IV : Le modle effets alatoires Paragraphe 1 : Le modle A - La problmatique Un des inconvnients du modle effets fixes tient ce que le coefficient i est vraiment propre lindividu i et uniquement cet individu. Ceci signifie que les prvisions construites partir du modle estim ne peuvent jamais porter que sur les individus faisant partie de lchantillon destimation. Autrement dit, les rsultats mis en vidence pour les individus faisant partie de cet chantillon ne peuvent tre extrapols lensemble de la population dont cet chantillon a t extrait. Cette proprit nest gure gnante si lobjet dtude est un groupe de pays clairement identifis et dont il sagit didentifier les spcificits. Il peut tre trs intressant par exemple, sagissant de ltude des fonctions de production macroconomiques des pays qui composent la zone euro de mettre en vidence, dessayer de voir sil y a des
34
spcificits pays et, le cas chant, didentifier les origines possibles de ces spcificits. En revanche, imaginons prsent quon sintresse aux habitudes de consommation des franais en gnral ; on a constitu cet effet un chantillon de 10000 individus reprsentatifs de la population. Aprs avoir mis en vidence lopportunit de modliser lhtrognit des individus on a estim un modle effets fixes qui attribue chaque individu de lchantillon une constante spcifique. La question est : quel intrt y a-t-il savoir que Mr X prsente une constante spcifique suprieure celle de Mlle Y ? Dans ce cas, le modle, tel quil a pu tre estim sur la base de cet chantillon, est de peu dintrt ds lors quil sagit de gnraliser les rsultats obtenus lensemble de la population. Dans un tel contexte, on doit privilgier lusage dun modle effets alatoires. B - Spcification du modle et proprits supposes des termes derreur On pose dsormais que : Yit = + Xit + ui + it = + Xit + it avec it = ui + it ou, en termes matriciels : au niveau individuel i :
Yi = iT + Xi + u i + i
T 1 T 1 T K K 1 T 1
T 1
avec :
u i u i u i i1 i2 iT
ui =
i =
Y = i NT + X + u
NT 1 NT K K 1
NT 1
NT 1
On suppose dsormais que la spcificit individuelle ui dont la valeur, pour un mme individu, est stable dans le temps, est la ralisation dune variable alatoire dont la loi de distribution est la mme pour tous les individus. A partir de l, et en admettant que les coefficients et paramtres du modle aient dj t estims, il devient possible de
35
construire une prvision pour nimporte quel individu tir de la population mre quand bien mme celui-ci naurait pas fait partie de lchantillon utilis pour lestimation... exercice impossible avec le modle effet fixe. On fait sur les erreurs ui et it les hypothses suivantes (en esprant quelles soient vrifies !) : E(it | X) = E(ui | X) = 0 i, t : linformation contenue dans X nest daucune utilit pour prvoir la valeur de it ou celle de ui E(it2 | X) = 2 i, t : lerreur est homoscdastique E(ui2 | X) = u2 i : lventail des valeurs possibles de ui est le mme (et avec les mmes probabilits) dun individu lautre E(uj it | X) = 0 i, j, t : les deux composantes de lerreur ne sont pas corrles entre elles, quil sagisse dun mme individu ou non E(it js | X) = 0 i, j, t, s , pour i j ou t s : les erreurs ne sont ni autocorrles ni corrles entre des individus diffrents E(ui uj | X) = 0 i, j, i j: les erreurs spcifiques ne sont pas corrles dun individu lautre. C - Matrice des variances covariances de lerreur du MCE On note que la matrice des variances covariances des erreurs it du modle prsente une structure particulire... qui justifiera lusage dun estimateur adapt. En effet, en notant la matrice des erreurs avec it = ui + it on a :
11 1T = N1 NT
et donc NT NT= E
2 11 111T 0 0 0
111T 0 0 0 0 0 0 1T
2
0 0 0 0 0 0 0 0 0 N1
2
N1NT NT
2
N1NT
= IN
36
ou, encore :
0 = 0 0
0 0 0
0 0 0
0 0 0
2 + u 2 2 u 2 u u 2 u
2 2 2
u u
2
2 2 2
avec = E
i1iT 2 iT i1 iT
2 i1
+ u u u
2 2
+ u u
2
u 2 u 2 2 + u u
2 2
= 2 IT + u2 iT iT = 2 IT + u2 JT
o iT est un vecteur colonne unitaire de dimension T et JT = iT iT une matrice carre unitaire. On en dduit que = 2 [IN IT] + u2 [IN JT]. Il est clair, compte tenu des proprits des erreurs nonces ci-dessus, que : les covariances entre les erreurs de deux individus diffrents sont nulles les covariances entre les erreurs dun mme individu mais des dates diffrentes sont gales 2u (puisque ui est alors la seule composante commune de ces deux erreurs) la variance de lerreur relative lindividu i la date t est gale u2 + 2.
On montre, pour en terminer avec ltude des proprits de la matrice , que celle-ci peut tre exprime comme une combinaison particulire des oprateurs within et between. En effet on a : = 2 [IN IT] + u2 [IN JT] = 2 IN [IT +
u
2 2
JT]
37
= 2 IN [IT -
JT T JT T JT T JT T
JT T
2 2
JT]
u
2 2
= 2 IN [(IT -
)+
JT T JT T
(1 + T
2
)]
2
= 2 IN [(IT -
)+
+ T u JT T
2
]
2
= 2[ IN (IT 2
) + IN
2
+ T u
2
= 2 [W +
+ T u
2
B]
= 2 W + (2 + T u2) B On voit donc bien que la matrice des variances covariances est, en effet, une combinaison linaire des oprateurs within et between. On peut facilement vrifier (rsultat quon aura rutiliser) que : -1 =
1 2
[W + B]
avec =
2 2
+ T u
Paragraphe 2 : Proprits des estimateurs Between et Within appliqus au modle composantes derreur. En admettant que le modle X Y prenne la forme dun modle composantes derreur : Y=i+X+u+ on peut envisager plusieurs classes destimateurs lmentaires pour les coefficients du modle. Lestimateur des MCO :
mco = (X1 X1)-1 X1 Y
en prenant la prcaution de dfinir X1 comme tant la matrice X augmente dune premire colonne unitaire
38
Lestimateur Within :
Lestimateur Between :
within = (X W X)-1 X W Y
On note au passage que le vecteur between (tout comme le vecteur mco dailleurs) prsente une composante de plus (lestimateur du coefficient ) que le vecteur within. Quoiquil puisse tre dmontr que, dans le contexte dfini par les hypothse relatives aux termes derreur, ces estimateurs demeurent sans biais 8 et convergents, ils ne sont pas, en revanche, de variance minimum (cf. cours de licence). On doit leur prfrer lestimateur des MCG.
est dfinie positive (ce qui est en effet le cas), alors il existe ncessairement une
matrice H, de mme dimension que la matrice telle que : H H = I On dduit de ce rsultat que :
Attention : lestimateur within ne peut tre dfini comme (X1 W X1)-1 X1 W Y puisque, dans ce cas,
la matrice (X1 W X1) nest pas inversible. On note en effet que toutes les composantes de la premire colonne de la matrice X1 sont gales 1. On en dduit que la premire colonne de X1 W est nulle et donc (X1 W X1) nest pas inversible.
8
Ceci est particulirement simple mettre en vidence dans le cas de lestimateur within puisque, en
travaillant sur les carts aux moyennes individuelles, on gomme la totalit des effets alatoires spcifiques ui : Yit = + Xit + ui + it
Yit -
Y i = (Xit - X i) + it - i
39
On peut montrer, compte tenu de la structure dsormais familire de la matrice , que cette matrice H a pour expression : H = IN Hi avec : Hi = o = 1
+ T u
2 2
I T T i T i T '
10
Quel intrt y a-t-il dfinir cette matrice H ? La rponse cette question passe par ltude des proprits du terme derreur dans le modle ainsi transform : HY = HX + H ( + u)
11
On note en effet que, si dans le modle primitif (Y = X1 + + u) le terme derreur + u est auto-corrl il en va diffremment dans le modle transform puisque : E [H ( + u) ( + u) H] = H H = INT
En effet on a : H = I H H H = H H = (H H)-1 H H H = I = (H H)-1 Le programme omega_hprimh.prg met en vidence lquivalence entre ces deux critures de :
10
11
Rappelons que la matrice X est ici augmente dune premire colonne unitaire.
40
de telle sorte que, au final, lerreur H ( + u) du nouveau modle est homoscdastique... et le modle peut (pourrait) alors tre estim par les MCO. Lestimateur MCG est donc lestimateur MCO du modle transform :
mcg = (XHHX)-1 XHHY = (X-1X)-1 X -1 Y On peut montrer que lestimateur MCG est une moyenne pondre des estimateurs
1 2
2 I N IT 2 u 2 I N J T + T u
o, rappelons-le, JT est une matrice carre de dimension T et dont tous les lments sont gaux 1. En partant de cette dernire expression de -1 on peut crire que : -1 = 1 2
2 1 1 I N IT I N J T + I N J T 2 u 2 I N J T T T + T u
Or, on se souvient que loprateur between B et loprateur within W sont tels que : B = D (DD)-1 D =
1 IN T 1 IN T JT
IT -
JT
-1 =
1 2
2 1 W + IN JT 2 u 2 IN JT T + T u
1 2
2 2 1 T u 1 1 IN JT = I JT W + IN JT 2 W + 2 2 2 2 N T T + T u + T u
41
1 2
2 1 W + 2 2 B = 2 [ W + B] + T u
en posant que :
2 2 + T u
2
Ds lors, lexpression de lestimateur mcg devient : mcg = [X (W + B) X]-1 X (W + B) Y = [X (W + B) X]-1 X W Y + [X (W + B) X]-1 X B Y Posons prsent : FW = [X (W + B) X]-1 X W X FB = [X (W + B) X]-1 X B X On voit tout de suite que FW + FB = 1 et que, donc : FB = I FW. Or FW with = [X (W + B) X]-1 X W X (X W X)-1 X W Y = [X (W + B) X]-1 X W Y correspond au premier lment de mcg De la mme faon, on a : FB betw = (I FW) betw = [X (W + B) X]-1 X B X (X B X)-1 X B Y = [X (W + B) X]-1 X B Y correspond, lui, au second lment de mcg. On en dduit que : mcg = FW within + (I FW) between On notera que : 1. dans le cas pour lequel = 0 (ce qui se produit, compte tenu de lexpression mme de , lorsque le nombre T des observations dans le temps tend vers linfini), tous les lments de la matrice FB = I FW sont nuls ; lestimateur des MCG converge donc vers lestimateur within quand T tend vers linfini.
cqfd
42
2. dans le cas oppos pour lequel = 1 (ce qui se produit lorsque la variance de ui tend vers 0, cest dire lorsquil ny a pas deffets spcifiques puisque les ui sont alors identiques), lestimateur des MCG converge vers lestimateur MCO du modle en pooling (aucune spcificit individuelle) puisque, en effet, dans ce cas on a : = 2 [IN IT] + u2 [IN JT] = 2 INT On voit tout de suite quon retrouve alors une matrice des variancescovariances qui est diagonale (pas dautocorrlation) et homoscdastique : lestimateur des MCG est alors analogue celui des MCO. Dans le cas gnral pour lequel est compris strictement entre 0 et 1, lestimateur des MCG doit par consquent tre interprt comme une combinaison linaire de lestimateur within (htrognit forte) et de lestimateur MCO sur donnes empiles (absence dhtrognit). La matrice des variances covariances de lestimateur des MCG est donne (rsultat connu) par :
V( mcg) = [X -1 X]-1 = 2 [X (W + B) X]-1 On peut montrer que les lments diagonaux de cette matrice (cest dire les variances des estimateurs MCG des coefficients) sont infrieurs ce queussent t ces mmes lments, dans le mme contexte marqu par la prsence deffets alatoires, si on avait privilgi lusage (alors inappropri) de lestimateur effets fixes within. Dans ce contexte, lestimateur des MCG est lestimateur BLUE (quoique, rappelons-le, lestimateur within, en particulier, demeure un estimateur sans biais et convergent).
43
paramtres sont inconnus : il faut les estimer. On peut imaginer pour cela plusieurs procdures. Lune des mthodes 12 les plus couramment utilises (sans doute en raison de sa simplicit) consiste exploiter les variances des rsidus issus de lestimation du modle composantes derreur par les mthodes within dune part et between dautre part. La variance rsiduelle de lestimateur within du modle effets alatoires Rappelons que, en partant de lexpression gnrale du modle erreurs composes Yit = +
k =1
X k ,it + i t
avec it = ui + it
on peut liminer les spcificits individuelles en travaillant sur des variables centres autour de leurs moyennes individuelles : Yit Yio = soit matriciellement : WY=WX+W Lestimateur within du modle erreurs composes est donn par :
with = (XWWX)-1 XW W Y et, comme la matrice W (oprateur within) est symtrique et idempotente with = (XWX)-1 X W Y La matrice des rsidus issus de lestimation du modle effets alatoires sur donnes centres sur les moyennes individuelles est donne par : with = W Y W X with On peut montrer13 que la somme des carrs des rsidus pondre par le nombre de degrs de libert de ce modle (NT observations N moyennes individuelles K coefficients)
k =1
(X k,it X k,io ) + it - io
12
13
44
sw2() =
est un estimateur sans biais de la variance thorique de la composante non spcifique de lerreur dans le modle MCE : E sw2() = 2 La variance rsiduelle de lestimateur between du modle effets alatoires En appliquant loprateur between au modle composantes derreur il vient : Yio = 0 + soit, matriciellement : B Y = B X1 + B en prenant, on le rappelle, la prcaution de dfinir X1 comme la matrice X augmente dune premire colonne dont tous les lments sont gaux lunit. Lestimateur between du modle ainsi transform est :
betw = (X1 B X1)-1 X1 B Y et le vecteur des rsidus 14 qui en rsulte : betw = B Y B X1 betw La variance des rsidus issus de ce modle : sB2() =
N T 1 ' i t 2 = (Nbetwk betw (N k b ) T i =1 t =1 b) T
j=1
X j,io + i o
avec io = ui + io
est, elle, un estimateur sans biais de la variance thorique de ui + io, cest dire de
14
composantes et non pas N composantes individuelles seulement. Pour un mme individu il y a T rsidus identiques. Cette remarque a son importance dans le calcul de la somme des carrs de ces rsidus !
45
u+ T
2
15
s2W T s2 B
j=1
jmcqg
X j,oo
Enfin, la matrice des variances covariances thoriques des estimateurs des coefficients : V( mcg) = [X -1 X]-1 = 2 [X (W + B) X]-1 o 2 est la variance thorique de la composante non spcifique de lerreur peut tre approche par sw2() puisque E sw2() = 2. Ds lors, la matrice des variances covariances des estimateurs des coefficients peut tre estime par :
2 V ( mcg) = sw () [X (W +
B) X]-1
46
On se souvient du rsultat selon lequel lestimateur des MCG est lestimateur optimal du modle effets alatoires... la condition que lerreur du modle (et, notamment, sa composante spcifique) ne soit pas suspecte de corrlation avec les diffrentes variables explicatives. Si, malheureusement, tel ntait pas le cas, lestimateur des MCG est alors biais... ce qui est videmment trs gnant. Or, si on peut tre dispos admettre labsence de corrlation entre la composante non spcifique de lerreur et les variables explicatives, on prouve quelque rticence admettre ce mme postulat dabsence de corrlation entre la composante spcifique et les variables explicatives qui sont elles-mmes senses rendre compte, justement, des caractristiques propres de chaque individu. Cest la critique de Mundlack. On commence par exprimenter 1. le caractre biais de lestimateur des MCQG et le caractre non biais de lestimateur within si lerreur spcifique est corrle avec lune au moins des variables explicatives. Dans ce cas, il existe une diffrence significative entre les estimations engendres par ces deux estimateurs 2. le caractre non biais des estimateurs within et MCQG si lerreur spcifique nest pas corrle avec les variables explicatives. Dans ce cas, il ny a pas de diffrence significative entre les estimations engendres par ces deux estimateurs. On privilgiera toutefois, dans ce contexte, lusage de lestimateur des MCQG dont on vrifie quil est alors plus efficace que lestimateur within. On dfinit ensuite la statistique de test de Hausman pour lhypothse nulle dabsence de corrlation entre erreur spcifique et variables explicatives. Du rsultat de ce test dpend le choix de la mthode destimation qui sera finalement retenue. A - Corrlation des erreurs spcifiques avec les variables explicatives : quelles proprits pour les estimateurs within et mcqg ? On exprimente les proprits des deux estimateurs (within et mcqg) en prsence et en labsence de corrlation entre erreur spcifique et variables explicatives.
15
On doit noter en effet que Var(io) = Var(ui + io) = Var(ui) + Var(io) = Var(ui) + Var(it) / T
47
Programme : WITH_OU_MCQG_EFF_ALEAT.PRG A 100 reprises, on cre un chantillon de donnes de panel pour les variables X et Y. On note N le nombre des individus et T la taille de lchantillon dans la dimension temporelle. Pour la simplicit on suppose . que le panel est cylindr . que le nombre des variables explicatives est gal 1 (ce qui ne nuit pas la gnralit du rsultat). On a suppos ici que N = 20 et T = 20. A chaque itration et pour chaque individu 1/ on produit une chronique derreurs non spcifiques it. On suppose ces erreurs non autocorrles dans le temps et non corrles de manire interindividuelle. On suppose que les it sont IIDN(0,1). 2/ on produit une erreur spcifique u telle que la ralisation de cette erreur pour lindividu i est tire alatoirement dune distribution Normale centre et dcart type u = 5. On se souvient que la valeur prise par cette erreur, spcifique lindividu i, est la mme quel que soit t. 3/ On cre une chronique pour la variable explicative X en ayant soin, selon le cas, dintroduire ou, au contraire, de ne pas introduire un lment de corrlation entre lerreur spcifique et les ralisations de X sil ny a pas de corrlation, les ralisations de X sont tires alatoirement dune distribution du Chi-Deux 1 DDL sil y a corrlation, on augmente la valeur de Xit dun lment ui en posant ici = 0.5 4/ Munis des ralisations de X, de U et de on cre ensuite la chronique de Y sur la base dune relation du type : Yit = 10 + 0.5 Xit + it avec it = ui + it 5/ On utilise successivement les trois estimateurs : OLS sur donnes empiles,
48
Within et MCQG. Dans le cas, pour commencer, pour lequel il ny a pas de corrlation entre Xit et lerreur spcifique ui les estimations within et mcqg du coefficient attach X obtenues sur la base de ces 100 simulations prsentent les caractristiques suivantes :
.60 .56 .52 .48 .44 .40 .36 25 50 75 100
.60 .56 .52 .48 .44 .40 .36 25 50 75 100
BETA_ESTIME_WITH
BETA_ESTIME_MCQG
On note que, dans ce cas, les deux estimateurs sont sans biais et fournissent des estimations assez voisines. Dans le cas, prsent, pour lequel il existerait un lien entre la variables explicative et lerreur spcifique (cas de figure qui na rien dexceptionnel) les 100 estimations engendres par lusage des estimateurs within et mcqg prsentent les caractristiques suivantes :
.60
.56
.52
.48
.44
.40 25 50 75 100
BETA_ESTIME_WITH
49
BETA_ESTIME_MCQG
Il est important de noter ici que lestimateur des MCQG est dsormais biais (il est aussi non convergent) de telle sorte quil existe une diffrence sensible entre les estimations issues de ces deux estimateurs. Le test de Hausman est, prcisment, fond sur ces proprits compares des estimateurs within et mcqg en prsence ou, au contraire, en labsence dun phnomne de corrlation X u. B - La statistique de test de Hausman On veut prouver lhypothse nulle dexognit des variables explicatives par rapport lerreur spcifique du modle... tant bien entendu que, du rsultat de ce test, dpend la mise en oeuvre d'un estimateur ou dun autre. Lintuition du test est que : . sil y a une diffrence significative entre les estimations within et mcqg cest que, vraisemblablement, lune au moins des variables explicatives est corrle avec lerreur spcifique. Dans ce cas il convient de privilgier lusage de lestimateur within qui garantit des estimations sans biais des coefficients j . sil ny a pas de diffrence significative entre les estimations within et mcqg cest que les variables sont exognes par rapport lerreur spcifique ; dans ce cas on privilgie lusage de lestimateur mcqg qui est alors sans biais et plus efficace que lestimateur within. Il sagit donc de tester lhypothse nulle :
H0 : j within - j mcqg = 0 j versus HA : j | j within - j mcqg 0
50
2 1 0 25 50 EXOGENEITE 75 100
La valeur critique pour un seuil de 5 % est, ici, gale 3.841, de telle sorte que, dans le premier cas (exognit) on nest amen rejeter lH0 que dans, approximativement, 5 % des cas.
Section V : Lapprciation de laptitude du modle reproduire les volatilits totale, intra et inter individuelles de Y
A lissue de lestimation dun modle en donnes de panel on est en droit de se poser quelques questions sur la qualit elle-mme de lajustement. Dans le cadre traditionnel du modle de rgression estim soit en coupe instantane soit sur sries chronologiques on apprcie la performance densemble du modle au regard de
51
son aptitude reproduire la variabilit de Y. Dans le cadre plus complexe dun modle estim sur donnes de panel, la performance du modle peut tre apprcie laune de plusieurs indicateurs. On se souvient 16 en effet que la variabilit totale TSS de Y (section I, paragraphe 3, B), cest dire la somme des carrs des carts des Yit par rapport sa moyenne densemble Y peut se dcomposer comme la somme de la variabilit interindividuelle BSS et de la variabilit intra individuelle WSS : TSSYY = WSSYY + BSSYY avec : TSSYY =
( Y
N T i =1 t =1 T N i =1 t =1 it
it
Y)
WSSYY =
( Y
N i =1
Yio ) Y)
BSSYY = T
(Y
io
La performance du modle tudi (quel quil soit au demeurant) peut tre apprcie par rapport son aptitude expliquer chacune de ces trois variabilits ; il est alors possible de dfinir, pour chaque modle, trois R2 : . le R2Total traditionnel qui nous renseigne sur la part explique de la variabilit totale de Y . le R2within qui nous renseigne sur la part explique de la variabilit intraindividuelle de Y . le R2betweenqui nous renseigne sur la part explique de la variabilit interindividuelle. Bien sr, chaque modle (MCO-Pooled, Within et Between) est plus particulirement ddi lexplication de lune de ces trois variabilits : . le modle MCO sur donnes empiles, par construction, est calibr pour
16
section I, paragraphe 3, B
52
minimiser la somme des carrs des rsidus entre Y observs et Y calculs. Cest le modle qui expliquera le mieux la variabilit totale de Y ; cest donc avec cette mthode que le R2 traditionnel sera le plus lev . quand on utilise le modle WITHIN sur donnes centres autour des moyennes individuelles, on cherche expliquer la variabilit intra-individuelle de Y ; cest donc avec cette mthode que le R2within sera le plus lev . quand on utilise le modle BETWEEN sur donnes centres autour des moyennes individuelles, on cherche expliquer la variabilit intra-individuelle de Y ; cest donc avec cette mthode que le R2between sera le plus lev De faon trs pratique, comment doit-on sy prendre pour calculer ces diffrents R2 ? On prendra comme exemple le cas du modle sur donnes empiles (modle Pooled) le calcul du R2total est tout fait standard ; il ny a donc pas lieu de sy attarder le calcul du R2within se fait ainsi : on commence par calculer les carts observs Yit Yio des Yit leurs moyennes individuelles ; on construit
ensuite les carts Yit Yio des Y calculs leurs moyennes individuelles avec :
Y it
Le R2within, pour ce modle, est alors calcul comme le carr du coefficient de corrlation entre les Yit Yio et les Yit Yio .
( (
)) )
le calcul du R2between se fait ainsi : on commence par calculer les moyennes individuelles des Y observs et calculs. Le R2between est alors calcul comme le carr du coefficient de corrlation entre ces moyennes individuelles :
53
) ( )
En partant prsent du modle Within, une prcaution doit tre prise pour le calcul
des Y it qui serviront au calcul des trois R2. Il convient en effet de ne pas introduire les effets fixes dans le calcul de ces Y ... sauf se retrouver avec un R2between gal 1
puisque les effets fixes sont justement calculs de telle sorte que les moyennes individuelles observes et calcules soient identiques 17 ; dans ces conditions, il y aurait adquation parfaite entre moyennes individuelles observes et moyennes individuelles calcules. Exemple : On dispose de donnes de panel relatives au nombre de grves dans le secteur industriel 18 . On note GREVEit le nombre de jours de grve pour 1000 salaris du secteur industriel dans le pays i au cours de lanne t. On souhaite relier cette variable au taux de chmage (CHOMit) et au taux dinflation (INFLit) du pays i tels quils ont pu tre observs au cours de lanne t. Le panel est constitu de 17 individus-pays et de 35 observations dans le temps chelonnes de 1951 1985. On estime les 5 modles tudis jusquici (Pool, LSDV, Within, Between et MCQG) et, pour chaque modle, on value sa performance au regard de la reproduction des diffrentes variabilits. Les donnes et le programme utiliss sont respectivement : hurlin_greves_emp.wf1 estimation_panel_data.prg (programme EViews)
17
On peut sen assurer sous Eviews 5.0 (page structure) en comparant les proprits statistiques des
HURLIN : Lconomtrie des donnes de panel : modles linaires simples . Document de Travail Ecole Doctorale Edocif Sminaire Mthodologique (2000).
54
R2 Inter =
0.5929
Estimateur LSDV Variable Coefficient CHOM -21.596840 INFL 16.272887 ESS R2 Total = 146958281 0.0004
R2 Inter =
0.1969
Estimateur WITHIN Variable Coefficient CHOM -21.596840 INFL 16.272887 ESS R2 Total = 146958281 0.0004
R2 Inter =
0.1969
Estimateur BETWEEN Variable Coefficient CHOM 80.954240 INFL 59.388224 Const -341.54624 ESS 503607.36 R2 Total = 0.0528
R2 Inter =
0.5933
Estimateur MCQG Variable Coefficient CHOM -12.081434 INFL 16.424731 Const 248.62161 ESS 192970787 R2 Total = 0.0081
R2 Inter =
0.0385
On notera que, conformment ce qui a t dit prcdemment, des diffrents modles, 1. celui qui maximise la valeur du R2total, cest le modle MCO sur donnes empiles
55
2. celui qui maximise la valeur du R2within, cest le modle Within sur donnes en diffrences aux moyennes individuelles 3. celui qui maximise la valeur du R2between, cest le modle Between sur les moyennes individuelles. Accessoirement, le programme fournit galement deux autres informations : un test pour lhypothse dhomognit (H0 : Homognit complte versus HA : Prsence deffets fixes ) un test de Hausman pour lhypothse nulle dexognit des variables explicatives par rapport aux erreurs spcifiques (le rsultat du test dtermine le choix dun modle effets fixes ou composantes derreur).
Test d'homognit (absence d'effets fixes) H0 : Homognit versus Ha : Prsence d'effets fixes F calc 9.03
Le rsultat du test permet de rejeter lhypothse dhomognit interindividuelle de la relation (chmage, inflation) grves. Il faut donc privilgier un modle tenant compte des spcificits individuelles.
Test d'Hausman H0 : EXOGENEITE DES Xj H calc DDL H* 5% Conclusion H* 1% Conclusion 13.92 2 5.99 Rejet de H0 9.21 Rejet de H0
Le rsultat du test est donc que lhypothse nulle dexognit des variables explicatives doit tre rejete. Dans ce contexte, on sait que les estimateurs des MCQG sont biaiss. On privilgiera donc lusage dun estimateur de type Within qui a le mrite de demeurer sans biais dans un tel environnement. Section VI : Htroscdasticit et autocorrlation : dtection et correction On a suppos jusquici que les erreurs du modle tudi prsentaient quelques bonnes proprits. Notamment : 1/ elles sont supposes homoscdastiques dans la dimension interindividuelle 2/ elles sont supposes non corrles dans la dimension chronologique
56
Plus formellement, ceci peut tre exprim comme : E(it2 | X) = 2 i, t : lerreur est homoscdastique E(it js | X) = 0 t, s, i, j, i j : les erreurs ne sont ni autocorrles ni corrles entre des individus diffrents On pose ici deux questions : celle de la dtection dune possible violation de lune ou lautre de ces deux hypothses celle de la prise en compte dun phnomne dautocorrlation ou dhtroscdasticit. On traitera de cette double question dans le cadre thorique dun modle effets fixes. Cette question nest pas vaine : comme on le sait dj (cft. cours de Licence) une autocorrlation ou une htroscdasticit non prises en compte (utilisation par exemple de lestimateur des MCO) ont pour consquence le caractre biais et non convergent des estimateurs de la variance de lerreur et, par voie de consquence, des estimateurs des variances et covariances des estimateurs des diffrents coefficients. Illustration de ce rsultat connu : GENR_PANEL_AUTOCORRELATION.PRG A 100 reprises on gnre un panel de donnes pour lesquelles le terme derreur qui affecte la relation X Y est autocorrl : it = i 1 + t o on suppose que les it sont IIDN(0,1). La variance thorique des it, dans ce contexte, est donc telle que : 2 = 2 2 + 2 = 1 1 2
On exprimente le fait que, quoique lestimateur within du coefficient associ X soit sans biais, celui de la variance de lerreur it est, lui, biais (on pourrait ventuellement montrer quil est aussi non convergent). On comparera notamment la moyenne des valeurs estimes de sa valeur thorique (ectyp_theorique). Paragraphe 1 : violation des hypothses : la dtection
57
La dtection des phnomnes dautocorrlation ou dhtroscdasticit procde, quelques difficults supplmentaires prs, de la mme mthodologie que celle qui est mise en oeuvre dans le cas dchantillons plus conventionnels . A - Le test dabsence dautocorrlation Soit le modle Yit = i + Xit + it. On veut prouver le bien fond de lhypothse nulle dabsence dautocorrlation. Dire quil ny a, dans le modle tudi, aucun phnomne dautocorrlation, cest reconnatre que : E is jt = 0 i, j, s, t, s t A dire vrai, le test dhypothse traditionnellement mis en oeuvre se borne prouver lhypothse nulle dabsence dautocorrlation dordre 1 pour quelque individu i que ce soit. En dautres termes, il sagit de tester : H0 : E i t i t-1 = 0 i, t La statistique de test utilise est elle-mme une forme tendue de la statistique de Durbin Watson, propose par Bhargava, Franzini et Narendranathan (1982) 19. La statistique DWBFN est calcule comme une statistique de DW usuelle, ceci prs que les rsidus utiliss sont les rsidus issus de lestimation du modle effets fixes et
DWBFN =
(
N T i =1 t = 2 N
it
i t 1 )
2 it
i =1 t =1
La statistique ainsi calcule est gnralement produite par la plupart des logiciels qui rendent possible l'estimation des modles sur la base de donnes de panel.
19
Bhargava, Franzini et Narendranathan : Serial correlation and fixed effect model . Review of
58
On reproduit ci-dessous le tableau des valeurs critiques telles quelles ont t produites par BFN (1982) pour un nombre dindividus relativement important :
N = 100 dmin T=6 K=3 K=9 T = 10 K=3 K=9 1.859 1.839 1.891 1.878 dmax 1.880 1.902 1.904 1.916 dmin 1.939 1.935 1.952 1.949 N = 500 dmax 1.943 1.947 1.954 1.957 dmin 1.957 1.954 1.967 1.965 N = 1000 dmax 1.959 1.961 1.968 1.970
Pour un nombre dobservations trs important N = 1000, on voit quil est possible de rejeter lhypothse nulle dabsence dautocorrlation si la valeur calcule de la statistique est infrieure 1.96. B - Un test dhomoscdasticit Ici encore le test de lhypothse nulle dhomoscdasticit est une extension au cas des donnes de panel du test bien connu de White. Il suffit simplement, lissue de lestimation, sur donnes de panel, du modle principal : Yit = i + 1 X1 it + ... + k Xk it + i t de procder un ajustement auxiliaire, toujours sur donnes de panel, du type : it2 = 0 + 1 X1 it2 + ... + k Xk it2 + i t
20
o, videmment, les i t sont les rsidus issus de lajustement principal. Sous lhypothse nulle dhomoscdasticit, la statistique W = N.T. R2auxiliaire est rpute tre distribue selon une loi du Chi Deux k degrs de libert. Exemple : strikes_hurlin.wf1 On a repris les donnes produites par Ch. Hurlin, relatives lexplication du nombre de jours de grves en fonction du taux de chmage et du taux dinflation dans un pays i une date t. Rappelons que lestimation est conduite sur la base dun panel de 17 pays pour lesquels on dispose de 35 observations dans le temps (le panel est cylindr).
20
Le cas chant, on peut introduire, de faon complmentaire, les variables en niveaux et les produits
croiss de celles-ci.
59
Lestimation within du modle est reproduite ci-dessous (on a nglig de faire apparatre les effets fixes) :
Dependent Variable: GREVES? Method: Pooled Least Squares Date: 02/16/04 Time: 15:37 Sample: 1951 1985 Included observations: 35 Ccross-sections included: 17 Total pool (balanced) observations: 595 Variable INFL? CHOM? Coefficient 16.27289 -21.59684 Std. Error 4.756583 9.191583 t-Statistic 3.421130 -2.349632 Prob. 0.0007 0.0191
Munis des rsidus de cet ajustement principal on a ensuite procd lajustement auxiliaire :
Dependent Variable: RESID?^2 Sample: 1951 1985 Included observations: 35 Ccross-sections included: 17 Total pool (balanced) observations: 595 Variable INFL?^2 CHOM?^2 C R-squared Coefficient 4.581650 -1781.656 286068.0 0.000701 Std. Error 1111.859 2780.008 128204.0 t-Statistic 0.004121 -0.640882 2.231350 Prob. 0.9967 0.5218 0.0260 246988.7
La statistique W est : W = 595 * 0.000701 = 0.417 La valeur prise par la statistique permet de conclure limpossibilit de rejeter H0. Paragraphe 2 : La violation des hypothses : la prise en compte On suppose prsent que lune ou lautre des deux hypothses dabsence dautororrlation et dhomoscdasticit a t rejete. Comment peut on en tenir compte. A - La correction de lautocorrlation
60
Le test de Durbin a mis en vidence, pour le modle tudi, la ralit dun phnomne dautocorrlation des rsidus. On peut donner deux interprtations de ce rsultat qui dbouchent sur un traitement spcifique de cette autocorrlation. la mise en vidence dun phnomne dautocorrlation des rsidus doit ncessairement amener lutilisateur sinterroger, avant toute chose, sur lventuelle omission dune variable essentielle qui serait elle-mme autocorrle. Une telle omission, au del de lautocorrlation des rsidus quelle suscite, est susceptible dengendrer aussi un biais sur lestimation des coefficients associs aux diffrentes variables explicatives si lventualit dune autocorrlation des rsidus induite par lomission dune variable essentielle peut tre carte, il faut alors songer un traitement spcifique de la probable autocorrlation des erreurs. Il est alors toujours possible de mettre en oeuvre une mthode de correction du type Cochrane Orcutt qui consiste prfrer au modle Yit = i + 1 X1 it + ... + k Xk it + i t pour lequel lerreur i t est, intraindividuellement, autocorrle une spcification du type : Yit = i (1-) + 1 (X1 it - X1 i t-1) + ... + k (Xk it - Xk i t-1) + i t - i t-1 pour laquelle le terme derreur i t - i t-1 ne serait pas autocorrl (sous rserve que le paramtre ait t correctement estim). Exercice : genr_panel_autocorrelation.prg. Ce programme fabrique 100 reprises un panel de donnes pour lequel l'erreur du modle est autocorrle. On montre que : - l'estimateur within demeure un estimateur sans biais de beta ( la condition, bien sr, que l'erreur ne soit pas aussi corrle avec la variable explicative X !) - que, dans ce contexte, la correction la Cochrane Orcutt induit un estimateur de beta qui est, lui, plus efficace. La relation X Y est du type : Yit = 10 + 10 Xi t + it avec i t = 0.95 i t-1 + t o les t sont iid N(0,1). Le graphique ci-dessous reproduit les estimations qui ont t obtenues du coefficient associ la variable X pour chaque panel de donnes en utilisant dabord
61
lestimateur within sans tenir compte du caractre autocorrl des erreurs puis en prenant en compte cette autocorrlation. On exprimente que les estimations induites par la mthode Cochrane Orcutt prsentent un degr defficacit suprieur.
10.16 10.12 10.08
10.02 10.06 10.04
10.04
10.00
B - La correction de lhtroscdasticit Dans le cas pour lequel la statistique de White rvlerait la prsence dun phnomne dhtroscdasticit interindividuelle on met traditionnellement en oeuvre une mthode de correction inspire de la mthode des MC Pondrs. On admet, par hypothse, que la variance de lerreur i t est homoscdastique pour un mme individu (homoscdasticit intraindividuelle) mais htroscdastique dun individu lautre (htroscdasticit interindividuelle) : Var it = i2 i, t Dans ce contexte on peut essayer de corriger lhtroscdasticit en pondrant toutes les observations relatives un mme individu par un coefficient spcifique cet individu. Il reste, videmment, dterminer la valeur de ces coefficients de pondration spcifiques. Un moyen simple consiste estimer, dans un premier temps, la relation X Y sur donnes empiles et calculer les variances intra individuelles des rsidus issus de cet ajustement prliminaire. Les carts type intra individuels ainsi calculs seront ensuite utiliss pour pondrer les observations relatives aux diffrents individus. Exemple : genr_panel_heteroscedasticite.prg. On montre que, en prsence dune htroscdasticit interindividuelle des erreurs, la mthode des MCP induit des estimateurs plus efficaces. A 100 reprises on construit un panel de donnes pour 20 individus (numrots !i =
62
1, ..., 20) et 30 observations dans le temps avec : effets fixes : on suppose que leffet fixe i relatif au ie individu est gal i. htroscdasticit des erreurs : on suppose que lcart type intra individuel de lerreur associe au ie individu est li lordre de grandeur de X, luimme variable dun individu lautre it = 10 X io it une relation X Y du type : Yit = i + 10 Xit + it A chaque itration, 1. on estime pour commencer un modle effet fixe sans correction de lhtroscdasticit 2. on calcule la statistique de White pour lhypothse nulle dhomoscdasticit 3. on estime un modle effets fixes en ayant soin de pondrer les variables du modle par les carts type intra individuels tels quils peuvent tre calculs. On exprimente que la statistique de White, dans ce cas dune htroscdasticit lie lordre de grandeur de X, dtecte correctement le phnomne 21 dune part et que, dautre part, la pondration des variables induit des estimateurs de plus efficaces.
90 80 70 60 50 40 30 20 10 0 25 50 VSTAT_WHITE 75 100
21
25%(1) = 3.85
63
11.5 11.0
Dans le cas pour lequel le phnomne dhtroscdasticit sexprime dans les deux dimensions, cest dire le cas pour lequel : Var it = it2 il est possible de mettre en oeuvre une autre technique pour lestimation des carts type it. 1/ On commence par estimer un modle effets fixes sans pondration des variables utilises 2/ Munis des coefficients estims, on calcule les rsidus de cette estimation :
it = Yit - i - Xit 3/ Sous lhypothse dune htroscdasticit lie lordre de grandeur de lune des variables du modle (par exemple X) selon la relation fonctionnelle : it2 = f(0 + 1 Xit + 2 Xit2) on obtient une estimation de llment 0 + 1 Xit + 2 Xit2 en rgressant f-1( it2) sur X et son carr. On obtient par ce truchement une estimation de it2 quon peut ensuite utiliser pour pondrer les variables du modle.
64
Section VII : Les modles dynamiques On sintresse ici une classe particulire de modles de donnes de panel. Ce sont les modles qui font dpendre la valeur de Y pour le ie individu la date t non seulement des valeurs prises par les variables Xj pour ce mme individu mais aussi et cest l que rside la source des difficults associes lestimation de ces modles des valeurs retardes de la variable explique elle-mme. Le modle tudi ici peut donc tre spcifi sous la forme : Yit = i + Xi t + Yi t-1 + i t si on sen tient une seule variable exogne. On pourrait considrer la valeur retarde de Y comme une variable explicative tout fait ordinaire et procder par consquent lestimation des coefficients du modle en mettant en oeuvre les techniques qui ont t prsentes jusquici (par exemple en utilisant lestimateur within). Malheureusement, on va montrer que, prcisment, Yi t-1 nest pas une variable explicative comme une autre et que lestimateur (within notamment) du coefficient qui lui est attach est ncessairement biais et non convergent. Ds lors, dautres techniques destimation doivent tre envisages qui font appel lusage de variables instrumentales. Paragraphe 1 : Les estimateurs traditionnels sont biaiss et non convergents On met ici en vidence le fait que les estimateurs usuels dvelopps jusquici sont biaiss et non convergents ds lors quils sont utiliss dans le cadre dun modle dynamique. Pour ne pas alourdir inutilement lexpos, on se contentera de mettre en vidence cette proprit fcheuse dans le cas de lestimateur within. On part du modle : /1/ Il implique : /2/ Y io = i + X io + Y io (1) + io o Y io (-1) est la moyenne intraindividuelle des Yit calcule sur les T-1 premires observations relatives lindividu i. Yit = i + Xi t + Yi t-1 + i t
65
Lestimateur within consiste, on le rappelle, appliquer lestimateur des MCO au modle /3/ obtenu en retranchant le contenu de lquation /2/ celui de lquation /1/ : /3/ (Yit - Y io) = (Xit - X io) + (Yi t-1 - Y io (-1)) + (it - io)
Le problme majeur qui se pose avec cette nouvelle quation est que sa spcification introduit de facto un phnomne de corrlation entre la nouvelle erreur du modle (it - io) et la variable (Yi t-1 - Y io (-1)). Lexplication dun tel phnomne est simple comprendre : le calcul de Y io (-1) fait intervenir implicitement les T-1 premires erreurs it... de telle sorte que, par construction, (Yi t-1 - Y io (-1)) et (it - io) sont ncessairement corrles. Les consquences dun tel phnomne sont bien connues :
66
.81 .80 .79 .78 .77 .76 .75 .74 .73 .72 10 20 30 40 50 60 70 0.8 80 90 100
COEFYLAG
En faisant varier la taille de lchantillon dans lune puis dans lautre des deux dimensions on peut vrifier que cet estimateur biais est . convergent dans la dimension temporelle . non convergent dans la dimension individuelle 22 :
.808 .806 .804 .802 .800 .798 .796 .794 .792 10 20 30 40 50 60 70 0.8 80 90 100
COEFYLAG
N = 24 ; T = 1000
22
67
.805 .800 .795 .790 .785 .780 .775 .770 .765 10 20 30 40 50 60 70 0.8 80 90 100
COEFYLAG
N = 1000 ; T = 32
On montrerait sur la base du mme argument que lestimateur between et lestimateur D1 du modle rcrit en diffrence premire sont, tous les deux, biaiss. On note en
effet que, pour le modle en diffrence premire : /4/ Yit = Yi t-1 + Xi t + (it - i t-1) Le terme Yi t-1 = Yit-1 Yi t-2 et le terme derreur (it - i t-1) on un lment commun, i t-1 en loccurrence. Paragraphe 2 : Lestimateur des Variables Instrumentales (Anderson et Hsiao 1981) On vient de voir que lestimateur within et lestimateur des MCO appliqu aux variables en diffrences premires sont biaiss. Rcrivons justement le modle en diffrences premires (on supposera, pour la simplicit, que le modle est purement autorgressif) : Yit Yi t-1 = (Yi t-1 Yi t-2) + (it - i t-1) On vient de voir que lestimateur des MCO appliqu ce modle est biais par construction puisque la variable explicative Yt-1 est corrle avec le nouveau terme derreur it (i t-1 est une des composantes de Yi t-1). Pour autant, Yi t-2, lui, nest thoriquement pas corrl avec it tout en demeurant fortement corrle avec
68
Yt1 23. Yt-2 prsente donc ce titre toutes les qualits attendues dun bon instrument. Dans ce contexte, la logique veut quon mette en oeuvre la mthode des variables instrumentales. Rappelons que, si Zt est un instrument pour la variable explicative Xt corrle avec le terme derreur, lestimateur VI des variables instrumentales, pour le modle Yt = + Xt + t est donn par :
VI =
z z
t =1 t =1 T
yt xt
Pour le modle dynamique tudi, lestimateur des variables instrumentales (Anderson et Hsiao 1981) a pour expression :
VI
y
i =1 t = 2
i =1 t = 2 N T
i t 2
(Yi t Yi t 1 )
i t2
(Yi t 1 Yi t 2 )
o yi t-2 est la valeur centre de Yi t-2 (on admet que Yit - Yi t-1 est desprance nulle). Alternativement, Anderson et Hsiao ont aussi propos dutiliser :
VI =
(Y (Y
i =1 t = 3 i =1 t =3 N T
i t 2
Yi t 3 ) (Yi t Yi t 1 )
i t 2
Yi t 3 ) (Yi t 1 Yi t 2 )
Illustration : genr_panel_dynamique_stacked.prg
A 100 reprises, on construit un panel de donnes et une relation : Yit = i + Xit + Yi t-1 + it avec i tir alatoirement, pour chaque individu, dune distribution uniforme [0, 100]. = 1 = 0.8
23
69
On cherchera, chaque itration, retrouver les valeurs de ces coefficients en estimant les coefficients dun modle dynamique Yit = i + Xit + Yi t-1 + it. A cet effet, on utilisera . un simple modle effets fixes . un modle en diffrences premires . la mthode des variables instrumentales (applique au modle en diffrence) avec Yi t-2 comme instrument . la mthode des variables instrumentales avec Yi t-2 comme instrument. Les rsultats obtenus peuvent tre apprcies au travers des graphes reprsentatifs des estimations qui ont t obtenues du coefficient attach Yi t-1 :
.80
.44 .40 .36
.76
.72
.32 .28
.68
.64
.60 10 20 30 40 50 60 70 80 90 100
.12 10 20 30 40 50 60 70 80 90 100
VGAMA_FE
VGAMA_DELTA1
4 3 2
0 1 -4 0 -1 -2 10 20 30 40 50 60 70 80 90 100 -8
-12 10 20 30 40 50 60 70 80 90 100
VGAMA_VI1
VGAMA_VI2
Moyenne des
Effet Fixe 0.71
70
Paragraphe 3 : lestimateur des moments gnraliss (Arellano et Bond 1991) On vient de voir, en nous plaant dans le cadre analytique simplifi dun modle purement autorgressif, que la mthode des variables instrumentales consiste retenir Yi t-2 comme instrument la place de Yt-1 dans le modle rcrit en diffrence premire : Yit Yi t-1 = (Yi t-1 Yi t-2) + (it - i t-1) Yi t = Yi t-1 + i t On sait que, la condition bien sr que Yi t-2 soit effectivement non corrl avec lerreur i t, lestimateur des variables instrumentales est convergent. Est-ce pour autant quil est efficient ? Arellano et Bond (1991) montrent prcisment quun gain defficience peut tre obtenu en exploitant, pour chaque observation, tous les instruments disponibles... opportunit qui a t nglige jusquici et, notamment, comme on va le voir dans un instant, par la mthode des variables instrumentales qui vient dtre prsente. On se limitera ici une prsentation simplifie de la mthode de Arellano et Bond dans le cadre du modle autorgressif pur24 A - Lestimateur des moments gnraliss : le cas dun modle purement autorgressif Soit donc ici le modle : /1/ Yit = Yi t-1 + i + i t
quon rcrit, comme on la dj fait, en vue dliminer les effets fixes, en diffrence premire :
24
Pour une gnralisation au cas pour lequel le modle serait augment dun certain nombre de
71
/2/
Yi t = Yi t-1 + i t
On suppose quon dispose dun chantillon ET de T observations indices t = 1, 2, ...T. Dans ce contexte, la premire ralisation observable du modle /2/ spcifi en diffrence premire est : Yi3 Yi2 = (Yi2 Yi1) + i3 - i2 La dernire ralisation observable (la T-2e) est : YiT Yi T-1 = (YiT-1 Yi T-2) + i T - i T-1 On fait sur les erreurs it les hypothses habituelles : E(it) = 0 i, t E(it2) = 2 i, t E(is it) = 0 i, s, t, s t Les erreurs it du modle en diffrence premire sont donc telles que : E(it) = 0 i, t E(it2) = 2 2 i, t E(it i t-1) = - 2 i, t E(it i t-k) = 0 i, t, k >1 La matrice des variances covariances des erreurs i t du modle en diffrences premires pour le ie individu est donc : E(i i) = 2 G o la matrice G, de dimension T-2 T-2, est telle que : 2 1 0 1 2 1 0 1 2 G= 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 2 1 0 1 2 1 0 1 2 0 0
72
avec = 13, 14, ..., 1T, ..., N3, N4, ..., NT la matrice des variances covariances des erreurs pour lensemble des individus est de la forme : E( ) = 2 IN G = 2 N(T-2) N(T-2) o , on le rappelle, est le produit de Kronecker.
Lorsquil sagit, pour la premire ralisation du modle en diffrence, Yi3 Yi2 = (Yi2 Yi1) + i3 - i2 de dfinir un instrument pouvant se substituer la variable explicative (Yi2 Yi1), corrle avec le terme derreur (i3 - i2), vrai dire, le seul instrument sur lequel on puisse sappuyer est Yi1. Cest cet instrument quon pourrait qualifier dinstrument de premier plan qui avait t utilis implicitement par lestimateur des variables instrumentales. Ds lors quil sagit de la deuxime ralisation disponible Yi4 Yi3 = (Yi3 Yi2) + i3 - i2 deux instruments sont offerts qui peuvent se substituer (Yi3 Yi2) : linstrument de premier plan Yi2 (dj utilis implicitement avec la mthode des variables instrumentales) mais aussi un instrument de second plan,Yi1, qui avait t dlaiss jusquici. A fortiori, lorsquil sagit de dfinir les instruments utilisables pour la T-2e et dernire ralisation du modle : YiT Yi T-1 = (Yi T-1 Yi T-2) + iT - i T-1 on peut alors compter sur un instrument de premier plan : Yi T-2 T-3 instruments de second plan : Yi T-3, Yi T-4, ... Yi 1
soit, au total, T-2 instruments. On comprend quil peut tre dommageable, en termes defficience, de ne pas tenir
73
compte de linformation dlaisse jusquici - contenue dans les instruments de second plan. La prise en considration de cette information passe par la construction dune matrice Zi dinstruments de premier et de second plans 25 pour lindividu i : [ Yi1 ] 0 Zi = 0 0 [ Yi1 , Yi 2 ] 0 Yi1 , Yi 2 ,..., Yi T 2 0 0
de dimension T-2 (1 + 2 + ... + T-2). Au niveau agrg de lensemble des individus, la matrice Z des instruments est donne par :
[ Z1 ] [ Z2 ] de dimension N (T-2) (1 + 2 + ... + T-2) Z= [ Z N ] On doit bien noter que les composantes de cette matrice Z doivent, par nature, vrifier les conditions suivantes dites conditions sur les moments : E (Z ) = 0 puisque ces composantes sont rputes tre des instruments pour les variables quelles reprsentent. Rien ninterdit de prmultiplier chacun des lments du modle /3/ par cette matrice des instruments de telle sorte que : /4/ Z Y = Z Y-1 + Z
25
On peut rapprocher cette matrice de celle qui avait t implicitement utilise avec la mthode des
variables instrumentales :
Yi1 0 Zi = 0
0 Yi2 0
0 0 Yi T 2
74
E(Z Z) = 2 Z Z Quel bnfice peut-on retirer dune telle transformation du modle sminal /3/ ? Ce quil faut bien comprendre (et ce qui a dj t mis en vidence) cest que lestimateur
MCO du modle en diffrence premire est, par construction, biais pour N grand et T fini. En revanche, lestimateur MCO du modle /4/ pour lequel les diffrentes
composantes du modle ont t prmultiplies par Z prsente une proprit intressante. On note en effet que cet estimateur dfini comme :
probabilit de mco est gale . Lestimateur est donc asymptotiquement sans biais.
Malheureusement, et parce que les erreurs it sont autocorrles, cet estimateur nest pas efficient. On doit lui prfrer lestimateur des MCG qui tient compte explicitement du caractre autocorrl des erreurs. Il est calcul comme (cest lestimateur one step de Arellano et Bond :
AB1 = (Y-1 Z (Z )-1 Z Y-1)-1 Y-1 Z (Z )-1 Z Y Muni de lestimation AB1 du coefficient , il est possible de calculer le vecteur
des rsidus du modle en diffrence premire. Il est alors possible de construire lestimateur de Arellano et Bond two step qui consiste substituer la matrice Z Z une estimation plus fine de la matrice des variances covariances : V = Z Z Au final, lestimateur des moments gnraliss la Arellano Bond est donn par :
75
Dependent Variable: GREVES Method: Panel Generalized Method of Moments Transformation: First Differences Date: 02/25/04 Time: 22:14
Sample (adjusted): 1952 1985 Cross-sections included: 17 Total panel (balanced) observations: 561 White period instrument weighting matrix White period standard errors & covariance (d.f. corrected) Instrument list: @DYN(GREVES,-2,-2) INFL CHOM
Variable
Coefficien t
Std. Error
t-Statistic
Prob.
Effects Specification
Mean dependent var S.D. dependent var Sum squared resid J-statistic
76
Introduction Section I : structure gnrale et typologie des modles Section II : Le modle sur donnes empiles : estimateur MCO et estimateur Between Section III : Le modle effets fixes Section IV : Le modle effets alatoires Section V : Lapprciation de laptitude du modle reproduire les volatilits totale, intra et inter individuelles de Y Section VI : Htroscdasticit et autocorrlation : dtection et correction Section VII : Les modles dynamiques