Académique Documents
Professionnel Documents
Culture Documents
Autocorrelation Spatiale Des Erreurs Et Erreurs de Mesure PDF
Autocorrelation Spatiale Des Erreurs Et Erreurs de Mesure PDF
1. INTRODUCTION
Les modles en coupe transversale sur donnes gorfrences sont trs sou-
vent caractriss par un phnomne dautocorrlation spatiale (Anselin, 1988 ;
Le Gallo, 2002 ; LeSage et Pace, 2009 ; Le Gallo, 2014). Cette dernire peut
tre la consquence dinteractions spatiales ou deffets de pairs entre individus
gographiquement proches ou encore provenir dun problme de spcification
du modle, comme la prsence de variables omises spatialement autocorrles
ou une mauvaise spcification de la forme fonctionnelle. Les mthodes
destimation et dinfrence des modles comportant une autocorrlation spatiale
sous la forme dune variable endogne dcale ou dune autocorrlation spatiale
des erreurs sont maintenant bien tablies (voir Arbia, 2014 ; Dub et Legros,
2014 ; Elhorst, 2014 ; Fisher et Nijkamp, 2014 pour des manuels rcents).
Dautres problmes conomtriques sont frquents dans les modles en
coupe transversale. Ainsi, une variable explicative peut tre endogne si elle est
corrle avec le terme derreur. Lendognit des variables explicatives peut
avoir plusieurs sources : biais de simultanit, variables omises corrles avec
les variables prsentes dans le modle ou encore erreurs de mesure. Si les con-
squences de lendognit de variables explicatives sont bien connues, la pr-
sence simultane dautocorrlation spatiale et de variables endognes na que
rcemment fait lobjet dtudes spcifiques. Ainsi, Fingleton et Le Gallo (2007,
2008) proposent une mthode destimation base sur les moments gnraliss
pour des modles comportant la fois des variables explicatives endognes et
une autocorrlation spatiale sous la forme dune variable spatiale dcale et/ou
dune autocorrlation spatiale des erreurs. Les proprits asymptotiques de cette
mthode destimation sont drives par Drukker et al. (2013). A travers des
simulations, Fingleton et Le Gallo (2009) montrent que le modle de Durbin
spatial est mme de limiter les biais lis la prsence de variables endognes.
Enfin, Jin et Lee (2013) et Liu et Lee (2013) sintressent au cas o de nom-
breux instruments existent.
Dans cet article, nous nous attachons au cas spcifique de lendognit pro-
venant dune erreur de mesure. Ces dernires sont frquentes en conomtrie
applique. Par exemple, Temple (1998) a montr que les paramtres estims
dans les modles de convergence et notamment la vitesse de convergence
taient trs sensibles aux problmes derreurs de mesure sur les donnes de
revenu par tte. Lorsque lerreur de mesure affecte uniquement la variable d-
pendante, elle est absorbe par le terme derreur et na pas deffet sur la conver-
gence des estimateurs des paramtres inconnus. Cependant, lorsquune variable
explicative est mesure avec erreur, alors les estimateurs des MCO obtenus en
utilisant la variable observe sont affects dun biais dattnuation : ils sont
asymptotiquement sous-estims. Les autres coefficients du modle peuvent
galement tre affects : cest le biais de contamination (Greene, 2011).
La question des erreurs de mesure dans le cadre des modles dconomtrie
spatiale reste aujourdhui trs largement inexplore. Le Gallo et Fingleton
(2012) ont analys les effets dune erreur de mesure sur le biais et lefficience
de diffrents estimateurs dans des modles dconomtrie spatiale. Sur la base
Rgion et Dveloppement 39
de simulations de Monte-Carlo, ils ont montr que les erreurs de mesure combi-
nes un processus spatial sur les erreurs, peuvent tre, de faon quelque peu
paradoxale, mieux traites par une mthode destimation ignorant
lautocorrlation spatiale. Ces rsultats font cho ceux obtenus par Dagenais
(1994) qui, dans un cadre de sries temporelles, montre thoriquement que dans
certaines circonstances, le biais de lestimateur des Moindres Carrs Ordinaires
(MCO) pouvait mme tre amlior par la prsence de corrlation srielle dans
les termes derreurs.
Dans ce contexte, lobjectif est de revenir sur les proprits asymptotiques
des estimateurs en prsence derreurs de mesure dans un cadre spatial. Nous
nous concentrons dans cet article sur le cas dune autocorrlation spatiale affec-
tant les termes derreurs dune rgression. Notre objectif est alors de driver les
probabilits limite et la distribution asymptotique des estimateurs des MCO et
des Moindres Carrs Gnraliss (MCG) en prsence dautocorrlation spatiale
des erreurs et derreur de mesure sur la variable explique afin dvaluer com-
ment ces deux effets interagissent.
Cet article est organis de la faon suivante. Dans une premire partie, nous
prsentons le modle et les hypothses. Ensuite, nous drivons les distributions
asymptotiques des estimateurs des MCO et des MCG. Enfin, nous comparons
les biais et lefficience asymptotiques de ces deux estimateurs laide de repr-
sentations graphiques. La dernire section conclut et offre quelques perspectives
de recherche futures.
2. LE MODLE ET LES HYPOTHSES
Hypothse 1 - sur Hn
Les lments deH n sont identiquement et indpendamment distribus
avec des moments absolument finis dordre 4 GH pour un GH ! 0 . En
outre, E H n V H2 ! 0 .
Hypothse 2 - sur Wn
Les lments de la matrice de poids Wn sont non-stochastiques avec :
(a) wii ,n 0
(b) Les sommes absolues en ligne et en colonne des matrices Wn et
I
1
n
O Wn sont uniformment bornes en valeur absolue, i.e.
n
aij d k d f , o k ne dpend pas de n (mais peut dpendre des pa-
i 1
ramtres du modle, i.e. O ) et aij dnotent les lments des matrices
Wn et I n O Wn .
1
1
duit que la matrice I n O Wn est inversible.
(3)
Hypothse 3 - sur Xn
La variable exogne X n est non-stochastique et compose dlments uni-
formment borns en valeur absolue.
Hypothse 4 - sur [n
(a) Les innovations X n dans les erreurs de mesure sont desprance nulle et
sont identiquement et indpendamment distribus avec des moments abso-
lument finis dordre 4 GX pour un GX ! 0 . En outre, les lments de X n
et de H n sont indpendants et E Xi2,n V X2 .
(b) La matrice de poids M n et le paramtre spatial dcal correspondant U
satisfont lhypothse 2.
(c) V [2 : plim nof n1[ n' [ n existe et est fini et existe et
est strictement positif et fini.
Notons que lexistence et le fait que V [2 est born est une consquence des
hypothses (4a) et (b) et du lemme de Chebyschev. En outre, dans la mesure o
les lments de X n sont borns, cela implique que existe et est fini. Ce-
pendant, afin de garantir lidentification asymptotique du modle avec erreurs
de mesure, il est ncessaire de supposer en outre que est inversible.
Nous considrons dans cette section les proprits en chantillon (3.1.) et les
proprits asymptotiques (3.2.) des estimateurs des MCO et des MCG en pr-
sence dautocorrlation spatiale et derreurs de mesure sur la variable explica-
tive.
3.1. Les estimateurs des MCO et des MCG
(5)
42 Julie Le Gallo et Jan Mutl
(6a)
(6b)
V H2 I n O Wn I
1 1
avec :u,n E u n u 'n n
O Wn' .
Notons quil sagit bien de lestimateur des MCG purs et non ralisables car
le paramtre O est inconnu. En pratique, il faudrait galement estimer ce para-
mtre. Cependant, nous considrons ici quil est connu afin dtudier les pro-
prits asymptotiques de lestimateur des MCG dans le meilleur des cas.
Ces deux estimateurs sont biaiss en prsence derreurs de mesure puisque
les conditions sur les moments sous-jacentes ne sont plus vrifies. Dans le cas
de lestimation par les MCO en effet, la condition sur les moments basant
lestimation est : . Cependant, compte tenu de la prsence
derreurs de mesure, nous avons :
(7)
o V [2,n : n1 E [ n' [ n .
existe.
1
I
1 1
m1 : lim tr I n U M 'n UMn (8a)
nof n n
1
I
1 1 1
m2 lim X 'n I n U M 'n .diag I n U M 'n UMn (8b)
nof n n
Ces quantits sont des fonctions des donnes et ne dpendent que du seul pa-
ramtre U qui mesure lautocorrlation spatiale dans les erreurs de mesure. Si
U 0 , alors m1 1 et m2 x lim nof (1/ n)i 1 xi .
n
En outre la quantit
(9)
Enfin, compte tenu de ces proprits, nous pouvons dmontrer les thormes
suivants1 :
Thorme 1 Distribution asymptotique de lestimateur des MCO
Sous les hypothses 1 6, on a :
n E MCO E o N ' MCO ,:MCO (10a)
(10b)
n EMCG E o N ' MCG ,:MCG (11a)
(11b)
o V [ * et
2
ont t dfinis prcdemment et .
Nous retrouvons le fait quen prsence derreurs de mesure sur une variable
explicative, le coefficient associ est affect dun biais dattnuation. Ces diff-
1
Pour des raisons de place, les dmonstrations des thormes 1 et 2 ne sont pas
reportes ici. Elles sont disponibles sur demande auprs des auteurs.
Rgion et Dveloppement 45
A laide des rsultats tablis dans la section prcdente, nous pouvons dri-
ver la forme du biais asymptotique relatif entre lestimateur des MCO et celui
des MCG des fins de comparaison. Ce biais relatif scrit :
(12)
(13)
1
I
1 1
V [2 V v2 lim tr I n U M 'n UMn V v sMM
2
(14)
nof n n
(15)
1
I OW I OW I UM
1 1
et V 2* V v2 lim tr I n U M 'n '
sMW (16)
[ nof n n n n n n n
Au final, le biais asymptotique relatif nest dtermin que par les forces rela-
tives de lautocorrlation spatiale dans les erreurs de mesure et lautocorrlation
spatiale dans lquation initiale.
La quantit est uniquement une
fonction de la variance explicative et du paramtre de dcalage spatial O , tous
deux tant connus. Il est possible de calculer lquivalent de cette expression en
chantillon fini. Supposons par exemple que les variables explicatives sont in-
dpendantes entre observations, i.e. E X nX 'n V X2 ,nI n , alors :
(17)
(17)
Rgion et Dveloppement 47
2
:MCG ssb1 2sMW s
ssb MWMMWM MM
/s (19)
:MCO
ssb 2 sW1W1 / sMM 1
o ssb, sMW et sMM ont t dfinis prcdemment et :
1
I
1 1
sMWMMWM : lim tr I n U M 'n O Wn I n U M n
nof n n
(20a)
I I
1 1
n
UM '
n n
O Wn I n U M n
1
I
1 1
sW1W1 : lim tr I n O Wn O Wn' (20a)
nof n n
riance provenant de lerreur de mesure est trs faible par rapport la variance
provenant de la variable non observe.
La Figure 1 reprsente toutes les courbes de niveau du biais relatif pour
n = 400, sbb = 50 et pour toutes les valeurs possibles de O , lautocorrlation
spatiale des erreurs de lquation initiale, en abscisse et de , lautocorrlation
spatiale de lerreur de mesure, en ordonne. La courbe A reprsente toutes les
valeurs de O et de pour lesquelles le biais relatif est gal 1, en dautres
termes il sagit de toutes les situations pour lesquelles le biais de lestimateur
des MCO et celui des MCG sont gaux. Lorsque le signal-sur-bruit est impor-
tant, il existe peu de combinaisons de valeurs de O et de pour lesquelles le
biais relatif est unitaire. Pour toutes les autres valeurs (autres courbes que A), le
biais de lestimateur des MCG est infrieur celui des MCO mais la diffrence
est faible dans la mesure o les autres courbes de niveau reprsentent des va-
leurs de 98%, 96%, 94%, 92% et 90%. Ainsi, dans un modle avec autocorrla-
tion spatiale des erreurs et erreurs de mesure, ne corriger que lautocorrlation
spatiale via une estimation par les MCG nest en mesure que de rduire lgre-
ment le biais de lestimateur. Rappelons en outre quil sagit de lestimateur des
MCG, pour lequel on suppose O connu, alors quen pratique, il faudrait gale-
ment estimer ce paramtre.
La Figure 2 reprsente le biais relatif pour un signal-sur-bruit plus faible,
sbb = 10, correspondant au cas o lerreur de mesure sur la variable explique
est importante. Dans ce cas, les combinaisons de paramtres de O et de pour
lesquelles le biais de lestimateur des MCG est moins important que celui des
MCO sont plus nombreuses.
Cette situation est inverse ds lors quon considre lefficience relative entre
les deux estimateurs (Figures 3 et 4). Lorsque le signal-sur-bruit est important
(Figure 3), il existe des combinaisons de paramtres pour lesquelles lestimateur
des MCG est moins efficient que lestimateur des MCO (courbes B et C pour
des niveaux de 1,05 et 1,1). Il sagit de cas o il existe une forte autocorrlation
spatiale dans lerreur de mesure. Lorsque le signal-sur-bruit diminue (Figure 4),
lestimateur des MCG voit les cas dans lesquels il est plus efficient que
lestimateur des MCO se rduire fortement. La courbe de niveau unitaire, cen-
trale dans la Figure 3, se dcale en effet vers la droite dans la Figure 4.
En dautres termes, nombreuses sont les combinaisons de paramtres entre
O de pour lesquelles lestimateur des MCO est plus efficient que celui des
et
MCG. Au final, ces reprsentations graphiques illustrent un arbitrage entre le
biais et la variance : on peut essayer de rduire le biais en corrigeant par
lautocorrlation spatiale au prix dune rduction de lefficience de lestimateur.
Rgion et Dveloppement 49
Figure 1
Figure 2
50 Julie Le Gallo et Jan Mutl
Figure 3
C
B
Figure 4
Rgion et Dveloppement 51
4. CONCLUSION
REFERENCES
Fingleton B., Le Gallo J., 2008, Estimating spatial models with endogenous
variables, a spatial lag and spatially dependent disturbances : finite sample
properties, Papers in Regional Science, 87, pp. 319-339.
Fischer M.M, Nijkamp P. (Eds.), 2014, Handbook of Regional Science, Berlin:
Springer-Verlag.
Greene W.H., 2011, Econometric Analysis, 7th Edition, Pearson.
Jin F., Lee L.-F., 2013, Generalized spatial two stage least squares estimation
of spatial autoregressive models with autoregressive disturbances in the
presence of endogenous regressors and many instruments, Econometrics, 1,
pp. 71-114.
Kelejian H.H., Prucha I.-R., 1999, A generalized moments estimator for the
autoregressive parameter in a spatial model, International Economic
Review, 40, pp. 509-533.
Le Gallo J., 2002, Economtrie spatiale : lautocorrlation spatiale dans les
modles de rgression linaire, Economie et Prvision, 155, pp. 139-158.
Le Gallo J., 2014, Cross-section spatial regression models, in Fischer M.M.,
Nijkamp P. (Eds.), Handbook of Regional Science, Springer-Verlag, pp.
1511-1533.
Le Gallo J., Fingleton B., 2012, Measurement errors in a spatial context,
Regional Science and Urban Economics, 42, pp. 114-125.
LeSage J., Pace K.P., 2009, Introduction to Spatial Econometrics, CRC Press.
Lewbel A., 2012, Using heteroscedasticity to identify and estimate mis-
measured and endogenous regressor models, Journal of Business and
Economic Statistics, 30, pp. 67-80.
Liu X., Lee L.-F., 2013, Two-stage least squares estimation of spatial
autoregressive models with endogenous regressors and many instruments,
Econometric Reviews, 32, pp. 734-753.