Vous êtes sur la page 1sur 20

Article

Pratique de lanalyse de lautocorrlation spatiale en gomorphologie: dfinitions opratoires et tests Philippe Aubry et Herv Pigay
Gographie physique et Quaternaire, vol. 55, n 2, 2001, p. 111-129.

Pour citer la version numrique de cet article, utiliser l'adresse suivante : http://id.erudit.org/iderudit/008297ar
Note : les rgles d'criture des rfrences bibliographiques peuvent varier selon les diffrents domaines du savoir.

Ce document est protg par la loi sur le droit d'auteur. L'utilisation des services d'rudit (y compris la reproduction) est assujettie sa politique d'utilisation que vous pouvez consulter l'URI http://www.erudit.org/documentation/eruditPolitiqueUtilisation.pdf

rudit est un consortium interuniversitaire sans but lucratif compos de l'Universit de Montral, l'Universit Laval et l'Universit du Qubec
Montral. Il a pour mission la promotion et la valorisation de la recherche. rudit offre des services d'dition numrique de documents scientifiques depuis 1998. Pour communiquer avec les responsables d'rudit : erudit@umontreal.ca

Document tlcharg le 12 November 2009

Gographie physique et Quaternaire, 2001, vol. 55, no 2, p. 111-129, 8 g., 4 ann.

PRATIQUE DE LANALYSE DE LAUTOCORRLATION SPATIALE EN GOMORPHOLOGIE : DFINITIONS OPRATOIRES ET TESTS


Philippe AUBRY et Herv PIGAY* : UMR CNRS 5558 Biomtrie et biologie volutive, 43, boulevard du 11 novembre 1918, 69622 Villeurbanne Cedex, France (actuellement : Addinsoft, 40, rue Damrmont, 75018 Paris, France) ; UMR CNRS 5600 Environnement, Ville, Socit, 18, rue Chevreul, 69362 Lyon Cedex 07, France.
RSUM Lautocorrlation spatiale peut tre dnie comme la ressemblance des valeurs prises par une variable, exprime en fonction de leur localisation gographique. Lanalyse de lautocorrlation permet de quantifier la rgularit spatiale dun phnomne (une forme de complexit spatiale) et de dterminer la porte de la dpendance spatiale an, notamment, de dnir un dispositif dchantillonnage garantissant lindpendance des donnes, autorisant ainsi lutilisation des tests statistiques usuels. Larticle aborde trois points : i) dnition opratoire de lautocorrlation pour des variables quantitatives ou qualitatives ; ii) utilisation des tests de randomisation pour tester lhypothse nulle dabsence dautocorrlation ; iii) illustration des deux points prcdents par des exemples. Trois jeux de donnes simuls sont prsents pour illustrer les diffrences entre les statistiques : le premier ne prsente aucune structure spatiale, le deuxime est caractris par une structure spatiale priodique, le troisime est un gradient linaire. Deux jeux de donnes gomorphologiques sont galement analyss : i) une srie de segments uviaux lmentaires, distribus longitudinalement, et sur lesquels ont t mesures la largeur et lincision dun lit uvial ; ii) la cartographie des formes drosion dun bassin versant, traite comme une image matricielle. Dans le premier cas, la structure embote des tronons gomorphologiquement homognes est mise en lumire, et ce diffrentes chelles spatiales. Le second exemple montre quune analyse omnidirectionnelle peut conduire sous-estimer la porte de lautocorrlation lorsque le phnomne tudi prsente une orientation gographique privilgie. Dans ce cas, il peut savrer impossible de dnir un chantillon de donnes spatialement indpendantes, rpondant aux exigences des tests statistiques classiques. ABSTRACT Spatial autocorrelation analysis in geomorphology: Definitions and tests. Spatial autocorrelation can be dened as the similarity of values of a given variable, in relation with their spatial location. Autocorrelation functions are used to quantify the spatial regularity of a phenomenon (a form of spatial complexity) and to assess the lag of spatial dependence in order to design a sampling procedure for which the data are independent, which permits the use of traditional statistical tests. Three points have been developed: i) Denition of autocorrelation functions used for categorical and quantitative variables: Gearys c, Morans I, semivariogram, non ergodic covariance and correlation, J statistics; ii) Denition of the randomization tests used to test the null hypothesis of no autocorrelation: iii) examples illustrating the two previous objectives. Three sets of simulated data were used to compare different autocorrelation functions (Gearys c, non ergodic covariance and correlation): the rst one has no spatial structure, the second one has a periodic spatial structure whereas the third one is characterized by a linear gradient. Spatial autocorrelation has also been assessed on measured geomorphological data. Two sets were studied: i) a set of elementary channel segments of 500 m in length on which mean active channel width and degradation have been measured, ii) a set of pixels of an image of two basins representing the different types of hillslope erosion forms. In the rst case, the nested structure of homogeneous geomorphological reaches is highlighted at different spatial scales. The second example, which illustrates autocorrelation assessment on a categorical variable, shows that omnidirectional analysis can underestimate the autocorrelation lag when the studied phenomenon is characterized by a preferential geographical orientation. In this particular case, it may not be not possible to dene a sample of data which are spatially independent and on which it is possible to use classical statistical tests. RESUMEN Aplicacin del mtodo de anlisis de autocorrelacin espacial en Geomorfologa: funcionamiento y pruebas estadsticas. El mtodo de correlacin espacial puede denirse como la semejanza de valores que adopta una variable expresada en funcin de su localizacin geogrca. Dicho mtodo permite cuanticar la regularidad espacial de un fenmeno (un tipo de complejidad espacial) y determinar el alcance de la dependencia espacial a fin de definir una estrategia de muestreo que garantice la independencia de los datos y que permita la utilizacin de pruebas estadsticas usuales. El presente trabajo aborda los siguientes puntos: i) Explicacin del funcionamiento de la autocorrelacin aplicada a variables discretas o continuas; ii) utilizacin de pruebas aleatorias para aceptar o rechazar la hiptesis nula de ausencia de autocorrelacin; iii) ilustracin de los dos puntos anteriores por medio de ejemplos. Tres grupos de datos ficticios son presentados para ejemplificar las diferencias entre las estadsticas: el primero carece de estructura espacial, el segundo se caracteriza por una estructura espacial peridica y el tercero representa un gradiente lineal. As mismo se analizan dos grupos de datos geomorfolgicos: i) una serie de segmentos uviales elementales distribuidos longitudinalmente y de los cuales se ha medido la amplitud e incisin del lecho uvial; ii) la cartografa de los tipos de erosin de la pendiente de la cuenca tratado como imagen matricial. En el primero de los casos, la estructura constituida de elementos geomorfolgicos homogneos y puesta en evidencia a distintas escalas espaciales. El segundo ejemplo muestra que un anlisis omnidireccional pude conducir a subestimar el alcance de la autocorrelacin cuando el fenmeno estudiado muestra una orientacin geogrca privilegiada. En este caso, puede ser imposible denir una muestra de datos espacialmente independientes, respondiendo as a las exigencias estadsticas clsicas.

Manuscrit reu le 8 mai 2000 ; manuscrit rvis accept le 27 juillet 2001 *Adresse lectronique : piegay@sunlyon3.univ-lyon3.fr ; aubry@xlstat.com

112

P. AUBRY et H. PIGAY

INTRODUCTION
La gomorphologie peut tre considre comme un domaine de recherche situ linterface entre plusieurs disciplines scientifiques. En effet, le gomorphologue fait appel une varit de dmarches et doutils labors dans des disciplines connexes, principalement la gologie et lcologie. La gologie, et surtout lcologie, gurent parmi les disciplines scientiques qui font le plus appel aux mthodes statistiques, quil sagisse de lanalyse des donnes ou de la modlisation des phnomnes. Cependant, lutilisation des mthodes statistiques est encore rare dans le domaine de la gomorphologie, en particulier la gomorphologie uviale (Clment et Pigay, sous presse). Cette situation peut sexpliquer en partie par une raison historique. En effet, cette discipline prsente de fortes racines dterministes et mcanistes, qui font rfrence lobservation et la mesure des processus sur le terrain, afin didentifier les lois physiques qui les rgissent. Nanmoins, ces lois peuvent faire intervenir des paramtres qui sont dtermins de faon empirique et non pas de faon thorique, et qui sont donc susceptibles de prsenter une variabilit qui peut tre apprhende statistiquement. Le faible recours aux mthodes statistiques peut sexpliquer galement par le fait que la gomorphologie, et en particulier la gomorphologie uviale, produit souvent des jeux de donnes de petite taille. Chaque mesure correspondant un vnement, une crue, un glissement de terrain, les donnes comptent rarement plus de 10 20 valeurs, ce qui est gnralement considr comme trop faible pour pouvoir appliquer les outils statistiques classiques. En consquence, les tudes de gomorphologie font peu appel aux outils statistiques, exception faite des mthodes de rgression. Toutefois, les mthodes statistiques, descriptives ou infrentielles, se rvlent aujourdhui pertinentes en gomorphologie dans la mesure o : 1. les progrs mtrologiques permettent dacqurir un grand nombre de donnes. Par exemple, en gomorphologie uviale, il devient ais et relativement bon march de mesurer le dbit, voire les concentrations de matire en suspension, lchelle de plusieurs stations et desquisser ainsi une analyse des phnomnes petite chelle. Il est donc possible dtendre gographiquement des recherches auparavant conduites essentiellement au niveau stationnel, ce qui se traduit par une augmentation de la quantit des donnes traiter (Rickenmann, 1997 ; Libault et al., 1999). Les progrs mtrologiques permettent galement de mieux comprendre les processus grande chelle. Des outils statistiques sont ainsi utiliss pour tudier comment se distribuent les vitesses dans la masse deau et le lien entre vitesses, dbit et dbut dentranement des particules (Clifford et al., 1992 ; Kirkbride et Ferguson, 1995 ; Biron et al., 1998) ; 2. lanalyse systmique (ou holistique) conduit largir le champ gographique des problmatiques. Dans le cas de la gomorphologie uviale, ce type danalyse conduit concevoir des recherches intgres au sein de bassins versants (Schumm, 1977 ; Newson, 1994). Dans ce cadre, des jeux de donnes de grande taille peuvent tre produits an de mettre en lumire les liens bassin versant chenal. Ces donnes se

prsentent gnralement sous une forme simplie pour pouvoir tre collectes sur un trs grand nombre de stations, dans le but de rpondre des problmatiques appliques ou interdisciplinaires (Downs, 1994). Par exemple, au lieu de mesurer prcisment la granulomtrie au laboratoire, il savre souvent prfrable de considrer une variable nominale k modalits identiables sur le terrain, visuellement ou au touch (Pigay et al., sous presse) ; 3. lapproche systmique en gomorphologie ainsi que les progrs technologiques en matire dacquisition et de traitement de linformation expliquent le recours croissant la tldtection et aux SIG (systmes dinformation gographique) (Merts et al., 1995 ; Andriamahefa, 1999 ; Gilvear et al., 1999) ; ces outils permettent danalyser simultanment un ensemble de couches dinformation gographique, par exemple en gomorphologie uviale, les formes drosion, la position du rseau hydrographique, la pente, laltitude ou la couverture vgtale, an de mettre en lumire les contrles gomorphologiques lchelle du bassin versant, tablir des scnarios et les simuler. La plupart des variables considres en gomorphologie ont pour caractristique commune dtre rgionalises , cest--dire localises dans lespace gographique. En gomorphologie uviale, cette localisation est unidimensionnelle, le long dun continuum uvial ou le long dun transect (Ichim et Radoane, 1990 ; Gurnell, 1997), ou bidimensionnelle, au sein dun bassin versant ou dun lit uvial (Montgomery et al., 1998a). En consquence, lanalyse des donnes gomorphologiques seffectue naturellement au sein des SIG (Carrara et al., 1991 ; Latulipe et Peiry, 1996 ; Montgomery et al., 1998b). Toutefois, il convient de reconnatre que les SIG se sont dvelopps indpendamment de lanalyse statistique des donnes spatiales, ce qui se traduit actuellement par une demande croissante dintgration des deux (Arbia, 1993 ; Haining et al., 1996). Dans le cadre dune analyse statistique, les SIG sont le plus souvent utiliss pour stocker les donnes, les exporter vers un programme statistique externe, puis les rsultats sont imports et visualiss. Linterfaage entre les principaux SIG et logiciels statistiques du march semble plus fort quil y a quelques annes (Croft et Kessler, 1996), mais encore faut-il que les outils statistiques utiliss se rvlent adapts la nature rgionalise des variables traites. En effet, le problme fondamental pos par lanalyse statistique des variables rgionalises rside dans le fait que les procdures statistiques usuelles (corrlation linaire, rgression, analyse de variance, etc.) ne tiennent pas compte de lautocorrlation spatiale des valeurs (Annexe I). Lautocorrlation spatiale peut tre dnie de faon intuitive comme la ressemblance des valeurs en fonction de leur localisation gographique. Lautocorrlation spatiale est positive lorsque les valeurs mesures dans des stations voisines se ressemblent davantage quelles ne ressemblent aux autres valeurs. On parle dautocorrlation ngative dans le cas dune dissemblance. Le terme autocorrlation spatiale est classiquement utilis comme synonyme de dpendance spatiale (Gatrell, 1979 ; Cliff et Ord, 1981). Lautocorrlation traduit le degr de structuration spatiale dune variable rgionalise, autrement dit une forme de complexit spatiale. La premire

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

113

tape du traitement statistique dune variable rgionalise consiste dcrire sa structure dautocorrlation spatiale. Lintrt de lanalyse de lautocorrlation en gomorphologie est multiple puisquelle permet : de dterminer la porte de lautocorrlation spatiale, cest--dire la distance partir de laquelle lhtrognit des valeurs peut tre considre comme indpendante de la localisation gographique. Connaissant la porte, on peut envisager de dnir un dispositif dchantillonnage garantissant lindpendance spatiale des donnes, an de pouvoir utiliser les tests statistiques usuels (test du coefcient de corrlation de Pearson, test dindpendance du 2, tests de lANOVA, etc.), de quantier la rgularit spatiale du phnomne, autrement dit, mesurer une forme de complexit spatiale. Cette dmarche est essentiellement labore en cologie du paysage (par exemple, Turner et al., 1991) mais peut tre applique des problmatiques gomorphologiques. Par exemple, partir des donnes dun prol en long (distance longitudinale, altitude) ou de lanalyse dun trac en plan (longueur donde des mandres), il est possible didentier une tendance ainsi que des ruptures morphologiques, et de dnir la longueur et lamplitude des principales units (Ferguson, 1975 ; Clifford et al., 1992 ; Madej, 1999), de modliser lautocorrlation spatiale an de pouvoir en tenir compte dans les procdures statistiques destimation spatiale, de test, ou de simulation. Lobjet de cet article est de traiter de lanalyse de lautocorrlation spatiale des variables rgionalises en gomorphologie, et plus particulirement en gomorphologie uviale. La thmatique de la modlisation de lautocorrlation spatiale nest pas aborde. Larticle est organis en trois sections : i) expos de quelques dnitions opratoires de lautocorrlation spatiale pour des variables quantitatives ou nominales ; ii) application des tests de randomisation an dvaluer lhypothse nulle dabsence dautocorrlation spatiale ; iii) illustration des deux points prcdents au moyen dexemples simuls et de donnes relles utilises en gomorphologie uviale.

DFINITIONS PROPOSES EN GOGRAPHIE STATISTIQUE Les statistiques mesurant la dpendance spatiale sont essentiellement issues de la gographie (revue dans Cliff et Ord, 1973, 1981), domaine largement domin par les tests de lautocorrlation spatiale (Ripley, 1988). Actuellement, ce sont encore les gographes qui produisent le plus de mesures et de tests dautocorrlation spatiale (par exemple, Anselin, 1988, 1995 ; Getis, 1989 ; Hubert et Arabie, 1991 ; Deichman et Anselin, 1994 ; Ord et Getis, 1995 ; Tiefelsdorf et Boots, 1997 ; Simon, 1997). Les statistiques dont lusage est le plus rpandu en gographie sont le c de Geary (Geary, 1954) et le I de Moran (Moran, 1950).

c de Geary
La forme originelle du c de Geary (Geary, 1954) peut tre gnralise en considrant une matrice W de poids ij affects tous les couples de supports (xi , xj), nots plus simplement (i , j ) (Cliff et Ord, 1981) :

c=

(z (n 1)
ij i, j

zj
2

2W

(z
i

z)

(1)

avec

W = i , j ij . La somme du numrateur est tendue

tous les couples de supports en faisant varier les indices i et j, la somme du dnominateur tant tendue tous les supports. Le c de Geary nadmet pas de borne suprieure mais admet une borne infrieure vidente min(c)=0 qui correspond lautocorrlation spatiale maximale, cest--dire lorsque les valeurs compares sont identiques. Par construction, le c de Geary est un rapport destimations de la variance respectivement spatiale et a-spatiale. Par consquent, la valeur attendue du c de Geary en absence dautocorrlation spatiale est E[c]=1 (Geary, 1954 ; Cliff et Ord, 1981). Les valeurs comprises dans lintervalle [0,1[ tmoignent donc dune autocorrlation spatiale positive tandis que les valeurs dans ]1,+[ traduisent la prsence dautocorrlation ngative. Les poids de la matrice W traduisent la manire dont on connecte les supports entre eux, cest--dire la relation de voisinage des supports. Il existe deux situations selon que le voisinage est dni en faisant intervenir : a) un graphe de voisinage des supports (ventuellement pondr) ; b) les vecteurs forms par les couples de supports (le plus souvent dans un espace muni de la mtrique euclidienne). Si les distances euclidiennes nont pas beaucoup de sens, par exemple lorsque la densit relative des supports varie fortement et/ou que les erreurs de localisation ne sont pas ngligeables, il convient dutiliser la place un graphe de voisinage reprsentant la topologie des connexions entre supports (Legendre et Fortin, 1989). Le problme est alors de savoir si la question pose par le gomorphologue permet de dnir ce graphe. Dans le cas de supports ponctuels reprs le

PRSENTATION DES DFINITIONS OPRATOIRES


Une variable rgionalise se note sous la forme dune fonction z(x) tablissant la correspondance entre la valeur mesure zi et le support spatial de la mesure xi, pour i=l,...,n ; toute statistique mesurant lautocorrlation spatiale repose sur la mise en relation des deux informations constitutives de la variable rgionalise z(x) : a) le voisinage des supports xi ; b) la ressemblance entre les valeurs zi. Dans lespace des supports (espace gographique) et dans lespace des valeurs, il est possible de dnir diffrents types de proximits. En outre, il existe plusieurs approches pour mettre en relation les proximits entre supports et les proximits entre valeurs, ce qui conduit de nombreuses dnitions opratoires de lautocorrlation spatiale.

Gographie physique et Quaternaire, 55(2), 2001

114

P. AUBRY et H. PIGAY

long dune rivire ou dune ligne de ct, le graphe est naturellement rduit une simple chane (Royaltey et al., 1975 ; Chessel et Sabatier, 1993 ; Thioulouse et al., 1995). Dans le cas de supports ponctuels rpartis dans le plan, la question pose peut parfois indiquer le graphe le plus appropri, mais en pratique il est gnralement difcile de prsenter des arguments en faveur dun graphe particulier (Gordon et Finden, 1985). Le choix de la matrice W conditionne la nature de lautocorrlation spatiale teste (Gabriel et Sokal, 1969 ; Sokal et Oden, 1978). La question est alors de savoir ce que lon doit infrer si lautocorrlation savre statistiquement signicative en utilisant une certaine dnition opratoire (par exemple, une certaine matrice de poids W) et non significative avec une autre dfinition (Gatrell, 1979). La rponse est simplement quun rsultat plus ou moins signicatif met en vidence ladquation plus ou moins bonne du modle de variation spatiale impos a priori par W aux donnes (Jumars et al., 1977 ; Cliff et Ord, 1981, p. 168, 174). Dans cette optique, plutt que de tester diffrents modles de variation spatiale, il est possible de chercher directement la matrice W qui maximise la statistique utilise (Kooijman, 1976 ; Boots et Dufournaud, 1994). Cependant, il reste ensuite interprter la signication du modle de variation spatiale obtenu, ce qui peut savrer assez difcile. Liens entre le c de Geary et dautres statistiques Le c de Geary (Geary, 1954) est li dautres statistiques dnies notamment dans le domaine des sries temporelles et en cologie statistique (Annexe II), ainsi quau variogramme de la gostatistique. En effet, en considrant uniquement les couples de supports (i, j) spars par un vecteur hij = h, la matrice W dnit une classe de vecteurs, et le c de Geary scrit comme la fonction :

Dans ce qui suit, nous considrons exclusivement le c de Geary sous la forme dune fonction de vecteurs inter-supports (qu. 2).

I de Moran
De mme que pour le c de Geary, la forme originelle du I de Moran (Moran, 1950) peut tre gnralise en considrant une matrice W de poids ij affects tous les couples de supports (xi, xj) (Cliff et Ord, 1981) :

n I= 2W
avec

(z
ij i, j i

z) zj z
i

(z

z)

(4)

W = i , j ij . La somme du numrateur est tendue

tous les couples de supports en faisant varier les indices i et j, la somme du dnominateur tant tendue tous les supports. Le I de Moran ne sinterprte pas exactement comme un coefcient de corrlation classique en ce quil nest pas restreint lintervalle [-1, +1] et ne vaut pas exactement 0 en absence dautocorrlation spatiale. En gnral, la borne suprieure |I| est infrieure 1, bien quelle puisse dpasser 1 dans certains cas particuliers (Cliff et Ord, 1981, p. 21). La valeur attendue du I de Moran en absence dautocorrlation spatiale est E[I] = (n 1)1 (Moran, 1950 ; Cliff et Ord, 1981). Une valeur infrieure E[I] traduit de lautocorrlation ngative tandis quune valeur suprieure tmoigne dune autocorrlation positive. DFINITIONS PROPOSES EN GOSTATISTIQUE

(h) c( h ) = 2 sn 1
avec
2 sn 1 = (n 1) 1

(2)

(z
i

z ) lestimateur sans biais de


2

la variance thorique, et le (demi) variogramme exprimental dfini en gostatistique par Matheron (1965). Le variogramme peut scrire (Isaaks et Srivastava, 1989) :

(h) =

1 zi z j 2 N (h) ( i , j ) h ij = h

(3)

Dautres mesures de la dpendance spatiale que le c de Geary et le I de Moran ont t introduites en gostatistique des ns de modlisation de la structure dautocorrlation spatiale (revue dans Isaaks et Srivastava, 1989 ; Deutsch et Journel, 1992 ; Myers, 1997). La statistique la plus utilise est le variogramme exprimental (Matheron, 1965), dni dans la section consacre au c de Geary (qu. 3). Plus rcemment, Isaaks et Srivastava (1988) ont introduit deux fonctions de covariance et de corrlation dites non ergodiques qui savrent tre dun grand intrt pour lanalyse de lautocorrlation spatiale. La diffrence entre la covariance spatiale classique (qu. 13, annexe III) et la covariance dite non ergodique tient dans la prise en compte des moyennes calcules sur deux ensembles forms par les valeurs situes de part et dautre du vecteur qui les spare, au lieu dune moyenne globale qui ne tient pas compte de la localisation des valeurs. La covariance non ergodique scrit (Isaaks et Srivastava, 1989) :

avec N(h) le nombre de couples de supports spars par le vecteur h. En considrant uniquement la norme du vecteur h, $ note h, la valeur 2 (h) nest pas autre chose que la moyenne des carrs des carts des valeurs dont les supports sont spars par la distance h. Sous cette forme, le c de Geary apparat comme le variogramme exprimental standardis par une estimation de la variance thorique. En consquence, la reprsentation graphique du c de Geary est strictement identique celle du variogramme, seule lchelle des valeurs prises par la statistique tant modie par la standardisation par la variance.

CD (h) =

1 (zi m h ) z j m+ h N (h) ( i , j ) h ij = h

(5)

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

115

avec mh la moyenne de toutes les valeurs dont les supports sont situs h des autres, cest--dire une extrmit du vecteur h :

a)

c (1) (h) = s 2 CD (h) / s 2 pour la covariance non ergo c ( 2 ) (h) = 1 D (h) pour la corrlation non ergo-

dique ; b) dique.

m h =

1 zi N (h) i h ij = h

(6)

et m+h la moyenne de toutes les valeurs dont les supports sont situs +h des autres, cest--dire lautre extrmit du vecteur h :

m+ h =

1 zj N (h) j h ij = h

(7)

Aprs transformation, les fonctions varient dans le mme sens que le variogramme standardis (c de Geary) et ont mme esprance sous lhypothse nulle dabsence dautocorrlation (E[c(h)]=1). Selon le couple de fonctions considr, une superposition imparfaite des reprsentations graphiques montre donc des diffrences de moyennes locales (c(h) et c(1)(h)), de variances locales (c(1)(h) et c(2)(h)) ou ventuellement des deux la fois (c(h) et c(2)(h)). La gostatistique dnit galement dautres fonctions telles que le rodogramme, ou le madogramme (Journel, 1988 ; Deutsch et Journel, 1992, p. 42 ; Walker et al., 1997), ainsi que diffrents types de variogrammes relatifs (Deutsch et Journel, 1992, p. 41-42 ; Myers, 1997, p. 297-300). Dans ce qui suit, nous considrons exclusivement le variogramme standardis ou c de Geary c(h), la covariance non ergodique et la corrlation non ergodique sous leurs formes c(1)(h) et c(2)(h). DFINITION POUR DONNES NOMINALES Le c de Geary, la covariance non ergodique et la corrlation non ergodique peuvent tre appliqus aussi bien des donnes quantitatives qu des donnes binaires, bien que des statistiques spcifiques aient t dveloppes dans le cas des donnes binaires (par exemple, Moran, 1948). En revanche, dans le cas des donnes nominales plusieurs modalits (par exemple, des types de sols, diffrentes formes drosion, ou diffrents couverts vgtaux), il convient dutiliser une autre statistique pour mesurer la dpendance spatiale. En effet, la statistique doit tre adapte la structure algbrique des donnes nominales qui permet uniquement de tester lgalit ou lingalit stricte de deux modalits. An dobtenir une mesure qui sinterprte de faon similaire au variogramme, nous proposons la statistique suivante :

Les valeurs de mh et de m+h sont gnralement diffrentes (Isaaks et Srivastava, 1989, p. 59). De mme que la corrlation classique est dnie comme la covariance entre deux variables, divise par le produit des carts types de chacune des variables, une fonction dautocorrlation spatiale standardise la covariance spatiale dune variable avec elle-mme (autocovariance spatiale), en la divisant par sa variance (cest--dire le produit de son cart type par lui-mme). La corrlation dite non ergodique est forme de la mme faon, en divisant la covariance non ergodique, non plus cette fois par la variance globale qui ne tient pas compte de la localisation des valeurs mais par le produit dcarts types calculs sur deux ensembles forms par les valeurs situes de part et dautre du vecteur qui les spare. La corrlation non ergodique scrit donc :

C (h) D (h) = D h + h

(8)

2 avec h la variance de toutes les valeurs dont les supports sont situs h des autres, cest--dire une extrmit du vecteur h : 2 h =

1 2 (zi m h ) N (h) i h ij = h

(9)

2 et +h la variance de toutes les valeurs dont les supports sont situs +h des autres, cest--dire lautre extrmit du vecteur h : 2 +h =

J (h) =
avec

1 (i, j ) N (h) ( i , j ) h ij = h

(11)

1 z j m+ h N (h) j h ij = h

(10)

0 si zi = z j (i, j ) = 1 sinon
La statistique J(h) nest pas autre chose que la statistique a ( h ) propose antrieurement par Deichman et Anselin (1994), mais exprime sous la forme dune dissimilarit plutt que sous la forme dune similarit, la ressemblance maximale moyenne tant atteinte pour 0 et la dissemblance maximale moyenne pour 1. Il convient de noter que les modalits prises en compte dans le calcul de J(h) doivent correspondre un mme niveau hirarchique dans la description des phnomnes gomorphologiques car une variable nominale ne permet pas de distinguer diffrents niveaux de prcision dans la description.

2 De mme que pour les moyennes, les valeurs de h et de sont gnralement diffrentes (Isaaks et Srivastava, 1989, p. 60). Ainsi, la nouveaut introduite par les fonctions non ergodiques est la prise en compte dventuelles diffrences : a) entre les moyennes locales, grce la distinction entre mh et m+h ; b) entre les variances locales, grce la distinction 2 2 entre h et +h . 2 +h

Pour comparer ces deux fonctions entre elles et avec le variogramme standardis c(h) il faut utiliser les transformations suivantes (Rossi et al., 1992 ; Liebhold et al., 1993) :

Gographie physique et Quaternaire, 55(2), 2001

116

P. AUBRY et H. PIGAY

TEST DES FONCTIONS DAUTOCORRLATION


TESTS PARAMTRIQUES Le c de Geary et le I de Moran sont tous les deux asymptotiquement normalement distribus sous lhypothse nulle H0 dabsence dautocorrlation. Afin de tester les valeurs observes en faisant rfrence la loi normale, les moments des deux statistiques sont donns par Cliff et Ord (1981). En ce qui concerne le c de Geary, la validit de lapproximation normale est discute dans Cliff et Ord (1981). La normalit de la distribution du I de Moran sous H0 a donn lieu une littrature plus abondante que dans le cas du c de Geary, citons notamment Cliff et Ord (1971), Sen (1976), Cliff et Ord (1977), Sen (1977), Cliff et Ord (1981) et plus rcemment, Terui et Kikuchi (1994), et Waldhr (1996). Les tests paramtriques du variogramme, de la covariance et de la corrlation non ergodiques nont pas t dvelopps, lobjet des gostatisticiens ntant pas de tester lautocorrlation spatiale, mais de la modliser. notre connaissance, il nexiste pas non plus de test paramtrique concernant la statistique J pour donnes nominales. TESTS DE RANDOMISATION Dans le cas o le nombre de supports est faible ou lorsque nous ne disposons pas dun test paramtrique, il est particulirement intressant dutiliser un test permutationnel. Le principe dun test permutationnel consiste gnrer toutes les valeurs possibles dune statistique cest--dire ici pour toutes les permutations des valeurs parmi les supports an de calculer la p-value exacte associe la valeur observe de la statistique (dtails dans lannexe IV). Le test permutationnel peut tre envisag pour n 10. Dans la plupart des cas (n > 10), lnumration de toutes les permutations est impraticable et le test permutationnel est estim par un test de randomisation (Edgington, 1986, 1987). Un test de randomisation consiste raliser alatoirement un nombre limit de permutations au lieu de raliser de faon exhaustive toutes les permutations possibles. Il est conseill de gnrer un nombre lev de permutations alatoires an dobtenir une estimation prcise de la p-value. Pour un jeu de donnes comportant une centaine de valeurs, un nombre de permutations m = 10 000 semble constituer un minimum raisonnable en de duquel il convient de ne pas descendre. Lorsque les donnes sont plus nombreuses, il conviendrait galement daugmenter le nombre des permutations alatoires, en restant toutefois dans des limites raisonnables en termes de temps de calcul. Outre le calcul dune p-value, la distribution empirique des valeurs de la statistique calcules pour lensemble des permutations alatoires permet de construire un intervalle de conance pour la valeur observe. Statistiques quivalentes Dans le cadre dun test de randomisation, le variogramme est une statistique quivalente au c de Geary et la fonction de covariance est une statistique quivalente au I de Moran. En

effet, le c de Geary et le I de Moran sont quivalents, respec2 tivement : a) au variogramme standardis par sn1 (qu. 2) ; b) la fonction de covariance, standardise par s2 (qu. 12, n Annexe III). Or, le calcul de la variance des donnes est invariant par permutation de lordre des valeurs, de sorte que la standar2 2 disation par sn1 (ou par sn) ne change pas les rsultats des tests de randomisation. Intrt des tests de randomisation Lintrt des tests de randomisation est de ne pas faire appel une hypothse distributionnelle concernant la statistique teste, ce qui vite notamment davoir dvelopper analytiquement les moments de la statistique sous lhypothse nulle H0 dabsence dautocorrlation, et permet ainsi de tester toute statistique, y compris une statistique qui serait imagine par le gomorphologue an de rpondre aux besoins dune tude particulire. Les p-values tant calcules pour chaque classe de vecteurs h, il est possible de xer un seuil arbitraire (par exemple, = 0,05) pour identier les valeurs dautocorrlation qui sont signicatives ce seuil. La p-value tant vue comme la force de lvidence contre lhypothse nulle, il est prfrable de visualiser toutes les p-values an dinterprter avec nesse la fonction dautocorrlation spatiale associe. cet effet, Walker et al. (1997) proposent de reprsenter les p-values comme des fonctions ou p-grammes, conjointement aux fonctions dautocorrlation spatiale, quil sagisse du variogramme, dun covariogramme ou dun corrlogramme. La distribution approximative de la statistique sous H0 tant connue, il est galement possible de tracer des intervalles de confiance approximatifs des fonctions dautocorrlation spatiale, pour diffrents seuils arbitraires tels que = 0,10, = 0,05 ou = 0,01.

IDENTIFICATION DE LA PORTE DE LAUTOCORRLATION : EXEMPLES DE DONNES SIMULES ET RELLES


Au-del de la question de savoir si lautocorrlation est signicative ou pas, ce qui intresse le gomorphologue cest de mesurer la porte de lautocorrlation an de dterminer lchelle de la dpendance spatiale. Lorsque lautocorrlation positive dcrot avec la distance puis sannule compltement, la porte est dnie de faon stricte comme la distance partir de laquelle lautocorrlation est non signicative. Lorsque lautocorrlation dcrot, sannule, puis change de signe, la notion de porte perd de sa signication. Classiquement, les fonctions issues de la gostatistique sont considres comme utiles pour mesurer la porte de lautocorrlation spatiale (Rossi et al., 1992). En fait, le corrlogramme du I de Moran peut tout aussi bien tre utilis quun variogramme ou que la covariance non ergodique, mais dans tous les cas, la dnition opratoire de la porte constitue un problme dlicat. Il convient dabord de remarquer que la dnition opratoire de la porte dpend du type de fonction dautocorrlation et quun rsultat diffrent peut tre obtenu selon

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

117

A
FIGURE 1. Images en niveaux de gris 30 x 30 pixels des variables quantitatives simules. A) Absence de structure spatiale. B) Structure spatiale priodique. C) Gradient linaire orient E-O. Panchromatic images 30 x 30 pixels of simulated quantitative variables. A) No spatial structure. B) Periodic spatial structure. C) Linear gradient E-W oriented.

que lon utilise le c de Geary (ou ce qui revient au mme, le variogramme) ou le I de Moran (ou ce qui revient au mme, la covariance, Annexe III) : la notion de porte nchappe videmment pas au problme de la dnition opratoire de lautocorrlation spatiale elle-mme. Par exemple, dans leur tude de la teneur en cuivre et en zinc dans les sdiments du bassin du Yangtze (Chine), Zhang et Selinus (1997) mettent en vidence une porte denviron 1 000 km avec le variogramme et de 500 km avec le corrlogramme du I de Moran. Nous proposons, linstar de Walker et al. (1997), dutiliser le p-gramme an de dterminer le plus objectivement possible la porte de lautocorrlation spatiale. Le choix dun seuil arbitraire au-del duquel lautocorrlation spatiale serait juge non signicative a peu de sens. En effet, le choix de inuence videmment la dnition de la porte (Walker et al., 1997). Il est plus judicieux dexaminer la variation des p-values au sein du p-gramme : lorsque plusieurs p-values successives plaident en faveur de lhypothse H0, alors cest que la porte de lautocorrlation a t atteinte ou a t lgrement dpasse. DONNES SIMULES Protocole Trois images ont t simules sur une grille de 30 x 30 pixels de pas = 1 (g. 1). La premire image a t obtenue en permutant alatoirement les pixels dune image spatialement structure et ne prsente par consquent plus aucune structure spatiale comme peut en tmoigner labsence de continuit spatiale des valeurs des pixels (g. 1A). Au contraire, limage de la gure 1B montre une structure spatialement rgulire qui prsente un caractre priodique avec alternance de zones fonces et de zones claires, spares par des zones de transition graduelle. Enn, un gradient orient E-O est reprsent sur la gure 1C. Pour chaque image, un chantillon de 100 pixels a t prlev selon une grille 10 x 10 centre dans la grille originelle de 30 x 30 pixels. Pour chaque chantillon, le c de Geary ainsi que la covariance et la corrlation non ergodiques ont t calculs pour un ensemble de 7 distances spares par des

intervalles de largeur d = 3. Le nombre de distances est limit 7 an de ne pas dpasser la distance maximale de reprsentativit de la fonction, cest--dire la distance au-del de laquelle seuls les pixels situs en priphrie sont compars entre eux. Soit Lmax la distance maximale dans limage (ici Lmax = 302 42,4) ; la distance maximale de reprsentativit de la fonction vaut Lmax /2, soit ici Lmax /2 21,2 (Journel, 1985 ; Rossi et al., 1992). Le cas du gradient tant un exemple de structure parfaitement anisotrope, les fonctions ont t calcules uniquement dans la direction E-O, pour des multiples exacts de d. Pour les deux autres chantillons, les fonctions ont t calcules dans toutes les directions, les structures sous-jacentes ne montrant pas de direction privilgie (isotropie). En outre, les valeurs ont t calcules pour des classes de distances dnies pour des multiples de d, avec une tolrance = 1,5. Lusage dune tolrance permet de lisser la fonction tout en augmentant le nombre de couples de pixels intervenant dans le calcul de chaque valeur de la fonction dautocorrlation (David, 1977 ; Journel et Huijbregts, 1978). La tolrance = 0,5 d permet dutiliser toute linformation disponible et savre dusage courant (par exemple, Isaaks et Srivastava, 1989, p. 148). Enn, des intervalles de conance au seuil de 1 % ont t tablis dans chaque cas sur la base de 10 000 permutations alatoires. Rsultat Dans le cas de lchantillon de limage alatoire, la superposition de la covariance et de la corrlation non ergodiques est parfaite, ce qui montre labsence de variation de la variance locale. Il existe toutefois de lgres diffrences de moyennes locales, sauf pour les distances 12 et 15 (g. 2A). Lexamen des intervalles de conance 1 % du c de Geary et de la covariance non ergodique montre que lautocorrlation nest pas signicative, quelle que soit la distance (g. 2A). Dans le cas de lchantillon de limage montrant une structure priodique, les trois fonctions calcules sont pratiquement identiques (g. 2B). Ceci montre labsence de diffrences marques la fois des moyennes et des variances locales. La nature priodique de la structure spatiale sous-jacente se traduit par une oscillation amortie des fonctions dautocorrlation autour de leur esprance sous H0 (E[c(h)] = 1). Lintervalle

Gographie physique et Quaternaire, 55(2), 2001

118

P. AUBRY et H. PIGAY

FIGURE 2. Fonctions dautocorrlation des variables quantitatives simules, superposition du c de Geary, de la covariance et de la corrlation non ergodiques. A) Absence de structure spatiale. B) Structure spatiale priodique. C) Gradient linaire orient E-O. Examples of three autocorrelation functions of simulated quantitative variables, the Gearys c , the non ergodic covariance and correlation. A) No spatial structure. B) Periodic spatial structure. C) Linear gradient E-W oriented.

A
1,2

Fonctions structurales

1,1 1,0 0,9 0,8 2 4 6 8 10 12 14 16 18 20 22

c de Geary et son intervalle de confiance au seuil de 1 %


corrlation non ergodique covariance non ergodique et son intervalle de confiance au seuil de 1 %

B
1,4

Fonctions structurales

1,2 1,0 0,8 0,6 0,4 0,2 2 4 6 8 10 12 14 16 18 20 22

c de Geary et son intervalle de confiance au seuil de 1 %


corrlation non ergodique covariance non ergodique

C
1,4 1,2 1,0 0,8 0,6 0,4 0,2 0,0 2 4 6 8 10 12 14 16 18 20 22 Distance (m)

Fonctions structurales

c de Geary
corrlation non ergodique covariance non ergodique et son intervalle de confiance au seuil de 1 %

de conance du c de Geary montre que lautocorrlation spatiale dcrot, puisquelle est dabord positive (de 3 6), non signicative (de 6 8), puis ngative (entre 8 et 12), avant de crotre nouveau (entre 12 et 15) et de samortir autour de E[c(h)] = 1. Les trois fonctions calcules pour lchantillon du gradient sont nettement distinctes (g. 2C). En effet, le c de Geary crot comme une branche de parabole tandis que la covariance non ergodique semble borne par un plateau correspondant lesprance sous H0 (E[c(h)] = 1) et que la corrlation non ergodique est parfaitement horizontale et situe 0. Lallure du c de Geary indique typiquement la prsence dune tendance, ce qui est conrm par lallure trs diffrente de la covariance non ergodique qui tient compte des diffrences de moyennes locales. Lintervalle de conance de la covariance non ergodique permet de dnir une porte situe entre 15 et 18, soit approximativement la moiti de la largeur de la grille 30 x 30. Ceci indique quune fois tenu compte des diffrences

de moyennes entre les extrmits des vecteurs inter-supports, des valeurs spares par une bande de 15 m peuvent tre considres comme indpendantes. Enn, la corrlation non ergodique est nulle quelle que soit la distance considre, ce qui tmoigne dune ressemblance parfaite toutes les distances et labsence dune source de variabilit autre que les diffrences de moyennes et de variances calcules aux extrmits des vecteurs inter-supports. Discussion Les images simules (fig. 1) correspondent des situations bien tranches qui permettent de faire le lien entre la structure spatiale telle quelle apparat visuellement et lallure du c de Geary, de la covariance et de la corrlation non ergodiques. Laspect plat des fonctions dautocorrlation dans le cas de limage alatoire (fig. 1A) traduit le fait que la variabilit

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

119

des valeurs est indpendante de la distance ; autrement dit, la variabilit nest pas spatialement structure. Labsence de structure spatiale est connue dans la littrature gostatistique sous le nom d effet de ppite pur (pure nugget effect) (Journel et Huijbregts, 1978). Leffet de ppite pur constitue donc lhypothse nulle du test de lautocorrlation spatiale et peut tre dmontr sans ambigut laide dun test de randomisation (g. 2A). En pratique, labsence dautocorrlation spatiale signicative aux faibles distances constitue lexception plutt que la rgle dans le cas des phnomnes gomorphologiques. Lhomognit spatiale des moyennes et des variances locales observe dans le cas de la structure priodique (g. 2B) provient du fait que limage a t obtenue en calculant une ralisation dun modle stochastique (fonction alatoire) stationnaire lordre 2 (voir Journel et Huijbregts, 1978 ; Myers 1989). Lhomognit spatiale des moyennes et des variances locales ainsi que lisotropie constituent les hypothses structurelles les plus simples, auxquelles il est fait rfrence par dfaut lors de lanalyse de lautocorrlation spatiale. Lcart ces hypothses par dfaut peut tre mis en vidence de faon assez fine en comparant le c de Geary, la covariance et la corrlation non ergodique, calcules selon diffrentes directions. Lexemple du gradient parfait (g. 2C) illustre lallure non borne du c de Geary en prsence dune tendance, ainsi que les diffrentes tapes du ltrage de la variabilit effectu par la covariance et la corrlation non ergodiques. En pratique, mme dans le cas dune forte ressemblance, la corrlation non ergodique ne peut pas se maintenir zro pour toutes les distances, parce quil existe toujours une variabilit rsiduelle. Les variables rgionalises rencontres dans ltude des phnomnes gomorphologiques combinent selon diffrents degrs les situations archtypales illustres par les figures 1A, 1B et 1C. En effet, les structures spatiales ne sont jamais parfaitement alatoires (g. 1A), ni parfaitement homognes et isotropes (g. 1B) et encore moins constitues dune tendance simple, sans variabilit rsiduelle (g. 1C). Un des objectifs de lanalyse de lautocorrlation spatiale est prcisment de contribuer dcrire la structure spatiale, en termes dcart labsence de structure spatiale, dcart lhomognit (prsence dune tendance) et dcart lisotropie (anisotropie). EXEMPLES DE VARIABLES RGIONALISES UNIDIMENSIONNELLES : INCISION ET LARGEUR DU LIT DE LA DRME (FRANCE) Zone dtude La Drme est une rivire dune longueur de prs de cent kilomtres, afuent de rive gauche du Rhne moyen (g. 3). Elle draine un bassin de 1 640 km2, principalement dessin dans les pr-alpes calcaires et marneuses du Vercors et du Diois. Avec un module de 18,6 m3s-1 Saillans, cette rivire fond graveleux prsente un style uvial en tresses, tout fait caractristique dans sa basse valle. Depuis les annes 1945,

la Drme enregistre une mtamorphose : son lit se rtracte et sincise, en raison dune modication des pratiques agricoles en lit majeur et du dveloppement de lactivit extractive en lit mineur (Pigay et Landon, 1997 ; Landon et al., 1998). la suite de ltude intgre conduite en 1995 sur ce bassin, une base de donnes gomorphologiques a t constitue. Deux cent douze segments de rivire dune longueur de 500 m ont t dnis. Pour chacun deux, prs de 30 variables gomorphologiques et biogographiques ont t mesures (Landon et al., 1995). Ces donnes ont permis de mettre en lumire des tendances gomorphologiques la fois synchroniques, amont - aval, et diachroniques, certaines variables ayant t collectes diffrentes dates. Deux variables cls lincision du lit entre 1928 et 1996 et sa largeur en 1991 ont t retenues pour mesurer leur autocorrlation spatiale et dcrire leur variabilit amont - aval. Lincision et la largeur du lit tendent augmenter nettement vers laval. Ces tendances ne sont cependant pas parfaitement rgulires, plusieurs secteurs sindividualisant (g. 4). Incision Le c de Geary et la covariance non ergodique ne se superposent pas parfaitement, ce qui indique la prsence de diffrences de moyennes locales qui sorganisent selon une tendance (g. 5A). Cette tendance est du reste bien visible dans la reprsentation graphique des donnes (g. 4A). Les covariogramme et corrlogramme non ergodiques prsentent un trac approximativement parallle : ceci tmoigne de la prsence de diffrences de variances locales, ces diffrences tant toutefois approximativement constantes quelle que soit la distance considre (tracs parallles). Les diffrences de variance locale constituent une source de variabilit qui est ltre par la corrlation non ergodique, ce qui explique que le corrlogramme soit situ en dessous du covariogramme. Comme cette source de variabilit est quasiment indpendante de la distance, elle nest pas intressante considrer du point de vue de lanalyse de la structure gomorphologique. Le trac du c de Geary tmoigne dune tendance globale et dun embotement de quatre niveaux de structuration : les ruptures se situent approximativement aux kilomtres 13, 25 et 40 (g. 5A). Cette structure embote est relativement difcile mettre en vidence par un simple examen des donnes. Toutefois, on distingue assez clairement deux segments dune longueur de 40 km qui correspondent deux tronons particuliers de la Drme, de part et dautre du km 40 (Saillans). Le secteur aval a t le plus intensment exploit par lindustrie des granulats et prsente ainsi une forte incision. Il se distingue du secteur amont, plus loign des centres de consommation de granulats (Valence, valle du Rhne), moins exploit et donc moins incis. La structure denviron 20-25 km de longueur correspond grosso modo des units gomorphologiques lmentaires : km 0 km 20 (secteur tressage actif, fortement incis), km 20 km 40 (secteur divaguant dont le fond de lit est ponctuellement sous la commande des afeurements calcaires), km 40 km 60 (gorge centrale o le lit est moins exploit et moins sensible lenfoncement par rosion

Gographie physique et Quaternaire, 55(2), 2001

120

P. AUBRY et H. PIGAY

FIGURE 3. Localisation des jeux de donnes relles. A) Localisation des sites de la Drme (B) et du Roubion (C) dans le couloir rhodanien (France). B) Tronon de la Drme, depuis sa confluence avec le Rhne jusquau km 95. C) Sous-bassins de la Bine et du Soubrion dans le bassin du Roubion.

A) Location of the two studied sites in the southeastern France. B)The reach of the Drme river from its conuence with the Rhne to km 95. C)The sub-basins of the Bine and the Soubrion within the Roubion basin.

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

121

A
8 6 4 2 0 -2 -4 -6 0 350 300 250 200 150 100 50 0 0 10 20 30 40 50 60 70 80 90 100 10 20 30 40 50 60 70 80 90 100

B Largeur du lit en 1991 (m)

volution altimtrique du lit entre 1928 et 1996 (m)

Distance du Rhne la source (km)


FIGURE 4. Valeurs moyennes de lincision et de la largeur du lit de la Drme, depuis sa conuence avec le Rhne jusquau km 95, par segments de 500 m. A) Incision du lit de la Drme entre 1928 et 1996. B) Largeur du lit de la Drme en 1991. Mean degradation and width of the active channel of the Drme river, from its conuence with the Rhne to km 95, per segment of 500 m of river length. A) Active channel degradation between 1928 and 1996. B) Active channel width in 1991.

A INCISION DU LIT
1,4

B LARGEUR DU LIT
1,4 1,3 1,2 1,1 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3

Fonctions structurales

1,2 1,0 0,8 0,6 0,4 0,2 0 0 10 20 30 40 50 60

10

20

30

40

50

60

Distance (km)
c de Geary
covariance non ergodique

Distance (km)
corrlation non ergodique

FIGURE 5. Superposition des reprsentations graphiques du c de Geary, de la covariance et de la corrlation non ergodiques en fonction de la distance entre segments (km). A) Incision du lit de la Drme entre 1928 et 1996. B) Largeur du lit de la Drme en 1991. Les ches noires indiquent des ruptures de tendance dcrites dans le texte.

Evolution of the Gearys c, non ergodic covariance and correlation according to the distance between the channel segments (km). A) Active channel degradation between 1928 and 1996. B) Active channel width in 1991. The black arrows indicate trend breaking described in the text.

Gographie physique et Quaternaire, 55(2), 2001

122

P. AUBRY et H. PIGAY

rgressive ou progressive), amont km 60 (plaine alluviale intramontagnarde touche ponctuellement par lincision) (g. 3B). La structure la plus lmentaire (10-15 km) distingue au sein de chaque grand segment gomorphologique des sousensembles, diffremment touchs par lincision. Le tronon km 0 - km 10 correspond une zone de tressage fortement incise alors que le tronon km 10 - km 20 est marqu par un gradient : la zone aval est endigue et soumise une rosion rgressive qui sattnue lamont dans une zone plus naturelle. Entre les km 40 et 50, le contexte est similaire : un gradient oppose la gorge proprement dite, laval, peu touche par lincision car le lit est protg par des blocs provenant des versants, et le tronon amont, alluvial et plus touch par lincision. Le km 90 spare galement deux segments :

une plaine alluviale trs stable laval et une zone en gorge lamont et au sein de laquelle le lit enregistre un exhaussement. La structure spatiale la plus lmentaire distingue ainsi clairement des units morphologiques dune dizaine de kilomtres de longueur en fonction de leur sensibilit lincision, de la position des zones dextraction ou des points xes (afeurements rocheux, seuils articiels, pavage) dterminant lenfoncement du lit. La covariance non ergodique montre galement les ruptures identies en examinant le c de Geary. En effet, aprs la prise en compte des diffrences de moyennes locales, une porte situe entre 10 et 15 km peut tre identie en examinant lintervalle de conance au seuil de 1 % (g. 6A). une distance de 25 km, puis de 40 km, la covariance non

A INCISION DU LIT
1,6 1,4 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0 10 20 30 40 50 6 60 1,4 1,2 1,0 0,8 0,6 0,4 0 10 20 30 40 50 60 6

B LARGEUR DU LIT

c de Geary

1,2 1,0 0,8 0,6 0,4 0,2 0

10

20

30

40

50

60

Covariance non ergodique

1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0

10

20

30

40

50

60

Distance (km)

Distance (km)

fonction et son intervalle de confiance au seuil de 1 %


FIGURE 6. Reprsentation graphique du c de Geary, de la covariance non ergodique et de la corrlation non ergodique en fonction de la distance entre segments (km) et intervalles de conance sous H0 au seuil de 1 % (10 000 permutations alatoires). A) Incision du lit de la Drme entre 1928 et 1996. B) Largeur du lit de la Drme en 1991. Evolution of the Gearys c, the non ergodic covariance and correlation according to the distance between the channel segments (km) and condence interval under H0 for a threshold of 1 % (10 000 random permutations). A) Active channel degradation between 1928 and 1996, B) Active channel width in 1991.

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

123

ergodique prsente deux pics dautocorrlation spatiale positive, signicative au seuil de 1 % (g. 6A). Largeur du lit Dans le cas de la largeur, le c de Geary met en lumire une tendance (g. 5B), mais celle-ci est moins nette que celle observe prcdemment (g. 5A). La diffrence entre le c de Geary et le couple covariance / corrlation non ergodiques se manifeste essentiellement partir de 35 km (g. 5B). En effet, lexamen des donnes montre que les tronons spars par une distance suprieure 35 km ont des moyennes diffrentes : par exemple, les segments situs aux alentours du km 85 ont une largeur trs diffrente de ceux localiss vers le km 50, qui ont eux-mmes une largeur diffrente de ceux localiss vers le km 15 (g. 4B). De fait, le c de Geary distingue clairement le secteur aval, trs large, qui correspond un tronon de plaine alluviale laval des gorges de Saillans marqu par une tendance llargissement, et le secteur amont qui se caractrise par une alternance de secteurs trs troits (gorges, zones endigues) et de secteurs plus larges (plaine alluviale plus naturelle). La covariance et la corrlation non ergodiques se superposent, ce qui tmoigne de labsence dune diffrence de variance locale. La porte, dtermine laide des intervalles de conance au seuil de 1 %, est identique, que lon considre le c de Geary ou la covariance non ergodique : elle peut tre situe entre 5 et 10 km (g. 6B). Ce segment lmentaire est ainsi beaucoup plus court que celui calcul avec les valeurs dincision. De fait, la largeur semble distinguer des sous-secteurs au sein des segments lmentaires identis par lincision : km 10 - km 20, distinction nette entre la zone endigue aval (km 10 - km 15) et la zone des ramires (km 15 - km 20), km 40 - km 50, distinction nette entre la gorge aval (km 40 - km 44) et la zone alluviale amont plus large (km 44 - km 50). Discussion Lanalyse conjointe des trois statistiques dcrivant la dpendance spatiale permet de mettre en vidence la prsence ventuelle dune tendance, de structures embotes (g. 5A) ou de diffrences de moyennes locales sur une portion particulire de laxe des distances (g. 5B). Avec lexemple de lincision du lit, il apparat que la dnition de la porte (au sens large) dpend de la statistique utilise, puisquelle peut tre value environ 28 km dans le cas du c de Geary, et situe entre 10 et 15 km dans le cas de la covariance non ergodique. Avec le c de Geary, la dnition de la porte inclut la tendance, tandis quavec la covariance non ergodique, la porte est dnie en ltrant les effets de la tendance. Dans le cas de la largeur du lit, la porte dnie au sens du c de Geary ou de la covariance non ergodique est semblable dans la mesure o il nexiste pas de diffrence de moyenne locale jusqu cette distance (g. 5B). Lanalyse des deux variables (incision et largeur) montre des diffrences de rgularit spatiale : en effet, le trac des fonctions concernant lincision est lisse (g. 5A et 6A), alors que celui concernant la largeur est nettement plus irrgulier (fig. 5B et 6B). Ceci correspond lexistence de segments

prsentant une largeur trs diffrente de celle des segments voisins (par exemple, km 10, km 17, km 44, g. 4B), tandis que lincision est un phnomne effectivement beaucoup plus rgulier (g. 4A). Lanalyse de lautocorrlation des variables lmentaires dcrivant la variabilit longitudinale de la gomtrie des lits uviaux permet de mettre en lumire les tendances gomorphologiques densemble, tout en distinguant diffrentes chelles spatiales des segments homognes. De fait, dans le cadre dune analyse longitudinale, le c de Geary constitue un outil pertinent permettant de mettre en vidence lallomtrie (au sens de Church et Mark, 1980) au sein du systme, notamment laugmentation de la largeur du lit avec laugmentation de la taille du bassin et donc du dbit, tout en soulignant limportance des facteurs locaux (affleurements rocheux, morphologie du fond de valle, position des sites dextraction et des tronons endigus) qui contrlent la gomtrie du lit, notamment sa largeur et son niveau dincision. Ceci montre que dans les bassins versants dont la gologie est contraste et o les actions humaines sexpriment variablement le long du continuum uvial, les facteurs locaux au-del dun paramtre de taille tel que la supercie du bassin jouent un rle cl, expliquant le fait que les tendances longitudinales sexpriment modestement. Cette dmarche permet ainsi de montrer la complexit longitudinale de lagencement des formes gomorphologiques notamment en raison de la distribution complexe des facteurs de contrle le long du continuum tout en indiquant au-del de quelle distance les supports peuvent donner lieu des donnes spatialement indpendantes, utilisables dans des analyses statistiques classiques. Dans le cadre de ltude longitudinale de la gomtrie hydraulique, lanalyse de lautocorrlation spatiale permet ainsi de pouvoir mieux chantillonner les segments sur lesquels une analyse de rgression peut ensuite tre ralise an de prvoir lvolution de la gomtrie du lit en fonction de la taille du bassin versant ou de la distance la source. EXEMPLE DE VARIABLES RGIONALISES BIDIMENSIONNELLES : FORMES DROSION DES SOUS-BASSINS DU ROUBION (FRANCE) Zone dtude et problmatique Le Roubion est galement un afuent du Rhne moyen, dont le bassin est limitrophe de celui de la Drme (g. 3C). Il draine le mme compartiment gologique que ce dernier : les zones en relief, dont laltitude ne dpasse pas 1 600 m, sont dessines dans des calcaires massifs alors que les zones en creux prsentent une lithologie domine par les marnes et les marno-calcaires. Il sagit dune rgion sdimentaire plisse, soumise dimportantes dformations et prsentant un relief inverse typique. Deux de ses sous-bassins, la Bine et le Soubrion, ont fait lobjet dune tude dtaille pour valuer quelles taient les potentialits de recharge du Roubion en sdiments grossiers (Libault et al., 1998). Lun des problmes cl sur ce bassin comme sur celui de la Drme est de grer le dcit sdimentaire du bras principal caus par les

Gographie physique et Quaternaire, 55(2), 2001

124

P. AUBRY et H. PIGAY

extractions de graviers en lit mineur et dvaluer la capacit dautorestauration de la rivire compte tenu des potentialits de son bassin. Lun des enjeux est de pouvoir identier quels sont les bassins versants qui prsentent des stocks sdimentaires abondants et qui peuvent alimenter durablement le Roubion en sdiments. Dans ce cadre, prvoir la distribution gographique des formes drosion partir de diffrents descripteurs du bassin, comme la lithologie, les formations supercielles, le couvert vgtal, la pente, lorientation, ou encore laltitude, pourrait tre utile pour valuer une chelle rgionale plus petite quelles sont les potentialits du bassin en matire dalimentation du Roubion en charge de fond. Mesurer lautocorrlation spatiale est ainsi une premire tape permettant de savoir sil est possible de dnir un chantillon de valeurs spatialement indpendantes et dtablir un modle de rgression, de faon classique (modle derreurs indpendantes, utilisation des tests). Formes drosion Une cartographie des phnomnes drosion se manifestant sur les versants a t ralise partir de lanalyse de photographies ariennes et dune reconnaissance de terrain (Libault et al., 1998). Ont ainsi t cartographis les glissements, les loupes de soliuxion, les boulements et les boulis, les seconds se distinguant des premiers par le processus de formation, la forme et la taille des particules, ou encore, le ruissellement diffus et le ravinement, ce dernier caractri-

sant un ruissellement concentr et mieux connect que le prcdant au rseau hydrographique. La carte des zones drosion, ralise sur Arc Info/Arc View, a t convertie en une image matricielle de 12 000 pixels de 50 m de ct dont un chantillon alatoire simple de 1 000 pixels a t extrait. Comme cette rgion se dessine dans une structure sdimentaire plisse, les formes de relief ont une orientation dominante. Dans le bassin de la Bine et du Soubrion, la lithologie, et par voie de consquence la topographie, prsentent une orientation prfrentielle NO-SE (g. 7A). De fait, la rpartition gographique des zones drosion, tous processus confondus, rpond au contexte topographique et lithologique et les formes de ces zones prsentent elles-mmes une orientation prfrentielle (g. 7B). La variable dcrivant les processus drosion est une variable nominale 8 modalits (g. 7B). Pour tudier lautocorrlation spatiale de cette variable, nous utilisons la statistique J. La modalit 8 correspondant aux entits non soumises lrosion, nest pas prise en compte dans les calculs. La statistique J est calcule pour un ensemble de 70 classes de distances dnies pour des multiples de d = 50 m, avec une tolrance de 25 m. Les calculs sont dabord effectus en considrant toutes les directions la fois (fonction omnidirectionnelle). Cependant, la structure spatiale sous-jacente ntant manifestement pas isotrope, des fonctions directionnelles sont galement calcules, pour les directions S-N, E-O, NE-SO et NO-SE, en utilisant une tolrance angulaire de 10. Des intervalles de conance ont t tablis pour les fonctions directionnelles, sur la base de 10 000 permutations alatoires.

A A

B B

440 560 680 800 -

560 680 800 915

915 - 1 035 1 035 - 1 150 1 150 - 1 270 1 270 - 1 390 1 390 - 1 510

FIGURE 7. Cartographies des sous-bassins de la Bine et du Soubrion. A) Hypsomtrie. B) Formes drosion.

The sub-basins of the Bine and the Soubrion. A) Relief architecture. A) Distribution of erosion forms.

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

125

Compte tenu de la taille du jeu de donnes trait (1000 pixels), un chantillon de 10 000 permutations alatoires ne permet pas destimer avec prcision les queues de distribution sous H0 de la statistique J. En consquence, les intervalles de conance ont t calculs en utilisant un seuil de 10 %. Lexamen de la fonction J omnidirectionnelle montre que lautocorrlation spatiale des processus drosion dcrot rgulirement, jusqu atteindre un palier situ 1,5 km, avant de crotre nouveau au-del de 2,5 km (g. 8A). Effectivement, lintervalle de confiance au seuil de 10 % confirme quen moyenne, les processus drosion sont autocorrls positivement jusqu une distance denviron 1,5 km et autocorrls ngativement au-del de 2,5 km (g. 8A). La carte des formes drosion montre que la taille des zones homognes varie fortement, mais excde rarement 2,5 km dans leur plus grande longueur (boulements et boulis). Plus les points sont proches, plus ils ont de chance de correspondre au mme processus drosion (autocorrlation positive). Deux points distants lun de lautre dune distance

comprise entre 1,5 km et 2,5 km ont, en moyenne, autant de chance de correspondre au mme processus drosion qu deux processus diffrents (autocorrlation non signicative). Au-del de 2,5 km de sparation, les deux points sont trs souvent situs dans des zones dlimitant des formes drosion diffrentes (autocorrlation ngative). Lanalyse directionnelle de lautocorrlation montre une forte anisotropie de la distribution spatiale des processus drosion. En effet, la reprsentation graphique de la statistique J diffre selon lorientation (fig. 8B). Parmi les quatre orientations envisages (S-N, E-O, NE-SO et NO-SE), la direction NO-SE prsente une fonction J nettement distincte des autres qui correspond lorientation prfrentielle des formes de relief, et par consquent, celle des processus drosion. La fonction J de direction NO-SE natteint jamais de porte, lautocorrlation positive tant toujours signicative. En revanche, la fonction J de direction NE-SO direction perpendiculaire lorientation prfrentielle des formes de relief a la porte la plus courte, les deux autres fonctions J prsentant une allure intermdiaire.

Fonctions J unidirectionnelles

FIGURE 8. Reprsentation graphique de la statistique J pour la variable rgionalise formes drosion en fonction de la distance entre supports. A) Fonction J omnidirectionnelle et intervalle de conance sous H0 au seuil de 10 % (10 000 permutations alatoires). B) Fonction J directionnelle pour les directions suivantes : S-N, E-O, NE-SO, NO-SE (tolrance angulaire de 10) et intervalle de confiance sous H0 au seuil de 10 % (10 000 permutations alatoires) pour la direction NO-SE. Evolution of the J statistics for the variable erosion forms in relation with the distance between pixels. A) Omnidirectional J function and condence interval under H0 for a threshold of 10 % (10 000 random permutations). B) Directional J function for the following orientations: S-N, E-W, NE-SW, NW-SE (angular tolerance 10) and condence interval under H0 for a threshold of 10 % (10 000 random permutations) for the NW-SE orientation.

A
0,9

Fonction J omnidirectionnelle

0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0


fonction J et son intervalle de confiance au seuil de 10 %

B
1,0 0,8 0,6 0,4 0,2 0

Directions : NE-SO S-N E-O NO-SE (borne infrieure de lintervalle de confiance au seuil de 10 % pour la direction ci-dessus)

Distance (km)

Gographie physique et Quaternaire, 55(2), 2001

126

P. AUBRY et H. PIGAY

Discussion La conversion en une image matricielle de la carte des formes drosion des bassins versants de la Bine et du Soubrion a gnr une variable rgionalise nominale dont lautocorrlation spatiale a pu tre mesure laide de la statistique J ; ceci illustre le fait que ce type danalyse statistique nest pas limit aux seules donnes quantitatives. Dans le cas de donnes bidimensionnelles, une analyse directionnelle est indispensable an de vrier la validit de lhypothse disotropie. Une allure nettement distincte des fonctions dautocorrlation tmoigne de lexistence dune anisotropie. En loccurrence, la direction prfrentielle NO-SE apparat trs clairement sur la gure 8B, conformment lapprciation visuelle de la carte des formes drosion (g. 7B). Dans le cadre de la dfinition dun chantillon visant garantir lindpendance spatiale des donnes, le recours une fonction omnidirectionnelle an de dterminer la porte de lautocorrlation spatiale nest valide quen situation disotropie. En loccurrence, la direction prfrentielle NO-SE des processus drosion ne permet pas de dnir une porte maximale compatible avec la taille du domaine dtude, qui puisse garantir lindpendance spatiale quelle que soit la direction. Cet exemple montre quil nest pas toujours possible de procder de faon simple un chantillonnage garantissant lindpendance spatiale des donnes. En consquence, une approche alternative au problme pos par lautocorrlation spatiale des donnes consiste la modliser an den tenir compte dans les procdures statistiques elles-mmes.

est difcile de gnrer un jeu de donnes spatialement indpendantes et il devient ncessaire de remplacer les procdures classiques qui supposent lindpendance spatiale, par des procdures statistiques tenant compte de lautocorrlation. Lanalyse de lautocorrlation spatiale se rvle donc indispensable, comme pralable la construction dun modle statistiquement valide. REMERCIEMENTS Les auteurs remercient vivement Norbert Landon, Frdric Libault et Fabrice Taillefumier de lUMR 5600 du CNRS pour avoir particip aux tudes conduites sur la Drme (1995) ou sur le Roubion (1998) et la construction des jeux de donnes relles utiliss dans cet article. Ils remercient galement Pierre Richard, Michael Church, Benot Saint-Onge et un lecteur anonyme, dont les commentaires constructifs ont permis damliorer le manuscrit. RFRENCES
Andriamahefa, H., 1999. Les hydro-corgions du bassin de la Loire : morphologie, hydrologie, pressions anthropiques sur les cours deau et les bassins versants. Thse de Gographie et Amnagement, Universit Jean Monnet de Saint-tienne, 272 p. Anselin, L., 1988. Lagrange multiplier test diagnostics for spatial dependence and spatial heterogeneity. Geographical Analysis, 20 : 1-17. ____ 1995. Local indicators of spatial association. Geographical Analysis, 27 : 93-115. Arbia, G., 1993. The use of GIS in spatial statistical surveys. International Statistical Review, 61 : 339-359. Biron, P.M., Lane, S.N., Roy, A.G., Bradbrook, K.F. et Richards, K.S., 1998. Sensitivity of bed shear stress estimated from vertical velocity proles : The problem of sampling resolution. Earth Surface Processes and Landforms, 16 : 427-445. Boots, B.N. et Dufournaud, C., 1994. A programming approach to minimizing and maximizing spatial autocorrelation statistics. Geographical Analysis, 26 : 54-66. Carrara, A., Cardinali, M., Detti, R., Guzzeti, F., Pasqui, V. et Reichenback, P., 1991. GIS techniques and statistical models in evaluating landslide hazard. Earth Surface Processes and Landforms, 16 : 427-445. Cerioli, A., 1997. Modied tests of independence in 2 x 2 tables with spatial data. Biometrics, 53 : 619-628. Chessel, D., 1981. The spatial autocorrelation matrix. Vegetatio, 46 : 177-180. Chessel, D. et Sabatier, R., 1993. Couplage de triplets statistiques et graphes de voisinage, p. 28-37. In B. Asselain, M. Boniface, C. Duby, C. Lopez, J.P. Masson et J. Tranchefort, dit., Biomtrie et analyse de donnes spatiotemporelles. Socit franaise de Biomtrie, ENSA, Rennes, 123 p. Church, M. et Mark, D.M., 1980. On size and scale in geomorphology. Progress in Physical Geography, 4(3) : 342-390. Clment, P. et Pigay, H., sous presse. Statistics and uvial geomorphology. In M.G. Kondolf et H. Pigay, dit., Tools in Fluvial Geomorphology, Wiley, Chichester. Cliff, A.D. et Ord, J.K., 1969. The problem of spatial autocorrelation, p. 25-55. In A.J. Scott, dit., London Papers in Regional Science. 1. Studies in Regional Science. Pion, London, 216 p. ____ 1971. Evaluating the percentage points of a spatial autocorrelation coefcient. Geographical Analysis, 3 : 51-61. ____ 1973. Spatial Autocorrelation. Pion, London, 178 p. ____ 1977. Large sample-size distribution of statistics used in testing for spatial correlation: A comment. Geographical Analysis, 9 : 297-299. ____ 1981. Spatial Processes. Models and Applications. Pion, London, 266 p.

CONCLUSION
La nature rgionalise des variables tudies par le gomorphologue loblige tenir compte de lautocorrlation spatiale de ses donnes avant de construire un modle statistique prdictif. Les exemples tudis dans cet article ont montr lintrt dune analyse de lautocorrlation spatiale mettant en uvre simultanment plusieurs statistiques, an de mettre en vidence diffrentes caractristiques des structures spatiales. Cette pratique, renforce par le recours aux intervalles de conance tablis par une procdure de permutation alatoire des donnes, permet de mieux apprhender la complexit spatiale des formes et leur structuration diffrentes chelles. Toutefois, la dnition objective de la porte de lautocorrlation spatiale constitue un problme dlicat. En effet, la porte est dnie conditionnellement au type de fonction dautocorrlation, de sorte quun rsultat diffrent peut tre obtenu selon la statistique qui est utilise. Le second exemple rel expos a notamment illustr le fait que lisotropie des phnomnes est rare en gomorphologie. En consquence, toute tude mene dans un espace bidimensionnel doit sappuyer sur une analyse directionnelle de lautocorrlation spatiale. Si le principal objectif de cette analyse consiste dterminer un pas dchantillonnage garantissant lindpendance spatiale des donnes, il convient alors de sappuyer sur la direction pour laquelle la porte est la plus leve. Cependant, le pas dchantillonnage qui est dtermin de cette faon nest pas ncessairement compatible avec la taille du domaine dtude et la taille de lchantillon constituer. Dans ce cas, il

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

127

Clifford, N.J., Robert, A. et Richards, K.S., 1992. Estimation of ow resistance in gravel-bedded rivers: a physical explanation of the multiplier of roughness length. Earth Surface Processes and Landforms, 17 : 111-126. Croft, F. et Kessler, B., 1996. Remote sensing, image processing, and GIS. Trends and forecasts. Journal of Forestry, 94 : 31-35. David, M., 1977. Geostatistical Ore Reserve Estimation. Elsevier, New York, 364 p. Deichman, U. et Anselin, L., 1994. Exploratory spatial data analysis of categorical variables: An application to African farming systems data, p. 21072116. In J.J. Harts, H.F.L. Ottens, H.J. Scholten et J. Van Arragon, dit., EGIS/MARI 94. Fifth European Conference and Exhibition on Geographical Information Systems. EGIS Foundation, Utrecht. Deutsch, C.V. et Journel, A.G., 1992. GSLIB. Geostatistical Software Library and Users Guide. Oxford University Press, New York, 340 p. Downs, P.W., 1994. Characterization of river channel adjustments in the Thames basin, south-east England. Regulated rivers. Research and Management, 9 : 151-175. Durbin, J. et Watson, G.S., 1950. Testing for serial correlation in least squares regression. I. Biometrika, 37 : 409-428. Dutilleul, P., 1993. Modifying the t test for assessing the correlation between two spatial processes. Biometrics, 49 : 305-314. Edgington, E.S., 1986. Randomization tests, p. 530-538. In S. Kotz et N.L. Johnson, dit., Encyclopedia of Statistical Sciences, vol. 7. Wiley, New York, 714 p. ____ 1987. Randomization Tests. Second edition. Marcel Dekker, New York, 341 p. Ferguson, R.I., 1975. Meander irregularity and wavelength estimation. Journal of Hydrology, 26 : 315-333. Gabriel, K.R. et Sokal, R.R., 1969. A new statistical approach to geographic variation analysis. Systematic Zoology, 18 : 259-278. Gatrell, A.C., 1979. Autocorrelation in spaces. Environment and Planning A, 11 : 507-516. Geary, R.C., 1954. The contiguity ratio and statistical mapping (with discussion). Incorporated Statistician (The), 5 : 115-145. Getis, A., 1989. A spatial association model approach to the identication of spatial dependence. Geographical Analysis, 21 : 251-259. Gilvear, D.J., Bryant, R. et Hardy, T., 1999. Remote sensing of channel morphology and in-stream uvial processes. Progress in Environmental Science, 1 : 257-284. Gordon, A.D. et Finden, C.R., 1985. Classification of spatially-located data. Computational Statistics Quarterly, 2 : 315-328. Greig-Smith, P., 1952. The use of random and contiguous quadrats in the study of the structure of plant communities. Annals of Botany, 16 : 293-316. Gurnell, A.M., 1997. Adjustments in river channel geometry associated with hydraulic discontinuities across the uvial-tidal transition of a regulated river. Earth Surface Processes and Landforms, 22 : 967-985. Haining, R., Ma, J. et Wise, S., 1996. Design of a software system for interactive spatial statistical analysis linked to a GIS. Computational Statistics Quarterly, 11 : 449-466. Hill, M.O., 1973. The intensity of spatial pattern in plant communities. Journal of Ecology, 61 : 225-235. Hubert, L.J. et Arabie, P., 1991. The assessment of spatial autocorrelation through constrained multiple regression. Geographical Analysis, 23 : 95111. Ichim, I. et Radoane, M., 1990. Channel sediment variability along a river: A case study of the Siret River (Romania). Earth Surface Processes and Landforms, 15 : 211-225. Isaaks, E.H. et Srivastava, R.M., 1988. Spatial continuity for probabilistic and deterministic geostatistics. Mathematical Geology, 20 : 313-341. ____ 1989. An Introduction to Applied Geostatistics. Oxford University Press, New York, 561 p.

Journel, A.G., 1985. The deterministic side of geostatistics. Mathematical Geology, 17 : 1-15. ____ 1988. New distance measures: the route toward truly non-Gaussian geostatistics. Mathematical Geology, 20 : 459-475. Journel, A.G. et Huijbregts, C.J., 1978. Mining Geostatistics. Academic Press, London, 600 p. Jumars, P.A., Thistle, D. et Jones, M.L., 1977. Detecting two-dimensional spatial structure in biological data. Oecologia, 28 : 109-123. Kirkbride, A.D. et Ferguson, R. 1995. Turbulent ow structure in a gravel-bed river: Markov chain analysis of the uctuating velocity prole. Earth Surface Processes and Landforms, 20 : 721-733. Kooijman, S.A.L.M., 1976. Some remarks on the statistical analysis of grids especially with respect to ecology. Annals of Systems Research, 5 : 113-132. Landon, N., Pigay, H. et Bravard, J.P., 1995. Mission dexpertise gomorphologique : propositions pour une gestion physique quilibre du lit de la Drme. Commission locale de lEau du Schma dAmnagement et de Gestion des Eaux de la Drme, Rapport, 105 p. ____ 1998. The Drme River incision (France): From assessment to management. Landscape and Urban Planning, 43 : 119-131. Latulippe, C. et Peiry, J.-L., 1996. Essai de hirarchisation des zones de production de matires en suspension dans le bassin-versant dun grand cours deau : lIsre en amont de Grenoble. Revue de Gographie alpine, 2 : 2944. Legendre, P. et Fortin, M.-J., 1989. Spatial pattern and ecological analysis. Vegetatio, 80 : 107-138. Libault, F, Clment, P., Pigay, H. et Landon, N., 1999. Assessment of bedload supply potentiality from the tributary watersheds of a degraded river: The Drme (France). Arctic, Antarctic and Alpine Research, 31 : 108-117. Libault, F., Pigay, H. et Taillefumier, F., 1998. valuation des potentialits de recharge du Haut-Roubion partir dune analyse ne des caractristiques gographiques du bassin et de deux affluents : la Bine et le Soubrion. Syndicat mixte dAmnagement rural de la Drme et Syndicat intercommunal du Bassin du Roubion, Rapport, 90 p. Liebhold, A.M., Rossi, R.E. et Kemp, W.P., 1993. Geostatistics and Geographic Information Systems in applied insect ecology. Annual Review of Entomology, 38 : 303-327. Ludwig, J.A. et Goodall, D.W., 1978. A comparison of paired-with-blocked-quadrat variance methods for the analysis of spatial pattern. Vegetatio, 38 : 4959. Madej, M.A., 1999. Temporal and spatial variability in thalweg proles of a gravel-bed river. Earth Surface Processes and Landforms, 24 : 1153-1169. Matheron, G., 1965. Les variables rgionalises et leur estimation. Une application de la thorie des fonctions alatoires aux sciences de la nature. Masson, Paris, 305 p. Merts, L.A.K., Daniel, D.L., Melack, J.M., Nelson, B., Martinelli, A. et Forsberg, B.R., 1995. Spatial patterns of hydrology, geomorphology, and vegetation on the oodplain of the Amazon river in Brazil from a remote sensing perspective. Geomorphology, 13 : 215-232. Montgomery, D.R., Dietrich, W.E. et Sullivan, K., 1998a. The role of GIS in watershed analysis, p. 241-261. In S.N. Lane, K.S. Richards et J.H. Chandler, dit., Landform, Monitoring, Modelling and Analysis, Wiley, Chichester, 454 p. Montgomery, D.R., Sullivan, K. et Greenberg, H.M., 1998b. Regional test of a model for shallow landsliding. Hydrological Processes, 12 : 943-955. Moran, P.A.P., 1948. The interpretation of statistical maps. Journal of the Royal Statistical Society Series B, 10 : 243-251. ____ 1950. Notes on continuous stochastic phenomena. Biometrika, 37 : 17-23. Myers, D.E., 1989. To be or not to be stationary? That is the question. Mathematical Geology, 21 : 347-362. Myers, J.C., 1997. Geostatistical Error Management. Quantifying Uncertainty for Environmental Sampling and Mapping. Van Nostrand Reinhold, New York, 571 p.

Gographie physique et Quaternaire, 55(2), 2001

128

P. AUBRY et H. PIGAY

Newson, M., 1994. Sustainable integrated development and the basin sediment system: guidance from uvial geomorphology, p. 1-10. In C. Kirby et W.R. White, dit., Integrated River Basin Development, Wiley, Chichester, 537 p. Okabe, A., 1976. A note on Gearys spatial contiguity ratio. Geographical Analysis, 8 : 315-318. Ord, J.K. et Getis, A., 1995. Local spatial autocorrelation statistics: Distributional issues and an application. Geographical Analysis, 27 : 286-306. Pettitt, A.N., 1982. Durbin-Watson test, p. 426-428. In S. Kotz et N.L. Johnson, dit., Encyclopedia of Statistical Sciences, Vol. 2. Wiley, New York, 613 p. Pigay, H., Bornette, G. et Grante, P., sous presse. Assessment of silting-up dynamics of 11 cut-off channel plugs on a free-meandering river (the Ain River), France. In R.J. Allison, dit., Applied Geomorphology, Theory and Practice, Wiley, Chichester. Pigay, H. et Landon, N., 1997. Promoting an ecological management of riparian forests on the Drme River, France. Aquatic Conservation: Marine and Freshwater Ecosystems, 7 : 287-304. Rickenmann, D., 1997. Sediment transport in Swiss torrents. Earth Surface Processes and Landforms, 22 : 937-951. Ripley, B.D., 1988. Spatial data analysis, p. 570-573. In S. Kotz et N.L. Johnson, dit., Encyclopedia of Statistical Sciences, vol. 8. Wiley, New York, 870 p. Rossi, R.E., Mulla, D.J., Journel, A.G. et Franz, E.H., 1992. Geostatistical tools for modeling and interpreting ecological spatial dependence. Ecological Monographs, 62 : 277-314. Royaltey, H.H., Astrachan, E. et Sokal, R.R., 1975. Tests for patterns in geographic variation. Geographical Analysis, 7 : 369-395. Schumm, S.A., 1977. The Fluvial System. Wiley, New York, 338 p. Sen, A., 1976. Large sample-size distribution of statistics used in testing for spatial correlation. Geographical Analysis, 8 : 175-184. ____ 1977. Large sample-size distribution of statistics used in testing for spatial correlation : A reply. Geographical Analysis, 9 : 300. Simon, G., 1997. An angular version of spatial correlations, with exact signicance tests. Geographical Analysis, 29 : 267-278. Sokal, R.R., 1979. Ecological parameters inferred from spatial correlograms, p. 167-196. In G.P. Patil et M. Rosenzweig, dit., Contemporary quantitative ecology and related ecometrics. International Co-operative Publishing House, Fairland, Maryland, 695 p. Sokal, R.R. et Oden, N.L., 1978. Spatial autocorrelation in biology. 1 Methodology. Biological Journal of the Linnean Society, 10 : 199-228. Terui, N. et Kikuchi, M., 1994. The size-adjusted critical region of Morans I test statistics for spatial autocorrelation and its application to geographical areas. Geographical Analysis, 26 : 213-227. Thioulouse, J., Chessel, D. et Champely, S., 1995. Multivariate analysis of spatial patterns: A unied approach to local and global structures. Environmental and Ecological Statistics, 2 : 1-14. Tiefelsdorf, M. et Boots, B., 1997. A note on the extremities of local Morans Iis and their impact on the global Morans I*. Geographical Analysis, 29 : 248-257. Turner, S.J., ONeill, R.V., Conley, W., Conley, M.R. et Humphries, H.C., 1991. Pattern and scale: statistics for landscape ecology, p. 17-49. In M.G. Turner et R.H. Gardner, dit., Quantitative Methods in Landscape Ecology. Ecological Studies, Vol. 82, Springer-Verlag, New York, 536 p. Ver Hoef, J.M., Cressie, N.A.C. et Glenn-Lewin, D.C., 1993. Spatial models for spatial statistics: Some unication. Journal of Vegetation Science, 4 : 441-452. von Neumann, J., 1941. Distribution of the ratio of the mean square successive difference to the variance. Annals of Mathematical Statistics, 12 : 367395. Waldhr, T., 1996. The spatial autocorrelation coefcient Morans I under heteroscedasticity. Statistics in Medicine, 15 : 887-892. Walker, D.D., Loftis, J.C. et Mielke, P.W., 1997. Permutation methods for determining the signicance of spatial dependence. Mathematical Geology, 29 : 1011-1024. Walter, S.D., 1974. On the detection of household aggregation of disease. Biometrics, 30 : 525-538.

Zhang, C.S. et Selinus, O., 1997. Spatial analyses for copper, lead and zinc contents in sediments of the Yangtze River basin. Science of the Total Environment, 204 : 251-262.

ANNEXE I
LOGICIELS STATISTIQUES ET DONNES SPATIALES Certains logiciels statistiques commerciaux offrent des possibilits en matire danalyse et de modlisation spatiale, cest le cas de Systat, qui comporte, au mme titre que des outils danalyse des sries chronologiques, un module de Spatial statistics, en fait strictement limit la gostatistique. Cest galement le cas de S+SpatialStats qui constitue un module supplmentaire de S+, permettant notamment de calculer certaines statistiques dautocorrlation spatiale telles que le c de Geary et le I de Moran. Toutefois, ces logiciels noffrent ni toutes les mesures exposes dans cet article ni la possibilit de raliser des tests de randomisation et des intervalles de conance non paramtriques comme nous le proposons. Par ailleurs, notre connaissance, il nexiste aucun logiciel statistique commercialis qui adapte les procdures statistiques classiques au traitement des variables rgionalises autocorrles, par exemple le test de la corrlation entre deux variables quantitatives (Dutilleul, 1993), ou bien un test dassociation pour variables binaires (Cerioli, 1997).

ANNEXE II
LIENS ENTRE LE c DE GEARY ET DAUTRES STATISTIQUES Le c de Geary (Geary, 1954) est une gnralisation lespace bidimensionnel du rapport de von Neumann dfini pour les sries temporelles (von Neumann, 1941). Par ailleurs, le de von Neumann est algbriquement identique la statistique d introduite par Durbin et Watson (1950) pour tester lautocorrlation srielle du terme derreur dans un modle linaire (Pettitt, 1982). Ainsi, le c de Geary est galement li au d de Durbin-Watson (Sokal et Oden, 1978). Okabe (1976) propose une interprtation du c de Geary base sur lanalyse de variance et Chessel (1981) mentionne les relations entre le c de Geary, lANOVA hirarchique propose par Greig-Smith (1952) dans le domaine de lcologie statistique, et la statistique de Walter (1974). En considrant uniquement les couples de supports (i, j) spars par un vecteur hij = h, la matrice W dnit une classe de vecteurs, et sous cette forme, le c de Geary nest pas autre chose que le variogramme exprimental standardis par une estimation de la variance thorique. En consquence, linstar des liens troits existant entre le c de Geary et lANOVA hirarchique propose par Greig-Smith (Chessel, 1981), le variogramme quivalent au c de Geary, un facteur de standardisation prs prsente de profondes analogies avec des statistiques proposes en cologie telles que la TTLV (TwoTerm Local Variance) de Hill (1973), ou la PQV (Paired-Quadrat Variance) de Ludwig et Goodall (1978) (Ver Hoef et al., 1993).

Gographie physique et Quaternaire, 55(2), 2001

ANALYSE DE LAUTOCORRLATION SPATIALE

129

ANNEXE III
LIENS ENTRE LE I DE MORAN ET DAUTRES STATISTIQUES En considrant uniquement les couples de supports (i, j) spars par un vecteur hij = h, la matrice W dnit une classe de vecteurs, et le I de Moran scrit comme la fonction :

laire constitue lassurance que le rsultat nest pas artefactuel et est bien indpendant de la statistique utilise ; b) une conclusion contradictoire doit ncessairement conduire le gomorphologue approfondir son analyse.

ANNEXE IV
PRINCIPE DES TESTS DE PERMUTATION ET DE RANDOMISATION Soit une statistique Z et soit lensemble des n! permutations des indices i = 1, 2,, n ; la distribution de Z sous H0 est obtenue en assignant une probabilit gale de 1/n! aux valeurs de Z calcules pour les n! permutations des valeurs {zi| i = 1,,n}. La distribution de Z sous H0 tant tablie conditionnellement aux donnes, le test ne concerne que les donnes elles-mmes et pas une population statistique dont seraient issues les donnes. partir de la distribution exacte de Z sous H0, la p-value associe la valeur observe Zobs est calcule comme la proportion de valeurs suprieures ou gales Zobs (ou infrieures ou gales, selon lhypothse alternative considre) :

I (h) =
avec

C( h ) 2 sn

(12)

s =n
2 n

(z
i

z)

$ la variance des valeurs, et C (h) la

fonction de covariance spatiale empirique :

C( h ) =

1 (zi z ) z j z N (h) ( i , j ) h ij = h

(13)

Sous cette forme, le I de Moran apparat comme la covariance spatiale standardise par la variance des valeurs. Le lien entre le I de Moran et le c de Geary a t tudi par Sokal (1979). Il savre que si le c de Geary montre une autocorrlation spatiale positive moins forte que le I de Moran ou une autocorrlation spatiale ngative plus forte que le I de Moran, cela peut indiquer que les valeurs extrmes sont spatialement structures, au sens de la matrice de pondration W utilise (Sokal, 1979). Par ailleurs, des rsultats donns dans Cliff et Ord (1969, 1981) indiquent que la variance du I de Moran est moins affecte par la distribution statistique des valeurs que le c de Geary. Lexprience montre que le c de Geary et le I de Moran conduisent des rsultats similaires dans le cas dune distribution symtrique, mais quune forte asymtrie peut entraner un dsaccord entre les deux statistiques. Ce dsaccord est dautant plus marqu que lautocorrlation spatiale est tnue et le c de Geary savre davantage affect par lasymtrie de la distribution que le I de Moran. Linuence du choix de la statistique sur la conclusion du test de lautocorrlation spatiale est un phnomne invitable mais indsirable. En consquence, il est judicieux dutiliser les deux statistiques conjointement : a) une conclusion simi-

p=

Card {Z Z Zobs } n!

(14)

Le test permutationnel peut tre envisag pour n 10. Dans la plupart des cas (n > 10), lnumration de toutes les permutations est impraticable et le test permutationnel est estim par un test de randomisation (Edgington, 1986, 1987), en construisant un ensemble de valeurs obtenu par chantillonnage alatoire et avec remise de . La p-value obtenue dans le test de randomisation est une estimation sans biais de la p-value exacte :

p=

Card {Z Z , Z Zobs } Card()

(15)

avec la valeur Zobs gurant dans lensemble pour les permutations considres. La distribution dchantillonnage de cette p-value est asymptotiquement normale, de moyenne p et de variance p(1 p)/m o m = Card ().

Gographie physique et Quaternaire, 55(2), 2001