Vous êtes sur la page 1sur 40

Statistiques spatiales: Analyse dun semis de points et autocorrlation spatiale

Thrse Saint-Julien, Hlne Mathian

Ecole dt Satistiques, Cartographies et Analyse spatiale Yaound 2006

Statistiques spatiales
1. Statistiques spatiales pour dcrire un semis de points 2. Analyse de la forme dun semis de points
2.1 Mthode des quadrats 2.2 Mthode du plus proche voisin

3. Analyse de la dpendance spatiale: lautocorrlation spatiale 4. Approches locales

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Les questions que lon peut poser un semis de points


Quel est le centre de la distributions des dommages causs par un tremblement de terre ? Quelle en est la dispersion ? Comment se rpartissent les vols dans le quartier du centre ? Quelle est la structure spatiale des arbres morts par chablis ? Dpend-elle de la structure spatiale du peuplement vivant ? Loffre de soins couvre -til uniformment le territoire ?
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Statistiques spatiales
1. Statistiques spatiales pour dcrire un semis de points 2. Analyse de la forme dun semis de points
2.1 Mthode des quadrats 2.2 Mthode du plus proche voisin

3. Analyse de la dpendance spatiale: lautocorrlation spatiale 4. Approches locales

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Semis de points
Description de la position de la distribution spatiale: Le point moyen G (moy(x),moy(y))

si d est la distance euclidienne, d2(i,G) est minimal

Le point mdian M(med(X),med(Y))

si d est la distance de Manhattan , d(i,M) est minimal.

Le point de distance minimale DM tel que d(i,DM) est minimal (quelle que soit la distance).

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Semis de points: indicateurs de position


Point mdian: le calcul dpendant de lorientation des axes, il nest pas unique et fait lobjet dune rsolution graphique.

Statistiques centrographiques: G est plus sensible aux points isols que DM, mais plus utilis cause du moment dordre 2.
Source: N.Levine &al., 2002 Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Semis de points
Description de la dispersion de la distribution spatiale:
Distance standard : 2XY=1/n id2(i,G) Dispersion relative : XY/r o r est le rayon du cercle de mme surface (r= S/) Distance moyenne d=iidii/(n(n-1)) Ellipse de dviation standard: ellipse tel que laxe dallongement soit laxe de variance maximal. (alors que la

distance standard dfinit un cercle autour du barycentre sans orientation spcifique)

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Comparaison de semis de points

Source: N.Levine &al., 2002

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple: loffre culturelle Strasbourg

Laboratoire Image et villeEcole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Statistiques spatiales
1. Statistiques spatiales pour dcrire un semis de points 2. Analyse de la forme dun semis de points
2.1 Mthode des quadrats 2.2 Mthode du plus proche voisin

3. Analyse de la dpendance spatiale: lautocorrlation spatiale 4. Approches locales

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Semis de points: de la structure au processus

Un semis est un ensemble de localisations, rsultant d'un processus ayant engendr chacun des points.
La structure spatiale d'un cosystme, c'est--dire la manire dont sont organiss dans l'espace les individus qui le composent, joue souvent un rle essentiel dans son fonctionnement. Pour un peuplement forestier, par exemple, la structure spatiale dtermine l'environnement local autour de chaque arbre (en particulier le nombre de voisins) et donc influence les processus naturels comme la croissance et la mortalit (Delvaux 1981, Barot et al. 1999), voire dtermine le choix d'un scnario d'claircies pour les peuplements faisant l'objet d'une gestion sylvicole. La structure spatiale influence galement le dveloppement des graines et donc la rgnration du peuplement. Inversement, les processus naturels ou les actions anthropiques modifient leur tour la structure spatiale du peuplement qui se trouve donc dans un cycle de rtroaction schmatis par la Figure 1.

Source: Goreaud et Plissier, 1999

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Formes des semis dans l'espace et processus de formation

effet de voisinage: attraction Processus


-

aucun effet de voisinage


= = = = = = = = = = = = = = = =

effet de voisinage: rpulsion


+ + + + + + + + + + + + +

Formes des semis et processus de formation

+
-

+ +

Forme distribution concentre distribution alatoire


Aucun processus dominant dans la formation de ce semis. Plusieurs processus indpendants les uns des autres ont pu intervenir, soit simulranment soit successivement.

distribution rgulire

Interprtation

Un processus dominant avec faible concurrence spatiale= forte polarisation= forte concentration

Un processus dominant avectrs forte concurrence spatiale= forte dispersion et rguilarit dans la dispersion

Il existe une relation entre la forme dune distribution et les processus qui ont prsid sa formation. On peut comparer un semis observ un semis thorique dont on connat la loi de probabilit

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Caractrisations dun semis de points

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple
Quelle est lvolution de la forme des habitats dans le Lunellois: concentration ou dispersion ?

Archaeomdes, 1997 Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

1. La mthode des quadrats

Gobran I., 2004, Source: DREIF, accidents entre 1998 et 2002 en Seine-Saint-Denis

La mthode se base sur un quadrillage de lespace. On comptabilise dans chaque maille le nombre de points. Puis on dnombre les mailles en fonction du nombre de points qu'elles contiennent. On note Nk le nombre de mailles ayant k points. On a N mailles. Le nombre total de points est M= k* Nk
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

La mthode des quadrats (2) On compare la distribution observe des Nk avec ce qu'elle serait dans le cadre d'un semis de points obtenu par processus ponctuel alatoire stationnaire (Poisson).

processus de Poisson : processus tel que chaque maille a la mme probabilit de recevoir un point, et cette probabilit est indpendante de ce qui s'est pass avant.

La probabilit qu'une maille contienne k points s'crit dans le cadre d'un processus de Poisson: P(=k)=e-D*Dk/k! o D est la densit de points, gale la densit observe D=M/N On construit alors la distribution thorique k par: k = P(=k)* N On fait l'hypothse nulle d'galit des 2 distributions (H0: le semis est alatoire). Et on teste l'galit des 2 distributions par un test du chi2.
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple de calcul: les tablissements hospitaliers Paris

64 tablissements (M=64) et 231 mailles (N=231) D=M/N=64/231=0.28


Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple de calcul:les tablissements hospitaliers Paris


k 0 1 2 3 4 chi2 Nk Nk (observs) (estims) obs-est 185 33 9 3 1 175.10 48.51 6.72 0.62 0.04 9.90 -15.51 2.28 2.38 0.96 (obs-est)^2/ est 0.56 4.96 0.77 9.12 21.31 36.72

Calcul du Chi2

Nk Nk l 2 = ~ k =1 Nk
~

2 suit une loi du chi2 l-1 degr de libert Ici le 2 observ vaut 36.7 . Le 2 thorique 4 d.d.l associ un risque d'erreur de 0.05 vaut 9.49. On rejette l'hypothse nulle que le semis est alatoire.
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Limites de la mthode des quadrats

Choix de la largeur de la maille Choix de l'origine de la grille Agrgation et perte d'information Reste cependant trs utilise en cologie, en archologie Beaucoup de mthodes plus sophistiques se sont dveloppes sur cette base.

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

2. Mthode du plus proche voisin

(Clarck, Evans, 1954)

Base sur le calcul de la moyenne des distances d'un point son plus proche voisin: dpv Dans le cadre d'un processus de Poisson, gnrant un semis alatoire, on peut calculer la distance moyenne thorique d'un point son plus proche voisin: dP =0.5 * (S/M)
o S est la superficie de l'espace tudi et M le nombre de points localiss sur cet espace.

Sous H0 (le processus ayant gnr le semis est un processus de Poisson) la moyenne dP une variabilit SE(dP )=0.261/(M/S)
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Mthode du plus proche voisin (2)


1. Statistique R du plus proche voisin: R= dpv / dP

2. Test z = |dpv- dP |/ SE(dP ) Sous H0, z ~ N (0,1)


Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple de calcul:les tablissements hospitaliers Paris

Observ M=64 S=760.8 S/M=11.88 dpv=1.32

Calculs thoriques: dP =0.5 * (S/M) = 0.5 * 11.88 = 1.72 SE(dP )=0.261/(M/S) = 0.261 / 5.38=0.11

R=1.32/1.72 = 0.77 Z=|1.32-1.72|/0.11 = 3.56


Sous H0, Z suit une loi normale. Au risque d'erreur de 0.05, l'cart rduit doit tre infrieur 1.96 pour que l'on accepte l'hypothse nulle. Ici on rejette l'hypothse que le semis est alatoire. Le semis des tablissements de sant Paris est significativement

concentr

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Statistiques spatiales
1. Statistiques spatiales pour dcrire un semis de points 2. Analyse de la forme dun semis de points
2.1 Mthode des quadrats 2.2 Mthode du plus proche voisin

3. Analyse de la dpendance spatiale: lautocorrlation spatiale 4. Approches locales

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

La notion d'autocorrlation spatiale


Chaque phnomne est reli tous les autres, mais des phnomnes proches dans lespace auront tendance tre davantage lis que des phnomnes loigns " [Tobler]

L'apparition en un lieu dpend de ce qui se passe dans les lieux voisins

Autocorrlation

Absence d'autocorrlation

2 lieux proches se ressemblent plus que 2 lieux loigns

Positive

2 lieux proches se ressemblent moins que 2 lieux loigns


Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Ngative

Exemple: Disparits sociales / Inscriptions spatiales

On cherche valuer si les lieux proches ont plus tendance se ressembler que des lieux loigns et mesurer cette relation.
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Gographie-cits, 2004

Structures spatiales simples Le gradient Les rgions homognes

Charre J, 1995.
Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemples dorganisations spatiales simples:

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

La variance locale
Mesure lintensit de la relation entre la proximit des lieux et leur degr de ressemblance. Les coefficients sont gnralement bass sur la comparaison entre la variance totale et la variance locale:
2 1 varT (X)= (X i X ) n i

2 varL(X)= 1 (X i X j) 2K i jv(i)

o V(i) dsigne un voisinage de i Et K le nombre de couples (i,j) voisins


Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple:
0 moyenne std 7.4 4.7 0 5 5 Lgende 0 5 10 15 20 0 moyenne std 7.4 6.2 0 0 5 10 0 0 5 5 10 5 0 0 5 5 5 5 5 5 10 10 Var.T Var.L 10 10 10 15 15 22.2 4.4 10 10 10 15 15 0 5 10 15 0 15 10 5 5 10 5 5 15 10 5 Var.T Var.L 10 10 0 5 5 22.2 25.6 15 5 10 5 0

0 5 5 15 15 Var.T Var.L

0 5 10 15 15 38.2 8.4

5 10 15 15 20

5 10 0 15 5

15 0 5 5 10

0 5 0 15 15 Var.T Var.L

15 5 15 10 0 38.2 52.0

5 10 0 0 20

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Indices globaux Indice de Moran

Indice de Geary

Avec N le nombre dindividus, Xi et Xj valeur de la variable X en i et j X est la moyenne de la variable X et Wij est une pondration applique la relation entre les lieux (i,j)

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Analyse des indices


Le systme de pondration (Wij )
Ce peut tre une matrice de contiguit Ce peut tre aussi une fonction continue, par exemple inversement proportionelle la distance entre i et j: (1/dij)

I varie entre 1 et 1, C varie habituellement entre 0 et 2. La significativit de la valeur de I peut tre teste par comparaison une distribution thorique, sous la forme:

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple:
Le revenu par habitant dans le County de Monroe Une variable alatoire

I= .66

P: < .001

I: .012 p: .515

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Effets de l'autocorrlation spatiale sur l'agrgation Mesure de lhtrognit

la part d'trangers hors CEE par arrondissement et par quartier IRIS Paris (1990) % trangers (hors CEE) Moyenne cart-type C.V.
14.2 - 17.2 9.3 - 14.2 8.4 - 9.3 6 - 8.4

Arrondissements 10.9 3.7 0.34

Quartiers Iris 11.3 6.9 0.62


%trangers hors CEE
14 - 48.9 (94) 9 - 14 (100) 8 - 9 (32) 2.6 - 8 (158)

%trangers hors CEE (5) (5) (4) (6)

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Effets de l'autocorrlation spatiale sur l'agrgation Mesure de lhtrognit


La part des cadres par arrondissement et par quartier IRIS Paris (1990)
% cadres Moyenne cart-type C.V. Arrondissements 32.8 7.7 0.23
Part moyenne des cadres 19.5 - 23.2 18.4 - 19.5 15.1 - 18.4 10.3 - 15.1 (5) (4) (5) (6)

Quartiers Iris 30.8 10.7 0.35


part des cadres 19.8 - 27.2 16.8 - 19.8 12.3 - 16.8 2.5 - 12.3 (96) (91) (99) (98)

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Extension du coefficient de Geary: Le corrlogramme pour l'identification de portes

Graphique Lebart

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Statistiques spatiales
1. Statistiques spatiales pour dcrire un semis de points 2. Analyse de la forme dun semis de points
2.1 Mthode des quadrats 2.2 Mthode du plus proche voisin

3. Analyse de la dpendance spatiale: lautocorrlation spatiale 4. Approches locales

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Approches locales: identifier les zones de concentrations dans un semis de points Comment identifier les zones de concentrations des

accidents Lille

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Banos A., 2002

Le lissage par la mthode des noyaux


Choix dune pondration fonction de la distance

Balayage de la zone dtude

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Approches locales: les indicateurs locaux d'association spatiale (LISA)


L'indice local de Moran mesur au lieu i est dfini comme un LISA de la faon suivante :

I i = ( X i X ) j Wi , j ( X j X )

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006

Exemple de LISA
Lidentification des zones de concentrations spatiales des accidents de la route (B.Flahaut)

Ecole dt Statistiques, Cartographies et Analyse Spatiale, Yaound 2006