Académique Documents
Professionnel Documents
Culture Documents
d'information géographique
201 Séance 4
Introduction à l’analyse
spatiale.
Professeur: Nicolas Saunier
CONTENU
Unité 0: Statistiques descriptives et corrélation
Unité 1: Motifs de points
Unité 2: Autocorrélation spatiale
Unité 3: Interpolation spatiale
L’analyse spatiale
L’analyse spatiale ou les statistiques spatiales incluent toutes les techniques
formelles qui étudient des entités selon leur propriétés topologiques,
géométriques ou géographiques (Source Wikipedia)
“L’analyse spatiale est une approche géographique qui étudie les localisations et
les interactions spatiales en tant que composantes actives des fonctionnements
sociétaux” (Source Wikipedia)
L’analyse spatiale
“Il s’agit de prendre en compte un ensemble complexe de données physiques et
humaines pour analyser les distributions spatiales de divers phénomènes”
(Source Wikipedia)
Exemples
Partage de vélo à Washington
Comptages routier à Paris
Lois de probabilité
Selon la catégorie d’une variable, comment décrire les valeurs qu’elle prend?
Une loi de probabilité décrit
soit les probabilités de chaque valeur d’une variable aléatoire (quand la variable aléatoire
est discrète, par ex. pour des comptages ou la gravité d’accidents)
soit la probabilité que la variable aléatoire appar enne à un intervalle arbitraire (quand la
variable est continue, par ex. pour des intervalles)
Quand la variable aléatoire X prend des valeurs réelles, la loi de probabilité́ est
complètement décrite par sa fonction de répartition
M3ES
Description et representation
Comment décrire n observations xi d’une variable aléatoire réelle X ?
Comment représenter toutes les valeurs prises par une variable réelle ?
M3ES
Boîte à moustache
M3ES
Boîte à moustache
M3ES
Boîte à moustache
M3ES
Illustration
(Source Wikipedia)
Ajouter un pied de page 20
M3ES
Exercice
Nous aimerions savoir si le poids influence le taux de glycémie. Le poids et le taux de glycémie de 20 adultes
ont été récoltés. Voici les données obtenues
Ce coefficient est une mesure non-paramétrique de la dépendance entre deux variables, à savoir à
quel point leur relation peut être décrite par une fonction monotone (sans que la relation soit
nécessairement linéaire)
Illustration
(Source Wikipedia)
Ajouter un pied de page 26
M3ES
Une étude révèle que le fait d'avoir un bon appétit, de manger des aliments riches en potassium,
notamment des bananes, et de ne pas sauter le petit-déjeuner semble augmenter les chances
d'avoir un garçon, selon un rapport de l'Associated Press.
Pourquoi?
Même si deux événements peuvent être corrélés (c'est-à-dire que l'un varie lorsque l'autre change), ils ne
sont pas nécessairement causés l'un par l'autre : une corrélation ne reflète donc pas toujours un lien de
causalité entre les deux variables reliées statistiquement.
Ensuite, le lien statistique de corrélation peut-être dû à une variable explicative cachée, influençant
simultanément les deux autres variables.
Exemple
En Floride, on observe une corrélation entre l'usage de la crème solaire et les cancers de la peau :
Importance de la visualisation
4 ensembles de 11 points à 2 dimensions avec
les mêmes caractéristiques (données sur
Wikipedia)
Moyenne des x : 9.0
Variance des x : 10.0
Moyenne des y : 7.5
Variance des y : 3.75
Corrélation entre les x et les y : 0.816
Equation de la droite de régression linéaire : y =
3 + 0,5x
Somme des carrés des erreurs rela vement à la
Moyenne : 110.0
Mesures de centralité
Centre moyen
3
On peut aussi calculer le centre médian, selon les distances de Manhattan et
euclidienne
Mesures de dispersion
Écart-type dans chaque axe sx , sy
1
Écart-type de la distance de chaque point par rapport aucentre moyen
2
Ellipse de dispersion
On utilise l’ellipse de dispersion (“standard deviational ellipse” ; SDE) quand la
dispersion n’est pas uniforme selon les deux dimensions (propriété
d’anisotropie)
anisotropie ≠ isotropie : invariance des propriétés ou valeurs en fonction de la direction
Ellipse de dispersion
Une ellipse est définie par
l’angle de rotation θ
2
la dispersion selon l’axe secondaire sy
3
Ellipse de dispersion
1
L’axe secondaire est orthogonal au grand axe (sy est la demi-longueur du petit
axe de l’ellipse)
2
Analyse de forme
Enveloppe convexe
Plus petit polygone convexe qui renferme un groupe d’objets, comme des points.
où Asj est une petite région autour du point sj de surface |Asj|, et E(Y (Asj)) est
1
l’espérance du nombre de points (événements) dans Asj
2
L’intensité est le nombre moyen de points par unité de surface au point sj
3
Catégories de processus
Les processus ponctuels peuvent être aléatoire ou déterministe
Un cas particulier est celui d’une structure spatiale totalement aléatoire
(“complete spatial randomness”, CSR), soit un ensemble de points répartis de
manière totalement aléatoire dans une région donnée
cela signifie que les points sont répartis selon une loi de probabilité uniforme sur
la région considérée : cette structure peut être décrite par un unique paramètre,
l’intensité λ 1
le nombre de points dans toute région arbitraire est proportionnel à sa surface,
c-à-d. l’intensité du processus ponctuel est constant dans la région d’étude R : 2
λ(sj ) = λ(sj+1 ) = . . . = λ(sn ) = λ sj R
le nombre attendu de points dans la région est donc 3
E(Y (R)) = λ|R|
Calcul de l’intensité
Comparaison de distributions
L’hypothèse nulle est généralement que le motif de points est généré par une
distribution avec une structure spatiale totalement aléatoire, ce qui peut
être testé de différentes façons
méthode des quadrats
analyse des distances entre points les plus proches
1
Gaussien
Diagramme de Voronoï
Un diagramme de Voronoï est un pavage (découpage) du plan en zones adjacentes
à partir d’un ensemble discret de points (“germes”) : chaque zone enferme un
seul point, et forme l’ensemble des points du plan plus proches de ce point
que d’aucun autre
les bords des zones sont définis par les médiatrices des segments entre les paires 1
de points
cette transformation permet de créer des zones à partir de motifs de points 2
calculer le chiffre d’affaires par commune à partir des points géolocalisés de vos clients.
déterminer le potentiel d’un secteur commercial à partir de données connues au canton.
estimer la population d’une zone à partir de la population des quartiers
L’auto-corrélation spatiale
Compte tenu du caractère inégalitaire de nombreuses distributions, des objets
géographiques se ressemblent plus que d’autres. Une question d’analyse spatiale
que l’on est alors en droit de se poser est la suivante :
Est-ce que les objets géographiques qui sont proches se ressemblent plus 1
que les objets géographiques qui sont éloignés ? C’est la question de
l’autocorrélation spatiale.
2
L’auto-corrélation spatiale
1
On parle d’auto-corrélation spatiale positive lorsque les lieux proches se
ressemblent plus que les lieux éloignés et d’auto-corrélation spatiale négative 2
lorsque les lieux proches se ressemblent moins que les lieux éloignés.
Enfin, l’auto-corrélation spatiale est nulle lorsqu’il n’existe pas de relation 3
démontrable entre proximité et ressemblance.
L’auto-corrélation spatiale
Notion de proximité
Pour n zones, une matrice de proximité spatiale (de voisinage) de taille n × n est
calculée, dans laquelle chaque élément wi,j représente la mesure de proximité
entre les zones Ai et Aj
w i,i = 0 par définition
Critère “Rook” : wi,j = 1 si Ai et Aj ont un bord commun, 0 sinon
Critère “Queen” : wi,j = 1 si Ai et Aj ont un bord commun ou un point commun, 0 1
sinon
wi,j = 1 si le centroïde de Ai est à moins d’une distance données D de celui de Aj , 2
0 sinon
wi,j = li,j /li où li,j est la longueur de la frontière entre Ai et Aj et li le périmètre de 3
la zone Ai
Notion de proximité
Queen : les voisins partagent un point de frontière commune.
Notion de proximité
Exemple : quelle est la matrice de proximité des zones A à E suivantes ?
Notion de proximité
Contiguïté selon Queen
Notion de proximité
Contiguïté selon Rook
Notion de proximité
Le nombre de voisins de la zone Ai est
Notion de proximité
Il est possible de calculer des moyennes lissées spatialement
(“spatial lag”)
Indice I de Moran
Indice I de Moran
On a besoin d’un critère pour décider si le phénomène est aléatoire, c-à-d. si
l’auto-corrélation spatiale est significative
sous l’hypothèse nulle d’indépendance spatiale, la valeur attendue et la variance
du I de Moran ont été dérivées
a
avec l’approximation normale, suit la loi normale centrée réduite
1
Échantillonnage
“L’échantillonnage est la démarche qui consiste
à mesurer une variable d’intérêt en quelques
points représentatifs d’une zone d’étude.
L’interpolation est la méthode perme ant de
déduire la valeur en tout point de l’espace à
partir des points d’échantillonnage.
L’interpolation est applicable si l’estimation des
valeurs prise par une variable en d’autres points
de l’espace considéré possède une précision
acceptable.”
Interpolation spatiale
Où : 1
Exemples
Interpolation spatiale
Comment utiliser la méthode des k plus proches voisins ?
Autres méthodes : variogramme et krigeage
Bibliographie
Rey, S. J. and Anselin, L. (2007).
PySAL : A Python Library of Spatial Analytical Methods.
The Review of Regional Studies, 37(1) :5–27.