Académique Documents
Professionnel Documents
Culture Documents
(Complment de cours)
Serge LHOMME
Lanalyse spatiale est une dmarche qui, linstar de la gographie gnrale , recherche
les similarits entre les phnomnes et tente dtablir des lois (des rgles). Cette dmarche
est qualifie de nomothtique. En loccurrence, comme son nom lindique, lanalyse spatiale
recherche ou applique des lois spatiales. Ces lois peuvent dans certains cas tre testes afin de
dterminer leur validit. Lanalyse spatiale est donc gnralement prsente comme une
dmarche hypothtico-dductive , puisque les similarits identifies entre les phnomnes
observs peuvent constituer des hypothses de travail aboutissant la formulation de modles
qui seront mis lpreuve. Nanmoins, contrairement aux sciences physiques, les modles
nont pas tous vocation dcrire le comportement rel des systmes tudis, puis tre test
et valid. Ils peuvent plus simplement servir comme modle de comparaison. Pour rsumer,
lanalyse spatiale met en vidence des structures et des formes dorganisation spatiale rcurrentes, que
rsument par exemple les modles centre-priphrie, les champs dinteraction de type gravitaire, les
trames urbaines hirarchises, les divers types de rseaux ou de territoires, etc. Elle analyse des
processus qui sont lorigine de ces structures, travers des concepts comme ceux de distance,
dinteraction, de porte spatiale, de polarisation, de centralit, de stratgie ou choix spatial, de
territorialit... Des lois de la spatialit relient ces formes et ces processus, et sont intgres dans des
thories et des modles du fonctionnement et de lvolution des systmes (Denise Pumain).
Malgr une apparente opposition entre ces deux dmarches, celles-ci ne sont pas
incompatibles. Bien au contraire, elles apparaissent complmentaires. En effet, la dmarche
idiographique ne rcuse pas toute possibilit de gnralisation au nom de lirrductible
unicit des lieux et la dmarche nomothtique nest pas ncessairement rductrice et
oublieuse des spcificits locales. Cest en fait entre ces deux attraits de la gographie, la
recherche de la rgularit dune part et la fascination pour ce que lon ne verra pas deux fois
Serge Lhomme Introduction lanalyse spatiale 2
dautre part, que peut naitre une science ayant son objet, sa place et sa propre contribution
au sein des sciences humaines (Pumain et Saint-Julien, 2010). Cette dichotomie permet
seulement dintroduire, de manire simplifie, la principale particularit de lanalyse spatiale
et la rupture que celle-ci a pu reprsenter.
Le concept de loi : Une loi est une formule gnrale nonant une relation
constante ou habituelle entre des phnomnes. En gographie humaine, les lois
sont plutt considres comme des rfrences ncessaires aux explications, que
lobjet tudi sy conforme ou quil sen carte. Dans ce cadre, le terme de loi est
souvent considr comme trop fort et remplac par le terme de rgle, ou encore
par celui de rgularit. En effet, les relations observes en gographie humaine
nont pas la prcision des lois physiques. Quoi quil en soit, les lois expriment
lexistence de dterminations, mme si dune part celles-ci ne sont pas connues
ou mesures avec prcision, et si dautre part il entre dans leurs effets une part
plus ou moins grande de hasard et dindtermination. Le terme de loi est aussi
employ pour dsigner des rgles de comportement plutt invariantes dans le
temps et lespace comme la loi du moindre effort nonce par Zipf. Cette loi
montre que le plus court chemin ou la plus grande proximit ont t
souvent privilgis dans la localisation des activits humaines.
Cet avnement souleva de nombreux dbats (voire des rticences et des oppositions) qui sont
pour certains toujours dactualit et parfaitement lgitimes. En effet, la dmarche
nomothtique est issue des sciences de la nature, son application dans une discipline qui
relve des sciences humaines et sociales soulve donc des questions pistmologiques qui ne
sont pas triviales.
Cet avnement fut initi par des gographes travaillant aux Etats-Unis, puis sest diffus en
Europe, notamment en Grande-Bretagne, en Sude et en Allemagne. Louvrage de William
Bunge en 1962, Theoritical geography, posa les fondations thoriques dune discipline de
lespace, dlimita les objets et offrit les outils. David Harvey effectua quant lui une
importante rflexion pistmologique. Enfin, le manuel de Peter Haggett, Locational analysis,
en proposant une histoire, une grammaire formelle de l'espace, finit d'tablir la normalit
1Cette partie, comme la partie suivante, reprend et modifie quelque peu certaines parties introductives de la
thse de Thomas Louail. En effet, ces premires parties constituent une bonne introduction (simplifie)
concernant lavnement de lanalyse spatiale en gographie et prsentent cursivement son cadre danalyse.
Serge Lhomme Introduction lanalyse spatiale 4
de ces nouvelles pratiques, qu'il fallait dsormais traiter comme une branche part entire de
la gographie.
Parmi les sujets qui ont t les plus mobiliss au dbut de cette rvolution scientifique
figurent les transports et la ville. Ainsi, Edward Ullman, l'un des initiateurs du mouvement,
qui a propos au dbut des annes 1950 que la gographie soit reconnue comme la science
de l'interaction spatiale , a travaill sur la gographie urbaine et sur la gographie de la
circulation. Avec le gographe allemand Walter Christaller, Ullman a conu une thorie de
la ville comme lieu central et a encourag le dveloppement de la modlisation. Le
symposium international de gographie urbaine de Lund en 1960 a marqu la conscration
internationale de cette approche thorique et quantifie de la ville.
En France, les annes 1970 vont tre dterminantes. Ainsi, la gographie francophone
europenne a connu au dbut des annes 1970 des bouleversements majeurs et la
rvolution thorique et quantitative en fait partie. Plusieurs lments ont permis
lmergence de ce mouvement scientifique. Le dveloppement de linformatique et le retour
de gographes doutre-Atlantique ont favoris lmancipation de jeunes gographes vis--vis
dune cole de gographie quils voulaient dpasser. Cela leur a permis de penser et de
pratiquer la gographie dune autre manire. Des gographes ont alors pris connaissance par
diffrents moyens (invits trangers, lectures, traductions) de nouvelles mthodes anglo-
amricaines, notamment statistiques, susceptibles de renouveler les tudes gographiques,
ainsi que de nouvelles thories, venant par exemple de la physique et permettant de repenser
ltude de lorganisation de lespace. A noter quen 1970 se sont droules les Journes
Gographiques dAix-en-Provence et Bernard Marchand, de retour des Etats-Unis, y a
prsent des mthodes statistiques innovantes. Plus encore, le premier colloque sur
lapplication des mthodes mathmatiques la Gographie sest droul Besanon,
inaugurant une srie de colloques dans cette mme ville et prfigurant les Rencontres
actuelles de Theo-Quant.
De surcrot, les spatialistes apparaissent comme des acteurs privilgis pour faire
communiquer les sciences dures et les sciences humaines et sociales , au moment o
de nombreux laboratoires et de nombreux projets de recherche se veulent
transdisciplinaires. En effet, modliser des phnomnes et des processus spatiaux implique le
plus souvent de combiner des savoirs et des comptences relatifs des domaines divers, les
uns lis la thmatique de recherche (gnralement issus des sciences humaines et sociales),
les autres issus de linformatique, des statistiques, de la physique ou des mathmatiques (i.e.
des sciences dures). Ces dernires disciplines ouvrent dailleurs des perspectives
mthodologiques stimulantes pour les thoriciens sintressant lorganisation de lespace et
lvolution des structures. En matire de formation, ce domaine mi-chemin entre les
sciences dures et les sciences humaines et sociales permet aux tudiants, qui sen donnent les
moyens, dacqurir un profil intressant et recherch par des entreprises commerciales, des
bureaux dtudes ou des collectivits territoriales.
Dun point de vue mthodologique, les premiers travaux danalyse spatiale furent fragments
et ne reposrent pas sur un cadre thorique bien formalis. Ce cadre a merg
progressivement. Dailleurs, certains gographes ont toujours du mal apprhender ce
quest lanalyse spatiale et contestent cette dnomination. Pourtant, lanalyse spatiale est
dsormais une dmarche institue et formalise reposant par exemple sur un cadre danalyse
comportant trois tapes :
La grille danalyse prsente ci-dessus nest quun exemple, il en existe dautres. De plus,
celle-ci nest pas rigide. Ainsi, il nest pas obligatoire de raliser les trois tapes dcrites
pour faire de lanalyse spatiale. Si la premire tape est incontournable, il est tout fait
envisageable de sarrter la deuxime tape. Lanalyse reste alors phnomnologique et
statique. Enfin, il est possible de dpasser cette grille en ajoutant une quatrime tape. Les
modles de cette quatrime tape pourront par exemple tenter dapprhender les aspects
multi-niveaux.
Aprs avoir dfini de manire cursive lanalyse spatiale, il convient daller plus avant. Pour
cela, deux approches sont possibles. La premire approche consiste prsenter lanalyse
spatiale en sappuyant sur ses concepts principaux (les concepts despace, de lieu,
dinteraction, de rseau). La deuxime approche consiste se focaliser sur les modles, les
lois et les thories rentrant dans le cadre de lanalyse spatiale. Nous allons privilgier la
deuxime approche. En effet, la premire approche a dj fait lobjet de nombreux ouvrages
(Bavoux, Pumain et Saint-Julien), il convient donc de ne pas refaire ce qui a dj t trs bien
fait. De plus, si thoriquement la premire approche est plus didactique, paradoxalement je
trouve quelle masque aux tudiants les principaux rsultats de lanalyse spatiale et par
consquent son utilit. Or, pour des tudiants qui peuvent ne pas tre motivs par une
discipline qui a recours aux mathmatiques, linformatique et la physique, il convient
selon moi den montrer la porte. Pour cela, la deuxime approche est selon moi la meilleure.
Nous nallons donc pas disserter ici sur les concepts despace, de lieu, dinteraction ou de
rseau, bien que ceux-ci soient prsents sous diffrentes formes tout au long de ce
complment de cours. Nous allons plutt nous focaliser sur les modles, les lois voire les
thories de lanalyse spatiale. Plus prcisment, ces diffrents modles vont tre
prsents au sein de familles qui tentent de les positionner simplement dans un contexte plus
gnral. Ces familles sont arbitraires et ne doivent pas tre considres comme arrtes. Les
principaux modles historiques seront prsents dans ce cadre.
De nombreux chercheurs, appartenant des domaines diffrents, ont t tonns par les
formes de certaines distributions comme celles des richesses, des populations ou des villes.
En effet, ces rpartitions mettent en exergue certaines ingalits bien rsumes par le
Serge Lhomme Introduction lanalyse spatiale 7
rapport 80/20 de Vilfredo Pareto. Ainsi, Vilfredo Pareto demeure clbre pour avoir
constat que 20% de la population italienne possdait 80% des richesses du pays.
Inversement, 80% de la population italienne ne concentre que 20% des richesses. Mme si
lon ne retrouve pas toujours ces mmes rapports dans toutes les distributions (par exemple
seulement 2% de la population mondiale concentrait 50% des richesses en 2006), cette
proprit particulire de certaines distributions ingalitaires est connue sous le terme de
principe de Pareto . En effet, ces diffrentes formes dingalit peuvent tre rsumes par
des fonctions mathmatiques du mme type. On parle dsormais de distribution de
Pareto . Par extension, on appelle aussi diagramme de Pareto un type d'histogramme o les
classes sont reprsentes par ordre dcroissant de frquence. Ce diagramme permet
notamment de mettre en vidence les classes les plus importantes. En gographie, on se
concentrera par exemple sur la rpartition des populations au sein de territoires comme les
villes. On parle ds lors de hirarchie urbaine. Il faut souligner ici que le concept de
hirarchie ne signifie pas toujours une hirarchie de pouvoir qui ferait que les objets dun
niveau dpendraient politiquement ou administrativement du niveau suprieur. Le concept
de hirarchie met plutt en exergue les ingalits flagrantes existant entre les lieux.
Dans cette partie, deux exemples de modle hirarchique seront prsents. Il sagit de deux
grands classiques de lanalyse spatiale. Premirement, la loi rang-taille, parfois nomme
loi de Zipf, sera prsente. Ce premier modle est assez simple appliquer et constitue donc
une bonne introduction aux modles danalyse spatiale. En loccurrence, la loi rang-taille
permettra danalyser la hirarchie des villes. Le deuxime modle se prsente comme une
thorie : la thorie des lieux centraux. Cette thorie est plus complexe mettre en uvre, car
elle requiert de nombreuses comptences. Celle-ci ne fera donc pas lobjet dune application
dans ce complment de cours. Il sera davantage question de critiquer cette thorie. En effet,
cette thorie constitue un bon exemple illustrant les limites et les critiques auxquelles sont
confrontes beaucoup de modles danalyse spatiale.
La loi rang-taille des villes permet de caractriser en partie la hirarchie des villes dans
un systme urbain. Ce sont les travaux pionniers de Auerbach (1913), de Goodrich (1926) et
de Singer (1936) qui ont mis en vidence, pour la premire fois, l'existence d'un phnomne
rang-taille des villes. Ces travaux ont t suivis par ceux de Lotka (1941) et de Zipf
(1949). Le nom de ce dernier fut associ une loi statistique selon laquelle la taille des
grandes villes dun systme urbain est proportionnelle leur rang (cest--dire au
classement par ordre dcroissant des tailles des grandes villes). Dans les faits, la loi de Zipf
est plus souvent prsente comme une observation empirique concernant la frquence des
mots dans un texte. Elle a pris le nom de son auteur, George Kingsley Zipf (1902-1950), qui
par un exemple incongru contribua populariser cette distribution. La lgende raconte que
Zipf entreprit d'analyser une uvre monumentale de James Joyce, Ulysse, d'en compter les
mots distincts, et de les prsenter par ordre dcroissant du nombre d'occurrences. La
lgende dit alors que :
Serge Lhomme Introduction lanalyse spatiale 8
( ) [1]
Cette loi est observe au sein de nombreux systmes. Ainsi, cette loi peut tre observe au
sein de certains systmes urbains. Par exemple, la hirarchie des villes fut tudie l'aide de
la relation entre le chiffre de sa population et son rang, en dcidant que plus une ville est
peuple plus son rang dans la hirarchie est lev (Tableau 1). Sur les graphiques qui
reprsentaient le lien discontinu qui stablit entre la population de chaque ville (axe vertical
: ordonne) et son rang (axe horizontal : abscisse) lchelle arithmtique fut remplace par
une chelle logarithmique sur un ou les deux axes (Figure 1). On obtint ds lors une
distribution semblant suivre une droite plus ou moins incline : on parle de loi rang-taille
(Figure 1).
Daprs George Kingsley Zipf, la loi rang-taille a pour principe le moindre effort , qui
en termes simples [] signifie, [], qu'une personne rsout ses problmes immdiats en fonction de
ses problmes futurs [en sefforant] de minimiser dans le temps [] sa dpense de travail . Dans
les faits, la loi de Zipf, linstar de la loi de Pareto, est une loi qui illustre le caractre
ingalitaire des hirarchies au sein des systmes. Ainsi, selon ces lois, il existe peu de
grandes villes et beaucoup de petites villes. De mme, dans le monde, il y a beaucoup de
pauvres pour peu de riches. Quoi quil en soit, pour retrouver la loi de Zipf de manire
rcurrente, il faut la gnraliser [2]. est alors le coefficient de Pareto, dont il est
intressant dtudier les variations en fonction des systmes tudis et du temps. Cette loi de
puissance traduit un effet dagglomration, dingalit. Cest Mandelbrot que lon doit la
dernire gnralisation de cette loi, appele loi de Mandelbrot [3].
( ) [2]
( ) [3]
( )
La loi rang-taille est devenue une des lois fondamentales de la gographie urbaine.
Historiquement, dans un bref article de quatre pages, Auerbach (1913) fit tout dabord
remarquer la constance singulire de la valeur du produit de la population dune ville par son
rang au sein dun systme urbain donn. Ainsi, la population de la deuxime plus grande
ville reprsente peu prs la moiti de la population de la premire, celle de la troisime ville
reprsente un tiers de la premire et, de faon plus gnrale, la population de la ville de rang
n correspond une proportion 1/n de la population de la plus grande ville. Auerbach tablit,
ds lors, un premier modle rang-taille o le nombre des villes est en relation inverse avec
leur poids dmographique.
Durant la premire moiti du XXme sicle, hormis une tude comparative de Singer (1936)
sur la distribution des villes dans sept pays, le modle rang-taille reste la marge des
constructions en conomie spatiale. Il faut attendre les travaux de Zipf et surtout leur
reformulation par Simon (1955), Beckmann (1958) et Berry (1961) pour que la loi rang-taille
apparaisse comme une contrainte de comportement des masses (Isard, 1960) dont la
rgularit dans le temps exige une interprtation thorique de lorganisation des systmes
urbains. Dsormais, de nombreux chercheurs ont test la validit de la loi de Zipf sur la
distribution rang-taille des villes au sein de diffrents systmes urbains (Tableau 2).
en conformit avec ce que lon pouvait attendre (Tableau 4), puisque les rsultats du modle
apparaissent meilleurs pour les villes amricaines. Lingalit concernant la rpartition de la
population au sein des villes franaises est donc bien relle.
Tableau 3 : Application de la loi rang taille aux villes franaises avec = 1 et en se fondant
sur la population parisienne. Ainsi f(n) = 10 587 309 / n.
Serge Lhomme Introduction lanalyse spatiale 11
On constate alors que la droite obtenue sapproche bien des valeurs relles. Ainsi, avec un R
de 0,98 les rsultats peuvent tre jugs satisfaisants. Seules les valeurs de Paris et de Lyon
semblent sloigner de cette droite, soulignant, une fois de plus, le poids excessif de la rgion
parisienne. Lapplication de cette mthode aux villes amricaines montre que la loi rang-
taille sapplique aussi bien la France quaux Etats-Unis (les valeurs de R sont trs
proches). Enfin, le coefficient plac devant le x (sapparentant loppos du coefficient de
Pareto) indique le caractre plus ingalitaire de la rpartition de la population au sein du
systme urbain franais quau sein du systme urbain amricain.
7,5
6,5
6 y = -1,0059x + 6,7657
R = 0,9802
5,5
4,5
4
0 0,5 1 1,5 2
6,5
6
y = -0,7311x + 6,769
R = 0,9863
5,5
5
0 0,5 1 1,5 2
Pour conclure avec la loi rang-taille, il est possible dajouter que lon peut la retrouver au
sein de systmes urbains comme les rgions, comme cest le cas pour les rgions franaises.
La thorie des lieux centraux est plus complexe manipuler et apprhender que la loi
rang-taille. Cette thorie a t conue, principalement par W. Christaller et A. Lsch, pour
expliquer la taille, le nombre des villes et leur espacement dans un territoire donn. Elle
sappuie sur une dfinition de la ville qui en fait essentiellement un centre de distribution de
biens et de services pour une population disperse, et sur des principes doptimisation (qui
tiennent compte des cots de transport). Pour W. Christaller, limportance dune ville est
lie celle de la clientle priphrique qui elle procure un certain nombre de biens et de
services. Cette clientle nest pas extensible linfini car le cot de transport sajoute celui
du bien et du service, et comme il augmente avec la distance, le cot du dplacement devient
dissuasif compar lattrait du produit. On appelle alors porte dun bien ou dun service
la distance maximale que la clientle est prte parcourir pour se le procurer. Si seul
comptait lintrt du consommateur, la porte serait faible et loffre de services trs
disperse. Mais cette offre ne peut tre rentable que si des conomies dchelle sont possibles,
et donc si le service nest offert que lorsque existe un certain volume de clientle satisfaire.
Les deux principaux postulats de la thorie des lieux centraux sont les suivants :
Les biens qui ont des portes comparables se regroupent dans les mmes
centres (ce qui implique des conomies dchelle et des conomies
dagglomration pour les producteurs comme pour les consommateurs) ;
Les centres de niveau suprieur offrent tous les biens et services offerts par les
centres de niveau infrieur.
gographique. Ainsi, si la population est rpartie de manire uniforme avec le mme pouvoir
dachat, si les conditions de circulation sont partout identiques et si laccs au march est
parfaitement libre, alors les lieux centraux peuvent tre disposs selon des figures
gomtriques relativement simples (Figure 4). En se fondant sur ces hypothses
simplificatrices, W. Christaller imagina trois principes dterminant trois types de
configuration spatiale des centres :
Figure 4 : Les reprsentations gomtriques des trois principes de la thorie des lieux
centraux. De la gauche vers la droite : K = 3, K = 4 et K = 7.
Serge Lhomme Introduction lanalyse spatiale 14
Les critiques concernant la thorie des lieux centraux sont nombreuses. En effet, cette
thorie concentre presque la totalit des critiques quil est possible dmettre au sujet des
modles danalyse spatiale. La principale critique concerne laspect minemment utopique de
cette thorie, puisque les formes gomtriques produites par ce modle semblent peu
reprsentatives de la ralit des systmes urbains. Nanmoins, on ne saurait rcuser la
thorie des lieux centraux au nom de la seule irralit des modles gomtriques quelle
permet de prvoir. A linstar de la loi rang-taille, peu importe que les modles danalyse
spatiale reprsentent la ralit et peu importe que ceux-ci soient universels . Ces modles
idaux ( thoriques , utopiques ) permettent avant tout de caractriser certains
phnomnes. Si le modle de W. Christaller ne semble pas reprsentatif de la ralit, cest
quil souligne tout simplement le caractre anisotrope des espaces gographiques.
Compte tenu des nombreuses contraintes physiques, culturelles et politiques, il nest pas
possible de trouver une telle rgularit dans lespacement des villes (comme cela se pourrait
dans un milieu isotrope). Dans les faits, lhypothse duniformit do se dduisent les
rapports fondamentaux de dimension et despacement entre lieux centraux peut difficilement
tre retenue dans la mesure o elle contredit, du moins certaines chelles, lhtrognit
de la rpartition spatiale du peuplement lie lexistence mme des centres. Cest bien plus la
situation dans un espace daccessibilit qui dtermine la hirarchie des centres en milieu
urbain que leur position en termes de distances physiques.
Le gographe Peter Hagett commenait son ouvrage sur lanalyse spatiale en Gographie
humaine publi en 1967 par la notion de mouvement. En effet, ce sont les dplacements entre
des lieux diffrents qui construisent lespace gographique. Pour caractriser ces
mouvements, on fait appel la notion de flux. Plus prcisment, on appelle flux ,
lcoulement, le transfert dune certaine quantit de personnes, de vhicules, dinformations,
de marchandises transports par un moyen de communication. Lanalyse des flux en analyse
spatiale est donc centrale. Il nest donc pas tonnant que des modles de flux aient merg.
Serge Lhomme Introduction lanalyse spatiale 15
Ces modles peuvent aussi tre prsents comme des modles dattraction. Deux de ces
modles seront prsents dans ce complment de cours. Le premier modle est le modle
gravitaire qui permet de prsenter un modle danalyse spatiale issu dune analogie avec la
physique. Le second est le modle de Huff qui dcoule directement du modle gravitaire. Ce
modle trouve des applications en gomarketing et permet dillustrer les potentialits
oprationnelles offertes par certains modles danalyse spatiale.
Le modle gravitaire
[4]
Le modle gravitaire rsume bien lessentiel des mouvements qui se produisent dans un
milieu o la mobilit et laccessibilit sont relativement homognes. Il prdit par exemple
assez bien lampleur des flux de dplacements domicile-travail dans un bassin demploi
urbain, partir de la rpartition des zones de rsidence et des zones demploi. De plus, le
modle gravitaire est trs employ pour analyser les flux de migration et pour dlimiter les
zones de chalandise en marketing (loi de Reilly). Cette formulation simple a t amliore
pour rendre le modle oprationnel, en particulier grce aux travaux dA. Wilson. Des
expressions plus raffines du modle sont aussi utilises pour la prvision des besoins en
infrastructures de transport. Enfin, sous diverses formes, la formulation gravitaire de
linteraction spatiale est reprise dans de trs nombreux modles plus complexes. Voir ci-
dessous des exemples de gnralisation du modle :
( )
: modle gravitaire exponentiel [5]
( )
: modle entropique de Wilson [6]
Serge Lhomme Introduction lanalyse spatiale 16
( )
: modle additif de Tobler [7]
Pour donner un exemple dapplication du modle gravitaire, nous allons utiliser les lments
de cours diffuss par Claude Grasland. Lobjectif est de reproduire les migrations au sein de
la Tchcoslovaquie. Pour ce calcul, deux sources de donnes sont utilises : les populations
des rgions de Tchcoslovaquie (Tableau 6) ; les migrations de population entre les rgions
(Tableau 7).
BC BS BO BN BE MS MN SO SC SE Total
BC 2096 1792 3025 2411 1110 793 395 284 282 12188
BS 2420 756 543 360 853 348 153 91 106 5630
BO 2635 1081 1312 399 553 369 213 211 146 6919
BN 4120 1073 1542 1406 648 535 220 183 292 10019
BE 3530 610 471 1275 1210 781 211 141 122 8351
MS 2187 1337 669 702 1267 2643 707 338 239 10089
MN 1852 593 662 682 1017 3143 599 623 370 9541
SO 668 177 249 225 226 737 559 3126 732 6699
SC 524 168 266 251 188 396 801 3839 1229 7662
SE 769 206 292 534 302 444 689 1567 1487 6290
Total 18705 7341 6699 8549 7576 9094 7518 7904 6484 3518 83388
Tableau 7 : Migrations inter-rgionales de population en Tchcoslovaquie en 1989. (de : en
ligne ; : en colonne).
Dans ce calcul, la population des rgions est utilise pour dterminer les valeurs
quantitatives de leur poids. Lhypothse est donc que plus une rgion une population
leve, plus celle attire les habitants des autres rgions et plus le nombre de personnes
pouvant la quitter est leve. En utilisant les distances entre les centres de gravit des
Serge Lhomme Introduction lanalyse spatiale 17
rgions, on peut dterminer les valeurs des coefficients du modle gravitaire afin de
minimiser les carts entre les flux rels et les flux estims par le modle [8]2.
( ) ( )
[8]
On dduit partir de lquation prcdente les flux thoriques F*ij qui devraient tre
observs si les flux ne dpendaient que de la population des rgions et de la distance qui les
spare avec une prcision satisfaisante (r = 57%) (Tableau 8). Cette application fait
apparaitre une des proprits majeures de cette loi. Les flux thoriques obtenus sont
symtriques F*ij = F*ji. Or, bien souvent, comme le montre les valeurs relles, ces flux sont
dissymtriques. Cet exemple montre une des principales limites de ce modle pour le calcul
de flux. Nanmoins, les rsultats obtenus avec ce modle sont meilleurs que ceux obtenus
avec un modle qui ne tient pas compte des distances (Fj = k Pi Pj).
Dans un deuxime temps, on peut calculer la matrice des rsidus du modle d'interaction
spatiale en effectuant la diffrence entre les flux observs et les flux thoriques : Rij = Fij -
F*ij (Tableau 9). Enfin, l'analyse des marges de la matrice des rsidus permet de reprer les
rgions qui ont globalement reu ou envoys plus (ou moins) de migrants que ce que laissait
prvoir le modle. On peut en dduire des coefficients de mobilit rsiduelle ou d'attractivit
rsiduelle (Tableau 10).
On laura compris, le modle gravitaire ne sert pas uniquement prvoir ou reproduire des
flux entre des lieux. Ce modle peut dailleurs se rvler assez imprcis dans ce contexte. Il
permet aussi de souligner certaines anormalits : mission et rception trs leves ou
trs faibles lorsquon tient compte de limportance des lieux et des distances entre ces lieux.
F*ij BC BS BO BN BE MS MN SO SC SE Total
BC 1389 1498 3548 2344 1874 1279 944 560 347 13782
BS 1389 366 352 413 668 355 345 179 106 4172
BO 1498 366 662 335 407 290 260 154 102 4075
BN 3548 352 662 806 649 529 378 241 159 7327
BE 2344 413 335 806 1725 1396 673 422 243 8357
MS 1874 668 407 649 1725 3250 2479 1120 512 12685
MN 1279 355 290 529 1396 3250 1840 1450 646 11034
SO 944 345 260 378 673 2479 1840 2415 778 10112
SC 560 179 154 241 422 1120 1450 2415 1205 7747
SE 347 106 102 159 243 512 646 778 1205 4097
2 Le dtail du calcul permettant dobtenir les coefficients de ce modle ne sera pas expos ici. Pour cela, il
faut se reporter la page 45.
Serge Lhomme Introduction lanalyse spatiale 18
Rij BC BS BO BN BE MS MN SO SC SE Total
BC 0 707 294 -523 67 -764 -486 -549 -276 -65 -1594
BS 1031 0 390 191 -53 185 -7 -192 -88 0 1458
BO 1137 715 0 650 64 146 79 -47 57 44 2844
BN 572 721 880 0 600 -1 6 -158 -58 133 2692
BE 1186 197 136 469 0 -515 -615 -462 -281 -121 -6
MS 313 669 262 53 -458 0 -607 -1772 -782 -273 -2596
MN 573 238 372 153 -379 -107 0 -1241 -827 -276 -1493
SO -276 -168 -11 -153 -447 -1742 -1281 0 711 -46 -3413
SC -36 -11 112 10 -234 -724 -649 1424 0 24 -85
SE 422 100 190 375 59 -68 43 789 282 0 2193
Total 4923 3169 2624 1222 -781 -3591 -3516 -2208 -1263 -579 0
Le modle de Huff
Lmergence du modle gravitaire en analyse spatiale est notamment lie des questions de
natures conomique et commerciale. En effet, en 1931, Reilly formula une loi concernant
l'organisation des zones d'attraction commerciale qui reprend la formulation du modle
gravitationnel de Newton. Cette loi est fonde sur des observations empiriques qui
quantifient les attractions commerciales entre diffrentes villes. Elle est dsormais nomme
loi de Reilly . Cest ma connaissance la premire formulation du modle gravitaire en
analyse spatiale. L'nonc de la loi de gravitation commerciale est le suivant : deux
centres (situs dans deux villes diffrentes) attirent les achats des populations situes entre elles en
proportion directe du nombre total d'habitants des villes considres et en proportion inverse du carr
de la distance qu'il faut parcourir pour y s'y rendre . Cette loi se fonde sur deux postulats :
Par la suite, cette loi a t gnralise en amenuisant le rle assign la distance [9]. En
effet, lever au carr la valeur de la distance (comme dans la loi de la gravitation universelle)
n'est valable que pour certains types de relations. La diminution de l'influence dun ple
(dun centre) selon le carr de la distance peut s'avrer trop forte dans le cas de biens rares et
coteux, ou au contraire trop faible dans le cas des services banals, des biens faible cot, ou
dans le cas d'un cot de dplacement trop lev par rapport au bien acheter. On obtient
alors lexpression de la loi de Reilly suivante :
( ) ( ) [9]
Avec : Va = ventes dans la ville a auprs de la population de la ville X ; Vb = ventes dans la ville b
auprs de la population de la ville X ; Da = distance sparant la ville a ; Db = distance sparant la
ville b ; Pa = population de la ville a ; Pb = population de la ville b ; = exposant indiquant le
taux auquel l'attraction d'une ville s'accrot mesure que la population de cette ville
augmente ; = exposant indiquant le taux auquel l'attraction d'une ville dcrot mesure que
la population de cette ville augmente ( et sont compris entre 0 et l infini).
Par la suite, Converse (1951) tablit un modle permettant de dlimiter les frontires des
aires d'influence entre deux ples commerciaux. En loccurrence, ce modle sapplique plutt
des centres urbains. Pour cela, il sappuya sur le modle gravitaire et les travaux de Reilly.
Plus prcisment, ce modle permet de dterminer un point d'quilibre (breaking point) entre
les zones de desserte de deux centres urbains. Ce point de partage (ou d'quilibre) dfinit la
limite entre les aires d'influence de deux villes de taille Pa et Pb spares par une distance
Dab, car au niveau de la frontire Va et Vb sont quivalents, on a donc Va/Vb = 1. Converse
considre = 1 et = 2. La formule de Reilly devient ds lors la suivante [10]. Converse
tablit donc la formule Dxb du point d'quilibre [11]. Cette formule indique simplement le
point o la masse des consommateurs se partage entre les deux ples concurrents de faon
quivalente (cest une zone dindiffrence).
( ) [10]
[11]
Ce modle peut tre utilis afin de calculer des zones de chalandise (une zone de
chalandise est une zone au sein de laquelle un commerce attire de manire privilgie les
clients potentiels). Dans ce cadre, le poids dun commerce peut tre valu laide de sa
surface commerciale. Lhypothse faite est la suivante : plus un commerce est grand, plus il
va attirer les clients. Ainsi, prenons un exemple trs simple, o lon cherche dterminer la
zone de chalandise dun commerce L. Pour cela, nous disposons des distances entre le
commerce L et les commerces concurrents. De surcroit, pour chacun de ces commerces, nous
disposons des surfaces commerciales (Figure 5).
Serge Lhomme Introduction lanalyse spatiale 20
Pour dlimiter cette zone de chalandise, il suffit de calculer lensemble des points de partage
laide de la formule ci-dessus. Ainsi, on obtient :
De mme, on obtient les distances suivantes : DxP = 22,5 km ; DxN = 36,7 km ; DxR = 29,4
km. On peut alors dessiner la zone de chalandise du commerce L (Figure 6).
Plus prcisment, le modle de Huff est un modle qui permet de calculer la probabilit
quun individu soit client dun point de vente en fonction de sa localisation et de lattractivit
des autres points de vente. Cest le premier modle probabiliste dattraction. Huff suggre
d'utiliser une approche dite des prfrences rvles . Le postulat principal du modle est
le suivant : l'attraction d'un magasin dpend de sa taille, de la distance parcourir pour y
accder et du nombre de magasins prsents dans la zone gographique donne. En termes
mathmatiques : pour tout consommateur i, l'attraction exerce par un point de vente j (la
probabilit que les clients sy rendent Pij) est directement proportionnelle la taille de j (Sj)
Serge Lhomme Introduction lanalyse spatiale 21
[12]
Avec : Pij = probabilit qu'un consommateur localis en i se rende dans le centre commercial
localis en j ; dij = distance entre i et j (cette distance peut tre exprime par des temps de
parcours) ; Sj = taille du centre commercial localis en j ; = paramtre calibrer qui varie
selon le type de centre commercial ; r = nombre de localisations des centres commerciaux.
A titre dexemple, laide du modle de Huff, il est possible dvaluer le nombre de clients
probables de trois hypermarchs H1, H2 et H3. Pour les trois hypermarchs, on connait le
temps de dplacement moyen des clients potentiels qui sont regroups au sein de trois
quartiers A, B et C. On connait aussi les surfaces des rayons des hypermarchs.
Tableau 11 : Ensemble des donnes concernant les hypermarchs et les temps de parcours
moyens pour se rendre ces hypermarchs depuis les trois quartiers regroupant les clients
potentiels (Cicri et al., 2012). Le rle de la distance nest pas le mme pour chaque rayon (
diffrents).
En utilisant le modle de Huff, on peut obtenir les probabilits quun client se rende dans un
hypermarch plutt que dans un autre. Plus prcisment, en appliquant ce modle au rayon
alimentaire, on obtient les probabilits quun habitant du quartier A se rende dans les
hypermarchs H1 (PAH1), H2 (PAH2) et H3 (PAH3) :
( )
( )
( )
Serge Lhomme Introduction lanalyse spatiale 22
Enfin, en effectuant ces calculs pour les autres quartiers et en se fondant sur les
recensements des habitants des quartiers A, B et C, on obtient les rsultats suivants :
A B C
A B C Total
(1500) (1500) (1500)
H1 0.377 0.178 0.520 565 356 832 1 753
H2 0.377 0.357 0.229 565 714 366 1645
H3 0.245 0.464 0.250 367 928 400 1695
Tableau 12 : Rcapitulatif des rsultats obtenus pour lalimentation par le modle de Huff
(Cicri et al., 2012).
Ainsi, le modle de Huff nous a permis de dterminer le nombre de clients se rendant dans
les diffrents hypermarchs pour lalimentation. En tenant bien compte du coefficient , ces
calculs peuvent tre reproduits pour les rayons vestimentaires et le mobilier.
Dun point de vue mathmatique, un rseau est dfini comme un graphe, cest--dire comme
un ensemble de sommets et darcs. Lanalyse de graphe est longtemps reste descriptive et
na pas abouti llaboration de modles. On distinguait seulement les graphes planaires (ces
graphes ont la particularit de pouvoir se reprsenter sur un plan sans qu'aucun arc n'en
croise un autre) et non planaires. On distinguait aussi des structures rgulires (chaque
sommet est reli un mme nombre darcs) et alatoires (chaque sommet est reli de manire
alatoire un certain nombre darcs). Ces types de graphes taient alors trop pauvres pour
constituer de vritables modles danalyse spatiale. Nanmoins, ces dernires annes des
modles thoriques de graphes sont apparus. Ils constituent dsormais de vritables modles
danalyse spatiale (en particulier les modles small-world et scale-free).
Le concept de small-world est issu des travaux de Stanley Milgram dans les annes 1960.
Lexprience consistait demander des habitants du Middle West de faire parvenir une
lettre un destinataire de la Cte Ouest en utilisant comme intermdiaire des personnes
quils appelaient par leur prnom. Milgram eu la surprise de constater que la moyenne des
chanes parvenues au destinataire ntait que de 5.6. Cette exprience a donn lieu un
Serge Lhomme Introduction lanalyse spatiale 23
mythe devenu dans sa version populaire les six degrs de sparation. Autrement dit, seules
cinq personnes nous sparent de nimporte quelle autre personne dans le monde.
En 1998 Watts et Strogatz publirent un article dans Nature o ils proposrent un modle
de graphes petit-monde (small-world network) qui diffre du modle dominant utilis
auparavant (graphe alatoire). Plus prcisment, un small-world network est un rseau o le
degr de clustering est lev (beaucoup de sous-graphes sont fortement connexes il y a une
forte transitivit du graphe cest--dire que les sommets voisins sont trs connects entre
eux, ainsi si les sommets A et B sont lis, tout comme les sommets B et C, alors la probabilit
est forte pour que les sommets A et C soient relis) et o la distance moyenne entre les
paires de sommets est faible.
Le principe de construction de ce graphe est simple, le graphe de dpart est k-rgulier (tous
les sommets ont le mme degr) et chaque sommet est li ses voisins proches. De faon
alatoire, un lien est supprim et un lien est ajout au graphe de dpart. Les auteurs
mesurent alors deux paramtres : la moyenne des plus courts chemins entre chaque paire de
sommets et le clustering coefficient. Ce processus aboutit un rseau parfaitement alatoire.
Entre le rseau rgulier de dpart et le rseau alatoire final se trouve les rseaux dits
small-world . Durant ce processus, la moyenne des plus courts chemins et le niveau de
clustering diminuent, mais comme la moyenne des plus courts chemins diminue plus
rapidement , certains rseaux prsentent un niveau de clustering lev et une moyenne
faible des plus courts chemins. Ce sont les rseaux small-world.
Moins dun an plus tard, deux physiciens, Barabsi et Albert, publient dans Science un article
o ils proposent un autre modle de graphes : les scale-free networks. En effet, en tudiant, de
manire empirique, diffrents graphes existant dans la nature, ils aboutirent une conclusion
qui leur apparut alors surprenante : contrairement ce qui tait communment admis, les
graphes quils tudient ne prsentent pas une distribution gaussienne des degrs, mais au
contraire des distributions qui suivent des lois de puissance [13]. Ainsi, il existe un grand
nombre de sommets relis dautres sommets par un nombre faible de liens. En revanche, il
existe peu de sommets relis directement un grand nombre de sommets (Figure 8).
( ) [13]
o k est le degr des sommets, P(k) la frquence des sommets de degrs k, est suprieur 2.
Serge Lhomme Introduction lanalyse spatiale 24
Pour expliquer cette distribution trs ingalitaire des degrs, les auteurs mettent et testent
des hypothses concernant la formation et lvolution des rseaux. Les graphes tudis
mettent en vidence des liens qui suivent apparemment un processus dattachement
prfrentiel (preferencial attachment).
En une dcennie, les notions de small-world et de scale-free sont devenues trs rpandues.
Ainsi, il apparait que de nombreux rseaux gographiques (ou spatiaux) prsentent ces
caractristiques (comme ceux des multinationales, des collaborations scientifiques, du rseau
arien chinois ou des rseaux Internet). Cest pour cela quils sont prsents dans ce
complment de cours comme des modles appartenant lanalyse spatiale. Nanmoins, les
rseaux qui ncessitent de grosses infrastructures matrielles linaires, comme les rseaux
techniques (rseau lectrique, rseau viaire, rseau deau), ne prsentent pas souvent ces
caractristiques. Ainsi, la mise lpreuve de ces modles peut permettre de mettre en
vidence des contraintes territoriales qui impose des distributions binomiales des degrs.
Trouver un exemple trs simple permettant dappliquer ces modles nest pas chose aise. En
effet, si ces modles ne sont pas trs complexes (seules quelques bases en thorie des graphes
sont ncessaires pour les comprendre), les graphes concerns par ces modles se doivent
dtre grands (ces graphes doivent comporter un nombre de sommets suprieur
plusieurs centaines). Or, il nest pas ais de manipuler de grands graphes. Cest dailleurs
pourquoi ces modles de graphes thoriques (bien que simples) ont merg rcemment,
puisquil fallait disposer de moyens informatiques modernes pour les dcouvrir et les
implmenter. Pour donner un exemple qui ait du sens, il apparait ds lors ncessaire davoir
recours des outils informatiques. Nous allons ici utiliser R , un logiciel conu pour faire
Serge Lhomme Introduction lanalyse spatiale 25
Puis, il faut charger le jeu de donnes GML dans R. Par exemple, si vous avez placez votre
jeu de donnes ( dzipp ) sur le bureau, il faut taper une ligne de code de ce type :
> donnees <- read.graph("C:/Users/xxxxxx/Desktop/as-22july06/as-
22july06.gml","gml")
Pour le vrifier, il faut dterminer la valeur du coefficient . Pour cela, il faut disposer de
donnes qui font abstraction des valeurs nulles (celles-ci vont en effet gner la dtermination
du coefficient ). De mme, il faut rcuprer les valeurs des degrs.
> dd[dd==0]<-NA
> sup<-which(is.na(dd))
> dd2<-dd[!is.na(dd)]
> id<--1:length(dd)
> id2<-id[-sup]-1
Ds lors, il est possible de calculer la valeur du coefficient (Figure 11) laide dune
rgression linaire (voir page 56), puis dafficher les rsultats dans un graphique (Figure
10) :
> summary(lm(log(dd2)~log(id2)))
> plot(log(id2),log(dd2), ylab="Log du de la distribution des degres",
xlab="Log des degres")
> abline(lm(log(dd2)~log(id2)))
Ainsi, les rsultats de la rgression sont approximatifs (R=73%). De surcroit, le coefficient
est gal 1.15. Ce coefficient est donc infrieur deux, ce qui place le graphe de la
structure dinternet dans un cas limite de scale-free. Cela sexplique par une
3Pour une introduction au fonctionnement de ce logiciel, qui peut surprendre ceux qui nous pas lhabitude
de travailler avec des lignes de commandes, vous pouvez trouver des initiations sur internet, comme par
exemple sur le site : http://elementr.parisgeo.cnrs.fr
Serge Lhomme Introduction lanalyse spatiale 26
surreprsentation des valeurs extrmes (en loccurrence les valeurs les plus fortes). En
revanche, si lon utilise la distribution cumule des degrs, la loi de puissance apparat plus
vidente (Figure 12).
Derrire la trs riche varit des paysages concrets que nous observons la surface du globe,
il existe des organisations structurantes rsultant du dsir des habitants ou de leurs
dirigeants damnager le sol pour leur plus grande commodit (Pumain et St-Julien, 2010).
Ce processus dadaptation un milieu donn peut sapparenter un principe doptimisation.
En effet, les socits cherchent trs souvent maximiser une fonction dutilit qui varie en
fonction des lieux et des priodes. Cette fonction dutilit peut tre purement conomique
(maximisation conomique de lutilisation du sol) ou plus complexe (maximisation du bien-
tre individuel ou social). Ainsi, il nest pas si surprenant quun des premiers modles
Serge Lhomme Introduction lanalyse spatiale 28
Dans la vie courante, le choix de son lieu de rsidence varie en fonction des capacits
financires de chacun, mais certains critres semblent partags par de nombreuses
personnes. Or, certains de ces critres font clairement rfrence des critres doptimisation
qui peuvent sexprimer simplement : minimisation du temps de trajet son lieu de travail en
fonction dune maximisation des accs certaines amnits (commerces, espaces verts, liens
sociaux). Ainsi, loptimisation, si elle ne doit pas tre systmatiquement recherche, peut
servir de modle de rfrence afin de mettre en exergue les singularits des territoires.
Von Thnen dans son ouvrage Der Isolierte Staat in Beziehung auf Landwirtschaft und
Nationalkonomie (1826) se donne comme objectif dexpliquer la localisation des activits
agricoles. Selon lui, les activits agricoles ne sont pas disposes de manire alatoire dans
lespace, mais rpondent une distribution spcifique. Dans sa thorie, Von Thnen est parti
de lide dveloppe par Adam Smith, selon laquelle le producteur cherche maximiser le
profit de sa terre. Von Thnen, lui-mme propritaire terrien, savait quun tel profit repose
sur lutilisation optimale des surfaces et des cots de transport. En se concentrant sur ces
deux variables, il obtient un tat isol homogne avec une ville-march en son centre.
Von Thnen conclut quune denre ne vaut la peine dtre produite que si elle se trouve
une certaine distance du march. En dehors de cette distance, le cot de la terre (rente
foncire) ou le cot de transport devient trop lev, une autre culture devient alors plus
rentable. Von Thnen ayant calcul les cots de transport par des distances vol doiseau du
march, les zones ainsi dfinies sont circulaires : on parle des anneaux de Von Thnen.
Le march est situ au centre dun Etat isol ou plus gnralement dun
territoire isol ;
Ltat isol est entour dtendues sauvages ;
Le pays est plat, sans rivire ni montagne ;
Les qualits du sol et du climat sont homognes ;
Les producteurs apportent directement leurs produits aux marchs par le chemin le
plus court (il ny a pas de routes et tout le transport se fait vol doiseau) ;
Les producteurs se comportent de manire maximiser leur profit.
Pour un mme rendement unitaire de surface, on obtient lquation suivante : Ri(d) = (pi
ci) Tid. Ainsi, pour chaque produit, la rente est reprsente par une droite dcroissante
de pente -Ti dont lordonne lorigine est gale (pi ci). Une production nest plus
rentable (cest--dire Ri(dmax)=0) au point dabscisse dmax = (pi ci) / Ti. Comme, la
surface est ddie la culture du produit qui offre la rente la plus leve aux propritaires
fonciers, la configuration des diffrentes cultures suit bien une forme de cercles
concentriques (Figure 13). Sur la figure ci-dessous, la premire parcelle sera affecte au
produit a, la seconde, un peu loigne du centre au produit b et la dernire encore un peu
plus distante du march au produit c.
Cultures
Mas Elevage
marachres
Prix de vente (Pi) 3000 1000 1500
Cultures
Mas Elevage
marachres
Bnfice brut (ordonne
3000-1800=1200 1000-660=340 1500-850=650
lorigine : pi ci)
Distance max de
1200/25=48 340 / 1.5 = 227 640/4=160
rentabilit ((Pi-Ci)/Ti)
Ds lors, on peut calculer les distances au centre pour lesquels les revenus nets entre deux
productions i et j sont gaux (Tableau 15). Par exemple, pour les cultures marachres et le
mas, on cherche rsoudre lquation suivante :
( ) ( )
Cultures
Mas Elevage
marachres
Cultures marachres - 37 26
Mas 37 - 124
Elevage 26 124 -
Tableau 15 : Distances au centre pour lesquels les revenus nets entre deux productions i et j
sont gaux.
Pour rsumer et visualiser les rsultats, il est possible de produire un schma (Figure 14).
Enfin, il est important de noter que le modle de Von Thnen peut sappliquer aux espaces
urbains. Ainsi, dans le modle dAlonso, au sein des villes, tout s'organise en fonction du
centre-ville et du cot de transport. La localisation des mnages s'effectue ds lors selon les
ressources de ces mnages et la distance au centre-ville. L'affectation du sol urbain rappelle
alors le modle de Von Thnen. Nanmoins, les limites de ces modles sont nombreuses.
Elles rsident dans les hypothses fondatrices de ces modles : savoir l'isotropie spatiale, la
libert de dplacement, la concurrence parfaite, la prsence d'un centre unique autour duquel
Serge Lhomme Introduction lanalyse spatiale 31
Enfin, il est important de noter que le modle de Von Thnen peut sappliquer aux espaces
urbains. Ainsi, dans le modle dAlonso, au sein des villes, tout s'organise en fonction du
centre-ville et du cot de transport. La localisation des mnages s'effectue ds lors selon les
ressources de ces mnages et la distance au centre-ville. L'affectation du sol urbain rappelle
alors le modle de Von Thnen. Nanmoins, les limites de ces modles sont nombreuses.
Elles rsident dans les hypothses fondatrices de ces modles : savoir l'isotropie spatiale, la
libert de dplacement, la concurrence parfaite, la prsence d'un centre unique autour duquel
s'ordonne la ville, la centralit du cot de transport dans l'allocation spatiale, la rationalit
des comportements...
capacit doffre de diffrents points de ventes). Nanmoins, il ne faut pas limiter la porte de
ces modles aux seules entreprises quelles soient publiques ou prives. En effet, si ces
modles font partie des fondements du gomarketing, il ne faut pas oublier que les individus
peuvent trs bien agir en suivant des comportements doptimisation (comme par exemple
dans leur mode de dplacement, en choisissant les chemins les plus courts pour aller dun
lieu un autre).
Ces modles trouveraient leur origine dans des travaux comme ceux dAlfred Weber. Alfred
Weber cherchait alors localiser un centre de production de manire minimiser la distance
pondre entre ce centre et les sources de matires premires : cest le problme p-median.
Dans les faits, le problme p-mdian (un problme particulier de localisation-allocation) est
beaucoup plus ancien, puisquil remonte Pierre de Fermat (1601-1665) qui posa le
problme suivant : tant donn trois points dans un plan, trouver un quatrime point dont la
somme des distances aux trois points donns est minimum (la distance entre deux points
tant mesure par la longueur du segment les joignant). Cependant, Alfred Weber posa le
problme sous sa forme moderne. Dsormais, chaque modle de localisation-allocation
contient cinq composants essentiels :
pour dterminer des emplacements de services durgence, tels que des localisations
dambulances, dhpitaux, ou de casernes de pompiers.
Le problme p-mdian consiste localiser p installations pour couvrir la demande de tous les
sommets de faon optimale. En dautres termes, cela revient minimiser la distance entre
chaque site de demande et le centre le plus proche. On note alors :
{ }
{
Lquation [15] assure quen tout sommet Vj, la somme des besoins
couverts par les installations places en Vi correspond bien au besoin
total wj du sommet Vj.
Si les techniques pour rsoudre ce systme sont gnralement assez complexes et lourdes
mettre en uvre, le principe de l'algorithme flou est en revanche assez simple : localiser les
installations une par une, en choisissant chaque fois la solution optimale. Autrement dit,
on espre obtenir un optimum global partir doptimums locaux (cest un algorithme
glouton). Ainsi, lalgorithme dtermine, dans un premier temps, le meilleur emplacement
pour la premire installation en calculant la fonction objective pour chaque nud envisag
(lalgorithme retient alors simplement le nud pour lequel la fonction objective est la plus
faible). Ensuite, lalgorithme dtermine un deuxime site en calculant de nouveau pour
chaque nud la fonction objective (sauf pour celui dj occup) et assigne au site dtermin
prcdemment les nuds qui lui sont les plus proches (ces nuds ninterviennent alors plus
dans la dtermination du nouveau site). De nouveau, lalgorithme retient le nud pour
lequel la fonction objective est la plus faible. Cette opration est rpte plusieurs reprises
afin de dterminer les localisations des p installations souhaites. Pour appliquer cet
algorithme, plusieurs hypothses doivent tre faites :
Le besoin dun nud est totalement satisfait par le site situ le plus prs de
lui, peu importe combien de nuds celui-ci doit grer et peu importe les
besoins de ces autres nuds.
Nous allons dtailler cet algorithme laide dun exemple didactique. Prenons la carte des
clients potentiels dune entreprise (Figure 15). Ces clients sont regroups au sein de 12 villes
(de A L).
Figure 15 : Carte des clients potentiels dune entreprise. Les lettres reprsentent le nom des
villes. Les nombres rouges correspondent aux nombres de clients potentiels de chaque ville.
Les chiffres noirs correspondent aux distances.
Serge Lhomme Introduction lanalyse spatiale 35
On cherche positionner 5 points de vente (parmi toutes les villes o se trouvent les clients
potentiels) afin de minimiser les distances parcoures par lensemble des clients pour se
rendre ces 5 points de ventes. Pour cela, il faut dans un premier temps calculer la matrice
des distances entre les diffrentes villes (Tableau 16).
Site potentiel
Ville A B C D E F G H I J K L
A 0 15 37 55 24 60 18 33 48 40 58 67
B 15 0 22 40 38 52 33 48 42 55 61 61
C 37 22 0 18 16 30 41 28 20 58 39 39
D 55 40 18 0 34 12 59 46 24 62 43 34
E 24 38 16 34 0 36 25 12 24 47 37 43
F 60 52 30 12 36 0 57 42 12 50 31 22
G 18 33 41 59 25 57 0 15 45 22 40 61
H 33 48 28 46 12 42 15 0 30 27 25 46
I 48 42 20 24 24 12 45 30 0 38 19 19
J 40 55 58 62 47 50 22 37 38 0 19 40
K 58 61 39 43 37 31 40 25 19 19 0 21
L 67 61 39 34 43 22 61 46 19 40 21 0
Tableau 16 : Matrice des distances entre les diffrentes villes.
Comme on cherche minimiser les parcours de lensemble des clients, il est ncessaire de
cumuler tous ces parcours. Pour cela, il faut multiplier la distance sparant la ville et le site
potentiel par le nombre de clients potentiels de la ville (Tableau 17). Par exemple, il y a 15
km parcourir pour les 15 clients de la ville A pouvant se rendre au site potentiel B, soit un
cot total de : 15 15 = 225. De mme, il y a 15 km parcourir pour les 10 clients de la ville
B pouvant se rendre au site potentiel A, soit un cot total de : 15 10 = 150.
Site potentiel
Ville A B C D E F G H I J K L
A 0 225 555 825 360 900 270 495 720 600 870 1005
B 150 0 220 400 380 520 330 480 420 550 610 610
C 444 264 0 216 192 360 492 336 240 696 468 468
D 990 720 324 0 612 216 1062 828 432 1116 774 612
E 120 190 80 170 0 180 125 60 120 235 185 215
F 1440 1248 720 288 864 0 1368 1008 288 1200 744 528
G 198 363 441 649 275 627 0 165 495 242 440 671
H 528 768 448 736 192 672 240 0 480 592 400 736
I 624 546 260 312 312 156 585 390 0 494 247 247
J 880 1210 1276 1364 1034 1100 484 814 836 0 418 880
K 1102 1159 741 817 703 589 760 475 361 361 0 399
L 1340 1220 780 680 860 440 1220 920 380 800 420 0
Ensuite, lalgorithme flou calcule la somme des cots totaux pour lensemble des sites qui
sont susceptibles daccueillir les points de vente. Le site qui a la somme des cots totaux la
plus faible est slectionn pour accueillir un premier point de vente.
Site potentiel
Ville A B C D E F G H I J K L
A 0 225 555 825 360 900 270 495 720 600 870 1005
B 150 0 220 400 380 520 330 480 420 550 610 610
C 444 264 0 216 192 360 492 336 240 696 468 468
D 990 720 324 0 612 216 1062 828 432 1116 774 612
E 120 190 80 170 0 180 125 60 120 235 185 215
F 1440 1248 720 288 864 0 1368 1008 288 1200 744 528
G 198 363 451 649 275 627 0 165 495 242 440 671
H 528 768 448 736 192 672 240 0 480 592 400 736
I 624 546 260 312 312 156 585 390 0 494 247 247
J 880 1210 1276 1364 1034 1100 484 814 836 0 418 880
K 1102 1159 741 817 703 589 760 475 361 361 0 399
L 1340 1220 780 680 860 440 1220 920 380 800 420 0
Total 7816 7913 5855 6457 5784 5760 6936 5971 4772 6886 5576 6371
Site potentiel
Ville A B C D E F G H I J K L
A 0 225 555 720 360 720 270 495 720 600 720 720
B 150 0 220 400 380 420 330 420 420 420 420 420
C 240 240 0 216 192 240 240 240 240 240 240 240
D 432 432 324 0 432 216 432 432 432 432 432 432
E 120 120 80 120 0 120 120 60 120 120 120 120
F 288 288 288 288 288 0 288 288 288 288 288 288
G 198 363 451 495 275 495 0 165 495 242 440 495
H 480 480 448 480 192 480 240 0 480 480 400 480
I 0 0 0 0 0 0 0 0 0 0 0 0
J 836 836 836 836 836 836 484 814 836 0 418 836
K 361 361 361 361 361 361 361 361 361 361 0 381
L 380 380 380 380 380 380 380 380 380 380 380 0
Total 3485 3725 3943 4296 3696 4268 3145 3655 4772 3563 3858 4392
Serge Lhomme Introduction lanalyse spatiale 37
Numro du point de
Site Cot total
ventes
1 I 4772
2 G 3145
3 F 2641
4 J 2157
5 A 1707
Tableau 20 : Rsultats finaux de lalgorithme flou.
Il est alors possible de raliser la carte des implantations des points de vente avec
laffectation des clients associs :
reproduire un processus (temporel) partir dun modle statique), ne peut avoir la mme
porte quun modle par essence dynamique. Il faut bien avouer que la mise en place de
modles mathmatiques dynamiques nest pas chose aise. Dans les faits, la modlisation
informatique se prte mieux cet exercice. Ainsi, si des modles de simulation existent en
gographie depuis le dbut des annes 1950, le dveloppement de linformatique a permis
une diffusion plus large de ces modles en facilitant leur implmentation. Deux grands
classiques de lanalyse spatiale vont tre prsents dans ce complment de cours : le modle
d'Hgerstrand et le modle de Schelling.
La diffusion sexprime par tous les dplacements qui, quelle quen soit la force motrice,
cherchent rpandre quelque chose de manire homogne dans un systme, tendant ainsi
le faire passer dun tat dquilibre un autre tat dquilibre. Ainsi, la notion de diffusion est
introduite quand on tudie des processus qui mettent en jeu des dplacements de produits,
de personnes, de pratiques... Plus prcisment, la notion de diffusion spatiale recouvre
lensemble des processus qui concourent aux dplacements dans lespace gographique et
aux effets que ces dplacements engendrent dans cet espace. La diffusion peut alors
correspondre un mouvement de migration avec relocalisation ou un mouvement
dexpansion (de contagion).
Depuis les travaux d'Hgerstrand, les gographes insistent sur le rle que peuvent avoir les
structures spatiales (effets de voisinage, de barrire, de hirarchie) sur les processus
spatio-temporels de toute diffusion. En matire danalyse spatiale, on identifie ainsi deux
types de mouvements dexpansion dans lespace. Dune part, la diffusion par contagion qui
repose sur les effets la fois de la distance et de la contigut dans un processus de diffusion
spatiale. Une innovation ou une nouvelle activit aura tendance se diffuser dans les
voisinages immdiats de son lieu dapparition. Dautre part, la diffusion hirarchique rend
compte de la propagation d'une activit selon la hirarchie des lieux. L'innovation se propage
en priorit travers les espaces fort potentiel dinteraction, privilgiant ainsi les grands
centres conomiques et dcisionnels, et se poursuit travers des espaces de moins en moins
denses mesure que l'innovation se banalise . Dans ce contexte, la taille et le rang d'une
ville dans un rseau urbain sont les critres dterminants du processus de diffusion.
Dans le cadre de son travail de thse portant sur la diffusion des innovations techniques
agricoles dans le centre de la Sude, Hgerstrand est le premier appliquer et dvelopper
des mthodes mathmatiques permettant de dcrypter des rgularits temporelles et
spatiales dans les mouvements humains. Cette thse, publie en 1953, devient une rfrence
mondiale aprs sa traduction en anglais (Innovation Diffusion as a Spatial Process). La
proposition originale de ce travail est le modle de simulation de la diffusion des innovations
par vagues fond sur une approche probabiliste des mises en contact entre metteurs et
rcepteurs . Ce modle est implment par une procdure Monte Carlo. Aujourdhui
encore, les principes fondamentaux de ce modle sont considrs comme trs pertinents.
Serge Lhomme Introduction lanalyse spatiale 39
Torsten Hgerstrand propose donc le premier modle de diffusion des innovations fond sur
des mcanismes de contact entre individus. Lide fondamentale de ce modle est que si ces
interactions sont stables et persistantes dans lespace et dans le temps, alors leur
reconnaissance et leur formalisation doivent permettre de dcrire correctement toute
diffusion dans lespace gographique que ce soit une chelle macroscopique, o la diffusion
seffectue en priorit selon la hirarchie des lieux, ou une chelle microscopique, la
contigut spatiale tant alors privilgie. Plus prcisment, les individus sont classs en (au
moins) deux groupes : les informs et les autres. Chaque individu inform peut, par la suite,
adopter linnovation. Lindividu ragi par stimulations : il peut passer de ltat dindividu non
inform celui dindividu adoptant, avec un tat transitoire dindividu inform se faisant une
reprsentation de linnovation par rapport ses propres besoins. Cette dynamique peut tre
modlise par de mthodes probabilistes. Depuis les travaux dHgerstrand, de nombreux
autres modles ont vu le jour. Dans ces modles, de manire gnrale, les informs ou les
adoptants contribuent diffuser des informations concernant linnovation : ils font, en
quelque sorte, de la publicit (involontaire ou non) pour linnovation. De surcrot, en
fonction des modles, les adoptants pourront se montrer plus ou moins exigeants.
Figure 17 : Schma du principe des modles de diffusion fonds sur les travaux
dHgerstrand.
Dans sa thse, Eric Daud dtaille bien les principes de fonctionnement des modles de
diffusion dHgerstrand. En effet, Hgerstrand construisit trois modles, dont la
prsentation constitue une introduction didactique son modle final (le troisime modle
qui est reconnu comme tant le modle dHgerstrand), puisque ces modles vont du plus
simple au plus complexe. Premirement, Hgerstrand imagine que tous les individus sont
informs en mme temps de linnovation. Les individus adoptent alors linnovation de
manire totalement alatoire. Le territoire est dcoup en une grille de 81 cellules (de 5km
de ct) comportant chacune 30 individus. A chaque itration, un individu est choisi de
manire totalement alatoire pour adopter linnovation et cela na pas dincidence sur
ladoption par ces voisins. Avec ce modle simple, on obtient finalement une diffusion
totalement alatoire de linnovation au sein du territoire (Figure 18). Dans le deuxime
modle, un seul individu est inform, il est situ au centre de la grille. Chaque individu
adopte linnovation ds quil est inform et diffuse linformation un autre individu. Il ny a
donc pas de diffrence entre les informs et les adoptants. Les individus nont pas de libre
arbitre. La probabilit quun individu transmette linformation un autre individu est
dtermine par une matrice de probabilit (la probabilit dcroit en fonction de la distance
entre les individus) (Figure 19). En choisissant chaque itration, pour chaque adoptant, un
chiffre entre 0 et 1 et en le rapportant la matrice du champ moyen dinformations
(Figure 19), il est possible de dterminer lindividu qui sera inform (Figure 20). Dans ce
Serge Lhomme Introduction lanalyse spatiale 40
modle, linnovation se propage trs vite et selon un mcanisme de tches dhuile . Pour
son troisime modle, Hgerstrand introduit alors une certaine rsistance la diffusion.
Chaque individu se voit attribuer un certain niveau de rsistance, de telle sorte quon obtient
pour chaque cellule une distribution des rsistances (Figure 21). Pour quun individu adopte
linnovation, il faut quil reoive un niveau dinformation (ce niveau augmente chaque fois
quil est inform par un individu) gal son niveau de rsistance. On obtient une diffusion
qui se propage plus lentement et de manire plus concentre (Figure 22).
Figure 18 : Exemple de rsultats pour le premier modle dHgerstrand (Eric Daud, 2002).
Figure 19 : A droite le champ de contact pour la cellule centrale (P=0,7966 1,585 log(d)).
A gauche le champ dinformation correspondant. Le champ de contact correspondant ici la
probabilit quun adoptant plac au centre de la grille informe les autres individus selon leur
appartenance une cellule. Le champ dinformation se calcule simplement partir du champ
de contact.
Figure 21 : Distribution des rsistances dans une mme cellule (30 individus au total).
Dans les annes 1970, Thomas C. Schelling a propos un modle afin dexpliquer le lien
entre sgrgation spatiale et les prfrences individuelles concernant cette sgrgation. Il
suffit pour mettre en uvre ce modle de disposer dune information concernant les
prfrences des individus et dune dichotomie permettant de ranger une population en deux
groupes distincts. Son application au cas urbain a grandement particip son succs . Il
faut dire que sa conclusion principale a de quoi marquer les esprits par son ct paradoxal.
En effet, Schelling montre quune forte sgrgation peut tre le rsultat collectif de dcisions
individuelles qui ne visent pas une telle sgrgation. Ainsi, mme si les individus sont
tolrants , on aboutit presque toujours des situations de sgrgation.
tolrants , les individus dmnageront si, parmi leurs voisins immdiats, au moins deux
tiers ne sont pas de la mme couleur queux. En sens inverse, ils seront satisfaits et ne
dmnageront pas si, parmi leurs voisins immdiats, strictement plus dun tiers sont de
couleur identique. Cette rgle du tiers peut sembler assez souple, car on ne peut pas dire que
les individus recherchent la sgrgation : ce nest qu partir du moment o chacun souhaite
tre majoritaire que la sgrgation est vritablement vise. En de, certaines minorits
peuvent saccepter et le mlange des deux communauts reste possible. Nanmoins, il est
vident que de vritables individus tolrants ne tiendraient pas compte de la couleur de leurs
voisins.
Dans une situation de dpart altern avec les coins vides, tous les individus sont satisfaits de
leur voisinage. On effectue alors une petite perturbation. On commence par retirer au hasard
8 pions blancs et 8 pions noirs, puis on remet 8 pions au hasard, la couleur de chacun tant
elle aussi choisie alatoirement (il y a donc finalement 52 pions et 12 cases vides). Cette
perturbation suffit le plus souvent engendrer un peu dinsatisfaction et les pions concerns
seront alors amens se dplacer au hasard (ces pions sont entours en rouge) vers des cases
vides jusqu ce que lon atteigne un nouvel tat dquilibre o tous les pions seront satisfaits
en regard de la rgle du tiers (Figure 23). Dans ces conditions, le rsultat est surprenant :
des quartiers noirs et des quartiers blancs apparaissent sans que personne ne le veuille
rellement. Or, ce nest pas un rsultat marginal. Comme le dit Schelling, ressayez plusieurs
fois de jouer ce jeu et vous aboutirez probablement chaque fois une forte sgrgation.
Figure 23 : Le modle de Schelling illustr. En gris les cases vides, en blanc et en noir les
deux populations. Les pions amens se dplacer sont entours en rouge.
Pour disposer dun exemple pratique, nous allons utiliser le logiciel SPACELLE
(http://www.spatial-modelling.info/Cellular-Automata-SPACELLE). A partir de ce logiciel,
il faut ouvrir le fichier Schelling_test.ac5 (lien). Ce fichier reproduit le modle de
Schelling avec un taux de tolrance de 20%. Lorsque vous ouvrez le fichier sous SPACELLE
( Fichier Ouvrir ), vous obtenez une grille totalement vide :
Faire de mme avec la population B, pour cela il ne faut pas hsiter mettre la population B
ct de la population A :
Cliquez sur la touche pour lancer la simulation, puis aprs quelques secondes arrtez la
simulation , vous allez pouvoir constater quun processus de sgrgation changer la
situation de dpart :
Figure 27 : Exemple dun rsultat obtenu avec le modle de Schelling aprs plusieurs
itrations, la situation est bien sgrge.
Serge Lhomme Introduction lanalyse spatiale 45
Figure 28 : Deuxime exemple dun rsultat obtenu avec le modle de Schelling, la situation
est toujours sgrge.
Ensuite, placez une douzaine despaces vides de manire alatoire, comme ci-dessous :
Serge Lhomme Introduction lanalyse spatiale 46
Au bout dun certain temps de simulation, vous obtenez de nouveau une rpartition
sgrge :
Figure 31 : Exemple dun rsultat obtenu avec le modle de Schelling, la situation est bien
sgrge.
Pour faire de lanalyse spatiale, il est ncessaire davoir des connaissances dans diffrents
domaines complmentaires la gographie. Comme vous avez t amens le voir
prcdemment, il faut notamment des connaissances en mathmatiques (comme par exemple
Serge Lhomme Introduction lanalyse spatiale 47
pour la loi rang-taille ou le modle de Huff) et en informatique (comme par exemple pour les
modles de sgrgation ou lanalyse de graphes). Ces domaines sont considrs comme des
outils pour effectuer de lanalyse spatiale. De surcrot, lanalyse spatiale nest pas uniquement
compose de modles. Il existe aussi de nombreux indicateurs permettant de mettre en
exergue certains phnomnes spatiaux. Ce complment de cours propose donc trois
initiations : une initiation la statistique spatiale, une initiation la thorie des graphes et
une initiation la simulation informatique.
La statistique spatiale
Un outil privilgi de lanalyse spatiale est lanalyse statistique. En effet, lanalyse spatiale
sappuie sur de linformation gographique qui est compose par des informations
concernant la localisation des objets tudis (cest la composante spatiale) et des
informations relatives leurs caractristiques, leurs proprits (cest la composante
smantique). Or, la statistique propose de nombreux outils, indicateurs, mthodes
permettant danalyser la composante smantique. Ainsi, la solution la plus simple, mais sans
doute pas la plus satisfaisante, pour analyser linformation gographique consiste alors
analyser la composante smantique sans tenir compte de la composante spatiale en effectuant
des analyses statistiques classiques. Ces analyses statistiques peuvent ensuite tre
cartographies afin de tirer profit de la composante spatiale.
Lanalyse de donnes
Les statistiques sont abordes assez tt dans lenseignement des mathmatiques, bien que ce
champ soit plutt rcent (les thories statistiques prennent corps durant le XXme sicle).
En effet, les statistiques trouvent de nombreuses applications pratiques et contribuent
rendre les mathmatiques moins abstraites. Dans les faits, la statistique est un domaine des
mathmatiques qui possde une composante thorique et une composante applique.
Dsormais, le minimum, le maximum, ltendu, la moyenne, la mdiane, les quartiles, lcart-
type et la variance font partie du socle commun des tudes secondaires. Ce sont des lments
permettant de dcrire et de rsumer les variables dune population. On considre cela comme
de lanalyse descriptive de donnes. Nanmoins, ces valeurs simplifient beaucoup la
complexit du jeu de donnes de dpart. Ainsi, des jeux de donnes trs diffrents peuvent
avoir la mme moyenne et la mme mdiane.
Le maximum de la variable j : { }
Le minimum de la variable j : { }
Ltendu de la variable j :
La moyenne de la variable j :
La variance de la variable j : ( ) ( )
Serge Lhomme Introduction lanalyse spatiale 48
Lcart-type de la variable j : ( ) ( )
Avant daller plus loin, il est important de revenir sur quelques termes. Une population est
une collection dobjets ayant des proprits communes (ce sont les lignes de votre fichier
Excel). Ces objets sont appels individus , ces derniers sont les lments de la population
tudie (une ligne = un individu). Ces individus alors caractriss par des variables (ces sont
les colonnes, les champs de votre jeu de donnes). Une variable est alors une proprit
commune aux individus de la population que lon souhaite tudier (une variable = une
colonne). On note alors : X la population ; Xi les individus ; Xj les variable ; xij la valeur prise
par une variable j et un individu i.
A contrario des lments ci-dessus, les distributions ont pour objectif de dcrire finement les
jeux de donnes, tout en simplifiant malgr tout leur interprtation. Pour cela, il peut tre
pertinent davoir recours une reprsentation graphique : le diagramme de frquence ou
diagramme de distribution. Une distribution est simplement une numration de toutes les
valeurs prises par le jeu de donnes tudi avec leurs probabilits (frquences) respectives.
Cette reprsentation peut se faire par plage de valeurs. En matire danalyse spatiale, ces
distributions sappuient gnralement sur des frquences. La frquence dsigne un nombre
d'lments rapport lensemble plus large auquel ces lments appartiennent. Cette
frquence peut s'exprimer en % ou en fraction de 1. Par exemple, prenons le jeu de donnes
suivant : 1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 3, 2, 3, 2, 1, 4, 0, 0. On peut tablir le comptage de
chaque valeur prise par la variable. De ces comptages, on en dduit les frquences
respectives :
On peut aussi travailler partir des frquences (des probabilits) cumules. Lorsque ces
frquences cumules sont reprsentes dans un graphique, on parle de diagramme de
rpartition.
Frquence
Valeur Comptage Frquence
cumule
0 4 4/20 = 0,2 0,2
1 6 6/20 = 0,3 0,2 + 0,3 = 0,5
2 5 5/20 = 0,25 0,5 + 0,25 = 0,75
3 3 3/20 = 0,15 0,75 + 0,15 = 0,9
4 2 2/20 = 0,1 0,9 + 0,1 = 1
Total : 20 1
Il est aussi pertinent de reprsenter les distributions par des fonctions mathmatiques qui
sen rapprochent (Figure 33). Lorsque lon utilise ces fonctions (courbes), on parle de densit
de distribution ou de rpartition. En thorie des probabilits et en statistique, une loi de
probabilit dcrit le comportement alatoire d'un phnomne dpendant du hasard. Ces lois
de probabilit peuvent alors servir tudier des distributions pour dterminer si les
variables suivent un comportement alatoire.
Par exemple, la loi normale (ou loi gaussienne) est une loi centrale en thorie des
probabilits et en statistique [18]. Elle dcrit le comportement des sries d'expriences
alatoires lorsque le nombre d'essais est trs grand. La loi normale est caractrise par sa
moyenne (qui est galement sa mdiane) et par son cart-type. Sa densit est symtrique et
sa forme est communment appele courbe de Gauss ou courbe en cloche .
( )
( ) [18]
Serge Lhomme Introduction lanalyse spatiale 50
Si lon veut conserver le caractre discret de la distribution, il est possible davoir recours
la binomiale :
( ) ( ) ( ) [19]
Des lois discrtes peuvent se rapprocher de la loi binomiale, comme la loi de Poisson. La loi
de Poisson est la loi des petites probabilits parfois appele loi des vnements rares (c'est--
dire des vnements avec une probabilit faible). Si la loi normale donne une bonne
approximation de la loi binomiale pour q fix et n tendant vers l'infini, la loi de Poisson,
quant elle, dcrit bien la loi binomiale pour n tendant vers l'infini et q tendant vers zro,
avec le produit nq tendant vers une constante.
En gnral, le diagramme de distribution obtenu avec une loi de Poisson est dissymtrique
(par rapport ) avec un talement marqu vers la droite, car les valeurs leves dune
variable de Poisson sont peu rencontres. A mesure que augmente, la forme de la
distribution tend devenir symtrique et sapproche de celle de la loi normale.
( ) ( ) [20]
Serge Lhomme Introduction lanalyse spatiale 51
Enfin, la loi log-normale est une autre loi de probabilit frquemment rencontre dans la
nature et dans les diverses activits humaines. Une variable alatoire X suit une loi log-
normale quand son logarithme suit une loi normale. Ces lois sont utilises dans le mme
cadre que les lois normales lorsque les observations sont le rsultat dun effet multiplicatif
dun trs grand nombre dautres variables indpendantes entre elles et individuellement
ngligeables.
Depuis le dbut de cette introduction sur les statistiques, nous avons considr que la
population X tait caractrise par plusieurs variables, mais nous avons prsent jusquici
que des outils statistiques qui dcrivent une seule variable et ce indpendamment des autres
(on parle danalyse univarie). Nanmoins, il est souvent pertinent dtudier les relations
pouvant exister entre les variables (on parle danalyse multi-varie). En statistique, les
analyses multivaries tudient la distribution conjointe de plusieurs variables. Les analyses
multivaries sont trs diverses selon l'objectif recherch, la nature des variables et la mise en
uvre formelle. Ainsi, on peut identifier deux grandes familles danalyse : celle des mthodes
descriptives (visant structurer et rsumer l'information) et celle des mthodes explicatives
visant expliquer une ou des variables dites dpendantes (variables expliquer) par un
ensemble de variables dites indpendantes (variables explicatives). Nous allons tout
Serge Lhomme Introduction lanalyse spatiale 52
dabord nous focaliser sur les mthodes descriptives, dans la continuit de ce qui a t dj
prsent.
( ) ( )( ) [21]
( ) ( ) ( )
( ) ( ) ( ) [22]
( ( ) ( ) ( ) )
( ) ( )( )
( ) [23]
( ) ( )
De manire gnrale, les analyses multivaries comparent les variables entre elles, mais elles
peuvent aussi tre intressantes pour comparer les individus entre eux. Ainsi, on peut classer
les individus en regroupant ceux qui se ressemblent . Pour cela, on va sappuyer sur des
matrices (tableaux) de distance (de ressemblance, dchange).
Parmi les mthodes danalyse de donnes multivaries, la mthode factorielle est trs
apprcie par les gographes. Ainsi, les manuels danalyse spatiale y font souvent rfrence.
La mthode factorielle a pour but de rduire le nombre de variables en perdant le moins
dinformations possibles, cest dire en gardant le maximum de variabilit totale. Cela
revient projeter les donnes des variables sur un espace de dimension infrieure en
maximisant la variabilit totale des nouvelles variables. Pour faire simple, en rgle gnrale,
on tente de reprsenter les individus dfinis par plusieurs variables sur un graphique 2D
facilement interprtable.
Lanalyse en composantes principales (ou ACP) est la mthode la plus couramment utilise
parmi les mthodes danalyse factorielle. Lobjectif de lACP est purement descriptif : il sagit
dexplorer un ensemble dobservations rassembles sous la forme dun tableau de
donnes. Le tableau de donnes peut tre de dimensions importantes : le nombre de lignes
(dunits statistiques) peut atteindre plusieurs centaines, et le nombre de colonnes (de
variables) plusieurs dizaines. Lanalyse en composantes principales est fonde sur le calcul
des moyennes, des variances et des coefficients de corrlation.
corrlations. Elle suit les tapes suivantes : 1) on centre le tableau de donnes 2) on calcule la
matrice de variance-covariance 3) on rduit la matrice centre afin davoir une matrice
centre rduite 4) on calcule la matrice des corrlations 5) on dtermine les axes principaux
laide des valeurs et des vecteurs propres de la matrice des corrlations 6) on calcule la
matrice des composantes principales 7) on calcule la qualit de la reprsentation.
Pour illustrer cette mthode danalyse de donnes multivaries, nous allons nous appuyer
sur un exemple concret. Prenons le tableau ci-dessous, qui regroupe 4 individus caractriss
par 3 variables. Afin danalyser ce jeu de donnes, nous allons effectuer une ACP afin de
dterminer les composantes principales nous permettant de le reprsenter au mieux dans un
plan.
Pour la premire tape, nous allons calculer les moyennes des diffrentes variables (5,5 ;
18,25 ; 41,25) pour les soustraire aux valeurs du tableau de dpart. Cela revient centrer le
tableau de donnes, on obtient la matrice suivante :
( ) [24]
( ) [25]
( )( )( )
( ) [26]
Pour rduire la matrice X, qui correspond la troisime tape, on calcule tout dabord une
matrice M. Ensuite, la diagonale de la matrice T est forme par les racines carrs des termes
de M. On peut alors calculer une matrice intermdiaire Y.
Serge Lhomme Introduction lanalyse spatiale 54
( ) ( ) ( ) [27]
( ) ( ) [28]
( ) [29]
Pour calculer la matrice des corrlations, on effectue ds lors les calculs suivants :
( ) [30]
( ) [31]
On dtermine dans un cinquime temps les matrices des vecteurs propres et des valeurs
propres (respectivement u et vap) de la matrice des corrlations R. On obtient :
( ) ( ) [32]
Les deux plus grandes valeurs propres ( 1=2.4598 et 2=0.5368) donnent la valeur de la
variance explique par les 2 axes factoriels choisis pour le plan principal. On calcule alors la
matrice des composantes principales, puis lon obtient les nouvelles coordonnes des
individus dans le plan factoriel.
( ) [33]
C1 C3
Individu_1 -2.2535 0.4984
Individu_2 1.8540 0.9137
Individu_3 0.9882 -0.8891
Individu_4 -0.5886 -0.5230
Enfin, on calcule que 99,99% de la variance est explique par les deux axes factoriels choisis.
En effet, le taux de variance expliqu par les q premiers axes factoriels et relatif aux q plus
grandes valeurs propres est gal :
Serge Lhomme Introduction lanalyse spatiale 55
[34]
On le voit bien, dans les deux cas ci-dessus, les variables ne se rpartissent pas de nimporte
quelle manire. Les deux courbes traces en noir reprsentent les meilleures estimations
possibles des valeurs de la variable Y en se fondant uniquement sur les valeurs de la variable
X. Autrement dit, dans le cas le plus simple (celui de droite), la rgression cherche une droite
y = ax + b qui dcrive au mieux la tendance du nuage observ. La dmarche la plus
couramment utilise consiste :
La mthode des moindres carrs consiste minimiser la variance, en supposant que les
rsidus suivent une loi normale centre. Toutefois, si l'chantillon prsente des valeurs
aberrantes, il vaudra mieux utiliser dautres mthodes. La mthode des moindres carrs est
trs simple appliquer. Elle seffectue laide dun simple produit matriciel. Ce calcul peut se
rvler encore plus simple si la droite de rgression recherche est de type y = ax + b. En
effet, un calcul assez simple montre que :
( )( )
( )
[35]
[36]
Pour avoir une application, prenons un cas thorique o lon cherche dterminer la droite
qui approxime le mieux le revenu mdian des mnages vis--vis de leur distance au centre
(Tableau 25). Il semble en effet quil existe une relation linaire assez vidente entre ces deux
variables (Figure 1).
35 000
30 000
25 000
20 000
15 000
10 000
5 000
0
0 200 400 600 800 1000
Pour calculer a et b, il faut tout dabord calculer la moyenne des distances au centreX = 400
et la moyenne des revenus mdiansY = 23 250, puis remplir le tableau suivant :
A laide dExcel, on peut facilement vrifier ce calcul, en ajoutant au nuage de point une
courbe de tendance qui par dfaut et de type y = ax +b :
35000
30000
25000
20000
15000
10000
y = -15,968x + 29637
5000
0
0 200 400 600 800 1000
Figure 41 : Le revenu mdian des mnages, leur distance au centre et la courbe de tendance.
Bien quutiles, ces lments classiques de lanalyse statistique font fit de lespace, ce qui nest
videmment pas satisfaisant pour un gographe. Pour que ces analyses soient pertinentes, il
faudrait que chaque objet soit indpendant. Or, prcisment, lespace fait sens et les objets
gographiques ne peuvent gnralement pas tre considrs comme indpendants les uns
des autres, car ils interagissent les uns sur les autres. Pour analyser le rle de lespace, il faut
alors adapter des outils statistiques classiques ou crer des outils spcifiques.
Lautocorrlation spatiale est une mesure de la ressemblance des valeurs prises par une
variable en fonction de la localisation gographique de ces valeurs. Autrement dit,
lautocorrlation spatiale mesure lintensit de la relation entre la proximit des lieux et leur
degr de ressemblance. Chaque unit gographique lmentaire de la zone tudie est dcrite
par un attribut ou plusieurs attributs et par les relations de proximit qui la lient aux autres
lieux (matrice de contigut). Si la prsence dun attribut dans un lieu rend sa prsence dans
les lieux voisins plus ou moins probable, on dira que lattribut manifeste une autocorrlation
spatiale. Lautocorrlation spatiale est positive si les lieux proches ont tendance se
ressembler davantage que les lieux loigns. Inversement, elle est ngative si les lieux
proches ont tendance tre plus diffrents que les lieux plus loigns. Lautocorrlation est
nulle quand aucune relation nexiste entre la proximit des lieux et leur degr de
ressemblance.
Les coefficients dautocorrlation spatiale sont alors construits de telle manire quil soit
possible de rpondre la question suivante : la variation dun caractre entre units
contiges est-elle plus ou moins grande que la moyenne des variations observes entre
lensemble des units de la zone tudie prises deux deux ? Il existe plusieurs indicateurs
Serge Lhomme Introduction lanalyse spatiale 58
afin de mesurer lautocorrlation spatiale. Les deux principaux, cest--dire les plus
couramment utiliss, sont les indices de Moran et de Geary.
Indice de Moran
Lindice de Moran mesure le degr dautocorrlation spatiale sous forme dautocovariance
relative des observations pour une variable X. La covariance relative nest autre que le
produit moyen des valeurs observes (et centres sur la moyenne) rapport la variance de
lchantillon [37]. On parlera ici dauto-covariance pour tenir compte du fait que les
produits sont calculs pour une mme variable, mais pour diffrentes observations. On aura
toutefois not lanalogie avec le coefficient de corrlation, qui rapporte la covariance entre
deux variables au produit de leur cart-type. La dfinition classique de lindice de Moran,
appliqu des observations i et j, dpend dune matrice de proximit note lij, prenant la
valeur 0 partout sauf pour les i et j voisins (lij = 1). Quand la variable est normalise (moyenne
= 0 et =1), la covariance relative nest autre que la moyenne des produits croiss des
valeurs de la variable X [38].
( ) ( )
[37]
( )
( ) [38]
Les valeurs ngatives (positives) de l'indice indiquent une auto-corrlation spatiale ngative
(positive). Ses valeurs s'tendent de -1 (indiquant une dispersion parfaite) +1 (corrlation
parfaite). Une valeur nulle correspondra une rpartition spatiale parfaitement alatoire de
la variable au sein du territoire tudi. Pour le test d'hypothse statistique, l'indice I de
Moran peut tre transform en Z-scores pour lequel les valeurs plus grandes que +1,96 ou
plus petites que -1,96 indiquent une auto-corrlation spatiale significative avec un taux
d'erreur de 5 %.
Le calcul de Moran est dsquilibr, car certaines observations sont plus reprsentes que
dautres : certaines localits centrales ont en effet plus de voisins que dautres. On choisit
alors de corriger ce biais en calculant un indice Moran corrig du nombre de localits prises
en compte.
Indice de Geary
Serge Lhomme Introduction lanalyse spatiale 59
L'indice de Moran est reli celui de Geary, mais n'est pas identique. L'indice de Moran est
une mesure de l'autocorrlation spatiale globale, tandis que l'Indice de Geary est plus
sensible l'autocorrlation spatiale locale. Lindice de Geary se prsente comme un rapport
entre dune part la variance des carts des valeurs de X entre units spatiales contiges et
dautre part la variance totale de X :
( ) ( ( ) )
[39]
( )
Pour rendre cet indice plus interprtable, on calcule G = 1 G, ce qui donne G = 0 pour
une autocorrlation nulle, G > 0 pour une autocorrlation positive, G < 0 pour une
autocorrlation ngative. La pratique tend montrer que lindice de Moran devrait tre
prfr celui de Geary, du fait de sa plus grande stabilit.
( ) ( ) ( ) ( ) ( ) ( )
Serge Lhomme Introduction lanalyse spatiale 60
AB ( ( )) AC ( ) BA ( ( ))
BC ( ) CA ( ( )) CB ( ( ))
CD ( ) CE ( ) DC ( )
E ( ) Total 22
Soit le tableau ci-dessous (dont les colonnes peuvent reprsenter des communes et les lignes
des types dactivit, les cases reprsentent le nombre demploys) :
C1 C2 C3 Total
Total x1 x2 x3 x
F(x[ij])=(x[i]*x[j])/x[] [41]
Puisque nous avons :
Branche
B1 B2 B3 Total
Zone
Z1 48 325 287 660
Z2 27 185 148 360
Z3 45 90 45 180
Total 120 600 480 1200
( )
Plus gnralement, on obtient les quotients de localisation suivants :
Branche
B1 B2 B3
Zone
Z1 0,727 0,985 1,087
Z2 0,750 1,028 1,028
Z3 2,500 1,000 0,625
Lindice de Theil est une mesure gnrale du degr de concentration gographique dun
semis de points dnombr dans une grille spatiale. Le raisonnement repose sur la
comparaison de deux distributions de frquence avec rfrence lquirpartition dune part
et la concentration absolue dautre part. Historiquement, la construction de lindice de
Theil sinspire du concept dentropie, emprunt la thorie de linformation. En effet, en
1967, Theil introduit un nouvel indicateur dingalit de revenu driv dune analogie de la
seconde loi de thermodynamique (la loi de lentropie). Celle-ci mesure le dsordre dun
systme thermodynamique, en offrant la possibilit dvaluer la contribution des ingalits
intergroupes et intragroupes lingalit totale. Lentropie est linformation espre dans
une distribution laquelle est associe une probabilit. Theil effectue une transposition en
remplaant lide de probabilit, par les parts de revenu de chaque sous population calcules
partir du revenu total de la population mre.
Ainsi, en analyse spatiale, soit i une maille parmi les n que comprend la zone tudie, m i le
nombre de points que cette maille concentre parmi les m points de la zone. On se place ici
dans la situation la plus simple, qui est celle dun dnombrement des points du semis dans
une grille spatiale rgulire. ni est le nombre de mailles de population m. Le nombre moyen
de points regroups dans une maille tant gal m/n et :
[43]
Avec mi/m = gi et ni/n = fi, on a :
( ( )) ( ( ) ( )) [44]
Cet indice tend vers 0 quand la concentration est minimale et tend vers log (fi) quand la
concentration est maximale g1 = 1 et si i 1 gi = 0.
Plus gnralement, cet indice se calcule pour toute distribution dune variable quantitative.
Prenons alors un exemple trs simple. Soit trois revenus : 1 euro ; 1euro ; 7 euros. On a
alors : g1= 1/9 ; g2 = 1/9 ; g3 = 7/9. Pour les frquences : f1 = f2 = f3 = 1/3. A partir de
ces lments, on peut calculer lindice de Theil :
A noter que lindice de Theil permet de dcomposer les ingalits. Cette proprit permet de
distinguer les ingalits inter-rgionales des ingalits intra rgionales.
On ne peut voquer lindice de Theil sans voquer lindice de Gini. Le coefficient de Gini est
originellement une mesure du degr d'ingalit de la distribution des revenus dans une
socit. Cette mesure a t dveloppe par le statisticien italien Corrado Gini. Le coefficient
de Gini est un nombre variant de 0 1 o 0 signifie l'galit parfaite (tout le monde a le
mme revenu) et 1 signifie l'ingalit totale (une personne a tout le revenu et les autres n'ont
rien). Le coefficient de Gini se calcule par rapport la fonction (dont la reprsentation
graphique est la courbe de Lorenz) qui associe chaque part de la population (ordonne par
Serge Lhomme Introduction lanalyse spatiale 63
revenu croissant) la part que reprsente ses revenus. Ce coefficient estime alors l'ingalit en
mesurant l'cart entre la courbe de Lorenz et une courbe reprsentant une rpartition gale
des revenus. Plus prcisment, le coefficient de Gini est gal la diffrence entre 1 et le
double de l'intgrale de la fonction reprsente par la courbe de Lorenz [45]. En pratique,
on ne dispose pas de cette fonction, mais du revenu par tranches de la population. Ainsi,
pour n tranches, le coefficient de Gini s'obtient par la formule de Brown :
( )( ) [45]
A partir de ce tableau, on peut calculer les frquences cumules des salaires mensuels.
Tableau 31 : Calcul des frquences cumules des salaires mensuels (par classe).
Tableau 32 : Calcul des frquences cumules des masses salariales (par classe).
Ds lors, il est possible de reprsenter la courbe de Lorenz, avec en abscisse les frquences
cumules des salaires mensuels et en ordonne les frquences cumules des masses salariales.
Serge Lhomme Introduction lanalyse spatiale 64
Pour dterminer le coefficient de Gini, il faut calculer laire du triangle A et des trapzes B et
C:
( ) ( )
( ) ( )
On obtient alors :
( )
Comme 0,2032 est une valeur faible, la concentration des salaires est plutt faible, on peut
donc en dduire que les salaires sont assez bien rpartis dans cette entreprise.
Le fait de prendre en compte ou non la direction des liens caractrise la diffrence entre un
graphe orient et un graphe non orient. Si le graphe est non orient, la matrice dadjacence
correspondante est symtrique. De surcroit, on distingue aussi deux types de graphes en
fonction de la nature des liens : les graphes binaires (ou boolens) o les liens traduisent
lexistence dune relation entre deux sommets ; les graphes valus (pondrs) o les liens
traduisent la prsence et lintensit (la distance ; le poids) de la relation.
Pour complter un peu le vocabulaire, un sommet a est dit incident un lien l lorsquune des
extrmits de l est a. Si lautre extrmit de l est un sommet b, on dit que a et b sont
adjacents ou voisins (do le terme de matrice dadjacence). La distance la plus courte
mesure en nombre de liens entre deux sommets est nomme distance godsique ( ne pas
confondre avec la distance gographique pour un graphe valu). On appelle chane un
parcours sur un graphe non orient allant dun sommet un autre en empruntant des artes,
lorsque le graphe est orient, on utilise le terme chemin. Une chane (ou un chemin) est dite
lmentaire si chaque sommet y apparat au plus une fois. Lorsque le dpart et larrive de
cette chane (ou de ce chemin) lmentaire est le mme sommet, on parle de cycle (graphe
non orient) ou de circuit (graphe orient). Un graphe est dit connexe lorsquil existe un
chemin ou une chane entre toutes les paires de sommets.
Certaines proprits des graphes mritent dtre cites car elles connaissent de nombreuses
applications. Un graphe eulrien dsigne un graphe pour lequel il existe une chane passant
une fois (et une seule fois) par tous les liens du graphe. Dans un graphe hamiltonien, il existe
un cycle passant par tous les sommets du graphe.
De manire gnrale, il est important de connatre la taille dun rseau ainsi que sa
rpartition, ce qui permet de dcrire sa structure. On parle de mesures globales. Ainsi, la
taille d'un rseau se mesure en nombre de sommets (e) et de liens (v), ainsi que par le
diamtre (le diamtre cest le plus long des plus courts chemins godsiques) et le nombre de
composants connexes (p). Dans le cas d'un rseau valu, et selon les informations
disponibles, la longueur et le poids des liens peuvent tre additionns pour renseigner la
taille du rseau. Dautres indicateurs classiques sont trs utiliss en gographie des
transports : les indicateurs et mesure ainsi la connexit du graphe (lorsquil existe quun
seul passage pour relier les sommets dun rseau, les liens peuvent constituer des enjeux
stratgiques, en revanche la multiplicit des liens rend cette dconnexion plus difficile, cest
le niveau de connexit) ; lindice mesure la connectivit.
[46]
[47]
[48]
[49]
( )
Plus particulirement, certains indicateurs mesurent des proprits plus locales. Nanmoins,
en calculant les moyennes de ces indicateurs, il est possible dobtenir de nouvelles mesures
globales. Les mesures locales de voisinage dcrivent la situation dun lment par rapport
ses voisins immdiats (directement connects ou adjacents) et les mesures locales densemble
rendent compte de la situation dun lment par rapport tous les autres lments de mme
nature prsents dans le rseau. Les indicateurs de voisinage par excellence sont les mesures
de degrs et les mesures de clustering (de transitivit). La plupart des mesures densemble
sont des mesures daccessibilit. Par exemple, lindice de Shimbel se calcule partir dune
matrice des distances : en additionnant simplement les lignes ou les colonnes. Le sommet
dont la somme est la plus faible est le sommet le plus accessible. La centralit de proximit
est simplement linverse de lindice de Shimbel et prsente lavantage dtre normalise entre
0 et 1. Enfin, la centralit dintermdiarit (betweenness) a retenu lattention de nombreux
travaux rcents. Les sommets ayant un niveau lev de centralit dintermdiarit sont ceux
qui permettent de limiter la distance parcourir dans le rseau. Ce sont des points de
passage incontournables dans une logique de plus court chemin. Leur suppression conduirait
donc ralentir le flux, puisque ce dernier devrait passer par des chemins plus longs.
Le degr : [50]
()
Centralit intermdiaire : [54]
()
Clustering coefficient : () [55]
( )
La simulation informatique
Trs clairement, les progrs rcents en analyse spatiale sont fortement lis au
dveloppement de linformatique. Linformatique offre des possibilits nouvelles en matire
de simulation, mais elle offre aussi des outils pertinents pour crer des modles. Dans ce
complment de cours, nous allons introduire les automates cellulaires, les systmes agents et
la programmation oriente objet.
Un bon exemple illustrant la puissance des outils informatiques en gographie concerne les
automates cellulaires. En effet, le principe de fonctionnement des automates cellulaire est
extrmement simple. Et pourtant, ils permettent de simuler des processus complexes comme
les dynamiques urbaines. Un automate cellulaire est une grille rgulire de cellules
chacune caractrise par un tat . Cet tat peut alors voluer au cours du temps. L'tat
d'une cellule au temps t+1 est fonction de l'tat au temps t d'un nombre fini de cellules
considres comme son voisinage . chaque nouvelle unit de temps, les mmes rgles
sont appliques simultanment toutes les cellules de la grille, produisant une nouvelle
gnration de cellules dpendant entirement de la gnration prcdente. tudis en
mathmatiques et en informatique thorique, les automates cellulaires sont la fois un
modle de systme dynamique discret et un modle de calcul. Le modle des automates
cellulaires est remarquable par l'cart entre la simplicit de sa dfinition et la complexit que
peuvent atteindre certains comportements macroscopiques : l'volution dans le temps de
l'ensemble des cellules ne se rduit pas (simplement) la rgle locale qui dfinit le systme.
Le jeu de la vie est un automate cellulaire bien connu. Le jeu de la vie se droule sur une
grille deux dimensions o les cellules peuvent prendre deux tats distincts :
vivantes ou mortes . chaque tape, lvolution dune cellule est entirement
dtermine par ltat de ses huit voisines de la faon suivante :
Une cellule morte possdant exactement trois voisines vivantes devient vivante
(elle nat).
Une cellule vivante possdant deux ou trois voisines vivantes le reste, sinon elle
meurt.
En gographie, les automates cellulaire sont parfaits pour simuler des modles de
sgrgation de type Schelling . Ils peuvent aussi reconstituer des processus dvolution de
croissance urbaine. Tout lenjeu est alors de dterminer les rgles qui vont rgir lautomate.
couches
00 2TCoucheCells C0 Jeuvie 10 0.500
0 Dures de vie
2 Rgles
M>V=NV(V; 1 ; 3)
V>M=SV(V; 1 ; 2 ; 3)
TCoucheCells0C0
0000000000
0000010000
0000010000
0000010000
0000000000
0000000000
0011100000
0000000000
0000000000
0000000000
Le fichier dfini peut tre enregistr en lui affectant une extension .ac5 . Aprs avoir
lanc le logiciel SpaCelle, vous pouvez ouvrir le fichier que vous venez de crer en cliquant
sur Fichier Ouvrir . Lautomate cellulaire souvre (Figure 49).
En cliquant sur le bouton , il est possible de lancer une itration. Lors de cette itration les
cellules ont chang dtat, car certaines cellules sont nes et dautres sont mortes. Si vous
refaites une itration, vous revenez ltat initial (Figure 50).
Enfin, il est possible deffectuer plusieurs itrations en cliquant sur le bouton . Vous
pouvez alors constater que lon a produit un automate cellulaire qui tourne en rond. Bien que
les automates cellulaires permettent de simuler certains processus, il est vident que ceux-ci
Serge Lhomme Introduction lanalyse spatiale 70
ne peuvent pas simuler de tous les processus complexe. La programmation oriente objet
offre des possibilits beaucoup plus grandes en la matire.
Les premiers ordinateurs taient programms laide de cartes perfores, les instructions
tant donnes sous la forme de 0 ou de 1 quil fallait rentrer manuellement. Les
programmeurs devaient se confronter directement au langage machine, cest--dire au
langage brut que comprend la machine. Au milieu des annes 1950 apparurent les premiers
langages de programmation, dont lobjectif primordial tait de dtacher le programmeur du
Serge Lhomme Introduction lanalyse spatiale 71
langage machine. Depuis, les programmes sont crits dans un dialecte relativement
comprhensible respectant une syntaxe et une grammaire stricte et prcise. Comme les
langages furent dvelopps essentiellement par des anglos-saxons, on pourrait les qualifier
de langue anglaise trs simplifie.
Tandis que le langage machine est, par nature, trs li llectronique de lordinateur, le
dveloppement des langages de programmation a ouvert la voie labstraction, principe
fondamental qui cherche loigner autant que possible le programmeur des contingences
matrielle pour le rapprocher des concepts et des choses concrtes quil doit traiter. Ainsi, il
existe diffrents paradigmes de programmation. Un langage de programmation est dit de
bas niveau lorsque le codage de celui-ci se rapproche du langage machine (dit "binaire"), et
permet donc de programmer un degr trs avanc. Les langages de bas niveau sont
opposer aux langages de haut niveau, qui permettent de crer un programme sans tenir
compte de la faon dont fonctionne le matriel de l'ordinateur cens excuter le programme.
A chaque volution, lobjectif est de permettre la meilleure reprsentation informatique
impossible, la plus intuitive possible sur laquelle opre le programme.
De surcrot, il est important de faire la diffrence entre les langages interprts (Python) et
compils (C++). Les programmes interprts ne sont pas directement excuts par
lordinateur mais plutt par un interprteur. Grossirement, linterprteur lit les instructions
du programme et les transforme en instructions destines la machine. Linterprteur est
donc toujours ncessaire pour excuter un programme en langage interprt. Les
programmes crits dans un langage compil doivent subir une phase intermdiaire, la
compilation, lissue de laquelle on obtient un fichier directement excutable par la machine.
La compilation est effectue par un compilateur, qui nest alors plus ncessaire ds que le
fichier excutable a t produit.
Python est un langage orient objet de haut niveau interprt trs rpandu, bnficiant de
nombreuses bibliothques et dune communaut importante de dveloppeurs et
dutilisateurs. Il est rput pour tre facile daccs. Il est notamment trs utilis par les
scientifiques. Pour apprendre bien programmer en Python et bnficier ainsi de toute la
puissance de la programmation oriente objet, je vous conseille linitiation la
programmation avec Python et C++ de Yves Bailly. Dans ce complment de cours, nous
allons prsenter succinctement ce langage afin dutiliser une bibliothque danalyse spatiale
dveloppe en Python.
Python est un langage qui peut tre utilis dans de nombreux contextes et s'adapter tout
type d'utilisation grce des bibliothques spcialises chaque traitement. Il est cependant
particulirement utilis comme langage de script afin dautomatiser des tches simples
mais fastidieuses. Python a t conu pour tre un langage lisible. Il vise tre visuellement
pur. Ainsi, il utilise des mots anglais l o d'autres langages utilisent frquemment de la
ponctuation, et possde galement moins de constructions syntaxiques que de nombreux
langages structurs tels que C, Perl, ou Pascal. Les commentaires sont indiqus par le
caractre croisillon. De plus, les blocs sont identifis par l'indentation (ie. l'ajout de
tabulations ou d'espaces dans un fichier texte), au lieu d'accolades comme en C ou C++ ; ou
de begin ... end comme en Pascal. Une augmentation de l'indentation marque le dbut d'un
bloc et une rduction de l'indentation marque la fin du bloc courant. Ds lors, Python
requiert une rigueur dans lcriture des scripts, cest donc un langage pdagogique obligeant
ne pas coder vulgairement . Ainsi, une ligne correspond une commande et une colonne
correspond un niveau.
tr
>>> b=2
>>> e=a+b
Traceback (most recent call last):
File "<input>", line 1, in <module>
TypeError: cannot concatenate 'str' and 'int' objects
>>> b=str(b)
>>> print(b)
2
>>> e=a+b
>>> print e
tr2
>>> liste=[1,2]
>>> print liste
[1, 2]
>>> liste=liste+[4,5,6]
>>> print liste
[1, 2, 4, 5, 6]
>>> print liste[4]
6
>>> print liste[0]
1
Enfin, les boucles sexcutent de cette manire :
>>> for i in range(3) :
... print i
...
0
1
2
Pour plus dinformations, il existe dexcellentes introductions : http://www.larsen-
b.com/static/intro_python/ ; http://tdc-www.harvard.edu/Python.pdf.
Ici, nous allons nous limiter une application danalyse spatiale. Pour cela, nous allons
utiliser la bibliothque danalyse spatiale Pysal4. Avant dinstaller Pysal, il bien sr avoir
install au pralable une version de Python (http://www.python.org/download/), mais il
faut aussi avoir install les bibliothques Numpy et Scipy5. Tous ces tlchargements (et ces
installations) peuvent paraitre fastidieux. Nanmoins, ils traduisent prcisment la force de
Python qui est un langage disposant de nombreuses bibliothques.
A laide de Pysal, nous allons maintenant chercher dterminer, sil existe une
autocorrlation spatiale concernant les homicides dans la rgion de Saint-Louis (aux tats-
Unis) de 1988 1993. La reprsentation cartographique (classification effectue partir des
seuils naturels de Jenks) semble laisser apparaitre une autocorrlation spatiale positive, mais
ce nest pas si vident (Figure 51).
Pour calculer les indices de Geary et de Moran, il convient simplement de taper le code
suivant :
>>> Import pysal
>>> f = pysal.open(pysal.examples.get_path("stl_hom.dbf"))
>>> y = np.array(f.by_col['HR8893'])
>>> w = pysal.open(pysal.examples.get_path("stl.gal")).read()
4 http://code.google.com/p/pysal/downloads/list
5 http://www.scipy.org/scipylib/download.html
Serge Lhomme Introduction lanalyse spatiale 74
>>> gc = pysal.Geary(y, w)
>>> gc.C
0.59712821589368859
>>> mi = pysal.Moran(y, w)
>>> mi.I
0.24365582621771659
Les indices de Moran et de Geary ont des valeurs positives, il semble donc quil y ait
autocorrlation spatiale .
Par exemple, la diffusion est lie un ensemble dactions pouvant conduire diverses
trajectoires : du succs lchec. Lobjectif est alors de construire des modles capables de
gnrer cette diversit des futurs possibles, rompant ainsi avec une tradition de modlisation
des seuls succs de diffusion. Dans ce contexte, on pose lhypothse quen se situant au
niveau des entits lmentaires, cest--dire au niveau des units dcisionnelles de base, il est
possible de proposer ce type de modle. On postule ainsi que la rptition de processus plus
ou moins labors au niveau individuel a une incidence sur le devenir de la diffusion un
niveau global, la fois dans les taux de propagation, leurs distributions spatiales et la vitesse
de diffusion de linnovation. Il reste alors dcrire les lments qui paraissent jouer un rle
essentiel au niveau local pour rendre compte de possibles observations un niveau global.
Pour prendre un exemple simple, nous allons utiliser Netlogo qui est un logiciel vraiment
simple permettant de dvelopper des systmes agents. Ainsi, nous allons crer des moutons
(un peu idiots) qui se dplacent de manire alatoire et cherchent seulement manger pour
survivre et se reproduire. Nanmoins, plus les moutons sont nombreux, plus ceux-ci
consomment la ressource en herbe, plus celle-ci est difficile trouver. Un systme de
rgulation tend alors faire diminuer le nombre de moutons qui meurent de faim, car dans
leur dplacement alatoire ils ne trouvent plus dherbe pour se nourrir. Si ce processus de
rgulation est trop violent, il peut y avoir extinction de lespce.
Pour cela, il faut ouvrir un nouveau fichier, dans lequel il faut conserver linterface central
dfini par dfaut et y ajouter deux boutons. Un bouton setup qui permettra de crer une
situation initiale et un bouton go qui lancera la simulation. Pour cela, il suffit de
Serge Lhomme Introduction lanalyse spatiale 76
slectionner dans la barre des tches loutil bouton (parfois il se rvle ncessaire de
cliquer sur Add ).
Ds lors, il suffit de positionner les boutons o lon souhaite sur linterface laide dun
simple clic. Une fois positionne, il est possible de les diter car une bote de dialogue souvre
automatiquement (sinon il est possible de faire un clic droit sur le bouton et de cliquer sur
Edit ). Remplissez les deux botes de dialogue de la manire suivante :
Pour que les itrations soient automatiques, cochez la case forever lors de ldition du
bouton go . Les boutons apparaissent en rouge, car ils nimplmentent aucune action.
Pour linitialisation, tapez le code ci-dessous. Premirement, ce code qui nettoie tout, puis
cre cinq turtles , en loccurrence des moutons rouges qui sont rpartis de manire
alatoire dans la grille. Enfin, ce code rempli de vert toutes les cellules (ce qui reprsente
lherbe).
to setup
clear-all
create-turtles 5 [ setxy random-xcor random-ycor set color red ]
ask patches [ set pcolor green ]
reset-ticks
end
Les moutons vont alors se dplacer de manire alatoire chaque itration, ce qui leur coute
de lnergie. Ils vont aussi chercher manger de lherbe, ce qui leur donne de lnergie et
provoque la diminution du stock dherbes disponible (les cellules deviennent noires ds quun
mouton mange de lherbe). Nous obtenons le code suivant.
to move-turtles
ask turtles [
right random 360
forward 1
set energy energy - 1
]
end
to eat-grass
ask turtles [
if pcolor = green [
set pcolor black
set energy energy + 5
]
]
end
A ce rythme-l, la simulation peut tourner linfini car les moutons ne meurent jamais. Il
faut donc programmer leur mort par manque dnergie.
to check-death
ask turtles [
if energy < 0 [ die ]
]
end
Cette fois-ci les moutons meurent vites car la ressource est vite amene manquer. Il faut
donc prvoir un renouvellement de la ressource qui peut se faire de manire plus ou moins
alatoire.
to regrow-grass
ask patches [
if random 100 < 1 [ set pcolor green ]
]
End
Nanmoins, si les moutons peuvent vivre plus longtemps, ils ne capitalisent pas pour autant
sur leur bonne sant, le nombre de moutons ne dpassera donc jamais leur nombre initial.
Serge Lhomme Introduction lanalyse spatiale 78
Nanmoins, comme un mouton bien nourri en vaut deux, il semble ncessaire de prvoir des
naissances. Ainsi, ds quun mouton atteint une nergie de dix, il peut donner naissance un
mouton dnergie 5 et perd en contrepartie 5 points dnergie (car se reproduire est trs
fatigant). On peut alors implmenter la fonction suivante.
to naissance
ask turtles [
if energy > 10 [
set energy energy - 10
hatch 1 [ set energy 5 ]
]
]
end
Pour lancer tous ces codes, il faut crer le code dinteraction avec le bouton go qui va
chaque itration appeler lensemble des fonctions programmes, compter le nombre
ditrations ( tick ) et arrter le programme sil ny a plus de moutons ( if not any? turtles
[ stop ] ). Il faut de plus ne pas oublier de prciser que les moutons ont une variable
energy .
turtles-own [energy]
to go
if not any? turtles [ stop ]
move-turtles
eat-grass
check-death
regrow-grass
naissance
tick
end
Voil, le tour est jou, vous pouvez effectuer vos simulations. Pour aller plus loin, vous
pouvez crer des sliders afin de faire varier la vitesse de repousse de lherbe, le nombre
initial de moutons, la valeur nutritionnelle de lherbe. De mme, vous pouvez crer des
graphiques qui affichent la surface dherbe et le nombre de moutons au cours du temps.
Rfrences
Pumain D., Saint-Julien T., L'analyse spatiale, tome 1 : Les localisations dans l'espace, Armand
Colin, collection Cursus , 2010.
Pumain D., Saint-Julien T., Analyse spatiale, tome.2 : interactions spatiales, Armand Colin,
collection Cursus , 2010.
Ciceri M.F, Marchand B., Rimbert S., Introduction l'analyse de l'espace, Armand Colin,
collection U , 2010.
Caloz R., Collet C., Dumolard P., Analyse spatiale de l'information gographique, Presses
Polytechniques Universitaires Romandes, Science et ingnierie de l'environnement, 2011.
Drogoul A., Treuil J.P., Zucker J.D., Modlisation et simulation base dagents: Exemples
comments, outils informatiques et questions thoriques. Dunod, 2008.
Liens prcieux
Gnraliste
http://www.hypergeo.eu/
http://www.spatial-modelling.info/
http://grasland.script.univ-paris-diderot.fr/
Serge Lhomme Introduction lanalyse spatiale 80
http://www.univ-montp3.fr/ateliermercator/wp-
content/uploads/2010/02/ECUE2_W141TSS1_SPE_M1_0910_analyse_vecteur.pdf
http://piketty.pse.ens.fr/fichiers/semina/lunch/Forse2006.pdf (Schelling)
http://tel.archives-ouvertes.fr/docs/00/44/01/00/PDF/These_Eric_Daude_39-03.pdf
(Hgerstrand)
http://steconomice.uoradea.ro/anale/volume/2008/v1-international-business-and-
european-integration/121.pdf (opimisation)
http://igraph.sourceforge.net/igraphbook/igraphbook-creating.html
http://www-personal.umich.edu/~mejn/netdata/
http://www3.nd.edu/~networks/resources.htm
http://halshs.archives-ouvertes.fr/FMR/
http://groupefmr.hypotheses.org/
http://www.spatial-modelling.info/Application-du-modele-de-Schelling
http://cybergeo.revues.org/22976
http://mtg.labos.univ-rouen.fr/fiches/langloisPDF/SpaCelle%20-
%20%e0%20para%eetre%20dans%20L%27Espace%20G%e9ographique.pdf
http://thema.univ-
fcomte.fr/theoq/pdf/conferences/TQ2005%20CONFERENCE%20DROGOUL.pdf