Analyse Spatiale

Introduction lanalyse spatiale
(Complment de cours)
Serge LHOMME
Introduction historique et pistmologique
La gographie sappuie historiquement, en particulier en France, sur une dmarche dtude

des phnomnes dans leur singularit. Cette dmarche est qualifie didiographique. Ainsi,
la gographie sest dveloppe en sappuyant notamment sur de longues monographies
concernant des territoires dlimits par des caractristiques physiques, culturelles,
historiques ou sociales. Pour la gographie rgionale , cette dmarche est fondamentale.
En effet, la gographie rgionale recherche notamment en quoi chaque combinaison
rgionale est originale. Le postulat central de la gographie rgionale tend mme
considrer chaque rgion tudie comme unique. Tout le savoir gographique est alors mis
au service de cette unicit en vacuant probablement ce qui peut tre le plus fcond : c'est
dire ce qui est commun entre les rgions. La dmarche idiographique tend ainsi sopposer
une gographie gnrale qui tudierait les processus et les phnomnes pris par thme,
classant les phnomnes et cherchant les rgles gnrales qui les rgissent.
Lanalyse spatiale est une dmarche qui, linstar de la gographie gnrale , recherche
les similarits entre les phnomnes et tente dtablir des lois (des rgles). Cette dmarche
est qualifie de nomothtique. En loccurrence, comme son nom lindique, lanalyse spatiale
recherche ou applique des lois spatiales. Ces lois peuvent dans certains cas tre testes afin de
dterminer leur validit. Lanalyse spatiale est donc gnralement prsente comme une
dmarche hypothtico-dductive , puisque les similarits identifies entre les phnomnes
observs peuvent constituer des hypothses de travail aboutissant la formulation de modles
qui seront mis lpreuve. Nanmoins, contrairement aux sciences physiques, les modles
nont pas tous vocation dcrire le comportement rel des systmes tudis, puis tre test
et valid. Ils peuvent plus simplement servir comme modle de comparaison. Pour rsumer,
lanalyse spatiale met en vidence des structures et des formes dorganisation spatiale rcurrentes, que
rsument par exemple les modles centre-priphrie, les champs dinteraction de type gravitaire, les
trames urbaines hirarchises, les divers types de rseaux ou de territoires, etc. Elle analyse des
processus qui sont lorigine de ces structures, travers des concepts comme ceux de distance,
dinteraction, de porte spatiale, de polarisation, de centralit, de stratgie ou choix spatial, de
territorialit... Des lois de la spatialit relient ces formes et ces processus, et sont intgres dans des
thories et des modles du fonctionnement et de lvolution des systmes (Denise Pumain).
Malgr une apparente opposition entre ces deux dmarches, celles-ci ne sont pas
incompatibles. Bien au contraire, elles apparaissent complmentaires. En effet, la dmarche
idiographique ne rcuse pas toute possibilit de gnralisation au nom de lirrductible
unicit des lieux et la dmarche nomothtique nest pas ncessairement rductrice et
oublieuse des spcificits locales. Cest en fait entre ces deux attraits de la gographie, la
recherche de la rgularit dune part et la fascination pour ce que lon ne verra pas deux fois
Serge Lhomme Introduction lanalyse spatiale 2
dautre part, que peut naitre une science ayant son objet, sa place et sa propre contribution
au sein des sciences humaines (Pumain et Saint-Julien, 2010). Cette dichotomie permet
seulement dintroduire, de manire simplifie, la principale particularit de lanalyse spatiale
et la rupture que celle-ci a pu reprsenter.
Trois concepts apparaissent in fine centraux pour dfinir lanalyse spatiale :
Le concept de loi : Une loi est une formule gnrale nonant une relation
constante ou habituelle entre des phnomnes. En gographie humaine, les lois
sont plutt considres comme des rfrences ncessaires aux explications, que
lobjet tudi sy conforme ou quil sen carte. Dans ce cadre, le terme de loi est
souvent considr comme trop fort et remplac par le terme de rgle, ou encore
par celui de rgularit. En effet, les relations observes en gographie humaine
nont pas la prcision des lois physiques. Quoi quil en soit, les lois expriment
lexistence de dterminations, mme si dune part celles-ci ne sont pas connues
ou mesures avec prcision, et si dautre part il entre dans leurs effets une part
plus ou moins grande de hasard et dindtermination. Le terme de loi est aussi
employ pour dsigner des rgles de comportement plutt invariantes dans le
temps et lespace comme la loi du moindre effort nonce par Zipf. Cette loi
montre que le plus court chemin ou la plus grande proximit ont t
souvent privilgis dans la localisation des activits humaines.
Le concept despace : Lespace comme concept gographique, nest pas une

zone, ni un lieu, ni une rgion du monde, ni un territoire . Il se dfinit par la
forme (type et structure des distances , organisation des espacements, valeur
des liens) que prennent les relations entre les lieux, que ce soit pour un
individu, pour un groupe, ou pour une entit gographique. En dehors de ce
positionnement simple, il existe au moins trois manires de penser l'espace en
gographie : lespace absolu ; lespace relatif ; lespace construit (subjectif).
Premirement, lespace peut tre considr comme une ralit absolue. Ainsi,
les conditions go-climatiques sont vues comme stables, les rgions existent en
tant que telle, il y a un espace dfini de la civilisation occidentale et un espace
dfini de la civilisation musulmane Dans un deuxime temps, la ralit
spatiale peut aussi tre considre comme le fruit dun jeu de forces dans le
cadre dun systme, faisant que chaque lment du systme se situe
spatialement en fonction des autres lments. Ainsi, lespace nest plus absolu, il
est relatif et volutif. Enfin, lespace peut tre considr comme une ralit
fluctuante et libre, faisant que les rapports entre les lments ne sont jamais
rellement prdtermins. Dans ce cadre, lespace est une construction
entirement subjective.
Le concept de modle : Lexpression de modle spatial recouvre des

acceptations et des conceptions diffrentes. En effet, si les chercheurs de
diffrents domaines peuvent saccorder sur une dfinition relativement gnrale
de la notion de modle comme reprsentation simplifie de la ralit (dun

processus) en vue de la (le) comprendre et de la (le) faire comprendre , le rfrent
diffre considrablement suivant les disciplines. En gographie, on distinguera
notamment les modles purement thmatiques (gographie urbaine, gographie
des risques) et les modles informatiques (modles de donnes
gographiques, modles agents). De plus, modliser des dynamiques
spatiales peut tre compris de diffrentes faons : rendre compte des
changements de la manire la plus claire possible (logique descriptive) ou
rechercher les causalits derrire la forme et la vitesse des volutions observes
(logique explicative). En outre, les modles dforment la ralit et peuvent
sexprimer dans des langages diffrents. On peut ainsi distinguer les modles
iconiques, les modles mathmatiques et les modles informatiques. Il faut
galement diffrencier les modles statiques, qui sont les reprsentations dun
existant quelconque, et les modles dynamiques, dont le fonctionnement
permet de simuler des processus.
Lanalyse spatiale comme rupture1

Lavnement de la dmarche nomothtique en gographie a pu constituer une vritable
rvolution , puisque la gographie reposait jusqualors sur la dmarche idographique.
Cette rvolution se produisit dans les dcennies 1950, 1960. Ainsi, la volont de rupture tait
telle que les tenants de ce changement paradigmatique nhsitait pas alors parler, pour se
distinguer dune gographie quil qualifiait de classique , de Nouvelle Gographie. Plus
prcisment, ce fut une rvolution essentiellement thorique et quantitative
caractrise par le recours des analogies issues de la physique et lutilisation croissante
doutils mathmatiques relativement nouveaux. Nanmoins, il est important de prciser que
la dmarche nomothtique tait dj prsente dans des travaux antrieurs. Cest pourquoi,
certains modles prsents dans ce complment de cours sont antrieurs cette rvolution.
Cet avnement souleva de nombreux dbats (voire des rticences et des oppositions) qui sont
pour certains toujours dactualit et parfaitement lgitimes. En effet, la dmarche
nomothtique est issue des sciences de la nature, son application dans une discipline qui
relve des sciences humaines et sociales soulve donc des questions pistmologiques qui ne
sont pas triviales.
Cet avnement fut initi par des gographes travaillant aux Etats-Unis, puis sest diffus en
Europe, notamment en Grande-Bretagne, en Sude et en Allemagne. Louvrage de William
Bunge en 1962, Theoritical geography, posa les fondations thoriques dune discipline de
lespace, dlimita les objets et offrit les outils. David Harvey effectua quant lui une
importante rflexion pistmologique. Enfin, le manuel de Peter Haggett, Locational analysis,
en proposant une histoire, une grammaire formelle de l'espace, finit d'tablir la normalit
1Cette partie, comme la partie suivante, reprend et modifie quelque peu certaines parties introductives de la
thse de Thomas Louail. En effet, ces premires parties constituent une bonne introduction (simplifie)
concernant lavnement de lanalyse spatiale en gographie et prsentent cursivement son cadre danalyse.
de ces nouvelles pratiques, qu'il fallait dsormais traiter comme une branche part entire de
la gographie.
Parmi les sujets qui ont t les plus mobiliss au dbut de cette rvolution scientifique
figurent les transports et la ville. Ainsi, Edward Ullman, l'un des initiateurs du mouvement,
qui a propos au dbut des annes 1950 que la gographie soit reconnue comme la science
de l'interaction spatiale , a travaill sur la gographie urbaine et sur la gographie de la
circulation. Avec le gographe allemand Walter Christaller, Ullman a conu une thorie de
la ville comme lieu central et a encourag le dveloppement de la modlisation. Le
symposium international de gographie urbaine de Lund en 1960 a marqu la conscration
internationale de cette approche thorique et quantifie de la ville.
En France, les annes 1970 vont tre dterminantes. Ainsi, la gographie francophone
europenne a connu au dbut des annes 1970 des bouleversements majeurs et la
rvolution thorique et quantitative en fait partie. Plusieurs lments ont permis
lmergence de ce mouvement scientifique. Le dveloppement de linformatique et le retour
de gographes doutre-Atlantique ont favoris lmancipation de jeunes gographes vis--vis
dune cole de gographie quils voulaient dpasser. Cela leur a permis de penser et de
pratiquer la gographie dune autre manire. Des gographes ont alors pris connaissance par
diffrents moyens (invits trangers, lectures, traductions) de nouvelles mthodes anglo-
amricaines, notamment statistiques, susceptibles de renouveler les tudes gographiques,
ainsi que de nouvelles thories, venant par exemple de la physique et permettant de repenser
ltude de lorganisation de lespace. A noter quen 1970 se sont droules les Journes
Gographiques dAix-en-Provence et Bernard Marchand, de retour des Etats-Unis, y a
prsent des mthodes statistiques innovantes. Plus encore, le premier colloque sur
lapplication des mthodes mathmatiques la Gographie sest droul Besanon,
inaugurant une srie de colloques dans cette mme ville et prfigurant les Rencontres
actuelles de Theo-Quant.
Lanalyse spatiale comme dmarche institue et formalise

A lheure o diffrentes pressions sexercent afin que les recherches acadmiques soient de
plus en plus oprationnelles, lanalyse spatiale apparat comme lune des approches les plus
dynamiques en gographie. Ainsi, bnficiant notamment des dveloppements de
linformatique, les innovations y sont nombreuses. Dans le mme temps, les formations
proposant des cours danalyse spatiale sont en augmentation, et ce notamment dans des
masters professionnalisant. Or, comme les fondements de lanalyse spatiale se veulent
thoriques , cette situation peut paratre surprenante. Nanmoins, le caractre
simplificateur de certains modles et leur ventuel pouvoir prdictif permettent
de rpondre certains besoins oprationnels clairement identifis : en matire de prospective
territoriale (amnagement des territoires), danalyse de risques, de gomarketing Comme
le souligne le gographe amricain Richard Peet, le dveloppement de la gographie
quantitative est intimement li des intrts industriels et commerciaux .
De surcrot, les spatialistes apparaissent comme des acteurs privilgis pour faire
communiquer les sciences dures et les sciences humaines et sociales , au moment o
de nombreux laboratoires et de nombreux projets de recherche se veulent
transdisciplinaires. En effet, modliser des phnomnes et des processus spatiaux implique le
plus souvent de combiner des savoirs et des comptences relatifs des domaines divers, les
uns lis la thmatique de recherche (gnralement issus des sciences humaines et sociales),
les autres issus de linformatique, des statistiques, de la physique ou des mathmatiques (i.e.
des sciences dures). Ces dernires disciplines ouvrent dailleurs des perspectives
mthodologiques stimulantes pour les thoriciens sintressant lorganisation de lespace et
lvolution des structures. En matire de formation, ce domaine mi-chemin entre les
sciences dures et les sciences humaines et sociales permet aux tudiants, qui sen donnent les
moyens, dacqurir un profil intressant et recherch par des entreprises commerciales, des
bureaux dtudes ou des collectivits territoriales.
Dun point de vue mthodologique, les premiers travaux danalyse spatiale furent fragments
et ne reposrent pas sur un cadre thorique bien formalis. Ce cadre a merg
progressivement. Dailleurs, certains gographes ont toujours du mal apprhender ce
quest lanalyse spatiale et contestent cette dnomination. Pourtant, lanalyse spatiale est
dsormais une dmarche institue et formalise reposant par exemple sur un cadre danalyse
comportant trois tapes :
1) Cartographier le phnomne : La premire tape consiste choisir les observables et

dcrire le systme au moyen de ces observables. Ce choix se fait en fonction de la
question pose. A cette tape, il ne s'agit pas encore de relier les observables dans des
formules, mais uniquement de simplifier le systme en vue de le reprsenter en y faisant
apparatre ces observables. Cette premire tape de reprsentation peut simplement
revenir cartographier le phnomne observ laide les observables. Pour cela, il est
gnralement ncessaire doprer une opration de collecte de linformation spatiale,
puis de quantifier les observables et doprer des classifications. On est alors dans une
analyse descriptive assez simple des phnomnes. Nanmoins, cette premire tape nest
pas neutre. En effet, les choix effectus lors de cette tape conditionnent les tapes
suivantes et expliquent en partie les limites de lanalyse mene.
2) La formulation mathmatique et statique du phnomne : La recherche de

gnralisations (de lois spatiales) conduit inscrire de multiples configurations
observes dans un schma gnrique. Plus ce schma capture des configurations
existantes plus celui-ci est puissant. Cette tape consiste ds lors relier entre elles les
observables afin de dcrire le systme laide de formules mathmatiques. Ces modles
sont dits phnomnologiques . En effet, les modles produits lors de cette tape sont
des modles thoriques et descriptifs qui sont essentiellement statiques. Ces modles
nont pas de valeurs explicatives. Ainsi, leur but est de comprimer les observations dans
une ou plusieurs formules qui doivent permettre de reproduire les donnes, mais aussi
de les prvoir sans passer par l'observation directe.
3) La formulation dynamique du phnomne : Lambition des modles produits lors de

cette tape est de comprendre la mcanique des phnomnes dans le temps, de les
reconstruire en les simulant. Les modles produits correspondent par exemple aux
modles qui cherchent reconstruire des villes virtuelles qui prsenteront des
caractristiques structurelles semblables celles observes dans la ralit, ou
interpoler ou extrapoler le dveloppement de villes relles.
La grille danalyse prsente ci-dessus nest quun exemple, il en existe dautres. De plus,
celle-ci nest pas rigide. Ainsi, il nest pas obligatoire de raliser les trois tapes dcrites
pour faire de lanalyse spatiale. Si la premire tape est incontournable, il est tout fait
envisageable de sarrter la deuxime tape. Lanalyse reste alors phnomnologique et
statique. Enfin, il est possible de dpasser cette grille en ajoutant une quatrime tape. Les
modles de cette quatrime tape pourront par exemple tenter dapprhender les aspects
multi-niveaux.
Des modles, des lois et des thories
Aprs avoir dfini de manire cursive lanalyse spatiale, il convient daller plus avant. Pour
cela, deux approches sont possibles. La premire approche consiste prsenter lanalyse
spatiale en sappuyant sur ses concepts principaux (les concepts despace, de lieu,
dinteraction, de rseau). La deuxime approche consiste se focaliser sur les modles, les
lois et les thories rentrant dans le cadre de lanalyse spatiale. Nous allons privilgier la
deuxime approche. En effet, la premire approche a dj fait lobjet de nombreux ouvrages
(Bavoux, Pumain et Saint-Julien), il convient donc de ne pas refaire ce qui a dj t trs bien
fait. De plus, si thoriquement la premire approche est plus didactique, paradoxalement je
trouve quelle masque aux tudiants les principaux rsultats de lanalyse spatiale et par
consquent son utilit. Or, pour des tudiants qui peuvent ne pas tre motivs par une
discipline qui a recours aux mathmatiques, linformatique et la physique, il convient
selon moi den montrer la porte. Pour cela, la deuxime approche est selon moi la meilleure.
Nous nallons donc pas disserter ici sur les concepts despace, de lieu, dinteraction ou de
rseau, bien que ceux-ci soient prsents sous diffrentes formes tout au long de ce
complment de cours. Nous allons plutt nous focaliser sur les modles, les lois voire les
thories de lanalyse spatiale. Plus prcisment, ces diffrents modles vont tre
prsents au sein de familles qui tentent de les positionner simplement dans un contexte plus
gnral. Ces familles sont arbitraires et ne doivent pas tre considres comme arrtes. Les
principaux modles historiques seront prsents dans ce cadre.
Les modles hirarchiques : de la loi rang-taille la thorie des lieux centraux
De nombreux chercheurs, appartenant des domaines diffrents, ont t tonns par les
formes de certaines distributions comme celles des richesses, des populations ou des villes.
En effet, ces rpartitions mettent en exergue certaines ingalits bien rsumes par le
rapport 80/20 de Vilfredo Pareto. Ainsi, Vilfredo Pareto demeure clbre pour avoir
constat que 20% de la population italienne possdait 80% des richesses du pays.
Inversement, 80% de la population italienne ne concentre que 20% des richesses. Mme si
lon ne retrouve pas toujours ces mmes rapports dans toutes les distributions (par exemple
seulement 2% de la population mondiale concentrait 50% des richesses en 2006), cette
proprit particulire de certaines distributions ingalitaires est connue sous le terme de
principe de Pareto . En effet, ces diffrentes formes dingalit peuvent tre rsumes par
des fonctions mathmatiques du mme type. On parle dsormais de distribution de
Pareto . Par extension, on appelle aussi diagramme de Pareto un type d'histogramme o les
classes sont reprsentes par ordre dcroissant de frquence. Ce diagramme permet
notamment de mettre en vidence les classes les plus importantes. En gographie, on se
concentrera par exemple sur la rpartition des populations au sein de territoires comme les
villes. On parle ds lors de hirarchie urbaine. Il faut souligner ici que le concept de
hirarchie ne signifie pas toujours une hirarchie de pouvoir qui ferait que les objets dun
niveau dpendraient politiquement ou administrativement du niveau suprieur. Le concept
de hirarchie met plutt en exergue les ingalits flagrantes existant entre les lieux.
Dans cette partie, deux exemples de modle hirarchique seront prsents. Il sagit de deux
grands classiques de lanalyse spatiale. Premirement, la loi rang-taille, parfois nomme
loi de Zipf, sera prsente. Ce premier modle est assez simple appliquer et constitue donc
une bonne introduction aux modles danalyse spatiale. En loccurrence, la loi rang-taille
permettra danalyser la hirarchie des villes. Le deuxime modle se prsente comme une
thorie : la thorie des lieux centraux. Cette thorie est plus complexe mettre en uvre, car
elle requiert de nombreuses comptences. Celle-ci ne fera donc pas lobjet dune application
dans ce complment de cours. Il sera davantage question de critiquer cette thorie. En effet,
cette thorie constitue un bon exemple illustrant les limites et les critiques auxquelles sont
confrontes beaucoup de modles danalyse spatiale.
La loi rang-taille (loi de zipf)
La loi rang-taille des villes permet de caractriser en partie la hirarchie des villes dans
un systme urbain. Ce sont les travaux pionniers de Auerbach (1913), de Goodrich (1926) et
de Singer (1936) qui ont mis en vidence, pour la premire fois, l'existence d'un phnomne
rang-taille des villes. Ces travaux ont t suivis par ceux de Lotka (1941) et de Zipf
(1949). Le nom de ce dernier fut associ une loi statistique selon laquelle la taille des
grandes villes dun systme urbain est proportionnelle leur rang (cest--dire au
classement par ordre dcroissant des tailles des grandes villes). Dans les faits, la loi de Zipf
est plus souvent prsente comme une observation empirique concernant la frquence des
mots dans un texte. Elle a pris le nom de son auteur, George Kingsley Zipf (1902-1950), qui
par un exemple incongru contribua populariser cette distribution. La lgende raconte que
Zipf entreprit d'analyser une uvre monumentale de James Joyce, Ulysse, d'en compter les
mots distincts, et de les prsenter par ordre dcroissant du nombre d'occurrences. La
lgende dit alors que :
le mot le plus courant revenait 8 000 fois ;

le dixime mot 800 fois (8000/10) ;
le centime 80 fois (8000/100) ;
et le millime 8 fois (8000/1000).
Ces rsultats semblent un peu trop prcis pour tre parfaitement exacts. Reste que la loi de
Zipf prvoit que dans un texte donn, la frquence d'occurrences f(n) d'un mot est lie son
rang n (dans l'ordre des frquences dapparitions) par une loi de la forme [1] o K est une
constante :
( ) [1]
Cette loi est observe au sein de nombreux systmes. Ainsi, cette loi peut tre observe au
sein de certains systmes urbains. Par exemple, la hirarchie des villes fut tudie l'aide de
la relation entre le chiffre de sa population et son rang, en dcidant que plus une ville est
peuple plus son rang dans la hirarchie est lev (Tableau 1). Sur les graphiques qui
reprsentaient le lien discontinu qui stablit entre la population de chaque ville (axe vertical
: ordonne) et son rang (axe horizontal : abscisse) lchelle arithmtique fut remplace par
une chelle logarithmique sur un ou les deux axes (Figure 1). On obtint ds lors une
distribution semblant suivre une droite plus ou moins incline : on parle de loi rang-taille
(Figure 1).
Rang de la ville Population

1 50 400
2 50 400 / 2 = 25 200
3 50 400 / 3 = 16 800
4 50 400 / 4 = 12 600
5 50 400 / 5 = 10 080
10 50 400 /10 = 5 040
20 50 400 / 20 = 2 520
Tableau 1 : Traduction simple de loi de Zipf, dtermine partir de la population de la ville
principale (de rang 1 = 50 400 ou K = 50 400).
Figure 1 : Graphiques reprsentant en ordonne les populations (en loccurrence le

logarithme droite) et le rang des villes en abscisse (en loccurrence le logarithme droite).
Daprs George Kingsley Zipf, la loi rang-taille a pour principe le moindre effort , qui
en termes simples [] signifie, [], qu'une personne rsout ses problmes immdiats en fonction de
ses problmes futurs [en sefforant] de minimiser dans le temps [] sa dpense de travail . Dans
les faits, la loi de Zipf, linstar de la loi de Pareto, est une loi qui illustre le caractre
ingalitaire des hirarchies au sein des systmes. Ainsi, selon ces lois, il existe peu de
grandes villes et beaucoup de petites villes. De mme, dans le monde, il y a beaucoup de
pauvres pour peu de riches. Quoi quil en soit, pour retrouver la loi de Zipf de manire
rcurrente, il faut la gnraliser [2]. est alors le coefficient de Pareto, dont il est
intressant dtudier les variations en fonction des systmes tudis et du temps. Cette loi de
puissance traduit un effet dagglomration, dingalit. Cest Mandelbrot que lon doit la
dernire gnralisation de cette loi, appele loi de Mandelbrot [3].
( ) [2]
( ) [3]
( )
La loi rang-taille est devenue une des lois fondamentales de la gographie urbaine.
Historiquement, dans un bref article de quatre pages, Auerbach (1913) fit tout dabord
remarquer la constance singulire de la valeur du produit de la population dune ville par son
rang au sein dun systme urbain donn. Ainsi, la population de la deuxime plus grande
ville reprsente peu prs la moiti de la population de la premire, celle de la troisime ville
reprsente un tiers de la premire et, de faon plus gnrale, la population de la ville de rang
n correspond une proportion 1/n de la population de la plus grande ville. Auerbach tablit,
ds lors, un premier modle rang-taille o le nombre des villes est en relation inverse avec
leur poids dmographique.
Durant la premire moiti du XXme sicle, hormis une tude comparative de Singer (1936)
sur la distribution des villes dans sept pays, le modle rang-taille reste la marge des
constructions en conomie spatiale. Il faut attendre les travaux de Zipf et surtout leur
reformulation par Simon (1955), Beckmann (1958) et Berry (1961) pour que la loi rang-taille
apparaisse comme une contrainte de comportement des masses (Isard, 1960) dont la
rgularit dans le temps exige une interprtation thorique de lorganisation des systmes
urbains. Dsormais, de nombreux chercheurs ont test la validit de la loi de Zipf sur la
distribution rang-taille des villes au sein de diffrents systmes urbains (Tableau 2).
Lexemple de la France est intressant. En effet, lanalyse de la hirarchisation du systme

urbain franais souligne le poids crasant de Paris. Ainsi, si lon compare les populations des
villes franaises les plus peuples aux rsultats obtenus par un modle simple de la loi rang-
taille (=1) et en se fondant sur la population parisienne (K = 10 587 309), on obtient de
mauvais rsultats, puisque les populations thoriques surestiment largement les populations
relles des autres villes franaises (Tableau 3). Cette analyse vient conforter limage dun
pays centralis o les pouvoirs politiques et conomiques se concentrent Paris,
contrairement des tats fdraux comme les Etats-Unis ou lAllemagne. Dailleurs, les
rsultats obtenus laide de la mme dmarche avec les villes amricaines sont apparemment
en conformit avec ce que lon pouvait attendre (Tableau 4), puisque les rsultats du modle
apparaissent meilleurs pour les villes amricaines. Lingalit concernant la rpartition de la
population au sein des villes franaises est donc bien relle.
Nanmoins, il ne faudrait pas conclure de lexemple prcdent que la loi rang-taille ne

sapplique pas aux villes franaises. Dans les faits, la loi rang-taille gnralise rend plutt
bien compte de la hirarchisation du systme urbain franais (Figure 2). Pour le vrifier,
vous pouvez tlcharger les donnes issues de lINSEE ou les rcuprer sur Wikipedia.
Ensuite, il faut mettre ces tableaux en forme sous Excel, puis transformer les valeurs des
rangs et des populations en utilisant la fonction log. Enfin, il suffit de reprsenter les
donnes sous la forme dun nuage de points avec le log de la population en ordonne et le log
des rangs en abscisse, puis dafficher une courbe de tendance avec ses valeurs (Figure 2).
Auteur Nombre de pays Dates Coefficient
7 pays (villes > 2000

Singer (1936) Dbut XXme sicle 1.15
hab.)
Rosen et Resnick 78 pays (au moins 30
1970 1.13
(1980) villes par pays)
Brakman et al.
Allemagne 42 villes 1990 1.13
(1999)
Plusieurs dates entre
Rey et Y (2006) USA (160 villes) [0.8 ; 0.9]
1960 et 2000
Tableau 2 : Quelques exemples dapplication de la loi rang-taille (Schaffar, 2009).
Rang Ville Population Population thorique Ecart

1 Paris 10 587 309 10 587 309 -
2 Lyon 1 572 540 5 293 654 + 237%
3 Marseille Aix 1 368 138 3 529 103 + 158%
4 Lille-T-Roubaix 1 106 091 2 646 827 + 139%
5 Bordeaux 870 529 2 117 462 + 143%
6 Toulouse 862 701 1 764 551 + 105%
7 Nantes 640 805 1 512 472 + 136%
8 Nice 558 213 1 323 413 + 137%
9 Strasbourg 543 716 1 176 368 + 116%
10 Grenoble 502 264 1 058 731 + 111%
15 Nancy 401 177 705 820 + 76%
19 013 483 31 715 710 + 67%
Tableau 3 : Application de la loi rang taille aux villes franaises avec = 1 et en se fondant
sur la population parisienne. Ainsi f(n) = 10 587 309 / n.
Rang Ville Population Population thorique Ecart

1 New York 8 175 133 8 175 133 -
2 Los Angeles 3 743 995 4 087 566 + 9%
3 Chicago 2 707 120 2 725 044 + 1%
4 Houston 2 099 451 2 043 783 - 3%
5 Philadelphie 1 556 396 1 635 026 + 5%
6 Phnix 1 445 632 1 362 522 - 6%
7 San Antonio 1 296 682 1 167 876 - 9%
8 San Diego 1 256 951 1 021 891 - 18%
9 Dallas 1 232 940 908 348 - 26%
10 San Jos 945 942 817 513 - 13%
15 Detroit 713 777 545 008 - 23%
25 174 019 24 489 713 - 3%
Tableau 4 : Application de la loi rang taille aux villes amricaines avec = 1 et en se

fondant sur la population new-yorkaise. Ainsi f(n) = 8 175 133 / n.
On constate alors que la droite obtenue sapproche bien des valeurs relles. Ainsi, avec un R
de 0,98 les rsultats peuvent tre jugs satisfaisants. Seules les valeurs de Paris et de Lyon
semblent sloigner de cette droite, soulignant, une fois de plus, le poids excessif de la rgion
parisienne. Lapplication de cette mthode aux villes amricaines montre que la loi rang-
taille sapplique aussi bien la France quaux Etats-Unis (les valeurs de R sont trs
proches). Enfin, le coefficient plac devant le x (sapparentant loppos du coefficient de
Pareto) indique le caractre plus ingalitaire de la rpartition de la population au sein du
systme urbain franais quau sein du systme urbain amricain.
7,5
6,5
6 y = -1,0059x + 6,7657
R = 0,9802
5,5
4,5
4
0 0,5 1 1,5 2
Figure 2 : Application de la loi rang-taille aux cents premires agglomrations franaises

(population 2010). Log de la population en ordonne et Log du rang en abscisse.
6,5
6
y = -0,7311x + 6,769
R = 0,9863
5,5
5
0 0,5 1 1,5 2
Figure 3 : Application de la loi rang-taille aux cents premires agglomrations amricaine

(population 2010). Log de la population en ordonne et Log du rang en abscisse.
Pour conclure avec la loi rang-taille, il est possible dajouter que lon peut la retrouver au
sein de systmes urbains comme les rgions, comme cest le cas pour les rgions franaises.
La thorie des lieux centraux
La thorie des lieux centraux est plus complexe manipuler et apprhender que la loi
rang-taille. Cette thorie a t conue, principalement par W. Christaller et A. Lsch, pour
expliquer la taille, le nombre des villes et leur espacement dans un territoire donn. Elle
sappuie sur une dfinition de la ville qui en fait essentiellement un centre de distribution de
biens et de services pour une population disperse, et sur des principes doptimisation (qui
tiennent compte des cots de transport). Pour W. Christaller, limportance dune ville est
lie celle de la clientle priphrique qui elle procure un certain nombre de biens et de
services. Cette clientle nest pas extensible linfini car le cot de transport sajoute celui
du bien et du service, et comme il augmente avec la distance, le cot du dplacement devient
dissuasif compar lattrait du produit. On appelle alors porte dun bien ou dun service
la distance maximale que la clientle est prte parcourir pour se le procurer. Si seul
comptait lintrt du consommateur, la porte serait faible et loffre de services trs
disperse. Mais cette offre ne peut tre rentable que si des conomies dchelle sont possibles,
et donc si le service nest offert que lorsque existe un certain volume de clientle satisfaire.
Les deux principaux postulats de la thorie des lieux centraux sont les suivants :
Les biens qui ont des portes comparables se regroupent dans les mmes
centres (ce qui implique des conomies dchelle et des conomies
dagglomration pour les producteurs comme pour les consommateurs) ;
Les centres de niveau suprieur offrent tous les biens et services offerts par les
centres de niveau infrieur.
Combins des hypothses simplificatrices concernant lespace gographique, ces postulats

donnent une disposition prvisible des centres de diffrents niveaux dans lespace
gographique. Ainsi, si la population est rpartie de manire uniforme avec le mme pouvoir
dachat, si les conditions de circulation sont partout identiques et si laccs au march est
parfaitement libre, alors les lieux centraux peuvent tre disposs selon des figures
gomtriques relativement simples (Figure 4). En se fondant sur ces hypothses
simplificatrices, W. Christaller imagina trois principes dterminant trois types de
configuration spatiale des centres :
Selon le principe de march, qui est aussi un principe dquit spatiale, le

nombre de centres est maximis. Les consommateurs ont alors des chances
daccs au centre qui sont les moins ingales possibles. Cest le cas lorsque les
centres sont disposs au centre de triangles quilatraux, la clientle de chaque
centre de niveau infrieur se partageant galement entre trois centres de
niveau suprieur (Figure 4 gauche) : le rapport K=3 reprsente ainsi le facteur
multiplicatif entre le volume de clientle dun centre de niveau suprieur et
celui dun centre de niveau immdiatement infrieur ; le rapport entre les
rayons de deux hexagones successifs est de 3.
Le principe de transport correspond la volont de rduire la longueur des
infrastructures ncessaires la desserte des centres que le schma triangulaire
tend allonger. En les dplaant, pour les situer au milieu des cts des
hexagones (Figure 4 centre), on dtriore lgrement lgalit daccs des
clients aux centres, mais on amliore lgalit du transport dans le systme. Le
rapport entre le volume de clientle dun centre et celui dun centre de niveau
infrieur est alors de K=4.
Selon le principe dadministration, la clientle dun centre ne peut pas se
partager entre des centres concurrents. La clientle est au contraire incluse en
totalit dans une circonscription. De nombreux systmes urbains stant
constitus en incluant ce principe administratif dattribution exclusif, W.
Christaller imagine un systme spatial o les hexagones sont embots en
totalit dans lhexagone de niveau suprieur (Figure 4 droite), ce qui donne une
hirarchie des centres avec un rapport K = 7.
Figure 4 : Les reprsentations gomtriques des trois principes de la thorie des lieux
centraux. De la gauche vers la droite : K = 3, K = 4 et K = 7.
A partir de ces formes gomtriques, W. Christaller dtermine aussi quels pourraient

tre le nombre et lespacement des centres dans chacune de ces hirarchies thoriques
(Tableau 5).
Niveau K=3 K=4 K=7

A 1 1 1
B 2 3 6
C 6 12 42
D 18 48 294
E 54 172 2058
F 162 698 14406
Tableau 5 : Le nombre et lespacement des centres dans chacune des hirarchies thoriques
Les critiques concernant la thorie des lieux centraux sont nombreuses. En effet, cette
thorie concentre presque la totalit des critiques quil est possible dmettre au sujet des
modles danalyse spatiale. La principale critique concerne laspect minemment utopique de
cette thorie, puisque les formes gomtriques produites par ce modle semblent peu
reprsentatives de la ralit des systmes urbains. Nanmoins, on ne saurait rcuser la
thorie des lieux centraux au nom de la seule irralit des modles gomtriques quelle
permet de prvoir. A linstar de la loi rang-taille, peu importe que les modles danalyse
spatiale reprsentent la ralit et peu importe que ceux-ci soient universels . Ces modles
idaux ( thoriques , utopiques ) permettent avant tout de caractriser certains
phnomnes. Si le modle de W. Christaller ne semble pas reprsentatif de la ralit, cest
quil souligne tout simplement le caractre anisotrope des espaces gographiques.
Compte tenu des nombreuses contraintes physiques, culturelles et politiques, il nest pas
possible de trouver une telle rgularit dans lespacement des villes (comme cela se pourrait
dans un milieu isotrope). Dans les faits, lhypothse duniformit do se dduisent les
rapports fondamentaux de dimension et despacement entre lieux centraux peut difficilement
tre retenue dans la mesure o elle contredit, du moins certaines chelles, lhtrognit
de la rpartition spatiale du peuplement lie lexistence mme des centres. Cest bien plus la
situation dans un espace daccessibilit qui dtermine la hirarchie des centres en milieu
urbain que leur position en termes de distances physiques.
Les modles de flux : du modle gravitaire au modle de Huff
Le gographe Peter Hagett commenait son ouvrage sur lanalyse spatiale en Gographie
humaine publi en 1967 par la notion de mouvement. En effet, ce sont les dplacements entre
des lieux diffrents qui construisent lespace gographique. Pour caractriser ces
mouvements, on fait appel la notion de flux. Plus prcisment, on appelle flux ,
lcoulement, le transfert dune certaine quantit de personnes, de vhicules, dinformations,
de marchandises transports par un moyen de communication. Lanalyse des flux en analyse
spatiale est donc centrale. Il nest donc pas tonnant que des modles de flux aient merg.
Ces modles peuvent aussi tre prsents comme des modles dattraction. Deux de ces
modles seront prsents dans ce complment de cours. Le premier modle est le modle
gravitaire qui permet de prsenter un modle danalyse spatiale issu dune analogie avec la
physique. Le second est le modle de Huff qui dcoule directement du modle gravitaire. Ce
modle trouve des applications en gomarketing et permet dillustrer les potentialits
oprationnelles offertes par certains modles danalyse spatiale.
Le modle gravitaire
Le modle gravitaire est destin formaliser, tudier, reproduire et prvoir les

interactions. En effet, la rpartition des interactions dans un ensemble de lieux dpend de
leur configuration, cest--dire des forces dattraction et des difficults de communications
entre chaque lieu. Le modle gravitaire a t formul par analogie avec la loi de la
gravitation universelle de Newton : deux corps sattirent en raison directe de leur masse et
en raison inverse de la distance qui les spare. De mme, dans un espace de circulation
relativement homogne, les changes entre deux rgions ou deux villes seront dautant plus
importants que le poids des villes ou des rgions est grand et dautant plus faibles quelles
seront loignes. Dans les faits, comme ont pu lcrire R. Brunet et O. Dollfus, tout se passe
"comme si" tout lieu dans l'espace gographique exerait sur les autres une attraction en fonction
directe de sa masse et en fonction inverse de la distance qui les spare de lui . Ainsi le flux Fij entre
deux zones i et j est directement proportionnel au produit des masses P i et Pj de chaque zone
et inversement proportionnel la distance dij qui les spare [4], cette distance jouant un rle
plus ou moins important en fonction dune valeur n (n=2 dans la loi de la gravitation
universelle de Newton). Enfin, k est une constante dtermine lors de lajustement du
modle.
[4]
Le modle gravitaire rsume bien lessentiel des mouvements qui se produisent dans un
milieu o la mobilit et laccessibilit sont relativement homognes. Il prdit par exemple
assez bien lampleur des flux de dplacements domicile-travail dans un bassin demploi
urbain, partir de la rpartition des zones de rsidence et des zones demploi. De plus, le
modle gravitaire est trs employ pour analyser les flux de migration et pour dlimiter les
zones de chalandise en marketing (loi de Reilly). Cette formulation simple a t amliore
pour rendre le modle oprationnel, en particulier grce aux travaux dA. Wilson. Des
expressions plus raffines du modle sont aussi utilises pour la prvision des besoins en
infrastructures de transport. Enfin, sous diverses formes, la formulation gravitaire de
linteraction spatiale est reprise dans de trs nombreux modles plus complexes. Voir ci-
dessous des exemples de gnralisation du modle :
( )
: modle gravitaire exponentiel [5]
( )
: modle entropique de Wilson [6]
( )
: modle additif de Tobler [7]
Pour donner un exemple dapplication du modle gravitaire, nous allons utiliser les lments
de cours diffuss par Claude Grasland. Lobjectif est de reproduire les migrations au sein de
la Tchcoslovaquie. Pour ce calcul, deux sources de donnes sont utilises : les populations
des rgions de Tchcoslovaquie (Tableau 6) ; les migrations de population entre les rgions
(Tableau 7).
I Code Rgion Rpublique Population

1 BC Bohme-Centre Tchque 2 333 670
2 BS Bohme-Sud Tchque 698 568
3 BO Bohme-Ouest Tchque 869 445
4 BN Bohme-Nord Tchque 1 190 781
5 BE Bohme-Est Tchque 1 239 979
6 MS Moravie-Sud Tchque 2 058 234
7 MN Moravie-Nord Tchque 1 971 580
8 SO Slovaquie-Ouest Slovaque 2 164 548
9 SC Slovaquie-Centre Slovaque 1 611 930
10 SE Slovaquie-Est Slovaque 1 499 708
Tchcoslovaquie 15638443
Tableau 6 : Population des rgions de Tchcoslovaquie en 1989.
BC BS BO BN BE MS MN SO SC SE Total
BC 2096 1792 3025 2411 1110 793 395 284 282 12188
BS 2420 756 543 360 853 348 153 91 106 5630
BO 2635 1081 1312 399 553 369 213 211 146 6919
BN 4120 1073 1542 1406 648 535 220 183 292 10019
BE 3530 610 471 1275 1210 781 211 141 122 8351
MS 2187 1337 669 702 1267 2643 707 338 239 10089
MN 1852 593 662 682 1017 3143 599 623 370 9541
SO 668 177 249 225 226 737 559 3126 732 6699
SC 524 168 266 251 188 396 801 3839 1229 7662
SE 769 206 292 534 302 444 689 1567 1487 6290
Total 18705 7341 6699 8549 7576 9094 7518 7904 6484 3518 83388
Tableau 7 : Migrations inter-rgionales de population en Tchcoslovaquie en 1989. (de : en
ligne ; : en colonne).
Dans ce calcul, la population des rgions est utilise pour dterminer les valeurs
quantitatives de leur poids. Lhypothse est donc que plus une rgion une population
leve, plus celle attire les habitants des autres rgions et plus le nombre de personnes
pouvant la quitter est leve. En utilisant les distances entre les centres de gravit des
rgions, on peut dterminer les valeurs des coefficients du modle gravitaire afin de
minimiser les carts entre les flux rels et les flux estims par le modle [8]2.
( ) ( )
[8]
On dduit partir de lquation prcdente les flux thoriques F*ij qui devraient tre
observs si les flux ne dpendaient que de la population des rgions et de la distance qui les
spare avec une prcision satisfaisante (r = 57%) (Tableau 8). Cette application fait
apparaitre une des proprits majeures de cette loi. Les flux thoriques obtenus sont
symtriques F*ij = F*ji. Or, bien souvent, comme le montre les valeurs relles, ces flux sont
dissymtriques. Cet exemple montre une des principales limites de ce modle pour le calcul
de flux. Nanmoins, les rsultats obtenus avec ce modle sont meilleurs que ceux obtenus
avec un modle qui ne tient pas compte des distances (Fj = k Pi Pj).
Dans un deuxime temps, on peut calculer la matrice des rsidus du modle d'interaction
spatiale en effectuant la diffrence entre les flux observs et les flux thoriques : Rij = Fij -
F*ij (Tableau 9). Enfin, l'analyse des marges de la matrice des rsidus permet de reprer les
rgions qui ont globalement reu ou envoys plus (ou moins) de migrants que ce que laissait
prvoir le modle. On peut en dduire des coefficients de mobilit rsiduelle ou d'attractivit
rsiduelle (Tableau 10).
On laura compris, le modle gravitaire ne sert pas uniquement prvoir ou reproduire des
flux entre des lieux. Ce modle peut dailleurs se rvler assez imprcis dans ce contexte. Il
permet aussi de souligner certaines anormalits : mission et rception trs leves ou
trs faibles lorsquon tient compte de limportance des lieux et des distances entre ces lieux.
F*ij BC BS BO BN BE MS MN SO SC SE Total
BC 1389 1498 3548 2344 1874 1279 944 560 347 13782
BS 1389 366 352 413 668 355 345 179 106 4172
BO 1498 366 662 335 407 290 260 154 102 4075
BN 3548 352 662 806 649 529 378 241 159 7327
BE 2344 413 335 806 1725 1396 673 422 243 8357
MS 1874 668 407 649 1725 3250 2479 1120 512 12685
MN 1279 355 290 529 1396 3250 1840 1450 646 11034
SO 944 345 260 378 673 2479 1840 2415 778 10112
SC 560 179 154 241 422 1120 1450 2415 1205 7747
SE 347 106 102 159 243 512 646 778 1205 4097
Tableau 8 : Migrations estimes par le modle gravitaire.
2 Le dtail du calcul permettant dobtenir les coefficients de ce modle ne sera pas expos ici. Pour cela, il
faut se reporter la page 45.
Rij BC BS BO BN BE MS MN SO SC SE Total
BC 0 707 294 -523 67 -764 -486 -549 -276 -65 -1594
BS 1031 0 390 191 -53 185 -7 -192 -88 0 1458
BO 1137 715 0 650 64 146 79 -47 57 44 2844
BN 572 721 880 0 600 -1 6 -158 -58 133 2692
BE 1186 197 136 469 0 -515 -615 -462 -281 -121 -6
MS 313 669 262 53 -458 0 -607 -1772 -782 -273 -2596
MN 573 238 372 153 -379 -107 0 -1241 -827 -276 -1493
SO -276 -168 -11 -153 -447 -1742 -1281 0 711 -46 -3413
SC -36 -11 112 10 -234 -724 -649 1424 0 24 -85
SE 422 100 190 375 59 -68 43 789 282 0 2193
Total 4923 3169 2624 1222 -781 -3591 -3516 -2208 -1263 -579 0
Tableau 9 : Rsidus des migrations estimes par le modle gravitaire.
I Emissions Rception Mobilit Attractivit

BC -1594 4923 3328 6517
BS 1458 3169 4626 1711
BO 2844 2624 5468 -220
BN 2692 1222 3915 -1470
BE -6 -781 -786 -775
MS -2596 -3591 -6187 -995
MN -1493 -3516 -5010 -2023
SO -3413 -2208 -5620 1205
SC -85 -1263 -1347 -1178
SE 2193 -579 1613 -2772
Tableau 10 : Analyse des marges de la matrice des rsidus.
Le modle de Huff
Lmergence du modle gravitaire en analyse spatiale est notamment lie des questions de
natures conomique et commerciale. En effet, en 1931, Reilly formula une loi concernant
l'organisation des zones d'attraction commerciale qui reprend la formulation du modle
gravitationnel de Newton. Cette loi est fonde sur des observations empiriques qui
quantifient les attractions commerciales entre diffrentes villes. Elle est dsormais nomme
loi de Reilly . Cest ma connaissance la premire formulation du modle gravitaire en
analyse spatiale. L'nonc de la loi de gravitation commerciale est le suivant : deux
centres (situs dans deux villes diffrentes) attirent les achats des populations situes entre elles en
proportion directe du nombre total d'habitants des villes considres et en proportion inverse du carr
de la distance qu'il faut parcourir pour y s'y rendre . Cette loi se fonde sur deux postulats :
1) les deux ples (centres) sont accessibles de manire quivalente par le

consommateur, l'espace est donc homogne;
2) les deux commerces ont la mme efficacit.
Par la suite, cette loi a t gnralise en amenuisant le rle assign la distance [9]. En
effet, lever au carr la valeur de la distance (comme dans la loi de la gravitation universelle)
n'est valable que pour certains types de relations. La diminution de l'influence dun ple
(dun centre) selon le carr de la distance peut s'avrer trop forte dans le cas de biens rares et
coteux, ou au contraire trop faible dans le cas des services banals, des biens faible cot, ou
dans le cas d'un cot de dplacement trop lev par rapport au bien acheter. On obtient
alors lexpression de la loi de Reilly suivante :
( ) ( ) [9]
Avec : Va = ventes dans la ville a auprs de la population de la ville X ; Vb = ventes dans la ville b
auprs de la population de la ville X ; Da = distance sparant la ville a ; Db = distance sparant la
ville b ; Pa = population de la ville a ; Pb = population de la ville b ; = exposant indiquant le
taux auquel l'attraction d'une ville s'accrot mesure que la population de cette ville
augmente ; = exposant indiquant le taux auquel l'attraction d'une ville dcrot mesure que
la population de cette ville augmente ( et sont compris entre 0 et l infini).
Par la suite, Converse (1951) tablit un modle permettant de dlimiter les frontires des
aires d'influence entre deux ples commerciaux. En loccurrence, ce modle sapplique plutt
des centres urbains. Pour cela, il sappuya sur le modle gravitaire et les travaux de Reilly.
Plus prcisment, ce modle permet de dterminer un point d'quilibre (breaking point) entre
les zones de desserte de deux centres urbains. Ce point de partage (ou d'quilibre) dfinit la
limite entre les aires d'influence de deux villes de taille Pa et Pb spares par une distance
Dab, car au niveau de la frontire Va et Vb sont quivalents, on a donc Va/Vb = 1. Converse
considre = 1 et = 2. La formule de Reilly devient ds lors la suivante [10]. Converse
tablit donc la formule Dxb du point d'quilibre [11]. Cette formule indique simplement le
point o la masse des consommateurs se partage entre les deux ples concurrents de faon
quivalente (cest une zone dindiffrence).
( ) [10]
[11]

Ce modle peut tre utilis afin de calculer des zones de chalandise (une zone de
chalandise est une zone au sein de laquelle un commerce attire de manire privilgie les
clients potentiels). Dans ce cadre, le poids dun commerce peut tre valu laide de sa
surface commerciale. Lhypothse faite est la suivante : plus un commerce est grand, plus il
va attirer les clients. Ainsi, prenons un exemple trs simple, o lon cherche dterminer la
zone de chalandise dun commerce L. Pour cela, nous disposons des distances entre le
commerce L et les commerces concurrents. De surcroit, pour chacun de ces commerces, nous
disposons des surfaces commerciales (Figure 5).
Figure 5 : Les donnes ncessaires au calcul de la zone de chalandise du commerce L.
Pour dlimiter cette zone de chalandise, il suffit de calculer lensemble des points de partage
laide de la formule ci-dessus. Ainsi, on obtient :

De mme, on obtient les distances suivantes : DxP = 22,5 km ; DxN = 36,7 km ; DxR = 29,4
km. On peut alors dessiner la zone de chalandise du commerce L (Figure 6).
Figure 6 : La zone de chalandise du commerce L.
Dautres mthodes permettent, partir de ce modle, de calculer des zones de chalandise ou

encore des potentiels dactivit pour des points de vente. Ainsi, la mthode de Huff et la
mthode MCI sont des mthodes particulirement intressantes qui permettent de prendre
en considration, non seulement la clientle prsente, mais aussi les tablissements
concurrents pour tablir la qualit dun emplacement et le taux de pntration
thoriquement atteignable par un commerce.
Plus prcisment, le modle de Huff est un modle qui permet de calculer la probabilit
quun individu soit client dun point de vente en fonction de sa localisation et de lattractivit
des autres points de vente. Cest le premier modle probabiliste dattraction. Huff suggre
d'utiliser une approche dite des prfrences rvles . Le postulat principal du modle est
le suivant : l'attraction d'un magasin dpend de sa taille, de la distance parcourir pour y
accder et du nombre de magasins prsents dans la zone gographique donne. En termes
mathmatiques : pour tout consommateur i, l'attraction exerce par un point de vente j (la
probabilit que les clients sy rendent Pij) est directement proportionnelle la taille de j (Sj)
et inversement proportionnelle la distance entre i et j (Dij). Pour tout consommateur i, la

probabilit de choisir le point de vente j est gale l'attraction de j, divise par la somme des
attractions des autres points de vente k.
[12]

Avec : Pij = probabilit qu'un consommateur localis en i se rende dans le centre commercial
localis en j ; dij = distance entre i et j (cette distance peut tre exprime par des temps de
parcours) ; Sj = taille du centre commercial localis en j ; = paramtre calibrer qui varie
selon le type de centre commercial ; r = nombre de localisations des centres commerciaux.
A titre dexemple, laide du modle de Huff, il est possible dvaluer le nombre de clients
probables de trois hypermarchs H1, H2 et H3. Pour les trois hypermarchs, on connait le
temps de dplacement moyen des clients potentiels qui sont regroups au sein de trois
quartiers A, B et C. On connait aussi les surfaces des rayons des hypermarchs.
Surfaces des rayons

Temps de
Hypermarchs
dplacement Alimentation Vestimentaire Mobilier
=1 =2 =3
TA TB TC
15 30 10 H1 2 500 m 1 500 m 500 m 500 m
10 10 15 H2 2 000 m 1 000 m 400 m 600 m
20 10 18 H3 2 300 m 1 300 m 700 m 300 m
Tableau 11 : Ensemble des donnes concernant les hypermarchs et les temps de parcours
moyens pour se rendre ces hypermarchs depuis les trois quartiers regroupant les clients
potentiels (Cicri et al., 2012). Le rle de la distance nest pas le mme pour chaque rayon (
diffrents).
En utilisant le modle de Huff, on peut obtenir les probabilits quun client se rende dans un
hypermarch plutt que dans un autre. Plus prcisment, en appliquant ce modle au rayon
alimentaire, on obtient les probabilits quun habitant du quartier A se rende dans les
hypermarchs H1 (PAH1), H2 (PAH2) et H3 (PAH3) :

( )

( )

( )
Enfin, en effectuant ces calculs pour les autres quartiers et en se fondant sur les
recensements des habitants des quartiers A, B et C, on obtient les rsultats suivants :
A B C
A B C Total
(1500) (1500) (1500)
H1 0.377 0.178 0.520 565 356 832 1 753
H2 0.377 0.357 0.229 565 714 366 1645
H3 0.245 0.464 0.250 367 928 400 1695
Tableau 12 : Rcapitulatif des rsultats obtenus pour lalimentation par le modle de Huff
(Cicri et al., 2012).
Ainsi, le modle de Huff nous a permis de dterminer le nombre de clients se rendant dans
les diffrents hypermarchs pour lalimentation. En tenant bien compte du coefficient , ces
calculs peuvent tre reproduits pour les rayons vestimentaires et le mobilier.
Les modles de rseaux thoriques : les rseaux small-world et scale-free

Compte tenu de limportance des flux en gographie, la notion de rseau y est aussi centrale.
En effet, en gographie, les flux se dfinissent partir de lieux (ou dacteurs) au pralable
disjoints constituant un rseau de lieux (ou dacteurs). Considrer un rseau en analyse
spatiale revient donc expliciter les relations entre des lieux ou des objets, cest--dire
prendre en compte de manire concrte le fait que les units dobservation ne sont pas des
lments indpendants (Pumain et St-Julien, 2010). Il nexiste dailleurs pas de territoire
sans rseau. Un territoire est une portion de la surface terrestre approprie par un groupe et
lappropriation dune surface par une collectivit passe ncessairement par le contrle de
mobilit dans le territoire et par la mise en place de liens permanents entre les lieux (Pumain
et St-Julien, 2010).
Dun point de vue mathmatique, un rseau est dfini comme un graphe, cest--dire comme
un ensemble de sommets et darcs. Lanalyse de graphe est longtemps reste descriptive et
na pas abouti llaboration de modles. On distinguait seulement les graphes planaires (ces
graphes ont la particularit de pouvoir se reprsenter sur un plan sans qu'aucun arc n'en
croise un autre) et non planaires. On distinguait aussi des structures rgulires (chaque
sommet est reli un mme nombre darcs) et alatoires (chaque sommet est reli de manire
alatoire un certain nombre darcs). Ces types de graphes taient alors trop pauvres pour
constituer de vritables modles danalyse spatiale. Nanmoins, ces dernires annes des
modles thoriques de graphes sont apparus. Ils constituent dsormais de vritables modles
danalyse spatiale (en particulier les modles small-world et scale-free).
Le concept de small-world est issu des travaux de Stanley Milgram dans les annes 1960.
Lexprience consistait demander des habitants du Middle West de faire parvenir une
lettre un destinataire de la Cte Ouest en utilisant comme intermdiaire des personnes
quils appelaient par leur prnom. Milgram eu la surprise de constater que la moyenne des
chanes parvenues au destinataire ntait que de 5.6. Cette exprience a donn lieu un
mythe devenu dans sa version populaire les six degrs de sparation. Autrement dit, seules
cinq personnes nous sparent de nimporte quelle autre personne dans le monde.
En 1998 Watts et Strogatz publirent un article dans Nature o ils proposrent un modle
de graphes petit-monde (small-world network) qui diffre du modle dominant utilis
auparavant (graphe alatoire). Plus prcisment, un small-world network est un rseau o le
degr de clustering est lev (beaucoup de sous-graphes sont fortement connexes il y a une
forte transitivit du graphe cest--dire que les sommets voisins sont trs connects entre
eux, ainsi si les sommets A et B sont lis, tout comme les sommets B et C, alors la probabilit
est forte pour que les sommets A et C soient relis) et o la distance moyenne entre les
paires de sommets est faible.
Le principe de construction de ce graphe est simple, le graphe de dpart est k-rgulier (tous
les sommets ont le mme degr) et chaque sommet est li ses voisins proches. De faon
alatoire, un lien est supprim et un lien est ajout au graphe de dpart. Les auteurs
mesurent alors deux paramtres : la moyenne des plus courts chemins entre chaque paire de
sommets et le clustering coefficient. Ce processus aboutit un rseau parfaitement alatoire.
Entre le rseau rgulier de dpart et le rseau alatoire final se trouve les rseaux dits
small-world . Durant ce processus, la moyenne des plus courts chemins et le niveau de
clustering diminuent, mais comme la moyenne des plus courts chemins diminue plus
rapidement , certains rseaux prsentent un niveau de clustering lev et une moyenne
faible des plus courts chemins. Ce sont les rseaux small-world.
Figure 7 : Principes dun rseau small-world (Watts et Strogatz, 1998).
Moins dun an plus tard, deux physiciens, Barabsi et Albert, publient dans Science un article
o ils proposent un autre modle de graphes : les scale-free networks. En effet, en tudiant, de
manire empirique, diffrents graphes existant dans la nature, ils aboutirent une conclusion
qui leur apparut alors surprenante : contrairement ce qui tait communment admis, les
graphes quils tudient ne prsentent pas une distribution gaussienne des degrs, mais au
contraire des distributions qui suivent des lois de puissance [13]. Ainsi, il existe un grand
nombre de sommets relis dautres sommets par un nombre faible de liens. En revanche, il
existe peu de sommets relis directement un grand nombre de sommets (Figure 8).
( ) [13]
o k est le degr des sommets, P(k) la frquence des sommets de degrs k, est suprieur 2.
Figure 8 : Les principes dun rseau scale-free (Barabsi et Albert, 1999).
Pour expliquer cette distribution trs ingalitaire des degrs, les auteurs mettent et testent
des hypothses concernant la formation et lvolution des rseaux. Les graphes tudis
mettent en vidence des liens qui suivent apparemment un processus dattachement
prfrentiel (preferencial attachment).
En une dcennie, les notions de small-world et de scale-free sont devenues trs rpandues.
Ainsi, il apparait que de nombreux rseaux gographiques (ou spatiaux) prsentent ces
caractristiques (comme ceux des multinationales, des collaborations scientifiques, du rseau
arien chinois ou des rseaux Internet). Cest pour cela quils sont prsents dans ce
complment de cours comme des modles appartenant lanalyse spatiale. Nanmoins, les
rseaux qui ncessitent de grosses infrastructures matrielles linaires, comme les rseaux
techniques (rseau lectrique, rseau viaire, rseau deau), ne prsentent pas souvent ces
caractristiques. Ainsi, la mise lpreuve de ces modles peut permettre de mettre en
vidence des contraintes territoriales qui impose des distributions binomiales des degrs.
Trouver un exemple trs simple permettant dappliquer ces modles nest pas chose aise. En
effet, si ces modles ne sont pas trs complexes (seules quelques bases en thorie des graphes
sont ncessaires pour les comprendre), les graphes concerns par ces modles se doivent
dtre grands (ces graphes doivent comporter un nombre de sommets suprieur
plusieurs centaines). Or, il nest pas ais de manipuler de grands graphes. Cest dailleurs
pourquoi ces modles de graphes thoriques (bien que simples) ont merg rcemment,
puisquil fallait disposer de moyens informatiques modernes pour les dcouvrir et les
implmenter. Pour donner un exemple qui ait du sens, il apparait ds lors ncessaire davoir
recours des outils informatiques. Nous allons ici utiliser R , un logiciel conu pour faire
de lanalyse statistique3. De surcroit, il faut de surcrot tlcharger un package nomm

IGraph pour effectuer de lanalyse de graphe avec R . En ce qui concerne les donnes,
il est possible dutiliser celles fournies par Newman (http://www-
personal.umich.edu/~mejn/netdata/). Plus prcisment, nous allons tudier la structure
dinternet.
Aprs avoir ouvert R, il faut appeler le package IGraph :

> library(igraph)
Puis, il faut charger le jeu de donnes GML dans R. Par exemple, si vous avez placez votre
jeu de donnes ( dzipp ) sur le bureau, il faut taper une ligne de code de ce type :
> donnees <- read.graph("C:/Users/xxxxxx/Desktop/as-22july06/as-
22july06.gml","gml")
Il est ds lors trs simple de calculer la distribution des degrs:

> dd=degree.distribution(donnees, cumulative = FALSE)
Cette distribution peut tre reprsente dans un diagramme log-log . Ce diagramme

laisse entrevoir un comportement scale-free, puisque (mis part pour les valeurs suprieures)
la distribution des degrs semble diminuer en suivant une droite (Figure 9) :
> plot(dd, log = "xy", ylab="distribution degres", xlab="degres")
Pour le vrifier, il faut dterminer la valeur du coefficient . Pour cela, il faut disposer de
donnes qui font abstraction des valeurs nulles (celles-ci vont en effet gner la dtermination
du coefficient ). De mme, il faut rcuprer les valeurs des degrs.
> dd[dd==0]<-NA
> sup<-which(is.na(dd))
> dd2<-dd[!is.na(dd)]
> id<--1:length(dd)
> id2<-id[-sup]-1
Ds lors, il est possible de calculer la valeur du coefficient (Figure 11) laide dune
rgression linaire (voir page 56), puis dafficher les rsultats dans un graphique (Figure
10) :
> summary(lm(log(dd2)~log(id2)))
> plot(log(id2),log(dd2), ylab="Log du de la distribution des degres",
xlab="Log des degres")
> abline(lm(log(dd2)~log(id2)))
Ainsi, les rsultats de la rgression sont approximatifs (R=73%). De surcroit, le coefficient
est gal 1.15. Ce coefficient est donc infrieur deux, ce qui place le graphe de la
structure dinternet dans un cas limite de scale-free. Cela sexplique par une
3Pour une introduction au fonctionnement de ce logiciel, qui peut surprendre ceux qui nous pas lhabitude
de travailler avec des lignes de commandes, vous pouvez trouver des initiations sur internet, comme par
exemple sur le site : http://elementr.parisgeo.cnrs.fr
surreprsentation des valeurs extrmes (en loccurrence les valeurs les plus fortes). En
revanche, si lon utilise la distribution cumule des degrs, la loi de puissance apparat plus
vidente (Figure 12).
Figure 9 : La distribution des degrs de la structure dinternet dans un diagramme log-log.
Figure 10 : La distribution des degrs et la reprsentation de la droite de rgression.

Figure 11 : Les rsultats de la rgression linaire.
Figure 12 : La distribution cumule des degrs de la structure dinternet dans un

diagramme log-log.
Les modles doptimisation : de Von Thnen aux modles de localisation-allocation
Derrire la trs riche varit des paysages concrets que nous observons la surface du globe,
il existe des organisations structurantes rsultant du dsir des habitants ou de leurs
dirigeants damnager le sol pour leur plus grande commodit (Pumain et St-Julien, 2010).
Ce processus dadaptation un milieu donn peut sapparenter un principe doptimisation.
En effet, les socits cherchent trs souvent maximiser une fonction dutilit qui varie en
fonction des lieux et des priodes. Cette fonction dutilit peut tre purement conomique
(maximisation conomique de lutilisation du sol) ou plus complexe (maximisation du bien-
tre individuel ou social). Ainsi, il nest pas si surprenant quun des premiers modles
danalyse spatiale, le modle de Von Thnen , repose sur un principe de maximisation :

celui de la maximisation des rentes foncires.
Dans la vie courante, le choix de son lieu de rsidence varie en fonction des capacits
financires de chacun, mais certains critres semblent partags par de nombreuses
personnes. Or, certains de ces critres font clairement rfrence des critres doptimisation
qui peuvent sexprimer simplement : minimisation du temps de trajet son lieu de travail en
fonction dune maximisation des accs certaines amnits (commerces, espaces verts, liens
sociaux). Ainsi, loptimisation, si elle ne doit pas tre systmatiquement recherche, peut
servir de modle de rfrence afin de mettre en exergue les singularits des territoires.
Le modle de Von Thnen
Von Thnen dans son ouvrage Der Isolierte Staat in Beziehung auf Landwirtschaft und
Nationalkonomie (1826) se donne comme objectif dexpliquer la localisation des activits
agricoles. Selon lui, les activits agricoles ne sont pas disposes de manire alatoire dans
lespace, mais rpondent une distribution spcifique. Dans sa thorie, Von Thnen est parti
de lide dveloppe par Adam Smith, selon laquelle le producteur cherche maximiser le
profit de sa terre. Von Thnen, lui-mme propritaire terrien, savait quun tel profit repose
sur lutilisation optimale des surfaces et des cots de transport. En se concentrant sur ces
deux variables, il obtient un tat isol homogne avec une ville-march en son centre.
Von Thnen conclut quune denre ne vaut la peine dtre produite que si elle se trouve
une certaine distance du march. En dehors de cette distance, le cot de la terre (rente
foncire) ou le cot de transport devient trop lev, une autre culture devient alors plus
rentable. Von Thnen ayant calcul les cots de transport par des distances vol doiseau du
march, les zones ainsi dfinies sont circulaires : on parle des anneaux de Von Thnen.
Plus prcisment, le modle repose sur les hypothses suivantes :
Le march est situ au centre dun Etat isol ou plus gnralement dun
territoire isol ;
Ltat isol est entour dtendues sauvages ;
Le pays est plat, sans rivire ni montagne ;
Les qualits du sol et du climat sont homognes ;
Les producteurs apportent directement leurs produits aux marchs par le chemin le
plus court (il ny a pas de routes et tout le transport se fait vol doiseau) ;
Les producteurs se comportent de manire maximiser leur profit.
A partir de cette situation, on pose :
Ri = la rente foncire : Ri(d) = r(pi ci) rTid ;

r = le rendement par unit de surface ;
pi = le prix du march par unit de produit ;
ci = les charges de fabrication par unit de produit ;
Ti = le cot du transport, en unit de compte par unit de produit et par unit de

distance ;
d = la distance au march.
Pour un mme rendement unitaire de surface, on obtient lquation suivante : Ri(d) = (pi
ci) Tid. Ainsi, pour chaque produit, la rente est reprsente par une droite dcroissante
de pente -Ti dont lordonne lorigine est gale (pi ci). Une production nest plus
rentable (cest--dire Ri(dmax)=0) au point dabscisse dmax = (pi ci) / Ti. Comme, la
surface est ddie la culture du produit qui offre la rente la plus leve aux propritaires
fonciers, la configuration des diffrentes cultures suit bien une forme de cercles
concentriques (Figure 13). Sur la figure ci-dessous, la premire parcelle sera affecte au
produit a, la seconde, un peu loigne du centre au produit b et la dernire encore un peu
plus distante du march au produit c.
Figure 13 : Localisation de trois cultures dans le cadre du modle de Von Thnen.
A titre dexemple, en partant des donnes ci-dessous :
Cultures
Mas Elevage
marachres
Prix de vente (Pi) 3000 1000 1500
Cots de production (Ci) 1800 660 850

Cots de transport au
25 1.5 4
km (Ti)
Tableau 13 : Les donnes concernant trois productions agricoles diffrentes.
On obtient les rsultats intermdiaires qui suivent :
Cultures
Mas Elevage
marachres
Bnfice brut (ordonne
3000-1800=1200 1000-660=340 1500-850=650
lorigine : pi ci)
Distance max de
1200/25=48 340 / 1.5 = 227 640/4=160
rentabilit ((Pi-Ci)/Ti)
Pente de la rente (-Ti) - 25 - 1.5 -4
Tableau 14 : Calculs intermdiaires au modle de Von Thnen.
Ds lors, on peut calculer les distances au centre pour lesquels les revenus nets entre deux
productions i et j sont gaux (Tableau 15). Par exemple, pour les cultures marachres et le
mas, on cherche rsoudre lquation suivante :
( ) ( )
Cultures
Mas Elevage
marachres
Cultures marachres - 37 26
Mas 37 - 124
Elevage 26 124 -
Tableau 15 : Distances au centre pour lesquels les revenus nets entre deux productions i et j
sont gaux.
Pour rsumer et visualiser les rsultats, il est possible de produire un schma (Figure 14).
Enfin, il est important de noter que le modle de Von Thnen peut sappliquer aux espaces
urbains. Ainsi, dans le modle dAlonso, au sein des villes, tout s'organise en fonction du
centre-ville et du cot de transport. La localisation des mnages s'effectue ds lors selon les
ressources de ces mnages et la distance au centre-ville. L'affectation du sol urbain rappelle
alors le modle de Von Thnen. Nanmoins, les limites de ces modles sont nombreuses.
Elles rsident dans les hypothses fondatrices de ces modles : savoir l'isotropie spatiale, la
libert de dplacement, la concurrence parfaite, la prsence d'un centre unique autour duquel
s'ordonne la ville, la centralit du cot de transport dans l'allocation spatiale, la rationalit

des comportements...
Figure 14 : Traduction graphique des calculs effectus.
Enfin, il est important de noter que le modle de Von Thnen peut sappliquer aux espaces
urbains. Ainsi, dans le modle dAlonso, au sein des villes, tout s'organise en fonction du
centre-ville et du cot de transport. La localisation des mnages s'effectue ds lors selon les
ressources de ces mnages et la distance au centre-ville. L'affectation du sol urbain rappelle
alors le modle de Von Thnen. Nanmoins, les limites de ces modles sont nombreuses.
Elles rsident dans les hypothses fondatrices de ces modles : savoir l'isotropie spatiale, la
libert de dplacement, la concurrence parfaite, la prsence d'un centre unique autour duquel
s'ordonne la ville, la centralit du cot de transport dans l'allocation spatiale, la rationalit
des comportements...
Les modles de localisation-allocation (ou localisation-affectation)
Pour un large ventail d'entreprises prives et publiques, la bonne localisation de leurs

diffrentes installations (points de vente, bureaux, entrepts) reprsente un enjeu de
planification crucial. Lobjectif des modles de localisation-allocation est prcisment
doptimiser la localisation de ces installations (par exemple des points de vente) en tenant de
lallocation (laffectation) des ressources ou des clients (afin de dterminer par exemple la
capacit doffre de diffrents points de ventes). Nanmoins, il ne faut pas limiter la porte de
ces modles aux seules entreprises quelles soient publiques ou prives. En effet, si ces
modles font partie des fondements du gomarketing, il ne faut pas oublier que les individus
peuvent trs bien agir en suivant des comportements doptimisation (comme par exemple
dans leur mode de dplacement, en choisissant les chemins les plus courts pour aller dun
lieu un autre).
Ces modles trouveraient leur origine dans des travaux comme ceux dAlfred Weber. Alfred
Weber cherchait alors localiser un centre de production de manire minimiser la distance
pondre entre ce centre et les sources de matires premires : cest le problme p-median.
Dans les faits, le problme p-mdian (un problme particulier de localisation-allocation) est
beaucoup plus ancien, puisquil remonte Pierre de Fermat (1601-1665) qui posa le
problme suivant : tant donn trois points dans un plan, trouver un quatrime point dont la
somme des distances aux trois points donns est minimum (la distance entre deux points
tant mesure par la longueur du segment les joignant). Cependant, Alfred Weber posa le
problme sous sa forme moderne. Dsormais, chaque modle de localisation-allocation
contient cinq composants essentiels :
la fonction objective : elle tient compte de la distance sparant les

points de demande des emplacements potentiels .
les points de demande : ils reprsentent le niveau de la demande pour un

certain type de produits (ou de services) lchelle dune ville ou dun
quartier. En rgle gnrale, ce sont des clients.
les emplacements potentiels : ce sont les emplacements envisageables

pour les installations implanter (points de vente, points de distribution,
dpts).
la matrice dloignement ou de temps : Cette matrice regroupe toutes

les distances (kilomtriques ou temporelles selon ltude considre)
sparant les emplacements potentiels des diffrents points de demande.
la rgle dallocation : dans un cas simple, il est possible de considrer que

les clients seront desservis en priorit par les installations les moins
loignes de chez eux. La rgle dallocation choisie est alors la proximit
gographique. Il est cependant possible denvisager des rgles dallocation
plus complexes.
A partir de cette formulation, les modles de localisation-affectation sont nombreux. Ainsi, le

modle de couverture maximale a pour but de maximiser la demande potentielle (souvent
le nombre de clients, de consommateurs) en restant une distance infrieure une certaine
limite. Ce type de modle est, par exemple, utilis pour les services publics (Trsor Public,
Transport public, Mairie, Services Postiers). Le modle p-centr vise quant lui
minimiser la distance maximale entre les clients et le service considr. Ce modle est utilis
pour dterminer des emplacements de services durgence, tels que des localisations
dambulances, dhpitaux, ou de casernes de pompiers.
Le choix d'un modle dpend donc de la formulation du problme considr. Une

formulation frquemment utilise est celle du problme p-mdian. Le problme p-mdian
consiste trouver la configuration gographique des units d'offre de manire minimiser la
somme des distances parcourues sous une srie de contraintes nonces par l'utilisateur. Le
modle assure, en quelque sorte, la couverture efficace (voire quitable) du milieu. Pour
rsoudre ce problme, il faut avoir recours des algorithmes heuristiques. Un des
algorithmes les plus simples est lalgorithme flou (Fuzzy algorithm or Greedy algorithm). Cet
algorithme se formalise comme suit : on se donne un graphe G = (V, E) dont les sommets V
= {V1, V2, Vn} sont les n points reprsentant les points de demande potentiels. On
nomme E lensemble des arrtes de ce graphe. On note alors :
d(i,j) : la longueur du plus court chemin entre Vi et Vj
wj : la demande potentielle au point Vj
Le problme p-mdian consiste localiser p installations pour couvrir la demande de tous les
sommets de faon optimale. En dautres termes, cela revient minimiser la distance entre
chaque site de demande et le centre le plus proche. On note alors :
yi = 1 si une installation est place au point Vi et yi = 0 sinon
xij = la demande en Vj couvert par linstallation place en Vi (on considre

que chaque composant peut tre couvert par plusieurs installations).
Le but est ainsi de calculer :

( ) [14]
Et les contraintes sont respectivement les suivantes [15] [16] [17]:
{ }
{
Lquation [15] assure quen tout sommet Vj, la somme des besoins
couverts par les installations places en Vi correspond bien au besoin
total wj du sommet Vj.
Linquation [16] impose que la demande couverte par Vi pour le

sommet Vj ne dpasse pas la demande totale wj et dpend bien de la
prsence ou non dune installation en Vi.
Lquation [17] impose quil y ait exactement p installations places sur

le rseau.
Si les techniques pour rsoudre ce systme sont gnralement assez complexes et lourdes
mettre en uvre, le principe de l'algorithme flou est en revanche assez simple : localiser les
installations une par une, en choisissant chaque fois la solution optimale. Autrement dit,
on espre obtenir un optimum global partir doptimums locaux (cest un algorithme
glouton). Ainsi, lalgorithme dtermine, dans un premier temps, le meilleur emplacement
pour la premire installation en calculant la fonction objective pour chaque nud envisag
(lalgorithme retient alors simplement le nud pour lequel la fonction objective est la plus
faible). Ensuite, lalgorithme dtermine un deuxime site en calculant de nouveau pour
chaque nud la fonction objective (sauf pour celui dj occup) et assigne au site dtermin
prcdemment les nuds qui lui sont les plus proches (ces nuds ninterviennent alors plus
dans la dtermination du nouveau site). De nouveau, lalgorithme retient le nud pour
lequel la fonction objective est la plus faible. Cette opration est rpte plusieurs reprises
afin de dterminer les localisations des p installations souhaites. Pour appliquer cet
algorithme, plusieurs hypothses doivent tre faites :
Il ny a pas de limite de capacit pour un site. C'est--dire que lorsquun site

est plac, il peut subvenir lensemble des besoins des autres nuds dont il
doit soccuper (les nuds situs le plus prs de lui).
Le besoin dun nud est totalement satisfait par le site situ le plus prs de
lui, peu importe combien de nuds celui-ci doit grer et peu importe les
besoins de ces autres nuds.
Le besoin des diffrents nuds est fixe et ne fluctue pas en fonction du

temps.
Nous allons dtailler cet algorithme laide dun exemple didactique. Prenons la carte des
clients potentiels dune entreprise (Figure 15). Ces clients sont regroups au sein de 12 villes
(de A L).
Figure 15 : Carte des clients potentiels dune entreprise. Les lettres reprsentent le nom des
villes. Les nombres rouges correspondent aux nombres de clients potentiels de chaque ville.
Les chiffres noirs correspondent aux distances.
On cherche positionner 5 points de vente (parmi toutes les villes o se trouvent les clients
potentiels) afin de minimiser les distances parcoures par lensemble des clients pour se
rendre ces 5 points de ventes. Pour cela, il faut dans un premier temps calculer la matrice
des distances entre les diffrentes villes (Tableau 16).
Site potentiel
Ville A B C D E F G H I J K L
A 0 15 37 55 24 60 18 33 48 40 58 67
B 15 0 22 40 38 52 33 48 42 55 61 61
C 37 22 0 18 16 30 41 28 20 58 39 39
D 55 40 18 0 34 12 59 46 24 62 43 34
E 24 38 16 34 0 36 25 12 24 47 37 43
F 60 52 30 12 36 0 57 42 12 50 31 22
G 18 33 41 59 25 57 0 15 45 22 40 61
H 33 48 28 46 12 42 15 0 30 27 25 46
I 48 42 20 24 24 12 45 30 0 38 19 19
J 40 55 58 62 47 50 22 37 38 0 19 40
K 58 61 39 43 37 31 40 25 19 19 0 21
L 67 61 39 34 43 22 61 46 19 40 21 0
Tableau 16 : Matrice des distances entre les diffrentes villes.
Comme on cherche minimiser les parcours de lensemble des clients, il est ncessaire de
cumuler tous ces parcours. Pour cela, il faut multiplier la distance sparant la ville et le site
potentiel par le nombre de clients potentiels de la ville (Tableau 17). Par exemple, il y a 15
km parcourir pour les 15 clients de la ville A pouvant se rendre au site potentiel B, soit un
cot total de : 15 15 = 225. De mme, il y a 15 km parcourir pour les 10 clients de la ville
B pouvant se rendre au site potentiel A, soit un cot total de : 15 10 = 150.
Site potentiel
A 0 225 555 825 360 900 270 495 720 600 870 1005
B 150 0 220 400 380 520 330 480 420 550 610 610
C 444 264 0 216 192 360 492 336 240 696 468 468
D 990 720 324 0 612 216 1062 828 432 1116 774 612
E 120 190 80 170 0 180 125 60 120 235 185 215
F 1440 1248 720 288 864 0 1368 1008 288 1200 744 528
G 198 363 441 649 275 627 0 165 495 242 440 671
H 528 768 448 736 192 672 240 0 480 592 400 736
I 624 546 260 312 312 156 585 390 0 494 247 247
J 880 1210 1276 1364 1034 1100 484 814 836 0 418 880
K 1102 1159 741 817 703 589 760 475 361 361 0 399
L 1340 1220 780 680 860 440 1220 920 380 800 420 0
Tableau 17 : Matrice des cots totaux.

Ensuite, lalgorithme flou calcule la somme des cots totaux pour lensemble des sites qui
sont susceptibles daccueillir les points de vente. Le site qui a la somme des cots totaux la
plus faible est slectionn pour accueillir un premier point de vente.
Site potentiel
A 0 225 555 825 360 900 270 495 720 600 870 1005
B 150 0 220 400 380 520 330 480 420 550 610 610
C 444 264 0 216 192 360 492 336 240 696 468 468
D 990 720 324 0 612 216 1062 828 432 1116 774 612
E 120 190 80 170 0 180 125 60 120 235 185 215
F 1440 1248 720 288 864 0 1368 1008 288 1200 744 528
G 198 363 451 649 275 627 0 165 495 242 440 671
H 528 768 448 736 192 672 240 0 480 592 400 736
I 624 546 260 312 312 156 585 390 0 494 247 247
J 880 1210 1276 1364 1034 1100 484 814 836 0 418 880
K 1102 1159 741 817 703 589 760 475 361 361 0 399
L 1340 1220 780 680 860 440 1220 920 380 800 420 0
Total 7816 7913 5855 6457 5784 5760 6936 5971 4772 6886 5576 6371
Tableau 18 : Rsultats de la premire itration de lalgorithme flou. La ville I accueillera

donc le premier point de vente.
Dans notre exemple, lalgorithme flou place le premier point de vente dans la ville I.
Lalgorithme effectue ensuite le mme calcul en tenant compte cette fois-ci de la position du
premier point de vente. Par exemple, si la distance de A B est suprieure celle de A I
alors D(A,B) = D(A,I). En effet, si D(A,B) > D(A,I), les clients de la ville A se rendront en I
et ne chercheront pas aller en B. Il ne faut donc pas pnaliser le site B, alors que les clients
de la ville A ne sy rendront pas. On obtient alors une nouvelle matrice de cots.
Site potentiel
A 0 225 555 720 360 720 270 495 720 600 720 720
B 150 0 220 400 380 420 330 420 420 420 420 420
C 240 240 0 216 192 240 240 240 240 240 240 240
D 432 432 324 0 432 216 432 432 432 432 432 432
E 120 120 80 120 0 120 120 60 120 120 120 120
F 288 288 288 288 288 0 288 288 288 288 288 288
G 198 363 451 495 275 495 0 165 495 242 440 495
H 480 480 448 480 192 480 240 0 480 480 400 480
I 0 0 0 0 0 0 0 0 0 0 0 0
J 836 836 836 836 836 836 484 814 836 0 418 836
K 361 361 361 361 361 361 361 361 361 361 0 381
L 380 380 380 380 380 380 380 380 380 380 380 0
Total 3485 3725 3943 4296 3696 4268 3145 3655 4772 3563 3858 4392
Tableau 19 : Rsultats de la deuxime itration de lalgorithme flou. La ville G accueillera le

deuxime point de vente.
Lalgorithme place donc un autre point de vente dans la ville G. En repentant la mme
opration trois fois, lalgorithme produit la liste des points de vente qui suit :
Numro du point de
Site Cot total
ventes
1 I 4772
2 G 3145
3 F 2641
4 J 2157
5 A 1707
Tableau 20 : Rsultats finaux de lalgorithme flou.
Il est alors possible de raliser la carte des implantations des points de vente avec
laffectation des clients associs :
Figure 16 : Carte des points de vente dtermins laide de lalgorithme flou.
Les modles de dynamique spatiales : les modles dHgerstrand et de Schelling

Lensemble des modles prsents jusquici tait statique. Si certains de ces modles peuvent
ventuellement tre utiliss pour simuler (prdire) certaines volutions (le modle gravitaire
permet par exemple de prdire les flux de dplacement domicile-travail en fonction des poids
des lieux tudis), ils ne sont pas pour autant dynamiques. Ainsi, il ny a pas dans ces
modles de variable t reprsentant le temps. Or, paradoxalement, les processus tudis en
gographie sont en rgle gnrale dynamiques. La seule tude des variations obtenues en
faisant voluer les paramtres dentre dun modle (technique qui permet notamment de
reproduire un processus (temporel) partir dun modle statique), ne peut avoir la mme
porte quun modle par essence dynamique. Il faut bien avouer que la mise en place de
modles mathmatiques dynamiques nest pas chose aise. Dans les faits, la modlisation
informatique se prte mieux cet exercice. Ainsi, si des modles de simulation existent en
gographie depuis le dbut des annes 1950, le dveloppement de linformatique a permis
une diffusion plus large de ces modles en facilitant leur implmentation. Deux grands
classiques de lanalyse spatiale vont tre prsents dans ce complment de cours : le modle
d'Hgerstrand et le modle de Schelling.
Les modles de diffusion spatiale (et individus centrs) : le modle de

diffusion spatiale de linnovation dHgerstrand
La diffusion sexprime par tous les dplacements qui, quelle quen soit la force motrice,
cherchent rpandre quelque chose de manire homogne dans un systme, tendant ainsi
le faire passer dun tat dquilibre un autre tat dquilibre. Ainsi, la notion de diffusion est
introduite quand on tudie des processus qui mettent en jeu des dplacements de produits,
de personnes, de pratiques... Plus prcisment, la notion de diffusion spatiale recouvre
lensemble des processus qui concourent aux dplacements dans lespace gographique et
aux effets que ces dplacements engendrent dans cet espace. La diffusion peut alors
correspondre un mouvement de migration avec relocalisation ou un mouvement
dexpansion (de contagion).
Depuis les travaux d'Hgerstrand, les gographes insistent sur le rle que peuvent avoir les
structures spatiales (effets de voisinage, de barrire, de hirarchie) sur les processus
spatio-temporels de toute diffusion. En matire danalyse spatiale, on identifie ainsi deux
types de mouvements dexpansion dans lespace. Dune part, la diffusion par contagion qui
repose sur les effets la fois de la distance et de la contigut dans un processus de diffusion
spatiale. Une innovation ou une nouvelle activit aura tendance se diffuser dans les
voisinages immdiats de son lieu dapparition. Dautre part, la diffusion hirarchique rend
compte de la propagation d'une activit selon la hirarchie des lieux. L'innovation se propage
en priorit travers les espaces fort potentiel dinteraction, privilgiant ainsi les grands
centres conomiques et dcisionnels, et se poursuit travers des espaces de moins en moins
denses mesure que l'innovation se banalise . Dans ce contexte, la taille et le rang d'une
ville dans un rseau urbain sont les critres dterminants du processus de diffusion.
Dans le cadre de son travail de thse portant sur la diffusion des innovations techniques
agricoles dans le centre de la Sude, Hgerstrand est le premier appliquer et dvelopper
des mthodes mathmatiques permettant de dcrypter des rgularits temporelles et
spatiales dans les mouvements humains. Cette thse, publie en 1953, devient une rfrence
mondiale aprs sa traduction en anglais (Innovation Diffusion as a Spatial Process). La
proposition originale de ce travail est le modle de simulation de la diffusion des innovations
par vagues fond sur une approche probabiliste des mises en contact entre metteurs et
rcepteurs . Ce modle est implment par une procdure Monte Carlo. Aujourdhui
encore, les principes fondamentaux de ce modle sont considrs comme trs pertinents.
Torsten Hgerstrand propose donc le premier modle de diffusion des innovations fond sur
des mcanismes de contact entre individus. Lide fondamentale de ce modle est que si ces
interactions sont stables et persistantes dans lespace et dans le temps, alors leur
reconnaissance et leur formalisation doivent permettre de dcrire correctement toute
diffusion dans lespace gographique que ce soit une chelle macroscopique, o la diffusion
seffectue en priorit selon la hirarchie des lieux, ou une chelle microscopique, la
contigut spatiale tant alors privilgie. Plus prcisment, les individus sont classs en (au
moins) deux groupes : les informs et les autres. Chaque individu inform peut, par la suite,
adopter linnovation. Lindividu ragi par stimulations : il peut passer de ltat dindividu non
inform celui dindividu adoptant, avec un tat transitoire dindividu inform se faisant une
reprsentation de linnovation par rapport ses propres besoins. Cette dynamique peut tre
modlise par de mthodes probabilistes. Depuis les travaux dHgerstrand, de nombreux
autres modles ont vu le jour. Dans ces modles, de manire gnrale, les informs ou les
adoptants contribuent diffuser des informations concernant linnovation : ils font, en
quelque sorte, de la publicit (involontaire ou non) pour linnovation. De surcrot, en
fonction des modles, les adoptants pourront se montrer plus ou moins exigeants.
Figure 17 : Schma du principe des modles de diffusion fonds sur les travaux
dHgerstrand.
Dans sa thse, Eric Daud dtaille bien les principes de fonctionnement des modles de
diffusion dHgerstrand. En effet, Hgerstrand construisit trois modles, dont la
prsentation constitue une introduction didactique son modle final (le troisime modle
qui est reconnu comme tant le modle dHgerstrand), puisque ces modles vont du plus
simple au plus complexe. Premirement, Hgerstrand imagine que tous les individus sont
informs en mme temps de linnovation. Les individus adoptent alors linnovation de
manire totalement alatoire. Le territoire est dcoup en une grille de 81 cellules (de 5km
de ct) comportant chacune 30 individus. A chaque itration, un individu est choisi de
manire totalement alatoire pour adopter linnovation et cela na pas dincidence sur
ladoption par ces voisins. Avec ce modle simple, on obtient finalement une diffusion
totalement alatoire de linnovation au sein du territoire (Figure 18). Dans le deuxime
modle, un seul individu est inform, il est situ au centre de la grille. Chaque individu
adopte linnovation ds quil est inform et diffuse linformation un autre individu. Il ny a
donc pas de diffrence entre les informs et les adoptants. Les individus nont pas de libre
arbitre. La probabilit quun individu transmette linformation un autre individu est
dtermine par une matrice de probabilit (la probabilit dcroit en fonction de la distance
entre les individus) (Figure 19). En choisissant chaque itration, pour chaque adoptant, un
chiffre entre 0 et 1 et en le rapportant la matrice du champ moyen dinformations
(Figure 19), il est possible de dterminer lindividu qui sera inform (Figure 20). Dans ce
modle, linnovation se propage trs vite et selon un mcanisme de tches dhuile . Pour
son troisime modle, Hgerstrand introduit alors une certaine rsistance la diffusion.
Chaque individu se voit attribuer un certain niveau de rsistance, de telle sorte quon obtient
pour chaque cellule une distribution des rsistances (Figure 21). Pour quun individu adopte
linnovation, il faut quil reoive un niveau dinformation (ce niveau augmente chaque fois
quil est inform par un individu) gal son niveau de rsistance. On obtient une diffusion
qui se propage plus lentement et de manire plus concentre (Figure 22).
Figure 18 : Exemple de rsultats pour le premier modle dHgerstrand (Eric Daud, 2002).
Figure 19 : A droite le champ de contact pour la cellule centrale (P=0,7966 1,585 log(d)).
A gauche le champ dinformation correspondant. Le champ de contact correspondant ici la
probabilit quun adoptant plac au centre de la grille informe les autres individus selon leur
appartenance une cellule. Le champ dinformation se calcule simplement partir du champ
de contact.
Figure 20 : Exemple de rsultats pour le deuxime modle dHgerstrand (Eric Daud,

2002).
Figure 21 : Distribution des rsistances dans une mme cellule (30 individus au total).
Figure 22 : Exemple de rsultats obtenus pour le troisime modle dHgerstrand (Eric

Daude, 2002).
Les modles de sgrgation : le modle Schelling
Dans les annes 1970, Thomas C. Schelling a propos un modle afin dexpliquer le lien
entre sgrgation spatiale et les prfrences individuelles concernant cette sgrgation. Il
suffit pour mettre en uvre ce modle de disposer dune information concernant les
prfrences des individus et dune dichotomie permettant de ranger une population en deux
groupes distincts. Son application au cas urbain a grandement particip son succs . Il
faut dire que sa conclusion principale a de quoi marquer les esprits par son ct paradoxal.
En effet, Schelling montre quune forte sgrgation peut tre le rsultat collectif de dcisions
individuelles qui ne visent pas une telle sgrgation. Ainsi, mme si les individus sont
tolrants , on aboutit presque toujours des situations de sgrgation.
Pour comprendre ce modle, commenons par le prsenter plus prcisment. Prenez un

chiquier (une matrice 88 reprsentant le territoire tudi) et placez-y des pions de deux
genres diffrents (ce sont nos deux groupes). Vous avez l une reprsentation trs stylise
dune aire urbaine o se ctoient deux populations. Ce pourrait tre des Catholiques et des
Protestants, des riches et des pauvres ou tout autre clivage. Pour reprsenter un tel clivage,
nous allons rpartir des pions noirs et pions blancs sur lchiquier. Au dpart, ces pions sont
rangs alternativement pour reprsenter lintgration la plus parfaite possible entre deux
communauts. Schelling ajoute ensuite une rgle de dplacement des pions : bien que
tolrants , les individus dmnageront si, parmi leurs voisins immdiats, au moins deux
tiers ne sont pas de la mme couleur queux. En sens inverse, ils seront satisfaits et ne
dmnageront pas si, parmi leurs voisins immdiats, strictement plus dun tiers sont de
couleur identique. Cette rgle du tiers peut sembler assez souple, car on ne peut pas dire que
les individus recherchent la sgrgation : ce nest qu partir du moment o chacun souhaite
tre majoritaire que la sgrgation est vritablement vise. En de, certaines minorits
peuvent saccepter et le mlange des deux communauts reste possible. Nanmoins, il est
vident que de vritables individus tolrants ne tiendraient pas compte de la couleur de leurs
voisins.
Dans une situation de dpart altern avec les coins vides, tous les individus sont satisfaits de
leur voisinage. On effectue alors une petite perturbation. On commence par retirer au hasard
8 pions blancs et 8 pions noirs, puis on remet 8 pions au hasard, la couleur de chacun tant
elle aussi choisie alatoirement (il y a donc finalement 52 pions et 12 cases vides). Cette
perturbation suffit le plus souvent engendrer un peu dinsatisfaction et les pions concerns
seront alors amens se dplacer au hasard (ces pions sont entours en rouge) vers des cases
vides jusqu ce que lon atteigne un nouvel tat dquilibre o tous les pions seront satisfaits
en regard de la rgle du tiers (Figure 23). Dans ces conditions, le rsultat est surprenant :
des quartiers noirs et des quartiers blancs apparaissent sans que personne ne le veuille
rellement. Or, ce nest pas un rsultat marginal. Comme le dit Schelling, ressayez plusieurs
fois de jouer ce jeu et vous aboutirez probablement chaque fois une forte sgrgation.
Figure 23 : Le modle de Schelling illustr. En gris les cases vides, en blanc et en noir les
deux populations. Les pions amens se dplacer sont entours en rouge.
Le modle de schelling est un exemple la fois simple et significatif de la notion

dmergence dans un systme complexe. Ce modle montre que le tout (cest--dire le
comportement collectif) ne se dduit pas simplement des rgles du comportement individuel.
Pour simuler ce modle, qui peut tre gnralis plus de deux groupes, il faut passer par un
automate cellulaire ou un systme base dagents. Ce modle a suscit de nombreux dbats
et fait lobjet de nombreuses interprtations et propositions dextension. Nanmoins, en
matire danalyse spatiale stricto sensu, lespace y est rduit un support neutre, nexerant
aucune influence particulire sur la dynamique mme du modle.
Pour disposer dun exemple pratique, nous allons utiliser le logiciel SPACELLE
(http://www.spatial-modelling.info/Cellular-Automata-SPACELLE). A partir de ce logiciel,
il faut ouvrir le fichier Schelling_test.ac5 (lien). Ce fichier reproduit le modle de
Schelling avec un taux de tolrance de 20%. Lorsque vous ouvrez le fichier sous SPACELLE
( Fichier Ouvrir ), vous obtenez une grille totalement vide :
Figure 24 : Visualisation de SPACELLE aprs ouverture du fichier Schelling_test.ac5 .
Premirement, cliquez sur longlet Saisie , puis sur A (Population A) . Ensuite, en

cliquant sur la grille, placez 15 membres de la population A de manire viter quils soient
connexes :
Figure 25 : Positionnement de la population A (15 individus).

Faire de mme avec la population B, pour cela il ne faut pas hsiter mettre la population B
ct de la population A :
Figure 26 : Positionnement des populations A et B (15 individus chacun). La situation est

non sgrge.
Cliquez sur la touche pour lancer la simulation, puis aprs quelques secondes arrtez la
simulation , vous allez pouvoir constater quun processus de sgrgation changer la
situation de dpart :
Figure 27 : Exemple dun rsultat obtenu avec le modle de Schelling aprs plusieurs
itrations, la situation est bien sgrge.
Vous pouvez encore faire tourner le modle. Si les populations A et B continuent se

dplacer, il y a toujours sgrgation :
Figure 28 : Deuxime exemple dun rsultat obtenu avec le modle de Schelling, la situation
est toujours sgrge.
Deuximement, nous allons reproduire lexemple prcdent. Rinitialisez le modle en

cliquant sur , puis cliquez sur longlet Saisie et sur A (Population A) . Ensuite, en
cliquant sur la grille placez les membres de la population A comme ci-dessous. Faites de
mme pour la population B.
Figure 29 : Positionnement des populations A et B. La situation nest pas sgrge.
Ensuite, placez une douzaine despaces vides de manire alatoire, comme ci-dessous :
Figure 30 : Positionnement des populations A et B et dune douzaine despaces vides de

manire alatoire. La situation nest pas sgrge.
Au bout dun certain temps de simulation, vous obtenez de nouveau une rpartition
sgrge :
Figure 31 : Exemple dun rsultat obtenu avec le modle de Schelling, la situation est bien
sgrge.
Les outils de lanalyse spatiale
Pour faire de lanalyse spatiale, il est ncessaire davoir des connaissances dans diffrents
domaines complmentaires la gographie. Comme vous avez t amens le voir
prcdemment, il faut notamment des connaissances en mathmatiques (comme par exemple
pour la loi rang-taille ou le modle de Huff) et en informatique (comme par exemple pour les
modles de sgrgation ou lanalyse de graphes). Ces domaines sont considrs comme des
outils pour effectuer de lanalyse spatiale. De surcrot, lanalyse spatiale nest pas uniquement
compose de modles. Il existe aussi de nombreux indicateurs permettant de mettre en
exergue certains phnomnes spatiaux. Ce complment de cours propose donc trois
initiations : une initiation la statistique spatiale, une initiation la thorie des graphes et
une initiation la simulation informatique.
La statistique spatiale
Un outil privilgi de lanalyse spatiale est lanalyse statistique. En effet, lanalyse spatiale
sappuie sur de linformation gographique qui est compose par des informations
concernant la localisation des objets tudis (cest la composante spatiale) et des
informations relatives leurs caractristiques, leurs proprits (cest la composante
smantique). Or, la statistique propose de nombreux outils, indicateurs, mthodes
permettant danalyser la composante smantique. Ainsi, la solution la plus simple, mais sans
doute pas la plus satisfaisante, pour analyser linformation gographique consiste alors
analyser la composante smantique sans tenir compte de la composante spatiale en effectuant
des analyses statistiques classiques. Ces analyses statistiques peuvent ensuite tre
cartographies afin de tirer profit de la composante spatiale.
Lanalyse de donnes
Les statistiques sont abordes assez tt dans lenseignement des mathmatiques, bien que ce
champ soit plutt rcent (les thories statistiques prennent corps durant le XXme sicle).
En effet, les statistiques trouvent de nombreuses applications pratiques et contribuent
rendre les mathmatiques moins abstraites. Dans les faits, la statistique est un domaine des
mathmatiques qui possde une composante thorique et une composante applique.
Dsormais, le minimum, le maximum, ltendu, la moyenne, la mdiane, les quartiles, lcart-
type et la variance font partie du socle commun des tudes secondaires. Ce sont des lments
permettant de dcrire et de rsumer les variables dune population. On considre cela comme
de lanalyse descriptive de donnes. Nanmoins, ces valeurs simplifient beaucoup la
complexit du jeu de donnes de dpart. Ainsi, des jeux de donnes trs diffrents peuvent
avoir la mme moyenne et la mme mdiane.
Le maximum de la variable j : { }
Le minimum de la variable j : { }
Ltendu de la variable j :
La moyenne de la variable j :
La variance de la variable j : ( ) ( )
Lcart-type de la variable j : ( ) ( )
Avant daller plus loin, il est important de revenir sur quelques termes. Une population est
une collection dobjets ayant des proprits communes (ce sont les lignes de votre fichier
Excel). Ces objets sont appels individus , ces derniers sont les lments de la population
tudie (une ligne = un individu). Ces individus alors caractriss par des variables (ces sont
les colonnes, les champs de votre jeu de donnes). Une variable est alors une proprit
commune aux individus de la population que lon souhaite tudier (une variable = une
colonne). On note alors : X la population ; Xi les individus ; Xj les variable ; xij la valeur prise
par une variable j et un individu i.
A contrario des lments ci-dessus, les distributions ont pour objectif de dcrire finement les
jeux de donnes, tout en simplifiant malgr tout leur interprtation. Pour cela, il peut tre
pertinent davoir recours une reprsentation graphique : le diagramme de frquence ou
diagramme de distribution. Une distribution est simplement une numration de toutes les
valeurs prises par le jeu de donnes tudi avec leurs probabilits (frquences) respectives.
Cette reprsentation peut se faire par plage de valeurs. En matire danalyse spatiale, ces
distributions sappuient gnralement sur des frquences. La frquence dsigne un nombre
d'lments rapport lensemble plus large auquel ces lments appartiennent. Cette
frquence peut s'exprimer en % ou en fraction de 1. Par exemple, prenons le jeu de donnes
suivant : 1, 2, 1, 0, 3, 4, 0, 1, 1, 1, 2, 2, 3, 2, 3, 2, 1, 4, 0, 0. On peut tablir le comptage de
chaque valeur prise par la variable. De ces comptages, on en dduit les frquences
respectives :
Les valeurs Comptage Frquence

0 4 4/20 = 0,2
1 6 6/20 = 0,3
2 5 5/20 = 0,25
3 3 3/20 = 0,15
4 2 2/20 = 0,1
Total : 20 1
Tableau 21 : Le calcul des frquences dune variable.
Figure 32 : Le diagramme dune distribution de frquence.

On peut aussi travailler partir des frquences (des probabilits) cumules. Lorsque ces
frquences cumules sont reprsentes dans un graphique, on parle de diagramme de
rpartition.
Frquence
Valeur Comptage Frquence
cumule
0 4 4/20 = 0,2 0,2
1 6 6/20 = 0,3 0,2 + 0,3 = 0,5
2 5 5/20 = 0,25 0,5 + 0,25 = 0,75
3 3 3/20 = 0,15 0,75 + 0,15 = 0,9
4 2 2/20 = 0,1 0,9 + 0,1 = 1
Total : 20 1
Tableau 22 : Le calcul des frquences cumules dune variable.
Il est aussi pertinent de reprsenter les distributions par des fonctions mathmatiques qui
sen rapprochent (Figure 33). Lorsque lon utilise ces fonctions (courbes), on parle de densit
de distribution ou de rpartition. En thorie des probabilits et en statistique, une loi de
probabilit dcrit le comportement alatoire d'un phnomne dpendant du hasard. Ces lois
de probabilit peuvent alors servir tudier des distributions pour dterminer si les
variables suivent un comportement alatoire.
Figure 33 : Le diagramme dune distribution de frquence et sa fonction mathmatique

approche (ici un polynme du troisime degr).
Par exemple, la loi normale (ou loi gaussienne) est une loi centrale en thorie des
probabilits et en statistique [18]. Elle dcrit le comportement des sries d'expriences
alatoires lorsque le nombre d'essais est trs grand. La loi normale est caractrise par sa
moyenne (qui est galement sa mdiane) et par son cart-type. Sa densit est symtrique et
sa forme est communment appele courbe de Gauss ou courbe en cloche .
( )
( ) [18]

Figure 34 : La loi normale pour diffrentes valeurs (densit de probabilit et de rpartition).
Si lon veut conserver le caractre discret de la distribution, il est possible davoir recours
la binomiale :
( ) ( ) ( ) [19]
Figure 35 : La loi binomiale pour diffrentes valeurs (densit de probabilit et de

rpartition).
Des lois discrtes peuvent se rapprocher de la loi binomiale, comme la loi de Poisson. La loi
de Poisson est la loi des petites probabilits parfois appele loi des vnements rares (c'est--
dire des vnements avec une probabilit faible). Si la loi normale donne une bonne
approximation de la loi binomiale pour q fix et n tendant vers l'infini, la loi de Poisson,
quant elle, dcrit bien la loi binomiale pour n tendant vers l'infini et q tendant vers zro,
avec le produit nq tendant vers une constante.
En gnral, le diagramme de distribution obtenu avec une loi de Poisson est dissymtrique
(par rapport ) avec un talement marqu vers la droite, car les valeurs leves dune
variable de Poisson sont peu rencontres. A mesure que augmente, la forme de la
distribution tend devenir symtrique et sapproche de celle de la loi normale.
( ) ( ) [20]
Figure 36 : La loi de poisson pour diffrentes valeurs de k et de (densit de probabilit et

de rpartition).
Enfin, la loi log-normale est une autre loi de probabilit frquemment rencontre dans la
nature et dans les diverses activits humaines. Une variable alatoire X suit une loi log-
normale quand son logarithme suit une loi normale. Ces lois sont utilises dans le mme
cadre que les lois normales lorsque les observations sont le rsultat dun effet multiplicatif
dun trs grand nombre dautres variables indpendantes entre elles et individuellement
ngligeables.
Figure 37 : La loi log-normale pour diffrentes valeurs (densit de probabilit et de

rpartition).
Depuis le dbut de cette introduction sur les statistiques, nous avons considr que la
population X tait caractrise par plusieurs variables, mais nous avons prsent jusquici
que des outils statistiques qui dcrivent une seule variable et ce indpendamment des autres
(on parle danalyse univarie). Nanmoins, il est souvent pertinent dtudier les relations
pouvant exister entre les variables (on parle danalyse multi-varie). En statistique, les
analyses multivaries tudient la distribution conjointe de plusieurs variables. Les analyses
multivaries sont trs diverses selon l'objectif recherch, la nature des variables et la mise en
uvre formelle. Ainsi, on peut identifier deux grandes familles danalyse : celle des mthodes
descriptives (visant structurer et rsumer l'information) et celle des mthodes explicatives
visant expliquer une ou des variables dites dpendantes (variables expliquer) par un
ensemble de variables dites indpendantes (variables explicatives). Nous allons tout
dabord nous focaliser sur les mthodes descriptives, dans la continuit de ce qui a t dj
prsent.
La covariance est un nombre permettant d'valuer le sens de variation de deux variables

alatoires et, ainsi, de qualifier l'indpendance de deux variables [21]. Une matrice de
covariance est une matrice carre caractrisant les interactions (linaires) entre p variables
alatoires X1, , Xp [22]. Il se rvle aussi intressant dtudier la corrlation entre deux
ou plusieurs variables, cest--dire dtudier lintensit de la liaison qui peut exister entre ces
variables [23]. Une matrice de corrlation regroupe les corrlations de plusieurs variables
entre elles, les coefficients indiquant l'influence que les variables ont les unes sur les autres.
( ) ( )( ) [21]
( ) ( ) ( )
( ) ( ) ( ) [22]
( ( ) ( ) ( ) )
( ) ( )( )
( ) [23]
( ) ( )
De manire gnrale, les analyses multivaries comparent les variables entre elles, mais elles
peuvent aussi tre intressantes pour comparer les individus entre eux. Ainsi, on peut classer
les individus en regroupant ceux qui se ressemblent . Pour cela, on va sappuyer sur des
matrices (tableaux) de distance (de ressemblance, dchange).
Parmi les mthodes danalyse de donnes multivaries, la mthode factorielle est trs
apprcie par les gographes. Ainsi, les manuels danalyse spatiale y font souvent rfrence.
La mthode factorielle a pour but de rduire le nombre de variables en perdant le moins
dinformations possibles, cest dire en gardant le maximum de variabilit totale. Cela
revient projeter les donnes des variables sur un espace de dimension infrieure en
maximisant la variabilit totale des nouvelles variables. Pour faire simple, en rgle gnrale,
on tente de reprsenter les individus dfinis par plusieurs variables sur un graphique 2D
facilement interprtable.
Lanalyse en composantes principales (ou ACP) est la mthode la plus couramment utilise
parmi les mthodes danalyse factorielle. Lobjectif de lACP est purement descriptif : il sagit
dexplorer un ensemble dobservations rassembles sous la forme dun tableau de
donnes. Le tableau de donnes peut tre de dimensions importantes : le nombre de lignes
(dunits statistiques) peut atteindre plusieurs centaines, et le nombre de colonnes (de
variables) plusieurs dizaines. Lanalyse en composantes principales est fonde sur le calcul
des moyennes, des variances et des coefficients de corrlation.
Mathmatiquement, lanalyse en composantes principales est un simple changement de base :

passer dune reprsentation dans la base canonique des variables initiales une
reprsentation dans la base des facteurs dfinis par les vecteurs propres de la matrice des
corrlations. Elle suit les tapes suivantes : 1) on centre le tableau de donnes 2) on calcule la
matrice de variance-covariance 3) on rduit la matrice centre afin davoir une matrice
centre rduite 4) on calcule la matrice des corrlations 5) on dtermine les axes principaux
laide des valeurs et des vecteurs propres de la matrice des corrlations 6) on calcule la
matrice des composantes principales 7) on calcule la qualit de la reprsentation.
Pour illustrer cette mthode danalyse de donnes multivaries, nous allons nous appuyer
sur un exemple concret. Prenons le tableau ci-dessous, qui regroupe 4 individus caractriss
par 3 variables. Afin danalyser ce jeu de donnes, nous allons effectuer une ACP afin de
dterminer les composantes principales nous permettant de le reprsenter au mieux dans un
plan.
Gographie Revenu Age

Individu_1 8 30 55
Individu_2 2 6 40
Individu_3 5 15 30
Individu_4 7 22 40
Tableau 23 : Le jeu de donnes de lACP.
Pour la premire tape, nous allons calculer les moyennes des diffrentes variables (5,5 ;
18,25 ; 41,25) pour les soustraire aux valeurs du tableau de dpart. Cela revient centrer le
tableau de donnes, on obtient la matrice suivante :
( ) [24]
Pour la deuxime tape, il convient de calculer la matrice de variance-covariance. Pour cela,

on effectue une opration matricielle assez simple, en sappuyant sur une matrice diagonale
D. D est appele matrice des poids statistiques (elle est inversement proportionnelle au
nombre dindividus).
( ) [25]
( )( )( )
( ) [26]
Pour rduire la matrice X, qui correspond la troisime tape, on calcule tout dabord une
matrice M. Ensuite, la diagonale de la matrice T est forme par les racines carrs des termes
de M. On peut alors calculer une matrice intermdiaire Y.
( ) ( ) ( ) [27]

( ) ( ) [28]

( ) [29]
Pour calculer la matrice des corrlations, on effectue ds lors les calculs suivants :
( ) [30]

( ) [31]
On dtermine dans un cinquime temps les matrices des vecteurs propres et des valeurs
propres (respectivement u et vap) de la matrice des corrlations R. On obtient :
( ) ( ) [32]
Les deux plus grandes valeurs propres ( 1=2.4598 et 2=0.5368) donnent la valeur de la
variance explique par les 2 axes factoriels choisis pour le plan principal. On calcule alors la
matrice des composantes principales, puis lon obtient les nouvelles coordonnes des
individus dans le plan factoriel.
( ) [33]
C1 C3
Individu_1 -2.2535 0.4984
Individu_2 1.8540 0.9137
Individu_3 0.9882 -0.8891
Individu_4 -0.5886 -0.5230
Tableau 24 : Les nouvelles coordonnes des indivdus dans le plan factoriel.
Enfin, on calcule que 99,99% de la variance est explique par les deux axes factoriels choisis.
En effet, le taux de variance expliqu par les q premiers axes factoriels et relatif aux q plus
grandes valeurs propres est gal :

[34]
En ce qui concerne les mthodes explicatives, la rgression est un ensemble de mthodes

statistiques trs utilis. La rgression permet danalyser la relation d'une variable par
rapport une ou plusieurs autres. Dans le cas le plus simple, lobjectif est dtudier
linfluence dune variable quantitative X sur une autre variable quantitative Y. La premire
est souvent appele variable explicative (ou encore exogne) et la seconde est appele
variable explique (ou encore endogne). Pour cela, on compare les valeurs prises par
chacune des deux variables pour chaque individu. Ainsi, si lon reprsente les variables sur
un graphique avec en abscisse la variable X et en ordonne la variable Y, on peut entrevoir
cette relation si elle existe :
Figure 38 : Deux reprsentations graphiques de relations entre deux variables.
On le voit bien, dans les deux cas ci-dessus, les variables ne se rpartissent pas de nimporte
quelle manire. Les deux courbes traces en noir reprsentent les meilleures estimations
possibles des valeurs de la variable Y en se fondant uniquement sur les valeurs de la variable
X. Autrement dit, dans le cas le plus simple (celui de droite), la rgression cherche une droite
y = ax + b qui dcrive au mieux la tendance du nuage observ. La dmarche la plus
couramment utilise consiste :
faire lhypothse que, pour chaque individu i, on a: yi = a xi + b + ei, o ei est

une certaine erreur appele rsidu ;
rechercher la droite y*=ax+b (la droite des moindres carrs) telle que la
somme quadratique des rsidus ei soit minimale, cest--dire que
soit minimale.
Figure 39 : Notions de droite de rgression et de rsidu .

La mthode des moindres carrs consiste minimiser la variance, en supposant que les
rsidus suivent une loi normale centre. Toutefois, si l'chantillon prsente des valeurs
aberrantes, il vaudra mieux utiliser dautres mthodes. La mthode des moindres carrs est
trs simple appliquer. Elle seffectue laide dun simple produit matriciel. Ce calcul peut se
rvler encore plus simple si la droite de rgression recherche est de type y = ax + b. En
effet, un calcul assez simple montre que :
( )( )
( )
[35]
[36]
Pour avoir une application, prenons un cas thorique o lon cherche dterminer la droite
qui approxime le mieux le revenu mdian des mnages vis--vis de leur distance au centre
(Tableau 25). Il semble en effet quil existe une relation linaire assez vidente entre ces deux
variables (Figure 1).
Revenu mdian (Y) 30 000 28 000 21 000 14 000

Distance au centre (X) 0 100 500 1000
Tableau 25 : Le revenu mdian des mnages et leur distance au centre.
35 000
30 000
25 000
20 000
15 000
10 000
5 000
0
0 200 400 600 800 1000
Figure 40 : Le revenu mdian des mnages et leur distance au centre.
Pour calculer a et b, il faut tout dabord calculer la moyenne des distances au centreX = 400
et la moyenne des revenus mdiansY = 23 250, puis remplir le tableau suivant :
xi Yi xi -X yi -Y (xi -X) (yi -Y) (xi -X) (yi -Y)

0 30 000 - 400 6 750 - 2 700 000 160 000 45 562 500
100 28 000 - 300 4 750 - 1 425 000 90 000 22 562 500
500 21 000 100 - 2 250 - 225 000 10 000 5 056 250
1000 14 000 600 - 9 250 - 5 550 000 360 000 85 562 500
- 9 900 000 620 000
On peut alors calculer a et b :
a = (- 9 900 000) /(620 000) = 15.9677
b = 23 250 15,967 400 = 29636.8
A laide dExcel, on peut facilement vrifier ce calcul, en ajoutant au nuage de point une
courbe de tendance qui par dfaut et de type y = ax +b :
35000
30000
25000
20000
15000
10000
y = -15,968x + 29637
5000
0
0 200 400 600 800 1000
Figure 41 : Le revenu mdian des mnages, leur distance au centre et la courbe de tendance.
Bien quutiles, ces lments classiques de lanalyse statistique font fit de lespace, ce qui nest
videmment pas satisfaisant pour un gographe. Pour que ces analyses soient pertinentes, il
faudrait que chaque objet soit indpendant. Or, prcisment, lespace fait sens et les objets
gographiques ne peuvent gnralement pas tre considrs comme indpendants les uns
des autres, car ils interagissent les uns sur les autres. Pour analyser le rle de lespace, il faut
alors adapter des outils statistiques classiques ou crer des outils spcifiques.
Analyse des corrlations spatiales
Lautocorrlation spatiale est une mesure de la ressemblance des valeurs prises par une
variable en fonction de la localisation gographique de ces valeurs. Autrement dit,
lautocorrlation spatiale mesure lintensit de la relation entre la proximit des lieux et leur
degr de ressemblance. Chaque unit gographique lmentaire de la zone tudie est dcrite
par un attribut ou plusieurs attributs et par les relations de proximit qui la lient aux autres
lieux (matrice de contigut). Si la prsence dun attribut dans un lieu rend sa prsence dans
les lieux voisins plus ou moins probable, on dira que lattribut manifeste une autocorrlation
spatiale. Lautocorrlation spatiale est positive si les lieux proches ont tendance se
ressembler davantage que les lieux loigns. Inversement, elle est ngative si les lieux
proches ont tendance tre plus diffrents que les lieux plus loigns. Lautocorrlation est
nulle quand aucune relation nexiste entre la proximit des lieux et leur degr de
ressemblance.
Les coefficients dautocorrlation spatiale sont alors construits de telle manire quil soit
possible de rpondre la question suivante : la variation dun caractre entre units
contiges est-elle plus ou moins grande que la moyenne des variations observes entre
lensemble des units de la zone tudie prises deux deux ? Il existe plusieurs indicateurs
afin de mesurer lautocorrlation spatiale. Les deux principaux, cest--dire les plus
couramment utiliss, sont les indices de Moran et de Geary.
Indice de Moran
Lindice de Moran mesure le degr dautocorrlation spatiale sous forme dautocovariance
relative des observations pour une variable X. La covariance relative nest autre que le
produit moyen des valeurs observes (et centres sur la moyenne) rapport la variance de
lchantillon [37]. On parlera ici dauto-covariance pour tenir compte du fait que les
produits sont calculs pour une mme variable, mais pour diffrentes observations. On aura
toutefois not lanalogie avec le coefficient de corrlation, qui rapporte la covariance entre
deux variables au produit de leur cart-type. La dfinition classique de lindice de Moran,
appliqu des observations i et j, dpend dune matrice de proximit note lij, prenant la
valeur 0 partout sauf pour les i et j voisins (lij = 1). Quand la variable est normalise (moyenne
= 0 et =1), la covariance relative nest autre que la moyenne des produits croiss des
valeurs de la variable X [38].
( ) ( )
[37]
( )
( ) [38]
O N reprsente le nombre dobjets tudis et L = ( ).
Une extension de cette formule consiste dfinir diffrentes classes de voisinages ; la

matrice lij(dk) prendra dsormais la valeur 1 quand i et j seront distants de dk. On examinera
alors de manire rgulire lvolution de I(dk) de d1 dm (distance laquelle lautocorrlation
devient ngligeable), au moyen dun corrlogramme. Cette criture permet dentrevoir des
calculs par classe de distance croissante, plutt que pour les seuls voisins (espaces
directement contigus).
Les valeurs ngatives (positives) de l'indice indiquent une auto-corrlation spatiale ngative
(positive). Ses valeurs s'tendent de -1 (indiquant une dispersion parfaite) +1 (corrlation
parfaite). Une valeur nulle correspondra une rpartition spatiale parfaitement alatoire de
la variable au sein du territoire tudi. Pour le test d'hypothse statistique, l'indice I de
Moran peut tre transform en Z-scores pour lequel les valeurs plus grandes que +1,96 ou
plus petites que -1,96 indiquent une auto-corrlation spatiale significative avec un taux
d'erreur de 5 %.
Le calcul de Moran est dsquilibr, car certaines observations sont plus reprsentes que
dautres : certaines localits centrales ont en effet plus de voisins que dautres. On choisit
alors de corriger ce biais en calculant un indice Moran corrig du nombre de localits prises
en compte.
Indice de Geary
L'indice de Moran est reli celui de Geary, mais n'est pas identique. L'indice de Moran est
une mesure de l'autocorrlation spatiale globale, tandis que l'Indice de Geary est plus
sensible l'autocorrlation spatiale locale. Lindice de Geary se prsente comme un rapport
entre dune part la variance des carts des valeurs de X entre units spatiales contiges et
dautre part la variance totale de X :
( ) ( ( ) )
[39]
( )
Pour rendre cet indice plus interprtable, on calcule G = 1 G, ce qui donne G = 0 pour
une autocorrlation nulle, G > 0 pour une autocorrlation positive, G < 0 pour une
autocorrlation ngative. La pratique tend montrer que lindice de Moran devrait tre
prfr celui de Geary, du fait de sa plus grande stabilit.
Afin dappliquer cet indicateur, prenons la rpartition spatiale de diffrents objets

gographiques caractriss par une mme variable X :
Figure 42 : Diffrents objets gographiques possdant diffrentes valeurs dune mme

variable.
Tout dabord, on peut dterminer le graphe des relations de contigut :
Figure 43 : Le graphe des relations de contigut.
La moyenne de la variable X vaut ( ) et le calcul de la

variance donne le rsultat suivant :
( ) ( ) ( ) ( ) ( ) ( )
De plus, on a N = 5 et W= 10 (le nombre darcs multipli par 2). Il convient ds lors de

calculer pour toutes les paires dobjets contigus lopration suivante : ( ) . On
obtient le tableau ci-dessous :
AB ( ( )) AC ( ) BA ( ( ))
BC ( ) CA ( ( )) CB ( ( ))
CD ( ) CE ( ) DC ( )
E ( ) Total 22
Tableau 26 : Calculs intermdiaires pour lindice de Geary.
A partir de ces calculs intermdiaires, on peut dterminer G :

( )
Ainsi, G = 1 G = 0,66. La rpartition spatiale de la variable X est donc caractrise par

une autocorrlation positive.
Le quotient de localisation (une mesure locale de la concentration)
Le quotient de localisation est un indicateur de concentration. Il donne une mesure de

limportance relative dune modalit (ou catgorie) dans une unit spatiale, compare son
poids dans les autres units spatiales. Le quotient de localisation est un outil danalyse
spatiale, car il permet de caractriser le degr de concentration dune sous-population dans
une unit spatiale en le comparant toutes les autres units spatiales dun mme ensemble
territorial. Il permet de mener cette comparaison en faisant abstraction des ingalits du
poids des units spatiales et de celui des diffrentes catgories. Il est par exemple employ
pour comparer les rpartitions de diffrentes sous-populations entre des quartiers ou des
lots urbains, et procder ainsi ltude des sgrgations spatiales (ou des spcialisations)
entre ces sous-populations dans les villes ou les rgions.
Soit le tableau ci-dessous (dont les colonnes peuvent reprsenter des communes et les lignes
des types dactivit, les cases reprsentent le nombre demploys) :
C1 C2 C3 Total
B1 x11 x12 x13 x1
B2 x21 x22 x23 x2
B3 x31 x32 x33 x3
Total x1 x2 x3 x
Tableau 27 : Un tableau de contingence.
Si Q(x[ij]) est le quotient de localisation de x[ij] alors :

Q(x[ij]) = (x[ij]/x[j])/(x[i]/x[]) = (x[ij] x[])/(x[i] x[j]) [40]

On obtient par exemple :
Q(x[21]) = (x[21]/x[1])/(x[2]/x[]) = (x[21] x[])/(x[2] x[1])

Le quotient de localisation prend des valeurs suprieures 0. Le point de rfrence se situe
1. Si Q(x[ij]) > 1, le phnomne i est relativement concentr dans la zone j, autrement dit la
zone j est relativement spcialise dans lactivit i (lactivit i occupe dans la zone j une place
plus importante quailleurs). Si lon est familier avec le concept statistique du tableau de
contingence, le quotient de localisation peut tre compris comme tant la valeur dune case
du tableau de contingence divise par sa frquence thorique. En effet, la frquence thorique
F(x[ij]) est dfinie comme suit:
F(x[ij])=(x[i]*x[j])/x[] [41]
Puisque nous avons :
Q(x[ij]) = (x[ij]/x[j])/(x[i]/x[]) = x[ij]/((x[i] x[j])/x[])

Nous en dduisons que :
Q(x[ij]) = x[ij]/F(x[ij]) [42]

A titre dexemple, prenons le tableau de contingence ci-dessous :
Branche
B1 B2 B3 Total
Zone
Z1 48 325 287 660
Z2 27 185 148 360
Z3 45 90 45 180
Total 120 600 480 1200
Tableau 28 : Emploi par zone et par branche.
Pour Q(x[z2b1]), on calcule :

( )

Plus gnralement, on obtient les quotients de localisation suivants :
Branche
B1 B2 B3
Zone
Z1 0,727 0,985 1,087
Z2 0,750 1,028 1,028
Z3 2,500 1,000 0,625
Tableau 29 : Les quotients de localisation.

Mesure (gnrale) de lingalit : indice de Theil, indice de Gini.
Lindice de Theil est une mesure gnrale du degr de concentration gographique dun
semis de points dnombr dans une grille spatiale. Le raisonnement repose sur la
comparaison de deux distributions de frquence avec rfrence lquirpartition dune part
et la concentration absolue dautre part. Historiquement, la construction de lindice de
Theil sinspire du concept dentropie, emprunt la thorie de linformation. En effet, en
1967, Theil introduit un nouvel indicateur dingalit de revenu driv dune analogie de la
seconde loi de thermodynamique (la loi de lentropie). Celle-ci mesure le dsordre dun
systme thermodynamique, en offrant la possibilit dvaluer la contribution des ingalits
intergroupes et intragroupes lingalit totale. Lentropie est linformation espre dans
une distribution laquelle est associe une probabilit. Theil effectue une transposition en
remplaant lide de probabilit, par les parts de revenu de chaque sous population calcules
partir du revenu total de la population mre.
Ainsi, en analyse spatiale, soit i une maille parmi les n que comprend la zone tudie, m i le
nombre de points que cette maille concentre parmi les m points de la zone. On se place ici
dans la situation la plus simple, qui est celle dun dnombrement des points du semis dans
une grille spatiale rgulire. ni est le nombre de mailles de population m. Le nombre moyen
de points regroups dans une maille tant gal m/n et :
[43]
Avec mi/m = gi et ni/n = fi, on a :
( ( )) ( ( ) ( )) [44]
Cet indice tend vers 0 quand la concentration est minimale et tend vers log (fi) quand la
concentration est maximale g1 = 1 et si i 1 gi = 0.
Plus gnralement, cet indice se calcule pour toute distribution dune variable quantitative.
Prenons alors un exemple trs simple. Soit trois revenus : 1 euro ; 1euro ; 7 euros. On a
alors : g1= 1/9 ; g2 = 1/9 ; g3 = 7/9. Pour les frquences : f1 = f2 = f3 = 1/3. A partir de
ces lments, on peut calculer lindice de Theil :
T= 1/9 ln(1/3) + 1/9 ln(1/3) + 7/9 ln(7/3)
Pour des revenus de 3 euros ; 3 euros ; 3 euros. On obtient T = 0.
A noter que lindice de Theil permet de dcomposer les ingalits. Cette proprit permet de
distinguer les ingalits inter-rgionales des ingalits intra rgionales.
On ne peut voquer lindice de Theil sans voquer lindice de Gini. Le coefficient de Gini est
originellement une mesure du degr d'ingalit de la distribution des revenus dans une
socit. Cette mesure a t dveloppe par le statisticien italien Corrado Gini. Le coefficient
de Gini est un nombre variant de 0 1 o 0 signifie l'galit parfaite (tout le monde a le
mme revenu) et 1 signifie l'ingalit totale (une personne a tout le revenu et les autres n'ont
rien). Le coefficient de Gini se calcule par rapport la fonction (dont la reprsentation
graphique est la courbe de Lorenz) qui associe chaque part de la population (ordonne par
revenu croissant) la part que reprsente ses revenus. Ce coefficient estime alors l'ingalit en
mesurant l'cart entre la courbe de Lorenz et une courbe reprsentant une rpartition gale
des revenus. Plus prcisment, le coefficient de Gini est gal la diffrence entre 1 et le
double de l'intgrale de la fonction reprsente par la courbe de Lorenz [45]. En pratique,
on ne dispose pas de cette fonction, mais du revenu par tranches de la population. Ainsi,
pour n tranches, le coefficient de Gini s'obtient par la formule de Brown :
( )( ) [45]
o X est la part cumule de la population possdant un certain revenu et Y la part

cumule du revenu.
Par exemple, prenons le jeu de donnes ci-dessous qui rsume la rpartition des salaires
mensuels dans une socit. :
Salaire mensuel Effectif de la classi i : ni

[500 ; 1500[ 50
[1500 ; 2500[ 125
[2500 ; 5500] 25
Tableau 30 : Rpartition des salaires mensuels dans une socit.
A partir de ce tableau, on peut calculer les frquences cumules des salaires mensuels.
Salaire mensuel Effectif Frquence Frquence cumule

[500 ; 1500[ 50 50/200 = 0.25 0.25
[1500 ; 2500[ 125 125/200 = 0.625 0.875
[2500 ; 5500] 25 25/200 = 0.125 1
Tableau 31 : Calcul des frquences cumules des salaires mensuels (par classe).
De mme, on peut calculer les frquences cumules de la masse salariale.
Salaire Centre de Masse Pourcentage Frquence

Effectif
mensuel la classe salariale masse salariale cumule
[500 ; 1500[ 50 1000 50 000 0.125 0.125
[1500 ; 2500[ 125 2000 250 000 0.625 0.75
[2500 ; 5500] 25 4000 100 000 0.25 1
Tableau 32 : Calcul des frquences cumules des masses salariales (par classe).
Ds lors, il est possible de reprsenter la courbe de Lorenz, avec en abscisse les frquences
cumules des salaires mensuels et en ordonne les frquences cumules des masses salariales.
Figure 44 : La courbe de Lorenz.
Pour dterminer le coefficient de Gini, il faut calculer laire du triangle A et des trapzes B et
C:
( ) ( )
( ) ( )
On obtient alors :
( )
Comme 0,2032 est une valeur faible, la concentration des salaires est plutt faible, on peut
donc en dduire que les salaires sont assez bien rpartis dans cette entreprise.
La thorie des graphes et lanalyse de rseaux

Les rseaux (techniques ou sociaux) tiennent une place particulire en gographie. En effet,
il nexiste pas de territoire sans rseau. Ltude des rseaux constitue donc un point trs
important de lanalyse spatiale. En gographie, ltude des rseaux vise expliciter les
relations existant entre des lieux au pralable disjoints et considrer que ces lieux ne sont
pas des lments indpendants.
Un graphe G = (N ; L) se dfinit mathmatiquement comme un ensemble fini de sommets N

et de liens L. Le nombre dlments dans N et L est respectivement not N (ou e) et K (ou v).
Un graphe se dfinit par son ordre qui correspond au nombre de sommets et par sa taille qui
est dfinie par le nombre de liens. Ainsi, la modlisation dun rseau, qui comporte des
lments de natures diverses formant un systme plus ou moins complexe, sous la forme
dun graphe, qui nest quun simple ensemble de nuds et darcs, nest pas une opration
neutre. La reprsentation dun graphe peut se faire de deux manires quivalentes : soit par
un schma soit par un tableau (comme la matrice dadjacence). Dans les faits, la
reprsentation sous forme de schma nest utilise que pour reprsenter les rsultats des
analyses. Lanalyse de rseaux se focalise sur lanalyse et la manipulation de la matrice
dadjacence qui reprsente les nuds directement relis par un 1 et les autres par un 0.
Figure 45 : Les notions de rseau , de graphe et de matrice dadjacence.
Le fait de prendre en compte ou non la direction des liens caractrise la diffrence entre un
graphe orient et un graphe non orient. Si le graphe est non orient, la matrice dadjacence
correspondante est symtrique. De surcroit, on distingue aussi deux types de graphes en
fonction de la nature des liens : les graphes binaires (ou boolens) o les liens traduisent
lexistence dune relation entre deux sommets ; les graphes valus (pondrs) o les liens
traduisent la prsence et lintensit (la distance ; le poids) de la relation.
Pour complter un peu le vocabulaire, un sommet a est dit incident un lien l lorsquune des
extrmits de l est a. Si lautre extrmit de l est un sommet b, on dit que a et b sont
adjacents ou voisins (do le terme de matrice dadjacence). La distance la plus courte
mesure en nombre de liens entre deux sommets est nomme distance godsique ( ne pas
confondre avec la distance gographique pour un graphe valu). On appelle chane un
parcours sur un graphe non orient allant dun sommet un autre en empruntant des artes,
lorsque le graphe est orient, on utilise le terme chemin. Une chane (ou un chemin) est dite
lmentaire si chaque sommet y apparat au plus une fois. Lorsque le dpart et larrive de
cette chane (ou de ce chemin) lmentaire est le mme sommet, on parle de cycle (graphe
non orient) ou de circuit (graphe orient). Un graphe est dit connexe lorsquil existe un
chemin ou une chane entre toutes les paires de sommets.
Certaines proprits des graphes mritent dtre cites car elles connaissent de nombreuses
applications. Un graphe eulrien dsigne un graphe pour lequel il existe une chane passant
une fois (et une seule fois) par tous les liens du graphe. Dans un graphe hamiltonien, il existe
un cycle passant par tous les sommets du graphe.
Historiquement, un certain nombre de mesures permet de rsumer de faon relativement

simple la structure d'un rseau donn. Ces mesures sont trs diverses car chacune dcrit
seulement une partie de la structure d'ensemble. Une seule mesure ne suffit donc pas
conclure sur la nature d'un graphe. Les mesures de la thorie des graphes sont parfois juges
non robustes, car elles sont uniquement fondes sur le nombre de nuds et de liens. Ces
mesures peuvent donc fournir des rsultats identiques pour deux graphes dont la
morphologie diffre voire s'oppose. Cela explique sans doute pourquoi ces mesures ne sont
quasiment pas utilises par les physiciens, qui tentent par tous les moyens d'en proposer des
nouvelles.
De manire gnrale, il est important de connatre la taille dun rseau ainsi que sa
rpartition, ce qui permet de dcrire sa structure. On parle de mesures globales. Ainsi, la
taille d'un rseau se mesure en nombre de sommets (e) et de liens (v), ainsi que par le
diamtre (le diamtre cest le plus long des plus courts chemins godsiques) et le nombre de
composants connexes (p). Dans le cas d'un rseau valu, et selon les informations
disponibles, la longueur et le poids des liens peuvent tre additionns pour renseigner la
taille du rseau. Dautres indicateurs classiques sont trs utiliss en gographie des
transports : les indicateurs et mesure ainsi la connexit du graphe (lorsquil existe quun
seul passage pour relier les sommets dun rseau, les liens peuvent constituer des enjeux
stratgiques, en revanche la multiplicit des liens rend cette dconnexion plus difficile, cest
le niveau de connexit) ; lindice mesure la connectivit.
[46]
[47]
[48]
[49]
( )
Plus particulirement, certains indicateurs mesurent des proprits plus locales. Nanmoins,
en calculant les moyennes de ces indicateurs, il est possible dobtenir de nouvelles mesures
globales. Les mesures locales de voisinage dcrivent la situation dun lment par rapport
ses voisins immdiats (directement connects ou adjacents) et les mesures locales densemble
rendent compte de la situation dun lment par rapport tous les autres lments de mme
nature prsents dans le rseau. Les indicateurs de voisinage par excellence sont les mesures
de degrs et les mesures de clustering (de transitivit). La plupart des mesures densemble
sont des mesures daccessibilit. Par exemple, lindice de Shimbel se calcule partir dune
matrice des distances : en additionnant simplement les lignes ou les colonnes. Le sommet
dont la somme est la plus faible est le sommet le plus accessible. La centralit de proximit
est simplement linverse de lindice de Shimbel et prsente lavantage dtre normalise entre
0 et 1. Enfin, la centralit dintermdiarit (betweenness) a retenu lattention de nombreux
travaux rcents. Les sommets ayant un niveau lev de centralit dintermdiarit sont ceux
qui permettent de limiter la distance parcourir dans le rseau. Ce sont des points de
passage incontournables dans une logique de plus court chemin. Leur suppression conduirait
donc ralentir le flux, puisque ce dernier devrait passer par des chemins plus longs.
Le degr : [50]
Le degr pondr : [51]
Indice de Shimbel (loignement) : [52]
Centralit de proximit : [53]

()
Centralit intermdiaire : [54]
()
Clustering coefficient : () [55]
( )
La simulation informatique
Trs clairement, les progrs rcents en analyse spatiale sont fortement lis au
dveloppement de linformatique. Linformatique offre des possibilits nouvelles en matire
de simulation, mais elle offre aussi des outils pertinents pour crer des modles. Dans ce
complment de cours, nous allons introduire les automates cellulaires, les systmes agents et
la programmation oriente objet.
Les automates cellulaires
Un bon exemple illustrant la puissance des outils informatiques en gographie concerne les
automates cellulaires. En effet, le principe de fonctionnement des automates cellulaire est
extrmement simple. Et pourtant, ils permettent de simuler des processus complexes comme
les dynamiques urbaines. Un automate cellulaire est une grille rgulire de cellules
chacune caractrise par un tat . Cet tat peut alors voluer au cours du temps. L'tat
d'une cellule au temps t+1 est fonction de l'tat au temps t d'un nombre fini de cellules
considres comme son voisinage . chaque nouvelle unit de temps, les mmes rgles
sont appliques simultanment toutes les cellules de la grille, produisant une nouvelle
gnration de cellules dpendant entirement de la gnration prcdente. tudis en
mathmatiques et en informatique thorique, les automates cellulaires sont la fois un
modle de systme dynamique discret et un modle de calcul. Le modle des automates
cellulaires est remarquable par l'cart entre la simplicit de sa dfinition et la complexit que
peuvent atteindre certains comportements macroscopiques : l'volution dans le temps de
l'ensemble des cellules ne se rduit pas (simplement) la rgle locale qui dfinit le systme.
Le jeu de la vie est un automate cellulaire bien connu. Le jeu de la vie se droule sur une
grille deux dimensions o les cellules peuvent prendre deux tats distincts :
vivantes ou mortes . chaque tape, lvolution dune cellule est entirement
dtermine par ltat de ses huit voisines de la faon suivante :
Une cellule morte possdant exactement trois voisines vivantes devient vivante
(elle nat).
Une cellule vivante possdant deux ou trois voisines vivantes le reste, sinon elle
meurt.
Figure 46 : Le jeu de la vie.

En gographie, les automates cellulaire sont parfaits pour simuler des modles de
sgrgation de type Schelling . Ils peuvent aussi reconstituer des processus dvolution de
croissance urbaine. Tout lenjeu est alors de dterminer les rgles qui vont rgir lautomate.
Figure 47 : Un automate cellulaire reproduisant les dynamiques urbaines (Langlois, 2010).
Figure 48 : Le modle dun automate cellulaire (Langlois, 2010).
De nombreux logiciels permettent dimplmenter des automates cellulaires. A titre

dexemple, le logiciel SpaCelle, dvelopp par le laboratoire Thema, permet dimplmenter
simplement des automates cellulaires. Le jeu de la vie est ainsi assez simple implmenter
dans SpaCelle. Le programme dans sa version 5 ncessite de dfinir plusieurs grands
paramtres. Les paramtres gnraux denvironnement qui dfinissent la forme des cellules
(carr ou hexagonal), la topologie (voisinage de Moore ; Manathan), la taille des cellules, la
fonction dvaluation (uniforme ; inverse de la distance), le nombre de colonnes et de

lignes, le nombre dtats
topo=1
formeCell=0
topo=1
fctEval=0
alpha=1.000000
mode=0
univers=0
nc=10
nl=10
nEtats=2
nCch=1
x0=0.000
y0=0.000
tailleCell=1.000
NoData=255
De surcrot, il faut ajouter des informations sur les tats (notamment leur nom, leur couleur
et leur type), les couches, les dures de vie, les rgles et la matrice dtats.
Etats
001921921920M Mort
01255000V Vivant
couches
00 2TCoucheCells C0 Jeuvie 10 0.500
0 Dures de vie
2 Rgles
M>V=NV(V; 1 ; 3)
V>M=SV(V; 1 ; 2 ; 3)
TCoucheCells0C0
0000000000
0000010000
0000010000
0000010000
0000000000
0000000000
0011100000
0000000000
0000000000
0000000000
Le fichier dfini peut tre enregistr en lui affectant une extension .ac5 . Aprs avoir
lanc le logiciel SpaCelle, vous pouvez ouvrir le fichier que vous venez de crer en cliquant
sur Fichier Ouvrir . Lautomate cellulaire souvre (Figure 49).
En cliquant sur le bouton , il est possible de lancer une itration. Lors de cette itration les
cellules ont chang dtat, car certaines cellules sont nes et dautres sont mortes. Si vous
refaites une itration, vous revenez ltat initial (Figure 50).
Enfin, il est possible deffectuer plusieurs itrations en cliquant sur le bouton . Vous
pouvez alors constater que lon a produit un automate cellulaire qui tourne en rond. Bien que
les automates cellulaires permettent de simuler certains processus, il est vident que ceux-ci
ne peuvent pas simuler de tous les processus complexe. La programmation oriente objet
offre des possibilits beaucoup plus grandes en la matire.
Figure 49 : Lautomate cellulaire dvelopp correspondant au jeu de la vie.
Figure 50 : Lautomate cellulaire dvelopp aprs une premire itration.
La programmation oriente objet
Les premiers ordinateurs taient programms laide de cartes perfores, les instructions
tant donnes sous la forme de 0 ou de 1 quil fallait rentrer manuellement. Les
programmeurs devaient se confronter directement au langage machine, cest--dire au
langage brut que comprend la machine. Au milieu des annes 1950 apparurent les premiers
langages de programmation, dont lobjectif primordial tait de dtacher le programmeur du
langage machine. Depuis, les programmes sont crits dans un dialecte relativement
comprhensible respectant une syntaxe et une grammaire stricte et prcise. Comme les
langages furent dvelopps essentiellement par des anglos-saxons, on pourrait les qualifier
de langue anglaise trs simplifie.
Tandis que le langage machine est, par nature, trs li llectronique de lordinateur, le
dveloppement des langages de programmation a ouvert la voie labstraction, principe
fondamental qui cherche loigner autant que possible le programmeur des contingences
matrielle pour le rapprocher des concepts et des choses concrtes quil doit traiter. Ainsi, il
existe diffrents paradigmes de programmation. Un langage de programmation est dit de
bas niveau lorsque le codage de celui-ci se rapproche du langage machine (dit "binaire"), et
permet donc de programmer un degr trs avanc. Les langages de bas niveau sont
opposer aux langages de haut niveau, qui permettent de crer un programme sans tenir
compte de la faon dont fonctionne le matriel de l'ordinateur cens excuter le programme.
A chaque volution, lobjectif est de permettre la meilleure reprsentation informatique
impossible, la plus intuitive possible sur laquelle opre le programme.
De surcrot, il est important de faire la diffrence entre les langages interprts (Python) et
compils (C++). Les programmes interprts ne sont pas directement excuts par
lordinateur mais plutt par un interprteur. Grossirement, linterprteur lit les instructions
du programme et les transforme en instructions destines la machine. Linterprteur est
donc toujours ncessaire pour excuter un programme en langage interprt. Les
programmes crits dans un langage compil doivent subir une phase intermdiaire, la
compilation, lissue de laquelle on obtient un fichier directement excutable par la machine.
La compilation est effectue par un compilateur, qui nest alors plus ncessaire ds que le
fichier excutable a t produit.
En termes de paradigme, nous allons dans ce complment de cours nous intresser la

programmation oriente objet. En effet, la programmation oriente objet est aujourdhui un
des paradigmes les plus rpandus. Il consiste en la dfinition et l'interaction de briques
logicielles appeles objets ; un objet reprsente un concept, une ide ou toute entit du
monde physique, comme une voiture, une personne ou encore une page d'un livre. Cet objet
possde une structure interne et un comportement, et il sait communiquer avec ses pairs. La
communication entre les objets via leurs relations permet de raliser les fonctionnalits
attendues.
Plus prcisment, quest-ce quun objet ? Il sagit avant tout dun mcanisme dabstraction
qui repose sur un principe fondamental. La chose manipule par le programme est plus que
la simple collection de ses caractristiques. Pour modliser cette chose, il faut alors prendre
en compte des mthodes. Une voiture ce nest pas seulement une vitesse et du carburant,
cest aussi une consommation de carburant en fonction de la vitesse du vhicule. Ainsi, si
jattribue une vitesse une voiture, automatiquement je suis amen modifier la variable
carburant selon la mthode consommation (on parle dencapsulage). De plus, les
caractristiques dfinissant une voiture peuvent tre modifies pour dfinir une moto, ces
vhicules drivent donc dune mme classe, celle des vhicules (on parle dhritage)
Python est un langage orient objet de haut niveau interprt trs rpandu, bnficiant de
nombreuses bibliothques et dune communaut importante de dveloppeurs et
dutilisateurs. Il est rput pour tre facile daccs. Il est notamment trs utilis par les
scientifiques. Pour apprendre bien programmer en Python et bnficier ainsi de toute la
puissance de la programmation oriente objet, je vous conseille linitiation la
programmation avec Python et C++ de Yves Bailly. Dans ce complment de cours, nous
allons prsenter succinctement ce langage afin dutiliser une bibliothque danalyse spatiale
dveloppe en Python.
Python est un langage qui peut tre utilis dans de nombreux contextes et s'adapter tout
type d'utilisation grce des bibliothques spcialises chaque traitement. Il est cependant
particulirement utilis comme langage de script afin dautomatiser des tches simples
mais fastidieuses. Python a t conu pour tre un langage lisible. Il vise tre visuellement
pur. Ainsi, il utilise des mots anglais l o d'autres langages utilisent frquemment de la
ponctuation, et possde galement moins de constructions syntaxiques que de nombreux
langages structurs tels que C, Perl, ou Pascal. Les commentaires sont indiqus par le
caractre croisillon. De plus, les blocs sont identifis par l'indentation (ie. l'ajout de
tabulations ou d'espaces dans un fichier texte), au lieu d'accolades comme en C ou C++ ; ou
de begin ... end comme en Pascal. Une augmentation de l'indentation marque le dbut d'un
bloc et une rduction de l'indentation marque la fin du bloc courant. Ds lors, Python
requiert une rigueur dans lcriture des scripts, cest donc un langage pdagogique obligeant
ne pas coder vulgairement . Ainsi, une ligne correspond une commande et une colonne
correspond un niveau.
Commenons par introduire laffectation qui se fait laide du signe galit :

>>> a=2
>>> b=3
Lensemble des oprations mathmatiques seffectue simplement. Pour afficher le rsultat
dune opration il faut avoir recours la commande print :
>>> e=a+b
>>> print e
5
Attention, la division rserve des surprises, car par dfaut Python effectue une division
entire :
>>> e=a/b
>>> print e
0
Pour obtenir, la valeur gnralement attendue, il faut utiliser la commande float() :
>>> e=a/float(b)
>>> print e
0.666666666667
Les objets couramment utiliss en Python sont les chanes de caractre et les listes.
Loprateur + permet alors de concatner ces objets :
>>> a="tr"
>>> print a
tr
>>> b=2
>>> e=a+b
Traceback (most recent call last):
File "<input>", line 1, in <module>
TypeError: cannot concatenate 'str' and 'int' objects
>>> b=str(b)
>>> print(b)
2
>>> e=a+b
>>> print e
tr2
>>> liste=[1,2]
>>> print liste
[1, 2]
>>> liste=liste+[4,5,6]
>>> print liste
[1, 2, 4, 5, 6]
>>> print liste[4]
6
>>> print liste[0]
1
Enfin, les boucles sexcutent de cette manire :
>>> for i in range(3) :
... print i
...
0
1
2
Pour plus dinformations, il existe dexcellentes introductions : http://www.larsen-
b.com/static/intro_python/ ; http://tdc-www.harvard.edu/Python.pdf.
Ici, nous allons nous limiter une application danalyse spatiale. Pour cela, nous allons
utiliser la bibliothque danalyse spatiale Pysal4. Avant dinstaller Pysal, il bien sr avoir
install au pralable une version de Python (http://www.python.org/download/), mais il
faut aussi avoir install les bibliothques Numpy et Scipy5. Tous ces tlchargements (et ces
installations) peuvent paraitre fastidieux. Nanmoins, ils traduisent prcisment la force de
Python qui est un langage disposant de nombreuses bibliothques.
A laide de Pysal, nous allons maintenant chercher dterminer, sil existe une
autocorrlation spatiale concernant les homicides dans la rgion de Saint-Louis (aux tats-
Unis) de 1988 1993. La reprsentation cartographique (classification effectue partir des
seuils naturels de Jenks) semble laisser apparaitre une autocorrlation spatiale positive, mais
ce nest pas si vident (Figure 51).
Pour calculer les indices de Geary et de Moran, il convient simplement de taper le code
suivant :
>>> Import pysal
>>> f = pysal.open(pysal.examples.get_path("stl_hom.dbf"))
>>> y = np.array(f.by_col['HR8893'])
>>> w = pysal.open(pysal.examples.get_path("stl.gal")).read()
4 http://code.google.com/p/pysal/downloads/list
5 http://www.scipy.org/scipylib/download.html
>>> gc = pysal.Geary(y, w)
>>> gc.C
0.59712821589368859
>>> mi = pysal.Moran(y, w)
>>> mi.I
0.24365582621771659
Les indices de Moran et de Geary ont des valeurs positives, il semble donc quil y ait
autocorrlation spatiale .
Figure 51 : Affichage des homicides dans la rgion de Saint-Louis laide de QGIS.
La programmation oriente objet peut tre juge un peu contraignante apprendre.

Dvelopper des simulations requiert ainsi un investissement important si lon ne connait pas
un langage de programmation et ses bibliothques. Les systmes agents peuvent alors
reprsenter une alternative, car des applications permettent de les programmer facilement.
Les systmes agents
Les concepts d'agent et de systme multi-agents appartiennent au domaine de

l'Intelligence Artificielle. Le concept d'agent est une extension du concept d'objet (au sens de
la programmation oriente objet) utilis en informatique. Un agent peut tre dfini comme
un objet poursuivant un but. Pour ce faire, un agent dispose dune certaine autonomie
d'action. Il est ainsi capable d'interagir avec les autres agents du systme. Depuis le milieu
des annes 1990, la simulation informatique et les mthodes individu-centres connaissent
de nombreux dveloppements dans les sciences sociales. Ces mthodes offrent la possibilit
de modliser les comportements et les interactions au niveau des entits lmentaires (des
individus) dun systme afin de simuler la dynamique dun phnomne un niveau suprieur.
Il sagit ainsi de comprendre comment des dynamiques et des rgularits prsentes un
niveau global dobservation peuvent merger des interactions qui se produisent un niveau
jusquici mis de ct par les mthodes classiques de modlisation, le niveau local. Mais il
sagit galement dexplorer les effets de ces phnomnes mergents sur lvolution des
comportements individuels : il ne suffit plus dobserver de manire distincte lunivers

collectif et lunivers individuel, il peut tre pertinent dtudier les relations entre les deux.
Par exemple, la diffusion est lie un ensemble dactions pouvant conduire diverses
trajectoires : du succs lchec. Lobjectif est alors de construire des modles capables de
gnrer cette diversit des futurs possibles, rompant ainsi avec une tradition de modlisation
des seuls succs de diffusion. Dans ce contexte, on pose lhypothse quen se situant au
niveau des entits lmentaires, cest--dire au niveau des units dcisionnelles de base, il est
possible de proposer ce type de modle. On postule ainsi que la rptition de processus plus
ou moins labors au niveau individuel a une incidence sur le devenir de la diffusion un
niveau global, la fois dans les taux de propagation, leurs distributions spatiales et la vitesse
de diffusion de linnovation. Il reste alors dcrire les lments qui paraissent jouer un rle
essentiel au niveau local pour rendre compte de possibles observations un niveau global.
Or, un SMA est un programme informatique compos dagents, cest--dire dentits

informatiques autonomes capables dagir sur elles-mmes et sur leur environnement. Dans
un univers multi-agents, lagent peut communiquer avec dautres agents et se dplacer. Son
comportement est alors la consquence de ses observations, de ses comptences et des
interactions avec les autres agents. Le temps est directement intgr sous la forme dune
horloge qui rythme les squences dactions des agents.
Selon une problmatique de diffusion apprhende au travers dune modlisation multi-

agents, il est possible de poser lhypothse que lhtrognit des situations spatiales et
sociales et la diversit des comportements individuels sont les principaux moteurs des
dynamiques de propagation. Dans ce contexte, la comptence dun agent relve en partie de
son aptitude innover, ses connaissances relvent en partie de ses observations et tout ceci
est li aux nombreuses interactions et communications quil entretient avec les autres
agents. Cette diversit des situations doit permettre de dcrire et expliquer des phnomnes
que lon observe gnralement un niveau agrg. Les SMA offrent galement la possibilit
de rintroduire de la rciprocit entre une approche micro et une approche macro, car si les
individus sont lorigine des structures sociales et spatiales, celles-ci peuvent contraindre en
retour le comportement de ces individus.
Pour prendre un exemple simple, nous allons utiliser Netlogo qui est un logiciel vraiment
simple permettant de dvelopper des systmes agents. Ainsi, nous allons crer des moutons
(un peu idiots) qui se dplacent de manire alatoire et cherchent seulement manger pour
survivre et se reproduire. Nanmoins, plus les moutons sont nombreux, plus ceux-ci
consomment la ressource en herbe, plus celle-ci est difficile trouver. Un systme de
rgulation tend alors faire diminuer le nombre de moutons qui meurent de faim, car dans
leur dplacement alatoire ils ne trouvent plus dherbe pour se nourrir. Si ce processus de
rgulation est trop violent, il peut y avoir extinction de lespce.
Pour cela, il faut ouvrir un nouveau fichier, dans lequel il faut conserver linterface central
dfini par dfaut et y ajouter deux boutons. Un bouton setup qui permettra de crer une
situation initiale et un bouton go qui lancera la simulation. Pour cela, il suffit de
slectionner dans la barre des tches loutil bouton (parfois il se rvle ncessaire de
cliquer sur Add ).
Figure 52 : Barre des tches de NetLogo.
Ds lors, il suffit de positionner les boutons o lon souhaite sur linterface laide dun
simple clic. Une fois positionne, il est possible de les diter car une bote de dialogue souvre
automatiquement (sinon il est possible de faire un clic droit sur le bouton et de cliquer sur
Edit ). Remplissez les deux botes de dialogue de la manire suivante :
Figure 53 : Edition dun bouton setup dans NetLogo.
Figure 54 : Edition dun bouton go .

Pour que les itrations soient automatiques, cochez la case forever lors de ldition du
bouton go . Les boutons apparaissent en rouge, car ils nimplmentent aucune action.
Pour linitialisation, tapez le code ci-dessous. Premirement, ce code qui nettoie tout, puis
cre cinq turtles , en loccurrence des moutons rouges qui sont rpartis de manire
alatoire dans la grille. Enfin, ce code rempli de vert toutes les cellules (ce qui reprsente
lherbe).
to setup
clear-all
create-turtles 5 [ setxy random-xcor random-ycor set color red ]
ask patches [ set pcolor green ]
reset-ticks
end
Les moutons vont alors se dplacer de manire alatoire chaque itration, ce qui leur coute
de lnergie. Ils vont aussi chercher manger de lherbe, ce qui leur donne de lnergie et
provoque la diminution du stock dherbes disponible (les cellules deviennent noires ds quun
mouton mange de lherbe). Nous obtenons le code suivant.
to move-turtles
ask turtles [
right random 360
forward 1
set energy energy - 1
]
end
to eat-grass
ask turtles [
if pcolor = green [
set pcolor black
set energy energy + 5
]
]
end
A ce rythme-l, la simulation peut tourner linfini car les moutons ne meurent jamais. Il
faut donc programmer leur mort par manque dnergie.
to check-death
ask turtles [
if energy < 0 [ die ]
]
end
Cette fois-ci les moutons meurent vites car la ressource est vite amene manquer. Il faut
donc prvoir un renouvellement de la ressource qui peut se faire de manire plus ou moins
alatoire.
to regrow-grass
ask patches [
if random 100 < 1 [ set pcolor green ]
]
End
Nanmoins, si les moutons peuvent vivre plus longtemps, ils ne capitalisent pas pour autant
sur leur bonne sant, le nombre de moutons ne dpassera donc jamais leur nombre initial.
Nanmoins, comme un mouton bien nourri en vaut deux, il semble ncessaire de prvoir des
naissances. Ainsi, ds quun mouton atteint une nergie de dix, il peut donner naissance un
mouton dnergie 5 et perd en contrepartie 5 points dnergie (car se reproduire est trs
fatigant). On peut alors implmenter la fonction suivante.
to naissance
ask turtles [
if energy > 10 [
set energy energy - 10
hatch 1 [ set energy 5 ]
]
]
end
Pour lancer tous ces codes, il faut crer le code dinteraction avec le bouton go qui va
chaque itration appeler lensemble des fonctions programmes, compter le nombre
ditrations ( tick ) et arrter le programme sil ny a plus de moutons ( if not any? turtles
[ stop ] ). Il faut de plus ne pas oublier de prciser que les moutons ont une variable
energy .
turtles-own [energy]
to go
if not any? turtles [ stop ]
move-turtles
eat-grass
check-death
regrow-grass
naissance
tick
end
Voil, le tour est jou, vous pouvez effectuer vos simulations. Pour aller plus loin, vous
pouvez crer des sliders afin de faire varier la vitesse de repousse de lherbe, le nombre
initial de moutons, la valeur nutritionnelle de lherbe. De mme, vous pouvez crer des
graphiques qui affichent la surface dherbe et le nombre de moutons au cours du temps.
Figure 55 : Une simulation laide de NetLogo.

Figure 56 : Une deuxime simulation laide de NetLogo.
Rfrences
Pumain D., Saint-Julien T., L'analyse spatiale, tome 1 : Les localisations dans l'espace, Armand
Colin, collection Cursus , 2010.
Pumain D., Saint-Julien T., Analyse spatiale, tome.2 : interactions spatiales, Armand Colin,
collection Cursus , 2010.
Ciceri M.F, Marchand B., Rimbert S., Introduction l'analyse de l'espace, Armand Colin,
collection U , 2010.
Bavoux J.P., Initiation lanalyse spatiale, Armand Colin, 2010.
Caloz R., Collet C., Dumolard P., Analyse spatiale de l'information gographique, Presses
Polytechniques Universitaires Romandes, Science et ingnierie de l'environnement, 2011.
Bailly Y., Initiation la programmation avec Python et C++, Pearson, 2011.
Drogoul A., Treuil J.P., Zucker J.D., Modlisation et simulation base dagents: Exemples
comments, outils informatiques et questions thoriques. Dunod, 2008.
Liens prcieux
Gnraliste
http://www.hypergeo.eu/
http://www.spatial-modelling.info/
http://grasland.script.univ-paris-diderot.fr/
Pour les modles danalyse spatiale
http://www.univ-montp3.fr/ateliermercator/wp-
content/uploads/2010/02/ECUE2_W141TSS1_SPE_M1_0910_analyse_vecteur.pdf
http://region-developpement.univ-tln.fr/fr/pdf/R36/1_INTRO.pdf (loi de Zipf)
http://cybergeo.revues.org/22200?file=1 (loi de Zipf)
http://eeea.fr/docs/ModelesInteractionSpatiale.pdf (modle gravitaire)
http://www.filipponi.info/sito/2001-02/Commerces-Tessin.pdf (Reilly et Huff)
http://piketty.pse.ens.fr/fichiers/semina/lunch/Forse2006.pdf (Schelling)
http://tel.archives-ouvertes.fr/docs/00/44/01/00/PDF/These_Eric_Daude_39-03.pdf
(Hgerstrand)
http://steconomice.uoradea.ro/anale/volume/2008/v1-international-business-and-
european-integration/121.pdf (opimisation)
Pour les statistiques
http://proba.jussieu.fr/~detiliere/Cours/polycop_Bio.pdf (analyse multivarie)

http://www.math.u-psud.fr/~stafav/IMG/pdf/Statistique_Spatiale.pdf (statistique spatiale)
http://pbil.univ-lyon1.fr/R/pdf/bsa.pdf (statistique spatiale)
Pour lanalyse de graphe
http://igraph.sourceforge.net/igraphbook/igraphbook-creating.html
http://www-personal.umich.edu/~mejn/netdata/
http://www3.nd.edu/~networks/resources.htm
http://halshs.archives-ouvertes.fr/FMR/
http://groupefmr.hypotheses.org/
Pour les automates cellulaires
http://www.spatial-modelling.info/Application-du-modele-de-Schelling
http://cybergeo.revues.org/22976
http://mtg.labos.univ-rouen.fr/fiches/langloisPDF/SpaCelle%20-
%20%e0%20para%eetre%20dans%20L%27Espace%20G%e9ographique.pdf
Pour les systmes multi-agents
http://thema.univ-
fcomte.fr/theoq/pdf/conferences/TQ2005%20CONFERENCE%20DROGOUL.pdf

Analyse Spatiale

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Analyse Spatiale

Transféré par

Droits d'auteur :

Formats disponibles

Introduction lanalyse spatiale

Introduction historique et pistmologique

La gographie sappuie historiquement, en particulier en France, sur une dmarche dtude

Trois concepts apparaissent in fine centraux pour dfinir lanalyse spatiale :

Le concept despace : Lespace comme concept gographique, nest pas une

Le concept de modle : Lexpression de modle spatial recouvre des

de la notion de modle comme reprsentation simplifie de la ralit (dun

Lanalyse spatiale comme rupture1

Lanalyse spatiale comme dmarche institue et formalise

1) Cartographier le phnomne : La premire tape consiste choisir les observables et

2) La formulation mathmatique et statique du phnomne : La recherche de

3) La formulation dynamique du phnomne : Lambition des modles produits lors de

Des modles, des lois et des thories

Les modles hirarchiques : de la loi rang-taille la thorie des lieux centraux

La loi rang-taille (loi de zipf)

le mot le plus courant revenait 8 000 fois ;

Rang de la ville Population

Figure 1 : Graphiques reprsentant en ordonne les populations (en loccurrence le

Lexemple de la France est intressant. En effet, lanalyse de la hirarchisation du systme

Nanmoins, il ne faudrait pas conclure de lexemple prcdent que la loi rang-taille ne

Auteur Nombre de pays Dates Coefficient

7 pays (villes > 2000

Tableau 2 : Quelques exemples dapplication de la loi rang-taille (Schaffar, 2009).

Rang Ville Population Population thorique Ecart

Rang Ville Population Population thorique Ecart

Tableau 4 : Application de la loi rang taille aux villes amricaines avec = 1 et en se

Figure 2 : Application de la loi rang-taille aux cents premires agglomrations franaises

Figure 3 : Application de la loi rang-taille aux cents premires agglomrations amricaine

La thorie des lieux centraux

Combins des hypothses simplificatrices concernant lespace gographique, ces postulats

Selon le principe de march, qui est aussi un principe dquit spatiale, le

A partir de ces formes gomtriques, W. Christaller dtermine aussi quels pourraient

Niveau K=3 K=4 K=7

Les modles de flux : du modle gravitaire au modle de Huff

Le modle gravitaire est destin formaliser, tudier, reproduire et prvoir les

I Code Rgion Rpublique Population

Tableau 6 : Population des rgions de Tchcoslovaquie en 1989.

Tableau 8 : Migrations estimes par le modle gravitaire.

Tableau 9 : Rsidus des migrations estimes par le modle gravitaire.

I Emissions Rception Mobilit Attractivit

Tableau 10 : Analyse des marges de la matrice des rsidus.

1) les deux ples (centres) sont accessibles de manire quivalente par le

2) les deux commerces ont la mme efficacit.

Figure 5 : Les donnes ncessaires au calcul de la zone de chalandise du commerce L.

Figure 6 : La zone de chalandise du commerce L.

Dautres mthodes permettent, partir de ce modle, de calculer des zones de chalandise ou

et inversement proportionnelle la distance entre i et j (Dij). Pour tout consommateur i, la

Surfaces des rayons

Les modles de rseaux thoriques : les rseaux small-world et scale-free

Figure 7 : Principes dun rseau small-world (Watts et Strogatz, 1998).

Figure 8 : Les principes dun rseau scale-free (Barabsi et Albert, 1999).

de lanalyse statistique3. De surcroit, il faut de surcrot tlcharger un package nomm

Aprs avoir ouvert R, il faut appeler le package IGraph :

Il est ds lors trs simple de calculer la distribution des degrs:

Cette distribution peut tre reprsente dans un diagramme log-log . Ce diagramme

Figure 9 : La distribution des degrs de la structure dinternet dans un diagramme log-log.

Figure 10 : La distribution des degrs et la reprsentation de la droite de rgression.

Figure 11 : Les rsultats de la rgression linaire.

Figure 12 : La distribution cumule des degrs de la structure dinternet dans un

Les modles doptimisation : de Von Thnen aux modles de localisation-allocation

danalyse spatiale, le modle de Von Thnen , repose sur un principe de maximisation :

Le modle de Von Thnen

Plus prcisment, le modle repose sur les hypothses suivantes :

A partir de cette situation, on pose :