Vous êtes sur la page 1sur 162

COURS DE SYSTÈME D’INFORMATION

GÉOGRAPHIQUE
(SIG)

Bac3 Géologie
(2022-2023)
Contenu du cours
Ce cours est réparti en 5 chapitres suivants :

- Chapitre I : Généralités

- Chapitre II : De la réalité du terrain à l’information

géographique dans le SIG

- Chapitre III : Fondamentaux de l’information géographique

- Chapitre IV : Intégration de données géographique dans les

SIG

-Chapitre V :Visualisation, interrogation et enrichissement de

l’information géographique
Chapitre I : Généralités
I.1. Définitions du SIG
Il existe plusieurs définitions de Système d’Information Géographique (SIG), mais nous
focalisant uniquement sur les définitions les plus importantes :
1) La définition de l'économiste Didier (1990) « Un SIG est un ensemble de données
repérées dans l’espace, structuré de façon à pouvoir en extraire commodément des
synthèses utiles à la décision ».
2) Selon le Comité Fédéral de Coordination Inter-agences pour la Cartographie Numérique
aux États-Unis (1988) « Un SIG est un système informatique de matériels, de logiciels et
de processus conçu pour permettre : la collection, la gestion, la manipulation, l’analyse,
la modélisation, l’affichage des données à référence spatiale, afin de résoudre des
problèmes complexes d’aménagement et de gestion ».
3) Selon la Société Française de Photogrammétrie et de Télédétection : « Un SIG est un
système informatique qui permet à partir de diverses sources, de rassembler, d’organiser,
de gérer, d’analyser, de combiner, d’élaborer et de présenter des informations localisées
géographiquement, contribuant notamment à la gestion de l’espace ».
4) Selon Konecny (2003) « Un SIG, dans une définition étroite, est un système
informatique pour la saisie, la manipulation, le stockage et la visualisation des données
spatiales numériques. Dans une définition plus large, il est un système numérique
d'acquisition, de gestion, d'analyse, de modélisation et de visualisation de données
spatiales aux fins de la planification, l'administration et le contrôle de l'environnement
naturel et aux applications socio- économiques ».
Chapitre I : Généralités
I.2. Historique

Premièrement les SIG sont parus pendant les années 60 au


Canada et aux Etats-Unis. Les chercheurs de Canadian
Geographic Information System (1964) sont les premiers qui
ont utilisés les SIG pour rassembler des informations relatives
à l’usage du sol, et des données concernant l’environnement,
sur une grande partie du canada.
Deux autres institutions aux États-Unis à savoir le « New York
Land Use Information System (1967) » et le « Minnesota
Information System (1969) » ont aussi utilisées les SIG durant
cette décade. Depuis lors, les coûts et les difficultés techniques
ont largement réduit.
Chapitre I : Généralités
I.3. L’information géographique (IG)
L’IG est une donnée ayant une référence spatiale soit sous forme de :
1. Coordonnées géographiques
2. Nom de lieu
3. L’adresse postale ou autre.
Elle peut être dupliquée sans détérioration, s'échange à haute vitesse au travers des
réseaux de web, se cumule avec différents informations en vue d'en produire de
nouvelle. L’IG est obtenue, déposée, analysée, affichée et partagée à l’aide de système
d’information géographique (SIG). C’est une information liée à un objet ou à un
phénomène, décrit plus ou moins complètement :
1. Par ses caractéristiques diverses (c.-à-d. sa nature et son aspect).
2. Par son emplacement sur la terre.
Le premier groupe de données est appelé aussi attributs, alors que le second groupe est
appelé données géométriques. Par exemple l’IG sur une route se définit par son nombre
de voies, son revêtement, son nom, sa grandeur et son positionnement sur la surface
terrestre. Il faut signaler que l’IG est de plus en plus présente dans notre vie sous une
forme numérique (Figure I.1).
Chapitre I : Généralités
Chapitre I : Généralités
I.4. Les principales composantes d’un SIG
Selon ESRI France (ESRI, 2018) un Système d’Information Géographique est
composé de :
A/ Matériel informatique (hardware)
Les SIG marchent sur une très grande panoplie d’ordinateurs (pc de bureaux
raccordés en réseau ou exploités de manière autonome).
B/ Logiciels (software)
Les logiciels de SIG offrent les outils nécessaires pour sauvegarder, examiner
et visualiser l’information géographique.
C/ Données (Information Géographique)
Les données constituent la composante maîtresse des SIG. L’information
géographique peut, soit être constituée en interne, soit acquise auprès de
producteurs de données.
D/ Personnel formé
Un SIG étant avant tout un outil, donc c’est à l’utilisateur « expert en SIG » de
l’exploiter. Il faut signaler que les SIG sont élaborés d’une manière qui leurs
permettent d’être manipulés par plusieurs types d’utilisateurs, depuis ceux
qui créent et maintiennent les systèmes, jusqu’aux utilisateurs de logiciel
pour le traitement de l’information géographique. Actuellement, grâce à
l’accession des SIG sur Internet, le nombre d’utilisateurs de SIG s’agrandit de
façon importante.
Chapitre I : Généralités
Chapitre I : Généralités
I.5. Les fonctionnalités d’un SIG (les 5 A)

Les SIG sont créés pour répondre à différentes demandes et


comme le système commun n’existe pas, il faut les ajuster selon
les objectifs établis. Néanmoins il faut dire qu’il y’a 5
fonctionnalités « on les appelle les 5A » que tous les SIG doivent
assurer :
Abstraire : Concevoir un modèle qui arrange les données par
constituants géométriques et par attributs descriptifs, et qui
permet aussi d’établir des relations entre les objets.
Acquérir : Le logiciel doit posséder des fonctionnalités de
digitalisation et d’importation de données.
Archiver : Le logiciel doit avoir une grande capacité de stockage
des données.
Analyser : Capacité d’analyser les données géographiques
(méthodes quantitatives et statistiques, opérateurs topologiques,
etc.).
Afficher : Capacité d’affichage de l’information géographique sous
forme de Cartes, tables, graphes, etc
Chapitre I : Généralités
I.6. Domaines d’application des SIG
Les SIG peuvent être utilisés pour étudier plusieurs phénomènes, entre autres
on peut citer :
 Pour les grandes échelles
- La gestion foncière et cadastrale : ex. recensement des propriétés privées et le
calcul de leurs surfaces ; cadastre minier
- La planification urbaine : ex. réalisation des cartes d’occupation des sols et
plans
d’aménagement urbain.
- La gestion des réseaux : ex. réseau d’assainissement, approvisionnement en
eau
potable, gaz, électricité, téléphone, etc.
- La gestion des espaces verts naturels ou urbains : ex. parcs naturels et jardins
publics.
 Pour les échelles moyennes et petites
- L’identification des meilleurs endroits pour l’emplacement d’une nouvelle
ressource ou ce que on appelle carte d’aptitude
- Les études d’ingénierie routière : ex. constructions de routes ou d’autoroutes.
- Les applications liées à la prévention des risques naturels.
Chapitre I : Généralités
I.7. Le SIG idéal
Le SIG idéal possède certaines qualités qu’on cite ci-dessous :
 Rentable : en fonction de l’autorisation de l’organisation.
 Pertinent : notamment pour les résultats.
 Flexible : il faut qu’il soit capable d’évoluer.
 Sécuritaire : il protège l’information confidentielle.
 Compétitif : vérification de la qualité et le rendement des traitements

Autonome : notamment le logiciel, afin d’assurer l’évolution de la portabilité.
 Coopératif : les taches et les fonctions des différents services et individus
impliqués, il faut qu’elles soient bien définies.
 Motivant : la conception et l’utilisation doivent être gérées par l’utilisateur.
 Documenter : la documentation doit être écrite conjointement au
développement du logiciel.
Chapitre I : Généralités
I.8. Quelques logiciels SIG
I.8.1. Logiciels libres
GRASS GIS : Il rassemble des propriétés de traitement d'images satellitaires
et des fonctionnalités à base topologique.
Map Server : Logiciel libre d’édition des cartes sur le web.
QGIS : Il permet de visualisé les cartes ainsi que leurs transformation. Il
présente une qualité qui le rend très simple à utiliser.
PostGIS : C’est une extension pour la base de données PostgreSQL, qui
permet de faire des requêtes SQL et spatiales.
uDig, gvSIG : Logiciels libres développés en Java pour Linux et Windows.
I.8.2. Logiciels Gratuits
DIVA-GIS : Offre des outils d’analyse statistique et géostatistique de
l’information géographique.
AutoDEM : Il propose des dispositifs pour générer des modèles numériques
de terrains (MNT) à partir de courbes de niveaux. Il supporte plusieurs formats
tel que les images raster et les courbes de niveaux de type vectoriel.
I.8.3. Logiciels Commerciaux
ArcGIS : (ArcInfo, ArcView, etc.) de chez ESRI.
GeoMapGIS : Métiers s'appuyant sur l'environnement Autodesk (AutoCAD,
AutodeskMap, AutodeskMapGuide, etc.).
Manifold : Logiciel novateur (serveur, géocodage, 3D, script .net, sgbd).
Chapitre II : De la réalité du terrain à
l’information géographique dans le SIG
II.1. Types de données dans les SIG
Toutes les géométries spatiales peuvent être décrites par 4 types de
propriétés :
 Leur position à la surface de la terre.
 Les relations spatiales (topologie).
 Leurs attributs.
 Leurs métadonnées.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG
II.1 Objectifs :

Comprendre la nécessité de conceptualiser pour numériser le monde réel et
le traduire en information géographique ;

Distinguer les phénomènes géographiques continus et discret ;

Comprendre la différence entre une donnée géographique et une
information géographique

Connaître les principes de modélisation et de structuration de l’information
géographique dans un SIG ;

Comprendre l’intérêt de la structuration topologique des données en mode
vecteur.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
II. 2. Passage du mode réel à l’implémentation information

Le passage du monde réel à l’implémentation informatique sous la forme


d’un modèle de données s’effectue en trois étapes ou phases :

1. Abstraction : Identification des phénomènes géographiques observés sur


le terrain à représenter dans le SIG pour bien mener les analyses ;

2. Modélisation numérique : Choix du modèle de données par lequel les


données seront stockées, affichées et analysées ;

3. Structuration : définir la manière dont les relations entre les unités


d’observation du phénomène seront structurées.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG
II. 3 Construction du modèle spatial de la réalité du terrain

Le passage de la réalité à son observation, puis à son enregistrement sous


forme numérique dans le SIG dépend du filtre perceptif de l’observateur. De
dernier se base sur ses objectifs et ses caractéristiques propres (culture,
connaissances…). Aucune donnée ne doit être considérée comme
totalement neutre et objective.
Il faut en être conscient pour mieux interpréter et avec prudence les
résultats issus des traitements par les SIG.

Le processus d’abstraction de la réalité par lequel l’on simplifiée la donnée


pour la comprendre se nomme la modélisation. Pour reste cohérent avec la
réalité, ce processus devra décrire les objets et leurs relations afin de
prendre en compte la manière dont l’ensemble de ces objets
se structurent dans l’espace. Ces relations sont liées à leurs positions
relatives, décrivant ainsi des propriétés de voisinage, d’inclusion ou
d’intersection.
Chapitre II : De la réalité du terrain à
l’information géographique dans le SIG
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
II.4. Des données à l’information

Toute donnée qui se réfère à une localisation, via des


coordonnées géographiques, un nom de lieu ou une adresse,
peut être considérée comme une donnée géographique. Les
données localisées peuvent être obtenues par une mesure, une
imagerie satellite, un inventaire, une enquête, un recensement,
etc.
Bien que les termes, donnée et information, sont souvent
utilisées de façon interchangeable, l’on peut les distinguer. Les
données recueillies sont transformées en informations
géographiques lorsqu’elles sont intégrées dans un contexte ou
qu’elles prennent alors une signification particulière, qu’elles
sont interprétées par rapport à une question donnée.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG
Exemple d’illustration de la différence entre données et informations

Les membres d’une équipe de recherche sont mandatés pour proposer


des actions à mener pour adapter un territoire au changement
climatique. Trois chercheurs relèvent les températures de l’air sous
couvert forestier et hors couvert et effectuent des entretiens avec les
habitants pour recueillir leurs perceptions de la température
dans différents lieux. Les résultats obtenus sont transcrits dans des
tableaux ; ce sont les données. Ces données exprimées sous formes la
forme de nombres ou textes, n’ont pas de signification particulière en
elles-mêmes. Pour les rendre utiles et les transformer en information
géographique, il est nécessaire de préciser le contexte de l’étude et les
méthodes de recueil des Données. Elles doivent également être
accompagnées de leurs unités de mesures et de leur localisation. Ces
précisions sont généralement fournies dans ce qui est appelé
« métadonnées ».
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
II.5 Phénomènes géographiques continus, discrets, en réseau

Les phénomènes géographiques du monde réel sont classiquement


décomposés en phénomènes de nature continue et phénomènes de
nature discrète. À cette distinction on peut ajouter une catégorie
supplémentaire, celle des réseaux.
Un phénomène géographique est considérée comme continu si les
données observées pour le caractériser sont en tout point de l’espace.
Les phénomènes météorologiques (T°, pression, etc.), atmosphériques
(compositions chimiques de l’air,…), pédologiques (taux de salinité,
pH,etc.) sont des phénomènes continus dans l’espace.
Les phénomènes continus sont généralement caractérisés par des
variations graduelles, relèvent du domaine de l’environnement
physique, leurs données sont souvent issues de mesure
échantillonnées. Ils peuvent également être directement enregistrés de
manière continue dans l’espace par télédétection.
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Un phénomène géographique est considérée comme discret si les
éléments qui le constituent sont clairement délimités dans l’espace .
Ces éléments ou unités d’observation constituent des objets
géographiques et disposent chacun de caractéristiques spécifiques,
comme des espaces vers en milieu urbain, caractérisés chacun par
une taille, une fonction.
Certains phénomènes discrets couvrent l’ensemble de l’espace, c’est
le cas des mailles administratives. Ces dernières ne peuvent pas pour
autant être assimilées à un phénomène continu. Chaque entité
administrative correspond à un objet délimité dans l’espace et
caractérisé par sa superficie, sa population, son budget, etc.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG

Les réseaux sont des objets géographiques spécifiques. Clairement


délimités dans l’espace, comme les phénomènes géographiques
discrets, ils ont la spécificité d’être organisés par des connexions entre
les différents objets qui les constituent : un réseau hydrographique.
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
I.6 Notion de couche d’information géographique thématique

Pour faciliter la compréhension du monde réel, celui-ci est décomposé


en thèmes et la superposition des couches permet de reconstituer un
modèle du territoire.
Ex. : couche des routes, des écoles, des communes, des bâtiments, du
relief, des champs, de l’occupation...
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG
I.7 Modélisation numérique de l’information géographique

Le terme modélisation est employé selon différents sens :


Le processus d’abstraction de la réalité, qui permet de la simplifier pour
aider à la comprendre, est appelé modélisation en référence au fait que l’on
crée un modèle
du monde. La représentation cartographique offre une modélisation des
éléments constitutifs d’un territoire et des phénomènes qui s’y déroulent ;

Le processus qui consiste à adapter l’information géographique à un modèle
numérique pour l’intégrer dans un outil informatique est également nommé
modélisation. Pour le distinguer du premier sens, dans ce cours on parlera
de la modélisation numérique.

La nature continue ou discrète du phénomène géographique influence le


plus souvent la façon de réaliser la modélisation numérique. Deux types de
modélisations numériques fondamentales des données SIG sont utilisés :

Le mode vecteur et le mode raster.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
II. 9 Composantes des données de la modélisation numérique

Les données sous format numérique sont dotées de trois composantes :


Géométrique : qui précise la forme et l’extension du phénomène modélisé ;

De localisation (spatiale) : traduite par les coordonnées X et Y et enseigne
sur la position exacte à la surface de la Terre du phénomène modélisé ;

Sémantique, qui se traduit des propriétés qualifiant la nature et les
caractéristiques du phénomène modélisé. Les phénomènes du monde réel
possèdent des propriétés et des caractéristiques qui sont mesurées,
quantifiées, évalués par des indicateurs. La composante sémantique est
aussi thématique.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
II.10 Modes de représentation de l’information géographique en deux
dimensions

Les SIG sont conçus pour gérer des données géographiques. Pour
cela, les données doivent être modélisées sous forme numérique et
deux modes sont utilisés à cette fin :

le mode vecteur, qui consiste à décrire la géométrie des entités
géographiques à partir de trois formes géométriques élémentaires des
points, des lignes et des surfaces ;

Le mode raster, qui consiste à découper l’espace en une grille
régulière de cellules de même taille. À chaque cellule est associée
une valeur chiffrée qui représente un élément caractéristique du
territoire à cet emplacement.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
II.10.1 Le mode vecteur

En mode vecteur, les unités d’observation correspondent à des objets du


monde réel ou phénomène géographique discrets. Trois types de
représentations géométriques sont utilisés pour traduire les objets et
phénomènes du monde réel : le point, la polyligne, le polygone.

Les entités ponctuelles traduisent des phénomènes géographiques qui sont


localisés en un point précis. Ces entités ne présentent aucune forme
particulière et ne sont pas caractérisées par une longueur ou une superficie. Il
est modélisée uniquement par sa localisation formalisée à travers ses
coordonnées.

Les entités linéaires sont représentés par une ligne ou une succession de
lignes (d’où l’appellation polylignes). Ces lignes sont construites par une série
de couples de coordonnées X et Y dans l’ordre de succession des points
constitutifs de la polylignes. Les liens entre les points sont appelés arcs ou
segments. Une entité de type ligne est composée d’au moins deux couples de
Coordonnées X et Y et a une longueur mesurable mais pas de superficie.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Les entités surfaciques sont représentées par une succession de lignes dont
les coordonnées de début de la première ligne sont égales aux coordonnées
de fin de la dernière ligne formant un polygone. Ces entités représentent des
phénomènes qui sont dotés à la fois d’une longueur (périmètre) et d’une
superficie. Des lacs, des PR ou PE, des couches géologiques, des
Communes… sont enregistrés sous la forme des polygones.

Généralisation des tracés et généralisation conceptuelle

Faible généralisation (peu de pts) poids faible du fichier en octets


Forte généralisation (bcp de pts) poids du fichier élevé en octets

Objet Petite Échelle Grande Échelle Exemples


géographique

Entité Points Polygone Les territoires représentés par des pts mais
Administratives à l’échelle mais dans l’étude locale un
territoire serait représenté par un polygone.
Cours d’eau Polyligne Polygone Les réseaux hydro. Par des polylignes mais
aussi par une surface de son lit majeur.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
La composante sémantique
À chaque entité vecteur est associé un ensemble de valeurs alphanumérique,
appelées attributs. Ces attributs permettent de décrire les objets.
Par exemple à chaque sondage minier dans le cadre d’une campagne d’exploration,
l’on peut associer la profondeur du sondage, sa localisation, la date du début et de la
fin, le foreur…

En mode vecteur, la composante sémantique est stockée sous la forme d’un tableau
d’information géographique, appelé couramment table attributaire dans le logiciel SIG.
Dans cette table, les lignes sont appelées enregistrement et les colonnes champs
attributaire et chaque ligne correspond à une entité géographique.

Type de données numériques

Les données attributaires (en mode raster ou vecteur) peuvent être de différents types.
La distinction de type conditionne l’espace de stockage nécessaire pour enregistrer les
données et les types de traitement que l’on peut faire sur les données. Le type de
données est défini pour l’ensemble des valeurs d’un champ en mode vecteur et pour
l’ensemble des cellules d’une grille en mode raster.
En plus de type de données, il est nécessaire de définir également la longueur qui
correspond au nombre de caractère alphanumérique qu’il peut contenir.
Les formats utilisés pour le stockage des données attributaires sont identiques à ceux
des bases de données en générales.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Format des données
Le type texte
Un champ ou une valeur de cellule de type texte contient généralement des caractères
alphanumérique (lettres et chiffres) ;

Le type nombre
Les sont stockés dans des types de champs différents selon qu’il s’agit d’entiers ou de réels.
Par convention, dans la plupart des logiciels les données de type nombre apparaissent alignées
à droite dans les champs de type nombre.

Le type entier
Le type entier permet de stocker uniquement des nombres entiers. Il demande un espace de
stockage informatique réduit.

Le type réel
Les nombres avec des décimales sont appelés des réels. Le type réel utilise plus de place de
stockage informatique. En plus de la longueur du champ (nombre total de chiffres), il faut
préciser le nombre de décimales.

Le type date
Les données temporaires peuvent être stockées dans des champs de type date.

La particularité du champ identifiant


Le champ identifiant correspond à un code généré automatiquement par les logiciels SIG.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Le mode raster
Le mode raster (mode matriciel ou modèle des données raster) est utilisé pour les
photographies aériennes numériques, les images satellitaires et les cartes papiers
numérisées (scannées). C’est le mode d’acquisition de la donnée qui implique le
mode raster. Ce modèle est surtout approprié pour représenter de façon numérique
des phénomènes géographiques continus, tels que le relief ou la température de l’air.
Certaines données raster sont produites par des traitements, interpolation spatiale.

La composante géométrique et la composante localisation

En mode raster, l’espace est découpé en cellules de tailles identiques formant une
grille qui couvre l’intégralité du territoire. Ces cellules sont appelées pixels (picture
element). La succession de cellules contiguës ayant les mêmes valeurs peut être
interprétée comme représentant l’emprise spatiale et la forme des phénomènes.

La localisation de chaque cellule dans l’espace de représentation est définie par ses
coordonnées (latitude et longitude). Le degré de précision dans la localisation et dans
la géométrie est lié à la résolution de la grille, définie par la taille des cellules.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
La résolution de données en mode raster définit le niveau des détails qui seront visibles dans
l’image. Plus le nombre de cellules pour représenter le terrain en mode raster est élevé, plus il y
aura de détails visibles car la taille des cellules est petite. Plus la résolution est élevée et plus
le poids du fichier est important et plus l’unité d’observation est précise.

La composante sémantique

À chaque valeur de la cellule, on associe une valeur alphanumérique appelée attribut.


Cette valeur peut correspondre à une mesure, une valeur enregistrée par un capteur
(une console),
un code (nature du substrat rocheux), un indicateur (valeur de pente, indice de
végétation) ou à une valeur de niveaux de gris ou de couleur d’une image scannée
(carte topo ancienne).
La composante sémantique en mode raster est associée à chaque cellule, puisque
chacune prend une valeur et une seule.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
La structuration de l’information géographique
La structuration de l’information géographique consiste à une organisation des
différents objets géographiques au sein des différents jeux de données
géographiques. Elle est nécessaire pour élaborer une reconstitution numérique
du monde réel qui doit concerner aussi bien les objets modélisés que leurs
relations spatiales (adjancence, proximité, voisinage…)
La modélisation des données vecteur est généralement basée sur l’utilisation de
primitives géométriques que sont le point la polyligne et le polygone. Cette
modélisation vecteur renseigne sur les liens entre les points et les segments (manière
dont les objets eux-mêmes sont constitués) mais non sur les liens pouvant exister
entre des polygones juxtaposés ou entre des polylignes et des polygones qui peuvent
se superposer et s’intersecter. Pour palier à ce problème, il est nécessaire d’intégrer
numériquement cette organisation topologiques des entités. On utilise alors un modèle
de données vecteur topologique.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Topologie

La topologie est un des champs de la science mathématique qui s’intéresse


aux relations géométriques entre objets. Dans le domaine de l’information
géographique, la topologie est l’ensemble des règles qui expriment les
relations spatiales entre les entités en les situant les unes par rapport aux
autres. Les realtions spatiales élémentaires sont l’inclusion, l’adjacence et
l’intersection.

Il existe des projets SIG nécessitant la modélisation topologique et d’autres ne


nécessitant pas forcément de connaître la structuration topologique des
données vecteur. On parle alors de modèles de données vecteur non
topologique ou de modèle « spaghetti ».
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Le modèle vecteur non topologique

Cette modélisation n’intègre que les notions de sommets (points) et d’arcs


(segments de
droite entre deux points). Seule la forme des entités est identifiables, les
relations topologiques entre les objets graphiques sont seulement implicites à
travers la localisation relative des entités.
Par exemple :

Deux lignes se croisent sans que l’intersection ne soit codée numériquement
et intégrée dans le modèle de données de façon explicite ;

Chaque objet est défini indépendamment des autres objets, les lignes
communes à plusieurs polygones sont saisies autant de fois qu’il y a de
polygones concernés.

Les relations spatiales sont identifiées par calcul lors des traitements et
analyses, via les coordonnées des entités, en fonction des opérateurs
topologiques (inclusion, adjacence, intersection) utilisés.

L’intérêt de ce modèle non topologique est la facilité de construction,


d’utilisation et de mise à jour.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG
Inconvénient du modèle non topologique
Les inconvénients majeurs de ce modèle sont :

Nombreuses erreurs géométriques contenant dans les objets graphiques
(chevauchement
des polygones adjacents ou des interstices, erreurs de raccordement entre
les lignes ; erreurs de raccordements entre les lignes et aussi des arcs
constitutifs parfois non connectés entre eux ;

Duplication des coordonnées des points et des segments de ligne autant de
fois qu’il y a d’objets graphiques qui partagent ou intersectent des limites
communes, créant une redondance d’information dans les jeux de données.

L’absence de topologie a aussi un impact sur les performances informatiques
d’affichage graphique des objets. (une frontière commune à deux polygones
est dessinée deux fois, ce qui peut considérablement ralentir les temps
d’affichage.

La structuration non topologique ne permet pas de concevoir des
représentations basées sur la notion de réseau (réseaux routiers, de
transport, de flux, d’assainissement…).

Mais ce modèle reste moins contraignant et lourd à mettre en œuvre qu’un


modèle topologique.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG

Exemples d’erreurs topologiques sur des polygones et des polylignes


Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Le modèle vecteur topologique

Souvent la topologie est prise ne compte lors de la conception des données


géographiques car l’espace est abordé comme un système et non comme un
ensemble d’objets sans relation entre eux.
Le principe général des modèles topologiques est de ne pas créer de
redondance dans les points (sommets) et dans les lignes (arcs) utilisés pour la
construction des différents types d’entités (ponctuels, linéaires ou
surfaciques).
La structure est plus complexe car chaque objet est décrit non pas par la
simple liste de ses propres coordonnées constitutives mais par la référence à
une liste de sommets et d’arcs.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Types de modèles topologiques
1. Modèle DIME (Dual Independant Map Enconding): modèle topologique de base

Les objets sont décrits par leurs sommets. Les relations de voisinages sont des arcs
« orientés », dont on définit le premier et le dernier sommet, ainsi que les objets gauche et droit
qu’ils délimitent.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
2. Modèle POLYVRT (POLYgon conVeRTer) : modèle topologique
hiérarchique

Dans ce modèle, les objets font référence à des nœuds et à des chaînes qui
font eux-mêmes référence à des sommets. Cette succession de références à
d’autres éléments constitutifs explique pourquoi ce modèle est qualifié de
modèle hiérarchique. Les éléments de départ sont les sommets qui ont un
identifiant unique et des coordonnées. Les nœuds correspondent aux
sommets communs entre au moins deux arcs et deux polygones. Les chaînes
correspondent à la liste des sommets constitutifs d’arcs. Les objets
(polygones ou polylignes) sont décrits par une succession de chaînes.
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Intérêt du modèle topologique


Minimise le risque d’erreurs géométriques ;

Réduit le nombre de points saisis et allège donc le poids des fichiers ;

Facilite la modification et la mise à jour des caractéristiques partagées entre
différents jeux de données, puisqu’il assure le maintien de la cohérence
entre les données ;

Optimise le processus d’interrogation spatiale des données (exécution des
requêtes spatiales)
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Le réseau, un modèle vecteur particulier intégrant la topologie
Chaque réseau quelque soit sa nature (hydrographique, de transport, de
téléphonie etc), il constitue une information géographique car ils sont
constitués des objets linéaires connectés. La topologie de réseau décrit ces
relations de connexion.
Les réseaux sont modélisés sous forme de points, appelés nœuds, et des
lignes, appelés des liens (tronçons de routes, les cours d’eau, etc.). On
simplifie alors e réseau sous la forme d’un objet mathématique appelé graphe
ou réseau logique. Les liens peuvent être orientés ce qui signifie qu’ils ont des
nœuds de départ et d’arrivées selon un sens de circulation. Cette information
est indispensable pour pouvoir ensuite calculer la distance ou simuler des flux
sur le réseau.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG

Dans le monde réel, il existe deux types de réseaux dont les caractéristiques
impliquent une certaine structuration des données.
Les réseaux hydrographiques, de drainage ou de distribution d’électricité, par
exemple, sont des réseaux hiérarchiques dans lesquels l’orientation est
unique.
Les réseaux de transport, pour lesquels on connaît aussi le sens, sont
généralement dotés d’intersections et de boucles et constituent des réseaux
maillés.
Toute l’information décrivant les nœuds et les liens est stockée sous une forme
attributaire, la structuration d’un modèle de données réseau impliquant une
table attributaire plus complexe qu’un modèle vecteur basique. En plus de la
description des points et des lignes, d’autres tables et d’autres champs qui
seront mobilisés pour l’analyse de réseau sont généralement créés.
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Une table décrit la connectivité, c’est-à-dire pour chaque nœud la liste des
nœuds qui lui sont connectés, en précisant l’identifiant du lien permettant la
connexion.
Dans le cas d’un réseau de transport orienté, c’est-à-dire avec des tronçons à
sens unique, les règles qui définissent le sens des flux seront stockés dans la
table de connectivité.
Chapitre III : Fondamentaux de l’information
géographique
Objectifs
Ce chapitre permet :

1. Connaître les composantes d’un système de coordonnées géographiques.


2. Connaître les composantes d’un système de coordonnées projetées
3. connaître et être capable de reconnaître les principaux types de systèmes
de coordonnées
4. Comprendre comment la troisième dimension peut être intégrée dans les
données.
5. connaître les concepts clés de la topologie : relations topologiques et
opérateurs topologiques
6. Connaître les différentes mesures de distances possibles.
7. Comprendre comment la distance peut être prise en compte dans les
analyses
Chapitre III : Fondamentaux de l’information
géographique
III.1 Les systèmes de coordonnées
Les données géographiques qu’elles décrivent les phénomènes
continus ou discrets, sont des données localisées. Cette localisation
peut se faire au moyen de coordonnées (X,Y), d’adresses postales, de
noms de lieux…

Quelque soit le mode utilisé, la localisation se fait toujours en référence


à un système de référence spatiale dont les paramètres doivent être
définis. Une première distinction importante dans les systèmes de
coordonnées se fait entre les systèmes de coordonnées géographiques
et les systèmes de coordonnées projetées.
Les systèmes de coordonnées géographiques sont définis sur la surface
correspondant au globe terrestre tandis que les systèmes de
coordonnées projetées sont définis sur une surface plane correspondant
à la surface sur laquelle le globe terrestre (ou une de ses parties) a été
projetée.
Ces systèmes sont ainsi appelés système de coordonnées
cartographiques ou planimétriques.
Chapitre III : Fondamentaux de l’information
géographique
1.1 Les systèmes de coordonnées géographiques

Pour définir la coordonnée d’un point, en mathématique, il faut d’abord définir


les paramètres de repères du plan, à savoir le point origine du repère, l’axe
des abscisses (X) et l’axe des ordonnées (Y).
De même, pour définir la position et les coordonnées à la surface du globe, il
faut tout d’abord définir les paramètres du système de coordonnées
géographiques. Dès lors, contrairement à ce que l’on croirait, il existe plusieurs
systèmes de coordonnées géographiques de référence. La définition de
chacun de ces systèmes passe par la détermination :
- d’un système géodésique (Datum) qui permet notamment de déterminer le
point origine du système ;
- d’un méridien d’origine, pour définir la coordonnée en X ;
- d’un parallèle d’origine, l’équateur, pour définir la coordonnée en Y
Chapitre III : Fondamentaux de l’information
géographique
Géoïde, ellipsoïde et système géodésique
La terre n’est pas une sphère parfaite, il s’agit en fait d’un géoïde. C’est une
surface équipotentielle du champ de pesanteur et se traduit par une forme non
régulière.

Les géodésiens mesurent avec précision les coordonnées de points à la


surface de ce géoïde. Pour faciliter les calculs, cette surface non régulière est
généralement résumée par une surface géométrique régulière appelée
ellipsoïde. L’ellipse de l’ellipsoïde est caractérisée par des valeurs de demi-
grand axe a et demi-petit axe, ainsi que par un coefficient d’aplatissement
(f=(a-b)/a).
Comme les déformations du géoïde sont très irrégulières sur l’ensemble de la
Terre, plusieurs ellipsoïdes ont été définis pour correspondre localement au
mieux à la forme du géoïde. Les ellipsoïdes dits « locaux » sont utilisés pour
résumer la surface sur une partie du globe seulement. Clarke 1880 et Hayford
1909 sont des exemples d’ellipsoïdes locaux utilisés en France.
GRS80 (Gepdetic Reference System 1980) est un ellipsoïde global le plus
courant utilisé. Il résument l’ensemble de la surface terrestre.
Chapitre III : Fondamentaux de l’information
géographique
Système géodésique ou datum :
La forme de l’ellipsoïde, l’orientation de ses axes, ainsi que sa position par
rapport au centre de la Terre, permettent de définir le système géodésique
appelé aussi couramment datum. Le datum peut être matérialisé sur le terrain
par un réseau de stations géodésiques( points physiquement liés à la croûte
terrestre et matérialisés par des bornes, des piliers…).
Méridien et parallèle de référence
L’équateur est universellement admis comme étant le parallèle d’origine. Le
méridien servant de méridien d’origine n’est pas systématiquement le même
dans tous les pays. En ces jours, un consensus apparaît cependant pour
définir le méridien de Greenwich comme méridien d’origine (Conférence
Internationale du méridien, Washigton, 1884). D’autres méridiens ont été
utilisés dans l’histoire comme méridien d’origine (Paris, Naples, Alexandrie,
Saint-Petersbourg…).
Chapitre III : Fondamentaux de l’information
géographique

Un point à la surface de la Terre est défini par :


Sa longitude (X) qui correspond à l’angle entre le plan méridien du point A et
le plan méridien d’origine ;
Sa latitude (Y) qui correspond à l’angle entre la normale à l’ellipsoïde de A et
le plan équatorial.
Ces coordonnées sont mesurées en valeurs angulaires. Elles peuvent dans
certains systèmes de coordonnées, être négatives quand un lieu se situe au
sud de l’équateur ou à l’ouest du méridien d’origine.

Avec la généralisation de l’utilisation des GPS (Global Positionning System)


le système le plus fréquemment utilisé aujourd’hui dans le monde est le
WGS84 (World Geodetic System 1984).
Chaque système de coordonnées géographiques est associé à un système
géodésique (datum), lui même basé sur un ellipsoïde. Le centre de
l’ellipsoïde sert de point de référence au système de coordonnées
géographiques. L’existence de différents ellipsoïdes entraîne dons la
coexistence de plusieurs points de référence.
Chapitre III : Fondamentaux de l’information
géographique
Les systèmes de coordonnées projetées

La visualisation des données géographiques se fait généralement sur une


surface plane. L’ellipsoïde doit alors être projeté en deux dimensions.
Il existe plusieurs procédés de projection et ceux-ci peuvent s’appliquer à des
ellipsoïdes différents. Ainsi, tout système de coordonnées projetées se base
avant tout sur un système de coordonnées géographiques.
La définition de chaque système de coordonnées projetées passe par la
détermination :
- d’une projection ;
- d’un méridien et d’un parallèle d’origine ;
- d’un point origine du repère des coordonnées.
Chapitre III : Fondamentaux de l’information
géographique
La projection
La projection cartographique est une opération mathématique qui permet de
représenter une surface sphérique en 3D sur une surface plane en 2D. Il
existe plus de 200 projections différentes.
Le type de projection utilisé pour représenter un ellipsoïde sur une surface
plane est le premier paramètre définissant un système de coordonnées
projetées.
Deux paramètres permettent de définir une projection : la surface de projection
et l’altération.
Les surfaces de projection les plus couramment utilisées sont :
- le plan, pour les projections dites azimutales;
- le cylindre, pour les projection dites cylindriques ;
- le cône, pour les projections dites coniques.

L’ellipsoïde n’étant pas une surface développable, c’est-à-dire que l’on ne peut
pas la projetr sur un plan en conservant les angles et les surfaces, la
projection entraîne forcément des déformations.
Chapitre III : Fondamentaux de l’information
géographique

Dans chaque projection, l’on effectue toujours certains compromis :


- les projections conformes conservent les angles ;
- les projections équivalentes conservent les surfaces ;
- les projections aphylactiques ou composées tentent de minimiser
simultanément les altérations d’angles et de surfaces.

Ces deux paramètres (surfaces et altération) se retrouvent généralement


dans le nom de la projection (par exemple Lambert Conique Conforme)
Chapitre III : Fondamentaux de l’information
géographique
. Les composantes d’un système de coordonnées projetées

Les paramètres de projection (surface et altération) permettent de définir


comment l’ellipsoïde est projeté sur les 2D du plan. La projection seule ne
suffit pas à définir l’emplacement des objets dans un système de
coordonnées projetées. Comme pour les systèmes de coordonnées
géographiques, il est nécessaire de définir un repère avec un point d’origine
et les positions de l’axe des X et de l’axe des Y.
L’origine du sytème est définie par un méridien central ou longitude d’origine
(en X) et un parallèle central ou latitude d’origine (en Y). L’origine ainsi définie
se trouve généralement au centre de la surface projetée, entraînant des
coordonnées positives et négatives. Pour avoir uniquement des coordonnées
positives, l’origine du repère est déplacée. Ces paramètres de déplacement
sont appelés « False », suivis d’une direction par exemple « Northing » ou
Easting » et d’une valeur de distance.
Chapitre III : Fondamentaux de l’information
géographique
D’autres paramètres peuvent être utilisés pour définir le système de
coordonnées projetées : parallèles de référence et facteur d’échelle.

Si la projection est conique, des parallèles de référence (ou standard parallel
en anglais) sont indiqués. Il s’agit des parallèles où le cône de projection est
en contact avec la surface terrestre. Le long de ces lignes de contact entre le
plan de projection et l’ellipsoïde, les déformations liées à la projection sont
nulles.

Le facteur d’échelle correspond à une valeur, généralement inférieure à 1,
qui permet d’appliquer une réduction là où les déformations liées à la
projection sont nulles (au niveau du point, du parallèle ou du méridien de
contact de la projection), de sorte que les distorsions sur l’ensemble de la
surface projetée sont diminuées.
Chapitre III : Fondamentaux de l’information
géographique
Les systèmes de coordonnées dans les SIG
Les systèmes de coordonnées, géographiques ou projetées, sont des
paramètres à part entière des jeux de données géographiques. Un jeu de
données géographiques est défini dans un système donné. Ainsi, changer le
système de coordonnées d’un jeu de données revient à créer un nouveau jeu
de données, qui contient, certes, les mêmes objets géographiques, mais
définis dans un autre système et donc avec des coordonnées différentes.

C’est l’existence d’un système de coordonnées utilisé dans les logiciels qui
permet de fournir des mesures de surfaces, de périmètres, de longueurs, de
sinuosité des objets, ainsi que des distances entre objets.
Dans certains logiciels, les calculs de longueur et de surface sont possibles
que si le système de coordonnées est projeté. Il faudra donc être prudent lors
des calculs des superficies, car lorsque le système de coordonnées utilisé est
basé sur une projection conforme, les rapports de surface ne sont pas
conservés sur l’ensemble de la surface projetée.
Certains logiciels SIG gèrent l’affichage de jeux de données géographiques
définis dans différents systèmes de coordonnées en appliquant une projection
à la volée.
Chapitre III : Fondamentaux de l’information
géographique
La normalisation de la définition des systèmes de coordonnées

La définition des paramètres des différents systèmes de coordonnées a été


standardisée par des entreprises pétrolières, puis reprise par l’OGC (open
Geospatial Consortium) sous le code EPSG (European Petroleum Survey
Group).
Ces codes EPSG sont fréquemment utilisés dans les SIG pour définir le
système de coordonnées. Il existe des codes EPSG pour les systèmes de
coordonnées géographiques et projetées.
L’OGC est une organisation internationale à but lucratif rassemblant des
entreprises commerciales et industrielles de l’information géographiques et
des SIG, des services gouvernementaux et internationaux.
L’OGC travaille depuis 1994 sur les questions d’interopérabilité dans les SIG.Il
travaille au développement et la promotion de standards ouverts dans le but
de garantir l’interopérabilité des contenus et des services liés à l’information
géographique et ainsi faciliter l’échange de données.
Chapitre III : Fondamentaux de l’information
géographique
Système de Ellipsoïde de Système de Code EPSG
coordonnées référence Code EPSG coordonnées
géographique projetées
Lambert zone 1 à 4 27571 à 27574
NTF Clarke 1880 4807 27572
Lambert 2 étendu
Lambert93 2154
RGF93 GRS 1980 4171 Lambert zone CC42 3942 à 3950
À CC50
LAEA 3035
GRS 1980 4258 LCC 3034
ETRS89
UTM 30N 32630
WGS84 GRS 1980 4326 UTM 31N 32631
UTM 32N 32632
Chapitre III : Fondamentaux de l’information
géographique
La troisième dimension de l’information géographique
La plupart des objets géographiques sont des objets en volume, dotés de ce
qu’on appelle une troisième dimension 3D. Quant la troisième dimension est
modélisée, les objets ou les surfaces dont dotés de coordonnées X et Y,
définissant la localisation géographique, et de valeurs souvent, appelés Z, qui
représentent les hauteurs ou les profondeurs.
L’information décrivant l’altitude peut être intégrée dans les jeux de données
utilisées en SGI de deux façons différentes : en 2,5D ou en 3D. Il s’agit de
deux modes différents de stockage de la troisième dimension.

En 2,5D, le jeu de données peut simplement être doté d’un champ attributaire
décrivant la troisième dimension, ou d’une coordonnée qui est intégrée sous
forme d’un attribut ou d’une coordonnée Z. La modélisation 2,5D est
fréquente pour des phénomènes géographiques continus et notamment pour
représenter la surface terrestre, le plus souvent le relief.
Les modèles de données structurés en 3D intègrent la troisième dimension
dans la géométrie de l’objet. C’est le cas de la modélisation du bâti où les
hauteurs des étages et des fenêtres sont intégrées dans la géométrie de
l’objet.
Chapitre III : Fondamentaux de l’information
géographique
Quelques définitions
2D : modèle de données représentant les objets en vue horizontale et les surfaces continues
sous forme d ‘un plan.

2,5D : terme souvent utilisé pour désigner des modèles de données où la troisième dimension
est soit un attribut, soit intégrée dans les propriétés des données. Par exemple, dans un jeu de
données t-raster décrivant le relief, l’attribut des cellules correspond à l’altitude.

3D : modèle de données d’objets ou de surfaces géographiques dans lequel la géométrie de


l’objet contient, non seulement les coordonnées X et Y pour la localisation géographique, mais
également la coordonnée Z qui représente souvent la hauteur ou l’altitude. Il existe des formats
de données standards (CityGML, par exemple) qui intègrent la 3D dans la géométrie des objets.
Un autre type de données 3D correspond aux données acquises par LIDAR (acronyme anglais
de Light Detection and Ranging), qui est un scanner laser.
4D : modèle de données en 3D utilisé pour simuler un processus spatio-temporel. La quatrième
dimension est le temps (t) qui est alors considéré comme un attribut de type date.

Les modélisations en 2,5D et ene 3D peuvent être faites en mode raster ou en mode vecteur.
Chapitre III : Fondamentaux
de l’information
géographique
Chapitre III : Fondamentaux
de l’information
géographique
Chapitre III : Fondamentaux de l’information
géographique
Modélisation de surfaces de terrain
La surface terrestre peut être modéliser en prenant en compte la surface du
sol ou en intégrant la hauteur des objets comme le bâti ou la végétation.
Pour désigner ces modélisations du monde réel, on parle de modèles
numériques de terrain (MNT), de surface (MNS) et d’élévation (MNE).
Dans les MNT, l’altitude caractérise la surface nue de la Terre (sans
végétation, les bâtiments, etc.) ou le fond de la mer ;
Si les hauteurs de tous les objets placés sur le sol sont prises en compte, le
terme de modèle numérique de surface (MNS) est retenu ;
Enfin, le terme modèle numérique d’élévation (MNE) est utilisé de façon
générique pour désigner aussi bien un MNT qu’un MNS.

Dans les MNE en mode raster (2,5D), la valeur prise par les cellules
correspond à l’altitude (valeurs Z). Ces modèles sont les plus fréquemment
rencontrés en SIG et peuvent être visualisés en 2D ou en 3D.
Chapitre III : Fondamentaux de l’information
géographique
Un deuxième type de modélisation en 3D peut être réalisé à partir d’un réseau
triangulé irrégulier (TIN). Le TIN est un MNE en mode vecteur qui représente
une surface composé d’un ensemble de triangle contigus ne se chevauchant
pas.
Il est créé à partir d’un ensemble de points répartis dans l’espace de façon
irrégulière ou régulière et dotés d’un attribut d’altitude. Le relief est reconstitué
par une triangulation de l’ensemble des points qui joints par des lignes droites
qui ne se croisent jamais et qui produisent une mosaïque de triangles
irréguliers (Tesselation).

Un des avantages d’une modélisation TIN est que la densité de l’échantillon


des points utilisés pour la triangulation peut être adaptée sur le territoire pour
refléter correctement le relief. Un autre avantage de ce modèle de données est
la faible volume de données à stocker par rapport à un MNT en format raster.
Chapitre III : Fondamentaux de l’information
géographique
Le LIDAR (Light Detection And Ranging) recueille des données vecteur 3D
avec une représentation géométrique sous la forme d’un nuage de points en
trois dimensions. Elles sont une ressource importante de la visualisation d’un
territoire sous la forme d’un MNE car ces nuages de points 3D permettent de
créer des représentations très réalistes du paysage.

Le LIDAR est une technique de télédétection optique qui utilise la lumière


laser pour échantillonner avec une très grande précision la surface de la Terre.

Les jeux de données vecteur formés d’isohypses peuvent également être


visualisés en 3D. Ces courbes de niveaux sont fréquemment représentées
sur des cartes topographiques ou des cartes marines.

Les jeux de données non dotées d’une information sur la hauteur ou l’altitude,
comme une orthophotographie peuvent être visualisés en 3D par drapage sur
un MNE.
Chapitre III : Fondamentaux
de l’information
géographique

Le LIDAR
Chapitre III : Fondamentaux de l’information
géographique
Les relations des objets dans l’espace : la topologie

Les systèmes de coordonnées permettent de donner une position absolue des


objets dans l’espace. Les objets géographiques ne fonctionnent pas de
manière indépendante, mais entretiennent des relations qui sont induites par
leurs positions relatives dans l’espace.
Il est possible de distinguer :
- les relations basées sur la position relative des objets dans l’espace et dans
ce cas on parlera de relations topologiques ;
Les relations basées sur la distance qui sépare les objets.
Chapitre III : Fondamentaux de l’information
géographique
Les relations topologiques
Les principales relations topologiques proposées dans les SIG permettent de
traduire des notions d’inclusion, d’adjacence ou de continuité et d’intersection.
Ces relations sont traduites par des opérateurs :

L’inclusion décrit une relation par laquelle une entité (point, ligne, polygone)
est contenue dans une autre entité (point, ligne ou polygone). Elle peut
traduire des situations telles que la présence d’un arbre remarquable dans un
espace boisé ou l’existence d’un sentier de randonnée dans une aire
naturelle protégée.

L’adjacence ou la contiguïté décrit une relation de voisinage par laquelle deux
objets (ligne ou polygone) partage au moins un segment ou un sommet en
commun. La connectivité est un cas particulier de la relation d’adjacence.
Elle permet de décrire les liens entre, d’une part, les entités ponctuelle pour
représenter un réseau.

L’intersection traduit la relation de croisement entre deux objets ou d’une
façon plus générale, l’existence entre deux objets d’au moins un point
commun à deux objets. On considère que l’intersection est une relation
topologique plus générale car les objets qui entretienne une relation
d’inclusion ou d’adjacence ont forcément une relation d’intersection.
Chapitre III : Fondamentaux de l’information
géographique
Les opérateurs topologiques
La caractérisation des relations d’inclusion, d’adjacence et d’intersection entre
objets géographiques est basée sur l’utilisation d’opérateurs topologiques,
appelés aussi opérateurs spatiaux. Ces opérateurs portent sur la géométrie des
objets.
Les opérateurs topologiques utilisés par les SIG sont basés sur ceux définis par
l’OGC. Leurs conditions d’applications dépendent de la géométrie des objets et
des objectifs attendus. Elle est basée sur les notions de limite, d’intérieur et
d’extérieur qui caractérisent le contour de l’objet :
Limite : ensemble des points qui définissent le contour de l’objet.
- Intérieur : ensemble des points qui définissent l’objet lui-même (forme de
l’objet) sans ses limites.
- Extérieur : ensemble des points de l’espace quine constituent ni les limites, ni
l’intérieur de l’objet.

Les opérateurs topologiques interviennent à toutes les étapes du processus de


gestion et d’analyse de l’information : création de l’information, interrogation,
traitement et analyse.
Chapitre III : Fondamentaux de l’information
géographique

Utilisés entre les entités d’un même jeu de données, les opérateurs
topologiques permettent de vérifier la cohérence topologiques des données.

Mobilités pour formuler des requêtes spatiales, les opérateurs topologiques
permettent de sélectionner des objets en fonction de leur relation
topologique avec d’autres objets.

La jointure spatiale qui permet l’enrichissement sémantique des jeux de
données géographiques, utilise également les opérateurs topologiques pour
mettre en relation les entités de deux jeux de données différents.

Lors de traitements des données, les opérateurs topologiques permettent de
combiner des objets en prenant en compte leur relation topologique.

Enfin, différentes méthodes d’analyse spatiale, comme les analyses
d’attractivité ou des mesures d’autocorrélation spatiale, mobilisent ces
relations.
Chapitre III : Fondamentaux de l’information
géographique
La distance entre les objets géographiques : une notion fondamentale
La distance joue un rôle majeur dans le traitement et l’analyse de l’information
géographique. Elle est utilisé non seulement pur des mesures simples mais
aussi dans des nombreuses méthodes de traitement de données et de
modèles relevant de l’analyse spatiale .

Dans les SIG, les différents types de distances s’obtiennent par calcul. Cette
possibilité exploite la dimension « localisation » des jeux de données définis
dans un système de données.
Chapitre III : Fondamentaux de l’information
géographique
Les types de distances dans les SIG
Plusieurs catégories de distances peuvent être calculées dans les SIG en
fonction des données qui sont prises en compte pour le calcul :
1. à partir d’un réseau (vecteur) ou (2) assimilé (raster) :
3. à partir des coordonnées des lieux ;
4. à partir des relations topologiques des objets en mode vecteur

Distances calculées à partir d’un réseau en mode vecteur

Les distances calculées à partir d’un réseau ont pour ambition de mesurer les
véritables distances parcourues dans la réalité en empruntant un réseau. C’est
pourquoi les distances réseaux sont parfois appelées, de manière abusive, des
distances empiriques. Dans les SIG, ces distances sont calculées le plus
souvent en exploitant la modélisation de ces réseaux sous la forme d’objets
ponctuels et linéaires dont la connectivité est décrites dans un modèle
topologique de réseau.
Chapitre III : Fondamentaux de l’information
géographique
Les distances sur un réseau peuvent être calculées dans différentes unités de
mesure :

- en unité exprimée en unités de longueur (m, km, miles…) souvent appelée


distance kilométrique ;
- en distance-temps exprimée en unités de temps (heures, minutes…) ;
- en distance-coût, qui peut être définie comme le coût lié à un déplacement
entre deux lieux.

Dans les SIG, ces trois distances peuvent être calculées à partir de jeux de
données modélisés sous la forme d’un réseau en mode vecteur.
Chapitre III : Fondamentaux de l’information
géographique
Distances calculées à partir d’un jeu de données raster
A partir d’un jeu de données raster qui stocke des informations relatives à un
réseau, il est possible de mettre en œuvre un calcul de distance-coût. On
peut préciser la caractérisation des cellules en ajoutant d’autres catégories
d’attributs.
Le calcul s’effectue par un algorithme qui identifie l’itinéraire passant par les
cellules, telles que la somme de leurs attributs soit minimale.

Distances liées au système de coordonnées

Les distances le plus fréquemment calculées et utilisées dans les SIG sont
des distances exprimées en unités de longueurs. Ces distances sont
directement liées au système de coordonnées car elles sont calculées à
partir des coordonnées des points d’origine et d’arrivée.
Deux types de distances sont fréquemment calculés à partir des
coordonnées projetées : la distance euclidienne, distance à vol d’oiseau, et
la distance rectilinéaire, distance de Manhattan.
La distance orthodromique, distance géodésique, est calculée à partir de
coordonnées géographiques.
Chapitre III : Fondamentaux de l’information
géographique
La distance euclidienne. C’est la plus courte distance entre deux points dans
un repère orthonormé. Elle peut être matérialisée par une ligne droite entre les
deux points.
En SIG, si l’on disposer d’un MNT, on peut calculer une distance euclidienne
3D qui intègre les dénivelés sur les tracés entre les deux points.

La distance rectilinéaire est la distance entre deux points mesurée le long


d’axes verticaux et horizontaux.

La distance orthodromique est la plus petite distance courbe entre deux points
sur une sphère. Elle est calculée à partir des coordonnées géographiques.
Chapitre III : Fondamentaux de l’information
géographique
Distances liées à la topologie

Les distances calculées à partir de coordonnées sont des distances dites


mathématiques. D’autres distances mathématiques. Ce sont des distances
topologiques.
Elles sont liées aux relations topologiques d’adjacence ou de contiguïté et la
connectivité dans un réseau. Elles servent à mesurer des relations entre objets
dans un espace discret. Elles sont principalement utilisées avec des jeux de
données vecteur même s’il n’est pas impossible de parler de distance
topologique entre cellules d’une couche raster.
Chapitre IV : Intégration de données
géographique dans les SIG
II.1.1. Introduction
L’acquisition des données est une étape importante dans un
projet SIG. Les données acquises et intégrées doivent être en
adéquation avec les objectifs attendus :

Quels sont les cas d’utilisation ou quels problèmes doit-il
répondre ?

Quelles questions ou quels problèmes doit-il traiter ?
Dans ce chapitre l’on cherchera à connaître les principales
sources et types de données géographiques ;

Savoir intégrer des données de terrain ou du capteur dans les
SIG ;

Comprendre le processus de production de données
géographiques ;

Savoir créer des données géographiques raster et vecteur ;

Connaître l’utilité et le contenu des métadonnées :

Savoir identifier les ppx formats de données utilisés par les
SIG ;
Chapitre IV : Intégration de données
géographique dans les SIG
4.2 Mobilisation des jeux de données géographiques existants
Les sources de données géographiques disponibles sont très nombreuses et
variées. Les données de référence ou plus spécifiquement dédiées à une
activité, elles peuvent être gratuites ou payantes, libres de droit ou non. Leur
disponibilité s’est accrue avec le mouvement de l’Open Data et l’apparition de
nouvelles modalités d’accès (services Web) et la normalisation de leur niveau
de description (métadonnées).

2.1 Sources et fournisseurs d’information géographique

Il existe une grande variété de sources d’information géographique : les


sources de données de référence et les sources de données métier.
Chapitre IV : Intégration de données
géographique dans les SIG
Les données de référence
Les données de référence sont utilisées très largement quelle que soit la
question qui a donné lieu à la mise en place du projet. Elles constituent les
données de base, sorte de socle commun nécessaire à la représentation et la
visualisation cartographique. Elles jouent le rôle de fond de carte dans un
projet SIG : les limites administratives, les réseaux de transport, le relief, le trait
de côte, etc.
Elles sont distribuées par des fournisseurs de données institutionnelles ou
produites par des fournisseurs privés (Google Maps, Bing Cartes, Mappy,
Mapquest, Tomtom, Michelin…). Elles sont aussi construites de manière
collaborative, cas de OpenStreetMap (OSM).
OpenStreeMap est une base de données géographiques libre qui contient une
variété d’informations géographiques décrivant les infrastructures d’un
territoire telles que les routes, les bâtiments, les adresses, etc. dans le monde.
OSM est considéré comme le Wikipédia de la cartographie. C’est una
plateforme cartographique ouverte et libre d’accès, sur laquelle les internautes
contribuent gratuitement à la création, la vérification et la mise à jour de
données géographiques.
Chapitre IV : Intégration de données
géographique dans les SIG
Les données métier
La deuxième catégorie de données est constituée par les sources données
géographiques dites métier ou thématiques, relatives à un domaine ou activité
particulier. Elles ont une utilisation plus spécifique et peuvent être divisées en
deux types :

Celles qui intéressent diverses communautés d’utilisation et qui sont
produites sans objectif spécifiques d’utilisation, autre que la connaissance
des territoires, souvent au niveau national ou supranational.

Une deuxième sous-catégorie concerne des données relatives au domaine
d’application ou métier particulier. Elles sont produites à l’échelle d’un
territoire et pour répondre à un objectif spécifique.
Chapitre IV : Intégration de données
géographique dans les SIG
Les données ouvertes ou l’Open Data
Le mouvement de l’Open Data, diffuse de manière libre les données
géographiques, désigne les données dont l’accès est libre et gratuit. Il repose
sur le principe selon lequel les données issues des services de l’État et des
collectivités constituent un bien commun, et que leur diffusion présente un
intérêt public et général.
Standard de fait ou standard de facto : format propriétaire, dits natifs,
initialement développés par une société, et qui progressivement se sont
imposés aux logiciels SIG pour faciliter la réutilisation et l’échange des
données entre les applications (ex. le format Shapefile d’ESRI).
Standard interopérable ou ouvert : disponibles dans un type de format
standard dit « ouvert ». Ces formats et leurs spécification sont publics et sans
restriction d’accès et de mise en œuvre.

Pour favoriser la mutualisation, la mise à disposition et le partage des données


géographiques relatives à un territoire ou thématique au sein d’une
communauté d’acteurs, les collectivités territoriales s’attachent à mettre à
disposition leurs données de référence et leurs données plus spécifiques. Pour
cela les IDG (infrastructures de données géographiques se développent.
Chapitre IV : Intégration de données
géographique dans les SIG
Les IDG sont généralement dotées de plateformes accessibles par Internet et
offrent des fonctionnalités permettant :

De connaître la disponibilité des données via des moteurs de recherche ;

D’avoir une description des caractéristiques des données disponibles, via
des fiches de métadonnées. On parle alors d’IDG de type « géocatalogue » ;

De consulter et de visualiser les données, voire de les télécharger, ou d’y
accéder via un service Web géographique. On parle alors d’IDG de typa
« geoportail ».
Chapitre IV : Intégration de données
géographique dans les SIG
Les services Web géographiques pour accéder à l’information
géographique
Les SIG offrent la possibilité d’ajouter à un projet des données sous forme de services
Web géographiques, appelés parfois géoservices. Ces services permettent d’accéder
directement à des données géographiques ou cartographiques disponibles en ligne
via des serveurs cartographiques.
On distingue différents services Web géographiques relatifs aux :

Données vecteurs : Web Feature Service (WFS) ;

Données raster : Web Map Service (WMS), Web Coverage Service (WCS), Web
Map Tile Service (WMTS) ;

Métadonnées : Catalog Service for the Web (CSW) ;

Traitements de données : Web Processing Service (WPS).
Les services Web géographiques sont basés sur des protocoles de communication
http permettant d’accéder aux données via une adresse URL. D’un côté, l’organisme
met à disposition ses données via un serveur cartograhiaque. De l’autre, l’utilisation
envoie au serveur cartographique distant, via la fonctionnalité proposée par le
logiciel SIG, une requête formulée dans l’URL http qui contient tous les arguments
nécessaires à la selction des données à visualiser.
Chapitre IV : Intégration de données
géographique dans les SIG
Exemple d’un service Web géographique :

http://cursus.fr/serverSIG/LeJeuDeDonnées/
Service=WFS&version1.0&request=GetFeature&typeName=Ville
Est composé de :

L’adresse du serveur où est stocké le jeu de données :
cursus.fr/serverSIG/LeJeuDeDonnées ;

La version du service : service=WFSversion1.0 ;

Des entités (ici des villes) à récupérer : &request=GetFeature&typeName=Ville
Chapitre IV : Intégration de données
géographique dans les SIG
Type de service Description du service Commentaires

Web Feature Fournit des données géographiques en Les données peuvent


Service (WFS) mode vecteur sélectionnées et interrogées

Web Map Fournit des données cartographiques ou Les données ne peuvent être
Service une image géoréférencée en mode sélectionnées ou interrogées. C’est
(WMS) raster bon pour un fond de carte.
Web Map Tile Fournit des données cartographiques ou Service équivalent au WMS mais
Service (WMTS) une image géoréférencée sous forme de propose des fonds de cartes raster
tuiles raster tuilées.
Web Coverage Fournit des données raster de type À lz différence de WMS, le service
Service (WCS) « couverture » comme les MNT ou propose ls données dans leur
orthophotos. format d’origine.
Catalog Service Permet d’accéder à des catalogues de Ne s’applique pas aux données
for the Web métadonnées et de les récupérer géographiques mais aux
(CSW) métadonnées.
Web Processing Permet d’accéder à des procédures de Ces services complètent les
Service (WPS) traitement ou de géotraitement de fonctionnalités de traitement des
données géographiques : service de données géographiques des SIG.
géocodage, de traitements de données.
Chapitre IV : Intégration de données
géographique dans les SIG
Les métadonnées
Les métadonnées permettent de caractériser, comprendre et échanger
l’information géographique.
En fait pour être utilisées les données doivent nécessairement être
accompagnées d’informations qui les décrivent : contexte de leur production,
méthoes de recueil, propriétés, conditions d’utilisation.. On appelle ces
informations les métadonnées, c’est-à-dire des données sur les données.
Les métadonnées permettent de répondre aux questions de façon très
précise, comme :

Thème/territoire : que contiennent les données ? Quel est le territoire
couvert ?

Sources et références : quel est le système de coordonnées ? Comment
sont-elles acquises ;

Propriété des données : quelle est la résolution spatiale du jeu de données ?

Qualité des données : quel est le niveau de précision des données ? Quelle
est leur fréquence de mise à jour ?

Droits associées aux données : quels sont les droits d’accès et d’utilisation
des données ?
Chapitre IV : Intégration de données
géographique dans les SIG
Qualité des données dans les métadonnées

Le rôle des métadonnées est de fournir à l’utilisateur les informations


nécessaires au bon usage du jeu de données, mais aussi de le renseigner sur
la qualité des données. La notion de qualité, appliquée à des jeux de données
géographiques est complexe et regroupe différents aspects.

Elle concerne à la fois les notions de précision, d’exhaustivité, de cohérence


des données et d’incertitude :

La précision des données s’applique aussi bien à la géométrie des objets et
leur localisation, qu’aux autres attributs qui leur sont associés.

L’exhaustivité concerne les valeurs ou entités manquantes dans un jeu de
données.

La cohérence concerne l’existence de données aberrantes ou
contradictoires dans un jeu de données.

L’incertitude concerne le niveau de confiance que l’on peut avoir dans les
valeurs.
Chapitre IV : Intégration de données
géographique dans les SIG
Qualité des données dans les métadonnées
Le besoin de partager les données et la diversité des formats de production
ont conduit les organismes officiels à proposer des normes de description
structurés des métadonnées, comme ISO 19115. Ces normes impliquent une
description très précises. Le contenu des métadonnées géographiques est
basé sur la norme ISO 19155, à laquelle sont aussi associées la norme ISO
19157 pour la description de la qualité des données et la norme ISO 19139 qui
spécifie le format informatique (format XML) dans lequel doivent être décrites
les métadonnées.

Le format XML (eXtensible Markup Language) est un format standard de


métadonnées qui permet de décrire les données avec des balises et des
règles. Il a été créé pour échanger les données en utilisant un langage
compréhensible par les machines et les utilisateurs.
Chapitre IV : Intégration de données
géographique dans les SIG
Les différents niveaux de métadonnées
Les métadonnées sont aussi décrites sous une forme textuelle plus facilement
compréhensible pour les utilisateurs. Plusieurs niveaux de description sont
disponibles en fonction des usages :

Les métadonnées de découverte, qui décrivent a minima l’information. Elles
répondent à la question : où puis-je trouver des données ?

Les métadonnées d’exploration, qui donnent une information plus détaillée.
Elles permettent à l’utilisateur de mesurer l’adéquation des données à ses
besoins et d’identifier les plus pertinentes ;

Les métadonnées d’exploitation, qui vont permettre à l’utilisateur de
connaître les modalités d’utilisation tant méthodologique, technique que
juridique.
Chapitre IV : Intégration de données
géographique dans les SIG
Intégrer et créer des jeux des données géographiques dans un SIG
Intégrer l’information géographique en mode vecteur
Géocodage de données localisée
Le géocodage est une opération qui consiste à associer des coordonnées X, Y
et une entité de type ponctuel à des données localisées sous forme
alphanumérique (toponyme, adresse postale, code postal…). Cette opération
s’effectue au moyen d’une fonctionnalité intégrée dans les logiciels SIG, via un
service Web spécifique appelé géocodeur.
La procédure de géocodage s’appuie sur un jeu de données vecteur de
référence, souvent appelé table de géocodage.
La table de géocodage est structurée de la façon suivante :

Les champs de la table attributaire contiennent pour chaque enregistrement
les noms de lieux et/ou les adresses normalisées (ex. nom de la rue,
numéros des adresse dans chaque tronçon de rue…).

La géométrie des entités géographiques peut être de type ponctuel ou
linéaire. Dans le cas d’entités ponctuelles, elles peuvent correspondre aux
centroïdes des polygones, pour un géocodage à la commune ou au quartier.
Chapitre IV : Intégration de données
géographique dans les SIG
La procédure de géocodage s’appuie sur des algorithmes d’appariement
textuel dont l’objectif est de faire correspondre les noms de lieu ou les
adresses postales contenus dans le tableau de données de départ ne
disposant pas de coordonnées géographiques ou projetées avec ceux de la
table de géocodage.
Les attributs des champs correspondant aux toponymes ou adresses des deux
tables sont comparés enregistrement par enregistrement. La table d’origine à
géocoder doit être a minima structurée de la même façon que la table de
géocodage.
On distingue généralement deux façon de procéder à une opération de
géocodage. La première est un géocodage en masse qui apparie
automatiquement les adresses ou les toponymes à des coordonnées X, Y.
Seuls les enregistrements non géocodés sont proposés de façon interactive à
l’utilisateur, qui peut intervenir manuellement sur la procédure d’appariement et
la valider.
La seconde est interactive ou manuelle où l’utilisateur doit valider
systématiquement toutes les propositions d’appariement.
Chapitre IV : Intégration de données
géographique dans les SIG
Selon que le géocodage s’effectue à l’adresse postale ou au toponyme, les
coordonnées renvoyées correspondent à des localisations ponctuelles
différentes :

Avec un géocodage à l’adresse, le résultat transmis est des coordonnées X,
Y pour chaque adresse postale identifiée. Généralement, ces coordonnées
correspondent à la localisation postale du bâtiment pour lequel l’adresse a été
collectée (point d’adresse) ;

Le géocodage au toponyme renvoie comme résultat les coordonnées du
centroïde de l’objet graphique considéré : centroïde du polygone représentant
les contours des pays, régions, communes, quartiers, etc., ou du segment de
ligne représentant l’objet linéaire (rue, tronçon de zone, de rivière), lorsqu’il
s’agit de noms de rues, de route ou de cours d’eau.
La précision du géocodage dépend de celle des adresses d’origine : plus
l’adresse est complète et conforme au standard, plus le géocodage sera
précis et complète. Généralement, le géocodage informe pour chaque
adresse de la table d’origine le niveau de correspondance obtenue (par
exemple,0 = aucune correspondance ; 100= correspondance parfaite).
Chapitre IV : Intégration de données
géographique dans les SIG
Chapitre IV : Intégration de données
géographique dans les SIG
Intégrer des données provenant des capteurs GPS
Les données GPS sont stockées dans un format de fichier GPX (GPS
eXchange format). Un fichier GPX contient les coordonnées de latitude et de
longitude correspondant à la localisation du point enregistré, son altitude,
l’horodatage, c’est-à-dire la date (jour, mois, année) et l’heure (heure, minute,
seconde) à laquelle le point a été collecté, ainsi que des métadonnées
décrivant le contenu du fichier. Un fichier GPX permet de stocker le tracé d’un
itinéraire ou de points d’observation. Leur structuration est différente selon que
les données collectées correspondent à des points d’observations, aussi
appelés des points d’intérêts (WayPoint) ou des séquences e points définies
selon des pas de temps ou de distance spécifiés qui correspondent à des
traces d’itinéraires (TrackPoint).
Chapitre IV : Intégration de données
géographique dans les SIG
Type Structuration informatique du
Contenu du fichier
d’objet fichier
Un point (wpt) est défini par ses <wpt lat =’…’ lon=’...’>
coordonnées géographiques (lat, <ele> … </ele>
WayPoint lon), son altitude (ele), son nom <name> … </name>
(name) et sa date (time) <time> … </time>
</wpt>
Un itinéraire (trkt) est composé de <trk>
segments (trkseg), définis par des <trkseg>
points (trkpt). Chaque point <trkptlat= « ... » lon = « ... »>
d’itinéraire (trkpt) est carctérisé par <ele>...</ele>
TrackPoint ses coordonnées (lat ; lon) et son </trkpt>
altitude (ele). <trkpt lat= « « lon>
<ele> … </ele>
</trkseg>
</trk>

Les SIG proposent des fonctionnalités qui permettent la conversion de fichier


GPX en jeux de données vecteur. Les objets géographiques de ces jeux de
données vecteur sont de géométrie ponctuelle lorsque les relevés GPS
correspondent à des points d’intérêts (WayPoints) et linéaire pour des relevés
de traces d’itinéraire (TrackPoints).
Chapitre IV : Intégration de données
géographique dans les SIG
Intégrer des données ponctuelles géolocalisée
Les données de ce type sont généralement stockées dans des fichiers ASCII
(en format texte, comme les fichiers .txt ou .csv), mais peuvent aussi être
stockées dans un fichier de type tableur.
Ces tableaux de données correspondent à des valeurs mesurées, issues de
capteurs d’enregistrement tels que des sismographes, des pluviomètres, des
capteurs de particules d’air, ou des données d’inventaire issues d’observations
localisées.

Ces données peuvent être affichées dans un logiciel SIG sous forme d’entités
géométriques ponctuelles, puis enregistrés en mode vecteur. Chaque couple
de coordonnées X, Y permet de créer une entité de type point et les valeurs
mesurées associées à ces points sont stockées dans la table attributaire.
Chapitre IV : Intégration de données
géographique dans les SIG
Digitalisation de jeux de données vecteur
La digitalisation, ou saisie vectorielle, consiste à créer des jeux de données
géographiques vecteur par la saisie de la forme géométrique (surfacique,
ponctuelle ou linéaire) des objets au moyen d’un outil de saisie (souris ou
stylet).
Le principe consiste à « dessiner » les contours d’un objet géographique sous
forme de polyligne, de point ou de polygone, en se basant sur l’affichage de
données déjà existantes, généralement une image raster (photo aérienne). Ce
principe est similaire à l’utilisation d’une feuille de calque plaquée sur une
image sur laquelle sont dessinés des objets.
La création de données vectorielles par digitalisation nécessite donc non
seulement d’identifier les objets qui devront être saisis, mais aussi de préciser
leur forme géométrique, le niveau de généralisation et de précision, ainsi que le
système de coordonnées utilisé. IL s’agit aussi de définir la structure de la table
attributaire, c’est-à-dire de préciser les champs attributaires thématiques qui
doivent être renseignés ainsi que leur type : entier, réel, texte.
La création des métadonnées associées au jeu de données créé est
indispensable, en particulier si ces données sont destinées à être partagées.
Chapitre IV : Intégration de données
géographique dans les SIG
Intégrer l’information géographique en mode raster
Il existe différentes sources de données diffusées en mode raster, dont une
grande partie vient de méthodes d’acquisition par télédétection. Les utilisateurs
peuvent récuperer les images satellites et radar diffusées par des fournisseurs
de données soit sous forme d’images brutes, soit sous forme d’images déjà
traitées. Le mode raster est aussi très souvent utilisé pour représenter les
MNE.
Les images et photos brutes nécessitent une première interprétation et leur
traitement s’effectue généralement dans un logiciel de traitement d’image
spécialisé, même si les logiciels SIG intègrent souvent des fonctionnalités
permettant d’effectuer le traitement d’image.
Chapitre IV : Intégration de données
géographique dans les SIG
Géoréférencement d’images
L’opération de géoréférencement consiste à attribuer des coordonnées
géographiques ou projetées à une image numérique (plans, cartes ou dessins
scannés, phot aérienne…). L’image géoréférencée devient un jeu de données
de type raster, et peut être superposée à d’autres jeux de données raster ou
vecteurs. Elle peut aussi servir de fond pour digitaliser des objets visibles sur
l’image.
Le géoréférencement consiste à effectuer à chaque pixel de l’image des
coordonnées géographiques ou projetées. À partir de la mise en
correspondance de points de localisation dont les coordonnées sont connues
avec les pixels de l’image correspondant au même emplacement
géographique, il s’agit d’affecter de façon automatique des coordonnées à
chaque pixel au moyen d’une transformation mathématique.
Chapitre IV : Intégration de données
géographique dans les SIG
L’opération de géoréférencement nécessite :

- D’identifier des points de référence, appelés points de calage, dont les


coordonnées géographiques ou projetées sont connues. En théorie, au moins
deux points de calage sont nécessaires pour effectuer le géoréférencement
mais, pour un résultat correct, et en particulier si le document géoréférencer a
des déformations géométriques internes, le nombre de points de calage
conseillé est plus important. Les fonctionnalités offertes par les logiciels SIG
permettent de géoréférencer facilement une image selon deux méthodes :

Si les coordonnées des points de calage sont connues, il est possible de
saisir manuellement et directement les coordonnées de ces points.

Le géoréférencenment peut aussi s’efectuer à partir de l’affichage d’un autre
jeu de données raster ou vecteur, en faisant correspondre des points
sélectionnés sur l’image à géoréférencer à leur position sur ce jeu de
données défini dans un système de coordonnées.
- De connaître le système de coordonnées dans lequel les coordonnées des
points de calage sont définies. L’image géoréférencée sera alors définie dans
le même système de coordonnées que celui des points de calage.
- D’appliquer une transformation mathématique avec pour objectif de faire
coïncider au mieux les coordonnées géographiques ou projetées aux points
de l’image. Différentes types de transformation peuvent être appliquées.
Chapitre IV : Intégration de données
géographique dans les SIG
Méthode Nombre de points avantage/inconvénient
de calage minimum
Linéaire 2 en théorie privilégier 4 ou 5 Ne déforme pas le raster, mais n’est
pas toujours adapté pour les images
scannées
Polynomiale d’ordre 1 3 en théorie privilégier 5 Préserve la colinéarité et permet le
ou affine changement d’échelle, la translation et
la rotation. C’est le degré de
transformation minimale à appliquer à
une image scannée.
Polynomiale d’ordre 2 6 ou 10 Permet une distorsion du raster. Le
ou 3 degré de distorsion de l’image est
d’autant plus important que l’ordre est
élevé. Utile sur des images scannées
déformées (carte ancienne,
photographie aérienne non rectifiée)
Thin Plate Spline (TPS) 1 en théorie, privilégier 10 Prend en compte des déformations
locales. Utile sur des images scannées
de mauvaise qualité.
Chapitre IV : Intégration de données
géographique dans les SIG
Lorsque la transformation utilisée déforme le raster, les valeurs des cellules sont alors
recalculées au moyen d’une méthode de rééchantillonnage. Trois des principales méthodes de
rééchantillonnage sont généralement proposées par des logiciels SIG : plus proches voisins,
linéaire, cubique.
Méthodes Description Avantages/ Calcul des valeurs de
inconvénients pixel
Plus La valeur du nouveau pixel Rapidité de la
proches correspond à celle du pixel dont le méthode. Ne crée pas
voisins centre est le plus proche dans vraiment de nouvelles
l’image valeurs (affectation de
la valeur la plus
proche).
Linéaire La valeur du nouveau pixel est Permet un lissage du
déterminée à partir des valeurs raster
des 4 pixels dont les centres sont
les plus proches.
Cubique La valeur du nouveau pixel est Donne un rendu plus
déterminée à partir des valeurs continu. Importance
des 16 pixels dont les centres sont du temps de calcul.
les plus proches.
Chapitre IV : Intégration de données
géographique dans les SIG
Convertir des jeux de données
La conversion d’un jeu de données SIG est un processus qui transforme des
données modélisées sous une forme numérique particulière (vecteur ou
raster) en une autre forme numérique (vecteur ou raster). Elle est utilisée pour
rendre possible certaines analyses ou appliquer certains traitements
nécessitant des données modélisées sous une même forme.

Les logiciels SIG intègrent différentes fonctionnalités de conversion


automatique. Deux cas très fréquemment utilisés sont présentés : la
transformation d’un jeu de données vecteur en un jeu de données raster et
inversement.
Chapitre IV : Intégration de données
géographique dans les SIG
La rastérisation
La rastérisation, souvent mobilisée en SIG, consiste en la transformation d’un
jeu de données vecteur en une matrice de cellules. Celle-ci correspond à la
nature de l’objet initialement représenté en mode vecteur (point, polyligne,
polygone).

Il existe plusieurs méthodes de rastérisation. Pour des entités surfaciques, la


méthode consiste à affecter une valeur à une cellule en fonction de la valeur de
l’entité qui superpose la cellule. Si plus d’une entité chevauche la cellule, c’est
généralement l’entité correspondant à la plus grande surface de la cellule qui
détermine la valeur attributaire de la cellule.

La conversion en raster s’applique donc à des jeux de données vecteur de tout


type de géométries (point, polyligne et polygone) représentant des
phénomènes géographiques aussi bien discrets que continus.
Chapitre IV : Intégration de données
géographique dans les SIG
Chapitre IV : Intégration de données
géographique dans les SIG
La vectorisation
La vectorisation consiste à créer automatiquement un jeu de données vecteur à
partir d’un jeu de données raster. Elle repose sur l’identification des formes
créées par un ensemble de cellules contiguës ayant la même valeur attributaire
et la transformation de leurs contours en objets géométriques de type points,
polylignes et polygones. Le jeu de données vecteur obtenu contient la
géométrie des objets, ainsi que leurs identifiants sémantiques.

La vectorisation des jeus de données raster est utile dans difféentes situations.
Les données issues d’images satellite ou de photographies aériennes sont
initialement structurées en mode raster, et une classification à partir des
attributs des cellules de l’image permettra d’identifier les catégories
d’occupation du sol.
Chapitre IV : Intégration de données
géographique dans les SIG
Chapitre IV : Intégration de données
géographique dans les SIG
Stocker des jeux de données géographiques : les formats
informatiques
Les données modélisées numériquement sont stockées dans des fichiers
pour être exploitées par les SIG. Il existe de nombreux formats de fichiers :
certains sont propriétaires, d’autres correspondent à des standards reconnus.
On ne va les décrire tous mais donner des points de repère utiles. Les
modalités de stockage des données varient selon qu’il s’agit de jeux de
données vecteur ou raster.
Chapitre IV : Intégration de données
géographique dans les SIG
Stocker des jeux de données raster
Le stockage des données raster n’est pas normalisé et il existe plus d’une
centaine de formats, chaque logiciel SIG ayant plus ou moins développé son
propre format : ARC Digitized Raster (ADRG), Band Interleaved by line (DIL)
utilisé en imagerie satellitaire, ECW qui est un format compressé, ESRI Grid
en ASCII Grid utilisé par ESRI, Geotiff (format TIFF pour les SIG), IMG, JPEG
2000…
Ces différents formats correspondent aux différents types d’informations qui
peuvent être stockés dans les fichiers raster, ainsi qu’aux différents processus
de compression des données.

Les fichiers associés aux jeux de donnés raster stockent d’une part l’image
elle-même ou séparément les mosaïques de l’image, c’est-à-dire l’assemblage
d’images juxtaposées : d’autre part les données décrivant les caractéristiques
de l’image.
Chapitre IV : Intégration de données
géographique dans les SIG
Lorsque les fichiers raster stockent une seule information par pixel ou cellule,
qu’il s’agisse de valeurs de gris pour une image aérienne en noir et blanc ou
des valeurs d’altitude pour un MNT, le fichier est appelé monocanal.
Quand les données raster correspondent à une information issue d’images
aériennes ou satellite qui rassemblent les informations captées dans plusieurs
longueurs d’onde du spectre électromagnétique, des formats multicanaux
peuvent être utilisés. Cela peut être simplement des données issues d’un scan
en couleur RVB (rouge, vert, bleu). Les formats de fichiers multicanaux
peuvent éventuellement être utilisées pour stocker une information
monocanale mais l’inverse n’est évidemment pas vrai.
Chapitre IV : Intégration de données
géographique dans les SIG
Les procédés de compression des données raster
Un des enjeux informatiques lié aux données raster est leur poids en octets. En
effet, théoriquement, une valeur doit être enregistrée pour chaque cellule. Ainsi,
que l’image ou le fichier raster contienne des valeurs différentes pour chaque
cellule, ou qu’elle corresponde à des valeurs toutes identiques (cas improbable
d’une image totalement unie), le poids du fichier sera identique.
Pour réduire les poids des fichiers raster, différentes techniques de
compression sont utilisées. Elles s’appuient généralement sur l’identification de
cellules voisines ayant des valeurs identiques :

La compression séquentielle se base sur la définition de séquences de pixel
identiques. Le fichier informatique stocke ainsi le nombre de cellules
successives portant le même code.

La compression QuandTree se base sur une division successive du raster en
zones homogènes. Cela permet d’alléger le stockage informatique en
enregistrant les informations définies à la résolution la plus fine seulement
quand cela est nécessaire.
Ainsi, les 64 valeurs des cellules de départ peuvent être stockées en utilisant
seulement 19 valeurs.
Chapitre IV : Intégration de données
géographique dans les SIG
Stocker des jeux de données vecteur
Principe
En mode vectoriel, la géométrie des objets, les données attributaires, les liens
entre la géométrie des objets et les enregistrements des objets et les
enregistrements des tables, les systèmes de coordonnées… doivent être
stockées. Il existe différentes façons de stocker ces données : dans certains
cas, chaque type de données (géométrie, données attributaires…) est stocké
séparément dans un fichier spécifique ; dans d’autre cas, elles sont regroupées
dans un seul fichier. Nous présentons ici les formats informatiques les plus
répandus : des formats propriétaires, devenus des standards de facto, aux
formats interopérables.
Chapitre IV : Intégration de données
géographique dans les SIG
Le format shapefile : un standard de facto
Initialement, chaque logiciel SIG dispose de son propre format informatique
pour stocker les données de type vecteur. Le format shapefile est l’un des
formats de facto les plus répandus, qui est reconnu par les principaux logiciels
SIG.
Dans le format shapefile, les données sont stockées dans différents fichiers
selon leur nature. Les coordonnées qui décrivent la géométrie des objets sont
stockées dans des fichiers plats ou binaires, séparément des données
attributaires qui les caractérisent ; ces dernières sont stockées dans un fichier
dédié.
Le lien entre les données du fichier contenant les attributs et celui contenant
les géométries des entités géographiques de fichier. Les informations décrivant
le système de projection dans lequel sont définies les données sont stockées
elles aussi dans un fichier spécifique différent des autres. D’autres fichiers
peuvent être associés, comme ceux décrivant les métadonnées ou les index
spatiaux. Chacun de ses fichiers dispose d’une extension spécifique.
Le fichier .shp seule ne suffit pas pour afficher sous forme de couche
d’information géographique un jeu de données vecteur dans un SIG.
Chapitre IV : Intégration de données
géographique dans les SIG
Extension Informations stockées Description Précisions
des fichiers
Géométrie des objets Fichier du shapefile Format propriétaire utilisable
*.shp géographiques proprement dit uniquement par les logiciels
fichier binaire SIG
Données attributaires Format de type Lisible avec un tableur ou via
*.dbf DataBasefile un logiciel de base de données
de type DBase
Stockage enregistrements Fichier binaire Format propriétaire
*.shx contenu dans le fichier *.shp
Stockage des informations Stockage données Utilisable par d’autres logiciels
*.prj décrivant le système de en ASCII SIG
projection
Stockage des index spatiaux Format binaire Format propriétaire
*.sbn Fichiers créés après une
*.sbx requête ou une jointure
spatiale
Stockage métadonnées Format XML Format lisible avec un débiteur
décrivant le shape de texte
*.xml
Interopérable avec un logiciel
de géocodage
Chapitre IV : Intégration de données
géographique dans les SIG
Le format mif/mid : un format d’échange
Le format mif/mid (Mapinfo Interchangeable Format) associé au logiciel
Mapinfo, est un format créé initialement pour faciliter l’import/export des
données. C’est un format simple, composé de deux fichiers (*.mif et *.mid) dans
lesquels les données sont stockées en ASCII (fichier qui contient du texte non
formaté).

Le fichier *.mif stocke à la fois les informations relatives au système de
coordonnées, les noms et caractéristiques des champs attributaires, les
coordonnées décrivant les objets géographiques. Il stocke aussi la
symbologie des objets ;

Le fichier *.mid stocke la sémantique des entités géographiques : les valeurs
des attributs sont stockées sous forme d’une succession de lignes où chaque
ligne correspond à un objet décrit dans le *.mif.

Le numéro de la ligne contenu dans le fichier *.mid correspond à l’ordre de
déclaration des objets dans le *.mif.
Chapitre IV : Intégration de données
géographique dans les SIG
Le format GeoJson : un format interopérable
Il existe aujourd’hui d’autres formats numériques plus simples et plus
performants, utilisés pour stocker les données géographiques vectorielles,
comme le format GeoJson.
Le format GeoJson est une extension du format Json (JavaScript Open
Notation). Ce dernier a été crée pour faciliter l’échange de données. Il s’agit
d’un format de données ASCII dit « ouvert », dans lequel l’information est
représentée de façon structurée en XML et donc interopérable. Dans le format
GeoJson, les données attributaires et géométriques (coordonnées des points,
polylignes ou polygones) sont rassemblées au sein d’un même fichier. En
revanche, ce format ne stocke pas d’information relative au système de
projection car les données sont systématiquement spécifiées en WGS84. Les
entités géographiques sont décrites à travers leur type de géométrie
« Feature », leurs coordonnées « Coordinate » et la description de leurs
attributs « Properties ».
{
« type » : « Feature », geometry » : {« type » : « Point », « coordinate » :
[1,627, 40,127]}, « properties » : {« name » : « Pt1 »
}
Chapitre IV : Intégration de données
géographique dans les SIG
Le format GeoJson supporte les géométries simples (point, polyligne,
polygone), mais aussi complexes, de types multipoints, multiligne ou
multipolygone. Des objets géographiques de géométries différentes peuvent
être regroupés au sein d’un même fichier. En revanche, le format GeoJson ne
gère pas la topologie. Pour cela, il existe un format particulier, le TopoJson,
qui intègre la topologie.

Le format KML

Avec le développement des globes virtuels et des applications


cartographiques Web, l’usage du format KML (Keyhole Markup Language)
s’est répandu. Il est aujourd’hui reconnu comme une norme officielle par
l’OGC. Les fichiers KML sont basés sur langage XML et stockent à la fois les
données géométriques et les données attributaires.
Les fichiers KML ont une extension *.kml ou *.kmz (pour les fichiers KML
compressés ou zippés).
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
1. Visualiser l’information géographique

Pour prendre en main les jeux de données géographiques, l’utilisateur


commence généralement par les visualiser sous forme de cartes et de tableaux.
Plusieurs outils intégrés dans les logiciels SIG facilitent la visualisation.

1.1 Organiser les données dans un document cartographique

La décomposition des jeux de données par thématique (cours d’eau, routes,


bâtiments, etc.) amène à gérer l’affichage des données sous forme de couches
d’information qui se superposent comme des feuilles de papier-calque.
Plusieurs jeux de données (vecteur, raster, tableau, etc.) peuvent être ouverts
simultanément dans un logiciel SIG.
Les différents jeux de données intégrés dans le logiciel SIG apparaissent
généralement sous forme d’une liste, il est possible de gérer la visibilité ou non
de chaque couche, d’organiser l’ordre des couches et de les assembler dans
des groupes choisis par l’utilisateur.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
L’ordre des couches est généralement choisi, pour des questions évidentes de
lisibilité, en plaçant les données de représentation géographiques ponctuelle
au-dessus de celles en représentation linéaire, elle-mêmes au-dessus des
données en représentation surfacique et des données raster. Si les données en
représentation géométrique surfacique sont superposées à une couche raster,
il est utile de ne représenter que les contours des entités, le fond restant
transparent.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Naviguer à travers les données géographiques-les jeux de données
à l’écran
Basés sur le processus d’interactivité, les logiciels SIG offrent la possibilité de
consulter et d’explorer les données qu’ils contiennent. L’utilisateur peut
visualiser les données contenues dans le SIG en les affichant aussi bien sous
forme de cartes, que sous forme de tables attributaires.
Explorer la carte

Via la souris et au moyen de différents outils, l’utilisateur peut interagir avec


les cartes et les données. Différentes fonctionnalités sont proposées :

Pour se déplacer dans la carte (pan) ou zoomer ;

Pour obtenir une vue de l’ensemble de l’espace géographique des couches
(full-extent)

Pour connaître les coordonnées, les identifiants (nom, code) ou les attributs
d’un objet sélectionné ou survolé sur la carte

Pour sélectionner graphiquement un objet ou un ensemble d’objets
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Explorer les données attributaires
Chaque entité géographique est décrite par un ensemble d’attributs. Par
exemple les sondages sont décrits par leur identification, profondeur,
localisation…. Il est possible de connaître les attributs d’une entité en
particulier. Ou d’afficher sous forme de tableau l’ensemble des attributs de
toutes les entités.
Les deux formes de représentation, cartographique et attributaire, sont liées
dynamiquement : la sélection d’un objet ou d’un ensemble d’objet sur la carte a
pour effet de sélectionner dans le tableau attributaire les enregistrement
correspondant à ces objets.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
1.3 Personnaliser l’affichage

Afficher différents figurés cartographiques
Les logiciels SIG offrent des fonctionnalités permettant de modifier les figurés
cartographiques des entités tels que l’épaisseur, le style ou la couleur des
lignes et des contours : la taille, le symbole et la couleur des points ; la trame,
la couleur des polygones ; le niveau d’opacité des objets.

Choisir un système de coordonnées pour l’affichage des jeux de données
Chaque jeu de données géographiques est enregistré dans un système de
coordonnées géographiques ou projetées. Par défaut, l’affichage d’un seul jeu
de données géographiques se fait dans le système de coordonnées du jeu de
données. Si plusieurs jeux de données géographiques utilisés simultanément
sont définis dans des systèmes de coordonnées différents (Ex. WGS84 latlon
et Lambert93 projetées), ils se superposent généralement correctement grâce
à un changement de système de coordonnées dit « à la volée »
Le logiciel opère un changement de système de coordonnées des jeux de
données pour que leur affichage se fasse dans le même système. La
projection à la volée est un changement virtuel et ne modifie pas le système
de coordonnées d’origine du jeu de données.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique

Définir des échelles de visibilité
Les SIG permettent également de choisir à quelle échelle chaque jeu de
données devra être affiché, afin d’améliorer la lisibilité. Il s’agit d’une échelle
cartographique d’affichage.

Par appariement des entités/enregistrements et ajout de données
statistiques dans la table attributaire
L‘appariement des enregistrements de deux tables est utilisé pour mettre en
correspondance des enregistrements qui proviennent de jeux de données
différents.
Cet appariement peut être effectué de deux façons différentes. Lorsqu’elle est
fondée sur la mise en relation de deux tables ayant un champ attributaire
commun, on parle de jointure attributaire. Si ce sont des critères topologiques
qui permettent de faire le lien entre les entités de deux jeux de données
vecteur, on utilise une jointure spatiale.
Selon les caractéristiques des jeux de données sur lesquels porte la jointure, la
méthode de jointure choisie ne sera donc pas la même, mais le résultat est
toujours l’ajout des données d’une table à une autre table.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure attributaire

La jointure attributaire est utilisée pour ajouter des données statistiques à la


table attributaire d’un jeu de données vecteur, mais il est aussi possible de faire
une jointure entre deux tables attributaires de jeu de données vecteur.
Pour effectuer l’opération d’appariement entre les enregistrements par jointure
attributaire et associer des champs de la table à joindre à la table cible, deux
conditions préalables doivent être remplies :
1. Les deux jeux données doivent posséder pour tout ou partie les mêmes
enregistrements, par exemples les communes d’une région ;
2.Les tables attributaires des deux jeux de données doivent partager un champ
commun contenant un attribut unique pour chaque enregistrement dans la
table à joindre.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure attributaire

L’opération de jointure produit une seule table qui juxtapose les champs de la
table jointe à ceux de la table cible. Le résultat peut prendre deux formes :
conserver tous les enregistrements de la table cible ou ne garder que les
enregistrements communs. Deuxièmement, la jointure permet d’ajouter
l’ensemble des champs de la table jointe à la table cible, ou seulement une
partie des champs.
Un intérêt majeur de la jointure attributaire est de permettre de cartographier ou
d’analyser l’organisation spatiale de données d’un tableau statistique sans
entité graphique vectorielle associée à l’origine.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
Jointure attributaire géographique
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale

La jointure spatiale est spécifique à la gestion de l’information géographique


contrairement à celle attributaire qui peut être effectuée dans d’autres
environnements informatiques que les SIG (logiciels de traitements statistiques,
de SGBD et tableurs).
L’objectif de cette jointure est le même que pour les jointures attributaires. Il
s’agit d’associer des champs d’une table attributaire d’un jeu de données (table
jointe) à une table attributaire d’un autre jeu de données (table cible). Les
jointures spatiales sont utilisées notamment lorsqu’il n’existe pas de champ
commun identifiant de façon unique les enregistrements dans chacune des
deux tables attributaires à appareiller ; la jointure attributaire étant alors par
définition impossible. La jointure spatiale peut être utilisée lorsque deux jeux de
données vecteur contiennent des entités géographiques différentes.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale

La jointure spatiale étant fondée sur des relations topologiques, celles-ci


permettent l’appariement des enregistrements de deux tables attributaires
différentes entre elles. Elle est donc utilisable uniquement pour mettre en
relation deux jeux de données vecteur.
Exemple : les champs d’une table attributaire d’un jeu de données décrivant les
communes (table jointe) d’une région pourront être ajoutés à la table attributaire
d’un jeu de données décrivant les écoles de cette même région (table cible) en
fonction d’une relation topologique de type inclusion : l’appariement se fera
alors entre une école et la commune dans laquelle elle est incluse. Les champs
de la table des communes viendront s’ajouter aux champs de la table
attributaire des écoles. Cette jointure permettra ainsi de connaître pour chaque
école la commune dans laquelle elle se situe.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale

Si l’on inverse le sens de la jointure (le jeu de données des communes devient
la cible et le jeu de données des écoles, le jeu de données joint), on utilisera
également une relation topologique de type inclusion : l’appariement se fera
alors entre une commune et les écoles qui sont incluses dans chaque
commune.
Étant donné qu’une commune peut contenir plusieurs écoles, la jointure aura
pour effet de dupliquer l’enregistrement qui caractérise une commune autant de
fois que celle-ci possède une école. Pour éviter ce type de redondance, la
jointure spatiale est généralement associée à une étape d’agrégation des
données. Dans cette étape, des opérateurs mathématiques comme le nombre,
la somme ou la moyenne sont mobilisés. Parfois ces calculs se font de manière
automatique par défaut.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale

Le sens de la jointure est important et doit être réfléchi en amont de l’opération.


Le résultat obtenu n’est pas le même si on ajoute les informations décrivant les
écoles à la table des communes ou si on ajoute les informations des
communes à la table des écoles.
Il existe de nombreux opérateurs topologiques qui peuvent être utilisés pour
réaliser un appariement. Les plus fréquents sont : intersecte, se trouve dans ,
contient.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Enrichir des jeux de données raster
Il est moins aisé d’enrichir les jeux de données raster que les jeux de
données vecteur, notamment sans passer par de véritables traitements
des données.
Deux méthodes s’apparentant à l’enrichissement sémantique des jeux
raster sont abordées ici.

Par calcul et par combinaison de jeux raster
Comme dans une table attributaire, il est possible d’effectuer des
calculs sur les attributs de cellules d’un jeu de données raster. On
utilise pour cela ce qui est couramment appelé l’algèbre de cartes ou
l’algèbre spatiale. Celle-ci est basée sur des expressions
mathématiques ou logiques appliquées aux jeux de données raster.
L’algèbre de cartes permet d’obtenir des nouvelles données à partir
d’un seul jeu de données raster ou à partir de plusieurs, par la
combinaison des cellules qui se superposent.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Enrichir des jeux de données raster
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Enrichir des jeux de données raster

Par reclassification de raster
Il peut être nécessaire de modifier les attributs des cellules pour les
simplifier ou en change les valeurs. Pour cela, il est possible de
réaliser une reclassification du jeu de données raster. La
reclassification consiste à regrouper des valeurs selon un critère ou
selon des classes d’intervalle.
Exemple : dans un jeu de données raster où l’attribut de chaque cellule
correspond à la pente, il est possible de créer des informations sur
l’importance de la pente dans un région (1 : faible, 2 : moyenne , 3 :
forte) à partir des valeurs de pente en pourcentage (faible : 0 à 5 %,
moyenne : 5 à 10 %, forte : supérieure à 10%). La reclassification est
donc utilisée pour modifier les attributs des cellules.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Interroger et sélectionner l’information géographique
Dans le but de répondre à un questionnement géographique, les SIG
permettent d’interroger les données qu’ils contiennent afin de
connaître la localisation et la répartition d’objets géographiques
répondant à des critères plus ou moins complexes :

Où sont situés les parcelles constructibles dans le PLU (plan local
d’urbanisme intercommunal) ?

Comment se répartissent sur le territoire les exploitations artisanales
dont la superficie est inférieur à 5 hectares ?

Quels sont les terrains de sport qui sont situés à moins de 500 mètres
d’une école et à plus de 100 mètres d’une route très fréquentée ?
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Interroger et sélectionner l’information géographique
3.1 Les principes généraux d’interrogation des données
L’interrogation consiste à sélectionner un sous-ensemble d’entités
contenues dans un jeu de données selon des critères spécifiés. On
distingue deux types de critères qui peuvent être combinés :

Les critères thématiques qui font référence à une ou plusieurs
caractéristiques sémantiques des entités géographiques. Le sélection
s’effectue alors sur une ou plusieurs valeurs des champs du tableau
attributaire.

Les critères spatiaux, qui font référence aux caractéristiques spatiales
des objets géographiques. Ces caractéristiques peuvent être
géométriques (superficie, périmètre…), ou faire référence aux relations
topologiques ou de distance entre les entités, c’est-à-dire à la position
des objets géographiques les uns par rapport aux autres.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Interroger et sélectionner l’information géographique
3.1 Les principes généraux d’interrogation des données
Le processus de sélection de l’information s’appuie sur un langage
d’interrogation des données standard qui permet de formuler des
requêtes. Une requête est une expression logique dont le formalisme
est généralement basé sur le langage SQL (Structured Query
Language).

Les requête renvoient comme résultat la liste des entités
géographiques vérifiant les conditions, avec leurs attributs et leur
géométrie complète.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Interroger et sélectionner l’information géographique
3.1 Les principes généraux d’interrogation des données

Les requêtes SQL
Une requête SQL est composé de trois instructions fondamentales :

Select… correspond à la commande de sélection. Elle est suivie
de la liste des champs qui seront sélectionnés. Par
défaut tous les champs seront affichés.

From… spécifie le ou les jeux de données sur lesquels la
sélection ou la requête va s’appliquer.

Where…. Décrit les conditions de sélection.
Les logiciels SIG disposent d’un assistant de générateur de requête
permettant à l’utilisateur de construire facilement sa requête. Via ces
assistants, les clauses Select et From sont renseignées
automatiquement lorsque l’utilisateur sélectionne les jeux de données et
les champs attributaires. Seule la clause Where doit être renseignée par
l’utilisateur
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
3.2 Les critères d’interrogation des données

Critères sémantiques
Une requête attributaire (thématique) permet de sélectionner des entités
d’un jeu de données à partir de critères de sélection portant sur la valeur
des attributs d’un ou plusieurs champs de la table attributaire d’un jeu de
données vecteur, ou sur les valeurs des cellules d’un jeu de données
raster.

Dans le cas d’une requête à partir des champs d’une table attributaire
d’un jeu de données vecteur, il est possible de combiner plusieurs
conditions de sélection au sein d’une même requête.

Exemple : Sélectionner les communes dont la population est supérieure


à 10000 habitants et dont le taux de chômage est inférieur à 9 %: Select
Communes Where population > 10000 and Chômage < 9 %.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
3.2 Les critères d’interrogation des données

Critères sémantiques

L’expression des conditions de sélection-contenues dans la clause
Where est basée sur l’utilisation de trois grands types d’opérateurs :

Les opérateurs de comparaison permettent de comparer les valeurs
des attributs avec le critère de sélection.

Les opérateurs ensemblistes permettent de tester l’appartenance à un
ensemble ou à un intervalle de valeur.

Les opérateurs logiques permettent de combiner plusieurs conditions.

Les opérateurs de sélection utilisés pour les jeux de données vecteur


et raster sont identiques.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
3.2 Les critères d’interrogation des données

Critères sémantiques
Différents types d’opérateurs utilisés pour construire des requêtes
Types Description Jeu de Cas d’étude Clause Where
d’opérateurs données dans la requête
Opérateurs de comparaisons
Vecteur : Les parcelles
Parcelles constructibles (zonage AU CodePLU=’AU’
dans un PLU)
=
Egal Raster : Dans le raster décrivant
Occupation l’occupation du sol seront Valeur=’forêt’
du sol sélectionnées les zones
≠ Inférieur Vecteur : Les exploitations
strictement Exploitations agricoles dont la Surface < 5
agricoles superficie > 5 ha
Inférieur ou Vecteur : Les exploitations
<= égal Exploitations agricoles dont la Surface < = 5
agricoles superficie >= 5 ha
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Différents types d’opérateurs utilisés pour construire des requêtes

Types Description Jeu de Cas d’étude Clause Where


d’opérateurs données dans la requête

Opérateurs de comparaisons

Vecteur : Les écoles dont le nbre


Écoles d’élèves > 130 Nb élèves > 130
Supérieur
> Raster : Les cellules (parties du
strictement
Pente territoire) des pentes >
Valeur> 5 %
5%

>= Supérieur ou Vecteur : Les communes dont la


égal Communes pop > = à 5000 hab Pop >= 5000
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique
Types Description Jeu de Cas d’étude Clause Where ds la
d’opérateur données requête
s
<> ; ! = Différent ; Vecteur : Les parcelles non CodePlui<> « AU »
inégalité Parcelles constructibles

Like Ressemble à Vecteur : Les parcelles non CodePLUi Like « % U »


(Comme) Parcelles constructibles et
urbanisées
Opérations ensemblistes
Between Inclus entre Vecteur : Les exploitations Surface BETWEEN 5
deux valeurs Exploitations agricoles entre 5 et 10 AND 10
(types de agricoles ha Cellules (partie du
champs nbre) Raster : Relief territoire) Valeur de cellule
correspondant à une BETWEEN 500 AND
altitude entre 500 et 700
700 mètres
In/Not In Inclus ou non Les bâtiments qui sont
(Dans/Pas dans un des châteaux, des
NomBat in
dans) ensemble de Vecteur : églises ou des
(« Château »,
valeurs (types Bâtiments musées
« Églises », « Muséé »)
de champs
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique
Types Description Jeu de Cas d’étude Clause Where ds la
d’opérateurs données requête
Opérations logiques
And (Et) Les deux
conditions
Vecteur : Les bâtiments publics TypeBat= « Public »
doivent être
Bâtiments de plus de 1000 m² AND Surface > 1000
remplies
simultanément
Or (Ou Parmi les deux Les bâtiments publics
inclusif) conditions et les bâtiments de
Vecteur : Type Bat = « Publics »
exprimées, au plus de 1000 m²
Bâtiments OR Surface > 1000
moins une doit
être remplie

Les opérateurs arithmétiques (-, +, *, ) permettent d’intégrer dans les


conditions de la requête SQL des combinaisons mathématiques pour
créer de nouvelles variables. Par exemple, Select * From Communes
Where Population/Superficie>500, sélectionne les communes dont la
densité est supérieure à 500 hab./km², alors qu’il n’y a pas de champ
densité dans la table attributaire.
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique
Les résultats produits diffèrent selon que la requête est faite à partir d’un
jeu de données vecteur ou raster. Une requête effectuée sur jeu de
données vecteur permet d’obtenir soit une sélection visible (en
surbrillance) des objets sur la carte et des enregistrements dans la table
attributaire, soit un résultat n’affichant que les enregistrements
sélectionnés.
Critères géographiques
Les requêtes géographiques permettent de sélectionner les entités selon
des critères géométriques et/ou topologiques et reposent aussi sur le
formalisme SQL.
Les requêtes qui portent sur des critères géométriques sont basées sur
l’utilisation de fonctions géométriques permettant de connaître la surface,
la longueur, le périmètre, etc., de l’objet. Leur utilisation s’apparente aux
requêtes attributaires. Ces fonctions (area, perimeter, length…) peuvent
être intégrées dans la clause conditions de la requête SQL. Par exemple,
Select* From Communes Where communes.obj(area) >100, renvoie aux
communes dont la super est > 100 km carrés.
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique
Le deuxième type de requêtes spatiales est basé sur l’utilisation
d’opérateurs spatiaux, appelés aussi opérateurs topologiques, qui font
référence aux relations spatiales entre les objets : critères d’adjacence,
d’inclusion, d’intersection, de distance.
En général, les sélections spatiales font intervenir deux jeux de données.
Il est alors nécessaire d’identifier le jeu de données contenant les objets
par rapport auquel se fait la sélection.
Par exemple, si l’on cherche les exploitations agricoles qui constituent le
jeu de données à sélectionner (appelé parfois cible et les entiers de
randonnées le jeu de données par rapport auquel s’effectue la sélection
(appelé parfois source ou référence). Le résultat de la sélection se trouve
bien entendu dans le jeu de données à sélectionner (cible).
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique

Critères combinés
Les critères géographiques et attributaires peuvent être combinés entre
eux pour effectuer des sélections complexes. Une requête combinée
dans un jeu de données vecteur pourrait correspondre à la sélection
des bâtiments qui sont publics (sélection sur un critère attributaire) et
qui sont situés à moins de 500 m d’un château (sélection selon un
critère géographique).

En mode raster, des requêtes combinées mobilisent au moins deux
jeux de données raster, puisque la sélection de cellules d’un raster est
effectué à partir des attributs des cellules localisées au même endroit
(superposées) dans un autre jeu de données raster. De cette façon, il
est possible de sélectionner les zones non forestières situées sur des
pentes à plus de 10 % afin d’identifier les secteurs où il y a un risque de
glissement de terrain.
Chapitre V : Visualisation, interrogation et
enrichissement de l’information géographique

Vous aimerez peut-être aussi