Académique Documents
Professionnel Documents
Culture Documents
GÉOGRAPHIQUE
(SIG)
Bac3 Géologie
(2022-2023)
Contenu du cours
Ce cours est réparti en 5 chapitres suivants :
- Chapitre I : Généralités
SIG
l’information géographique
Chapitre I : Généralités
I.1. Définitions du SIG
Il existe plusieurs définitions de Système d’Information Géographique (SIG), mais nous
focalisant uniquement sur les définitions les plus importantes :
1) La définition de l'économiste Didier (1990) « Un SIG est un ensemble de données
repérées dans l’espace, structuré de façon à pouvoir en extraire commodément des
synthèses utiles à la décision ».
2) Selon le Comité Fédéral de Coordination Inter-agences pour la Cartographie Numérique
aux États-Unis (1988) « Un SIG est un système informatique de matériels, de logiciels et
de processus conçu pour permettre : la collection, la gestion, la manipulation, l’analyse,
la modélisation, l’affichage des données à référence spatiale, afin de résoudre des
problèmes complexes d’aménagement et de gestion ».
3) Selon la Société Française de Photogrammétrie et de Télédétection : « Un SIG est un
système informatique qui permet à partir de diverses sources, de rassembler, d’organiser,
de gérer, d’analyser, de combiner, d’élaborer et de présenter des informations localisées
géographiquement, contribuant notamment à la gestion de l’espace ».
4) Selon Konecny (2003) « Un SIG, dans une définition étroite, est un système
informatique pour la saisie, la manipulation, le stockage et la visualisation des données
spatiales numériques. Dans une définition plus large, il est un système numérique
d'acquisition, de gestion, d'analyse, de modélisation et de visualisation de données
spatiales aux fins de la planification, l'administration et le contrôle de l'environnement
naturel et aux applications socio- économiques ».
Chapitre I : Généralités
I.2. Historique
➢
Le processus d’abstraction de la réalité, qui permet de la simplifier pour
aider à la comprendre, est appelé modélisation en référence au fait que l’on
crée un modèle
du monde. La représentation cartographique offre une modélisation des
éléments constitutifs d’un territoire et des phénomènes qui s’y déroulent ;
➢
Le processus qui consiste à adapter l’information géographique à un modèle
numérique pour l’intégrer dans un outil informatique est également nommé
modélisation. Pour le distinguer du premier sens, dans ce cours on parlera
de la modélisation numérique.
Géométrique : qui précise la forme et l’extension du phénomène modélisé ;
De localisation (spatiale) : traduite par les coordonnées X et Y et enseigne
sur la position exacte à la surface de la Terre du phénomène modélisé ;
Sémantique, qui se traduit des propriétés qualifiant la nature et les
caractéristiques du phénomène modélisé. Les phénomènes du monde réel
possèdent des propriétés et des caractéristiques qui sont mesurées,
quantifiées, évalués par des indicateurs. La composante sémantique est
aussi thématique.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
II.10 Modes de représentation de l’information géographique en deux
dimensions
Les SIG sont conçus pour gérer des données géographiques. Pour
cela, les données doivent être modélisées sous forme numérique et
deux modes sont utilisés à cette fin :
●
le mode vecteur, qui consiste à décrire la géométrie des entités
géographiques à partir de trois formes géométriques élémentaires des
points, des lignes et des surfaces ;
●
Le mode raster, qui consiste à découper l’espace en une grille
régulière de cellules de même taille. À chaque cellule est associée
une valeur chiffrée qui représente un élément caractéristique du
territoire à cet emplacement.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
II.10.1 Le mode vecteur
Les entités linéaires sont représentés par une ligne ou une succession de
lignes (d’où l’appellation polylignes). Ces lignes sont construites par une série
de couples de coordonnées X et Y dans l’ordre de succession des points
constitutifs de la polylignes. Les liens entre les points sont appelés arcs ou
segments. Une entité de type ligne est composée d’au moins deux couples de
Coordonnées X et Y et a une longueur mesurable mais pas de superficie.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Les entités surfaciques sont représentées par une succession de lignes dont
les coordonnées de début de la première ligne sont égales aux coordonnées
de fin de la dernière ligne formant un polygone. Ces entités représentent des
phénomènes qui sont dotés à la fois d’une longueur (périmètre) et d’une
superficie. Des lacs, des PR ou PE, des couches géologiques, des
Communes… sont enregistrés sous la forme des polygones.
Entité Points Polygone Les territoires représentés par des pts mais
Administratives à l’échelle mais dans l’étude locale un
territoire serait représenté par un polygone.
Cours d’eau Polyligne Polygone Les réseaux hydro. Par des polylignes mais
aussi par une surface de son lit majeur.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
La composante sémantique
À chaque entité vecteur est associé un ensemble de valeurs alphanumérique,
appelées attributs. Ces attributs permettent de décrire les objets.
Par exemple à chaque sondage minier dans le cadre d’une campagne d’exploration,
l’on peut associer la profondeur du sondage, sa localisation, la date du début et de la
fin, le foreur…
En mode vecteur, la composante sémantique est stockée sous la forme d’un tableau
d’information géographique, appelé couramment table attributaire dans le logiciel SIG.
Dans cette table, les lignes sont appelées enregistrement et les colonnes champs
attributaire et chaque ligne correspond à une entité géographique.
Les données attributaires (en mode raster ou vecteur) peuvent être de différents types.
La distinction de type conditionne l’espace de stockage nécessaire pour enregistrer les
données et les types de traitement que l’on peut faire sur les données. Le type de
données est défini pour l’ensemble des valeurs d’un champ en mode vecteur et pour
l’ensemble des cellules d’une grille en mode raster.
En plus de type de données, il est nécessaire de définir également la longueur qui
correspond au nombre de caractère alphanumérique qu’il peut contenir.
Les formats utilisés pour le stockage des données attributaires sont identiques à ceux
des bases de données en générales.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Format des données
Le type texte
Un champ ou une valeur de cellule de type texte contient généralement des caractères
alphanumérique (lettres et chiffres) ;
Le type nombre
Les sont stockés dans des types de champs différents selon qu’il s’agit d’entiers ou de réels.
Par convention, dans la plupart des logiciels les données de type nombre apparaissent alignées
à droite dans les champs de type nombre.
Le type entier
Le type entier permet de stocker uniquement des nombres entiers. Il demande un espace de
stockage informatique réduit.
Le type réel
Les nombres avec des décimales sont appelés des réels. Le type réel utilise plus de place de
stockage informatique. En plus de la longueur du champ (nombre total de chiffres), il faut
préciser le nombre de décimales.
Le type date
Les données temporaires peuvent être stockées dans des champs de type date.
En mode raster, l’espace est découpé en cellules de tailles identiques formant une
grille qui couvre l’intégralité du territoire. Ces cellules sont appelées pixels (picture
element). La succession de cellules contiguës ayant les mêmes valeurs peut être
interprétée comme représentant l’emprise spatiale et la forme des phénomènes.
La localisation de chaque cellule dans l’espace de représentation est définie par ses
coordonnées (latitude et longitude). Le degré de précision dans la localisation et dans
la géométrie est lié à la résolution de la grille, définie par la taille des cellules.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
La résolution de données en mode raster définit le niveau des détails qui seront visibles dans
l’image. Plus le nombre de cellules pour représenter le terrain en mode raster est élevé, plus il y
aura de détails visibles car la taille des cellules est petite. Plus la résolution est élevée et plus
le poids du fichier est important et plus l’unité d’observation est précise.
La composante sémantique
Les relations spatiales sont identifiées par calcul lors des traitements et
analyses, via les coordonnées des entités, en fonction des opérateurs
topologiques (inclusion, adjacence, intersection) utilisés.
Les objets sont décrits par leurs sommets. Les relations de voisinages sont des arcs
« orientés », dont on définit le premier et le dernier sommet, ainsi que les objets gauche et droit
qu’ils délimitent.
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
2. Modèle POLYVRT (POLYgon conVeRTer) : modèle topologique
hiérarchique
Dans ce modèle, les objets font référence à des nœuds et à des chaînes qui
font eux-mêmes référence à des sommets. Cette succession de références à
d’autres éléments constitutifs explique pourquoi ce modèle est qualifié de
modèle hiérarchique. Les éléments de départ sont les sommets qui ont un
identifiant unique et des coordonnées. Les nœuds correspondent aux
sommets communs entre au moins deux arcs et deux polygones. Les chaînes
correspondent à la liste des sommets constitutifs d’arcs. Les objets
(polygones ou polylignes) sont décrits par une succession de chaînes.
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Intérêt du modèle topologique
Minimise le risque d’erreurs géométriques ;
Réduit le nombre de points saisis et allège donc le poids des fichiers ;
Facilite la modification et la mise à jour des caractéristiques partagées entre
différents jeux de données, puisqu’il assure le maintien de la cohérence
entre les données ;
Optimise le processus d’interrogation spatiale des données (exécution des
requêtes spatiales)
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Le réseau, un modèle vecteur particulier intégrant la topologie
Chaque réseau quelque soit sa nature (hydrographique, de transport, de
téléphonie etc), il constitue une information géographique car ils sont
constitués des objets linéaires connectés. La topologie de réseau décrit ces
relations de connexion.
Les réseaux sont modélisés sous forme de points, appelés nœuds, et des
lignes, appelés des liens (tronçons de routes, les cours d’eau, etc.). On
simplifie alors e réseau sous la forme d’un objet mathématique appelé graphe
ou réseau logique. Les liens peuvent être orientés ce qui signifie qu’ils ont des
nœuds de départ et d’arrivées selon un sens de circulation. Cette information
est indispensable pour pouvoir ensuite calculer la distance ou simuler des flux
sur le réseau.
Chapitre II : Dela réalité du terrain à l’information
géographique dans le SIG
Dans le monde réel, il existe deux types de réseaux dont les caractéristiques
impliquent une certaine structuration des données.
Les réseaux hydrographiques, de drainage ou de distribution d’électricité, par
exemple, sont des réseaux hiérarchiques dans lesquels l’orientation est
unique.
Les réseaux de transport, pour lesquels on connaît aussi le sens, sont
généralement dotés d’intersections et de boucles et constituent des réseaux
maillés.
Toute l’information décrivant les nœuds et les liens est stockée sous une forme
attributaire, la structuration d’un modèle de données réseau impliquant une
table attributaire plus complexe qu’un modèle vecteur basique. En plus de la
description des points et des lignes, d’autres tables et d’autres champs qui
seront mobilisés pour l’analyse de réseau sont généralement créés.
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Chapitre II : De
la réalité du terrain à l’information
géographique dans le SIG
Chapitre II : De la réalité du terrain à l’information
géographique dans le SIG
Une table décrit la connectivité, c’est-à-dire pour chaque nœud la liste des
nœuds qui lui sont connectés, en précisant l’identifiant du lien permettant la
connexion.
Dans le cas d’un réseau de transport orienté, c’est-à-dire avec des tronçons à
sens unique, les règles qui définissent le sens des flux seront stockés dans la
table de connectivité.
Chapitre III : Fondamentaux de l’information
géographique
Objectifs
Ce chapitre permet :
L’ellipsoïde n’étant pas une surface développable, c’est-à-dire que l’on ne peut
pas la projetr sur un plan en conservant les angles et les surfaces, la
projection entraîne forcément des déformations.
Chapitre III : Fondamentaux de l’information
géographique
C’est l’existence d’un système de coordonnées utilisé dans les logiciels qui
permet de fournir des mesures de surfaces, de périmètres, de longueurs, de
sinuosité des objets, ainsi que des distances entre objets.
Dans certains logiciels, les calculs de longueur et de surface sont possibles
que si le système de coordonnées est projeté. Il faudra donc être prudent lors
des calculs des superficies, car lorsque le système de coordonnées utilisé est
basé sur une projection conforme, les rapports de surface ne sont pas
conservés sur l’ensemble de la surface projetée.
Certains logiciels SIG gèrent l’affichage de jeux de données géographiques
définis dans différents systèmes de coordonnées en appliquant une projection
à la volée.
Chapitre III : Fondamentaux de l’information
géographique
La normalisation de la définition des systèmes de coordonnées
En 2,5D, le jeu de données peut simplement être doté d’un champ attributaire
décrivant la troisième dimension, ou d’une coordonnée qui est intégrée sous
forme d’un attribut ou d’une coordonnée Z. La modélisation 2,5D est
fréquente pour des phénomènes géographiques continus et notamment pour
représenter la surface terrestre, le plus souvent le relief.
Les modèles de données structurés en 3D intègrent la troisième dimension
dans la géométrie de l’objet. C’est le cas de la modélisation du bâti où les
hauteurs des étages et des fenêtres sont intégrées dans la géométrie de
l’objet.
Chapitre III : Fondamentaux de l’information
géographique
Quelques définitions
2D : modèle de données représentant les objets en vue horizontale et les surfaces continues
sous forme d ‘un plan.
2,5D : terme souvent utilisé pour désigner des modèles de données où la troisième dimension
est soit un attribut, soit intégrée dans les propriétés des données. Par exemple, dans un jeu de
données t-raster décrivant le relief, l’attribut des cellules correspond à l’altitude.
Les modélisations en 2,5D et ene 3D peuvent être faites en mode raster ou en mode vecteur.
Chapitre III : Fondamentaux
de l’information
géographique
Chapitre III : Fondamentaux
de l’information
géographique
Chapitre III : Fondamentaux de l’information
géographique
Modélisation de surfaces de terrain
La surface terrestre peut être modéliser en prenant en compte la surface du
sol ou en intégrant la hauteur des objets comme le bâti ou la végétation.
Pour désigner ces modélisations du monde réel, on parle de modèles
numériques de terrain (MNT), de surface (MNS) et d’élévation (MNE).
Dans les MNT, l’altitude caractérise la surface nue de la Terre (sans
végétation, les bâtiments, etc.) ou le fond de la mer ;
Si les hauteurs de tous les objets placés sur le sol sont prises en compte, le
terme de modèle numérique de surface (MNS) est retenu ;
Enfin, le terme modèle numérique d’élévation (MNE) est utilisé de façon
générique pour désigner aussi bien un MNT qu’un MNS.
Dans les MNE en mode raster (2,5D), la valeur prise par les cellules
correspond à l’altitude (valeurs Z). Ces modèles sont les plus fréquemment
rencontrés en SIG et peuvent être visualisés en 2D ou en 3D.
Chapitre III : Fondamentaux de l’information
géographique
Un deuxième type de modélisation en 3D peut être réalisé à partir d’un réseau
triangulé irrégulier (TIN). Le TIN est un MNE en mode vecteur qui représente
une surface composé d’un ensemble de triangle contigus ne se chevauchant
pas.
Il est créé à partir d’un ensemble de points répartis dans l’espace de façon
irrégulière ou régulière et dotés d’un attribut d’altitude. Le relief est reconstitué
par une triangulation de l’ensemble des points qui joints par des lignes droites
qui ne se croisent jamais et qui produisent une mosaïque de triangles
irréguliers (Tesselation).
Les jeux de données non dotées d’une information sur la hauteur ou l’altitude,
comme une orthophotographie peuvent être visualisés en 3D par drapage sur
un MNE.
Chapitre III : Fondamentaux
de l’information
géographique
Le LIDAR
Chapitre III : Fondamentaux de l’information
géographique
Les relations des objets dans l’espace : la topologie
Dans les SIG, les différents types de distances s’obtiennent par calcul. Cette
possibilité exploite la dimension « localisation » des jeux de données définis
dans un système de données.
Chapitre III : Fondamentaux de l’information
géographique
Les types de distances dans les SIG
Plusieurs catégories de distances peuvent être calculées dans les SIG en
fonction des données qui sont prises en compte pour le calcul :
1. à partir d’un réseau (vecteur) ou (2) assimilé (raster) :
3. à partir des coordonnées des lieux ;
4. à partir des relations topologiques des objets en mode vecteur
Les distances calculées à partir d’un réseau ont pour ambition de mesurer les
véritables distances parcourues dans la réalité en empruntant un réseau. C’est
pourquoi les distances réseaux sont parfois appelées, de manière abusive, des
distances empiriques. Dans les SIG, ces distances sont calculées le plus
souvent en exploitant la modélisation de ces réseaux sous la forme d’objets
ponctuels et linéaires dont la connectivité est décrites dans un modèle
topologique de réseau.
Chapitre III : Fondamentaux de l’information
géographique
Les distances sur un réseau peuvent être calculées dans différentes unités de
mesure :
Dans les SIG, ces trois distances peuvent être calculées à partir de jeux de
données modélisés sous la forme d’un réseau en mode vecteur.
Chapitre III : Fondamentaux de l’information
géographique
Distances calculées à partir d’un jeu de données raster
A partir d’un jeu de données raster qui stocke des informations relatives à un
réseau, il est possible de mettre en œuvre un calcul de distance-coût. On
peut préciser la caractérisation des cellules en ajoutant d’autres catégories
d’attributs.
Le calcul s’effectue par un algorithme qui identifie l’itinéraire passant par les
cellules, telles que la somme de leurs attributs soit minimale.
Les distances le plus fréquemment calculées et utilisées dans les SIG sont
des distances exprimées en unités de longueurs. Ces distances sont
directement liées au système de coordonnées car elles sont calculées à
partir des coordonnées des points d’origine et d’arrivée.
Deux types de distances sont fréquemment calculés à partir des
coordonnées projetées : la distance euclidienne, distance à vol d’oiseau, et
la distance rectilinéaire, distance de Manhattan.
La distance orthodromique, distance géodésique, est calculée à partir de
coordonnées géographiques.
Chapitre III : Fondamentaux de l’information
géographique
La distance euclidienne. C’est la plus courte distance entre deux points dans
un repère orthonormé. Elle peut être matérialisée par une ligne droite entre les
deux points.
En SIG, si l’on disposer d’un MNT, on peut calculer une distance euclidienne
3D qui intègre les dénivelés sur les tracés entre les deux points.
La distance orthodromique est la plus petite distance courbe entre deux points
sur une sphère. Elle est calculée à partir des coordonnées géographiques.
Chapitre III : Fondamentaux de l’information
géographique
Distances liées à la topologie
http://cursus.fr/serverSIG/LeJeuDeDonnées/
Service=WFS&version1.0&request=GetFeature&typeName=Ville
Est composé de :
✔
L’adresse du serveur où est stocké le jeu de données :
cursus.fr/serverSIG/LeJeuDeDonnées ;
✔
La version du service : service=WFSversion1.0 ;
✔
Des entités (ici des villes) à récupérer : &request=GetFeature&typeName=Ville
Chapitre IV : Intégration de données
géographique dans les SIG
Type de service Description du service Commentaires
Web Map Fournit des données cartographiques ou Les données ne peuvent être
Service une image géoréférencée en mode sélectionnées ou interrogées. C’est
(WMS) raster bon pour un fond de carte.
Web Map Tile Fournit des données cartographiques ou Service équivalent au WMS mais
Service (WMTS) une image géoréférencée sous forme de propose des fonds de cartes raster
tuiles raster tuilées.
Web Coverage Fournit des données raster de type À lz différence de WMS, le service
Service (WCS) « couverture » comme les MNT ou propose ls données dans leur
orthophotos. format d’origine.
Catalog Service Permet d’accéder à des catalogues de Ne s’applique pas aux données
for the Web métadonnées et de les récupérer géographiques mais aux
(CSW) métadonnées.
Web Processing Permet d’accéder à des procédures de Ces services complètent les
Service (WPS) traitement ou de géotraitement de fonctionnalités de traitement des
données géographiques : service de données géographiques des SIG.
géocodage, de traitements de données.
Chapitre IV : Intégration de données
géographique dans les SIG
Les métadonnées
Les métadonnées permettent de caractériser, comprendre et échanger
l’information géographique.
En fait pour être utilisées les données doivent nécessairement être
accompagnées d’informations qui les décrivent : contexte de leur production,
méthoes de recueil, propriétés, conditions d’utilisation.. On appelle ces
informations les métadonnées, c’est-à-dire des données sur les données.
Les métadonnées permettent de répondre aux questions de façon très
précise, comme :
●
Thème/territoire : que contiennent les données ? Quel est le territoire
couvert ?
●
Sources et références : quel est le système de coordonnées ? Comment
sont-elles acquises ;
●
Propriété des données : quelle est la résolution spatiale du jeu de données ?
●
Qualité des données : quel est le niveau de précision des données ? Quelle
est leur fréquence de mise à jour ?
●
Droits associées aux données : quels sont les droits d’accès et d’utilisation
des données ?
Chapitre IV : Intégration de données
géographique dans les SIG
Qualité des données dans les métadonnées
Ces données peuvent être affichées dans un logiciel SIG sous forme d’entités
géométriques ponctuelles, puis enregistrés en mode vecteur. Chaque couple
de coordonnées X, Y permet de créer une entité de type point et les valeurs
mesurées associées à ces points sont stockées dans la table attributaire.
Chapitre IV : Intégration de données
géographique dans les SIG
Digitalisation de jeux de données vecteur
La digitalisation, ou saisie vectorielle, consiste à créer des jeux de données
géographiques vecteur par la saisie de la forme géométrique (surfacique,
ponctuelle ou linéaire) des objets au moyen d’un outil de saisie (souris ou
stylet).
Le principe consiste à « dessiner » les contours d’un objet géographique sous
forme de polyligne, de point ou de polygone, en se basant sur l’affichage de
données déjà existantes, généralement une image raster (photo aérienne). Ce
principe est similaire à l’utilisation d’une feuille de calque plaquée sur une
image sur laquelle sont dessinés des objets.
La création de données vectorielles par digitalisation nécessite donc non
seulement d’identifier les objets qui devront être saisis, mais aussi de préciser
leur forme géométrique, le niveau de généralisation et de précision, ainsi que le
système de coordonnées utilisé. IL s’agit aussi de définir la structure de la table
attributaire, c’est-à-dire de préciser les champs attributaires thématiques qui
doivent être renseignés ainsi que leur type : entier, réel, texte.
La création des métadonnées associées au jeu de données créé est
indispensable, en particulier si ces données sont destinées à être partagées.
Chapitre IV : Intégration de données
géographique dans les SIG
Intégrer l’information géographique en mode raster
Il existe différentes sources de données diffusées en mode raster, dont une
grande partie vient de méthodes d’acquisition par télédétection. Les utilisateurs
peuvent récuperer les images satellites et radar diffusées par des fournisseurs
de données soit sous forme d’images brutes, soit sous forme d’images déjà
traitées. Le mode raster est aussi très souvent utilisé pour représenter les
MNE.
Les images et photos brutes nécessitent une première interprétation et leur
traitement s’effectue généralement dans un logiciel de traitement d’image
spécialisé, même si les logiciels SIG intègrent souvent des fonctionnalités
permettant d’effectuer le traitement d’image.
Chapitre IV : Intégration de données
géographique dans les SIG
Géoréférencement d’images
L’opération de géoréférencement consiste à attribuer des coordonnées
géographiques ou projetées à une image numérique (plans, cartes ou dessins
scannés, phot aérienne…). L’image géoréférencée devient un jeu de données
de type raster, et peut être superposée à d’autres jeux de données raster ou
vecteurs. Elle peut aussi servir de fond pour digitaliser des objets visibles sur
l’image.
Le géoréférencement consiste à effectuer à chaque pixel de l’image des
coordonnées géographiques ou projetées. À partir de la mise en
correspondance de points de localisation dont les coordonnées sont connues
avec les pixels de l’image correspondant au même emplacement
géographique, il s’agit d’affecter de façon automatique des coordonnées à
chaque pixel au moyen d’une transformation mathématique.
Chapitre IV : Intégration de données
géographique dans les SIG
L’opération de géoréférencement nécessite :
La vectorisation des jeus de données raster est utile dans difféentes situations.
Les données issues d’images satellite ou de photographies aériennes sont
initialement structurées en mode raster, et une classification à partir des
attributs des cellules de l’image permettra d’identifier les catégories
d’occupation du sol.
Chapitre IV : Intégration de données
géographique dans les SIG
Chapitre IV : Intégration de données
géographique dans les SIG
Stocker des jeux de données géographiques : les formats
informatiques
Les données modélisées numériquement sont stockées dans des fichiers
pour être exploitées par les SIG. Il existe de nombreux formats de fichiers :
certains sont propriétaires, d’autres correspondent à des standards reconnus.
On ne va les décrire tous mais donner des points de repère utiles. Les
modalités de stockage des données varient selon qu’il s’agit de jeux de
données vecteur ou raster.
Chapitre IV : Intégration de données
géographique dans les SIG
Stocker des jeux de données raster
Le stockage des données raster n’est pas normalisé et il existe plus d’une
centaine de formats, chaque logiciel SIG ayant plus ou moins développé son
propre format : ARC Digitized Raster (ADRG), Band Interleaved by line (DIL)
utilisé en imagerie satellitaire, ECW qui est un format compressé, ESRI Grid
en ASCII Grid utilisé par ESRI, Geotiff (format TIFF pour les SIG), IMG, JPEG
2000…
Ces différents formats correspondent aux différents types d’informations qui
peuvent être stockés dans les fichiers raster, ainsi qu’aux différents processus
de compression des données.
Les fichiers associés aux jeux de donnés raster stockent d’une part l’image
elle-même ou séparément les mosaïques de l’image, c’est-à-dire l’assemblage
d’images juxtaposées : d’autre part les données décrivant les caractéristiques
de l’image.
Chapitre IV : Intégration de données
géographique dans les SIG
Lorsque les fichiers raster stockent une seule information par pixel ou cellule,
qu’il s’agisse de valeurs de gris pour une image aérienne en noir et blanc ou
des valeurs d’altitude pour un MNT, le fichier est appelé monocanal.
Quand les données raster correspondent à une information issue d’images
aériennes ou satellite qui rassemblent les informations captées dans plusieurs
longueurs d’onde du spectre électromagnétique, des formats multicanaux
peuvent être utilisés. Cela peut être simplement des données issues d’un scan
en couleur RVB (rouge, vert, bleu). Les formats de fichiers multicanaux
peuvent éventuellement être utilisées pour stocker une information
monocanale mais l’inverse n’est évidemment pas vrai.
Chapitre IV : Intégration de données
géographique dans les SIG
Les procédés de compression des données raster
Un des enjeux informatiques lié aux données raster est leur poids en octets. En
effet, théoriquement, une valeur doit être enregistrée pour chaque cellule. Ainsi,
que l’image ou le fichier raster contienne des valeurs différentes pour chaque
cellule, ou qu’elle corresponde à des valeurs toutes identiques (cas improbable
d’une image totalement unie), le poids du fichier sera identique.
Pour réduire les poids des fichiers raster, différentes techniques de
compression sont utilisées. Elles s’appuient généralement sur l’identification de
cellules voisines ayant des valeurs identiques :
●
La compression séquentielle se base sur la définition de séquences de pixel
identiques. Le fichier informatique stocke ainsi le nombre de cellules
successives portant le même code.
●
La compression QuandTree se base sur une division successive du raster en
zones homogènes. Cela permet d’alléger le stockage informatique en
enregistrant les informations définies à la résolution la plus fine seulement
quand cela est nécessaire.
Ainsi, les 64 valeurs des cellules de départ peuvent être stockées en utilisant
seulement 19 valeurs.
Chapitre IV : Intégration de données
géographique dans les SIG
Stocker des jeux de données vecteur
Principe
En mode vectoriel, la géométrie des objets, les données attributaires, les liens
entre la géométrie des objets et les enregistrements des objets et les
enregistrements des tables, les systèmes de coordonnées… doivent être
stockées. Il existe différentes façons de stocker ces données : dans certains
cas, chaque type de données (géométrie, données attributaires…) est stocké
séparément dans un fichier spécifique ; dans d’autre cas, elles sont regroupées
dans un seul fichier. Nous présentons ici les formats informatiques les plus
répandus : des formats propriétaires, devenus des standards de facto, aux
formats interopérables.
Chapitre IV : Intégration de données
géographique dans les SIG
Le format shapefile : un standard de facto
Initialement, chaque logiciel SIG dispose de son propre format informatique
pour stocker les données de type vecteur. Le format shapefile est l’un des
formats de facto les plus répandus, qui est reconnu par les principaux logiciels
SIG.
Dans le format shapefile, les données sont stockées dans différents fichiers
selon leur nature. Les coordonnées qui décrivent la géométrie des objets sont
stockées dans des fichiers plats ou binaires, séparément des données
attributaires qui les caractérisent ; ces dernières sont stockées dans un fichier
dédié.
Le lien entre les données du fichier contenant les attributs et celui contenant
les géométries des entités géographiques de fichier. Les informations décrivant
le système de projection dans lequel sont définies les données sont stockées
elles aussi dans un fichier spécifique différent des autres. D’autres fichiers
peuvent être associés, comme ceux décrivant les métadonnées ou les index
spatiaux. Chacun de ses fichiers dispose d’une extension spécifique.
Le fichier .shp seule ne suffit pas pour afficher sous forme de couche
d’information géographique un jeu de données vecteur dans un SIG.
Chapitre IV : Intégration de données
géographique dans les SIG
Extension Informations stockées Description Précisions
des fichiers
Géométrie des objets Fichier du shapefile Format propriétaire utilisable
*.shp géographiques proprement dit uniquement par les logiciels
fichier binaire SIG
Données attributaires Format de type Lisible avec un tableur ou via
*.dbf DataBasefile un logiciel de base de données
de type DBase
Stockage enregistrements Fichier binaire Format propriétaire
*.shx contenu dans le fichier *.shp
Stockage des informations Stockage données Utilisable par d’autres logiciels
*.prj décrivant le système de en ASCII SIG
projection
Stockage des index spatiaux Format binaire Format propriétaire
*.sbn Fichiers créés après une
*.sbx requête ou une jointure
spatiale
Stockage métadonnées Format XML Format lisible avec un débiteur
décrivant le shape de texte
*.xml
Interopérable avec un logiciel
de géocodage
Chapitre IV : Intégration de données
géographique dans les SIG
Le format mif/mid : un format d’échange
Le format mif/mid (Mapinfo Interchangeable Format) associé au logiciel
Mapinfo, est un format créé initialement pour faciliter l’import/export des
données. C’est un format simple, composé de deux fichiers (*.mif et *.mid) dans
lesquels les données sont stockées en ASCII (fichier qui contient du texte non
formaté).
●
Le fichier *.mif stocke à la fois les informations relatives au système de
coordonnées, les noms et caractéristiques des champs attributaires, les
coordonnées décrivant les objets géographiques. Il stocke aussi la
symbologie des objets ;
●
Le fichier *.mid stocke la sémantique des entités géographiques : les valeurs
des attributs sont stockées sous forme d’une succession de lignes où chaque
ligne correspond à un objet décrit dans le *.mif.
●
Le numéro de la ligne contenu dans le fichier *.mid correspond à l’ordre de
déclaration des objets dans le *.mif.
Chapitre IV : Intégration de données
géographique dans les SIG
Le format GeoJson : un format interopérable
Il existe aujourd’hui d’autres formats numériques plus simples et plus
performants, utilisés pour stocker les données géographiques vectorielles,
comme le format GeoJson.
Le format GeoJson est une extension du format Json (JavaScript Open
Notation). Ce dernier a été crée pour faciliter l’échange de données. Il s’agit
d’un format de données ASCII dit « ouvert », dans lequel l’information est
représentée de façon structurée en XML et donc interopérable. Dans le format
GeoJson, les données attributaires et géométriques (coordonnées des points,
polylignes ou polygones) sont rassemblées au sein d’un même fichier. En
revanche, ce format ne stocke pas d’information relative au système de
projection car les données sont systématiquement spécifiées en WGS84. Les
entités géographiques sont décrites à travers leur type de géométrie
« Feature », leurs coordonnées « Coordinate » et la description de leurs
attributs « Properties ».
{
« type » : « Feature », geometry » : {« type » : « Point », « coordinate » :
[1,627, 40,127]}, « properties » : {« name » : « Pt1 »
}
Chapitre IV : Intégration de données
géographique dans les SIG
Le format GeoJson supporte les géométries simples (point, polyligne,
polygone), mais aussi complexes, de types multipoints, multiligne ou
multipolygone. Des objets géographiques de géométries différentes peuvent
être regroupés au sein d’un même fichier. En revanche, le format GeoJson ne
gère pas la topologie. Pour cela, il existe un format particulier, le TopoJson,
qui intègre la topologie.
Le format KML
L’opération de jointure produit une seule table qui juxtapose les champs de la
table jointe à ceux de la table cible. Le résultat peut prendre deux formes :
conserver tous les enregistrements de la table cible ou ne garder que les
enregistrements communs. Deuxièmement, la jointure permet d’ajouter
l’ensemble des champs de la table jointe à la table cible, ou seulement une
partie des champs.
Un intérêt majeur de la jointure attributaire est de permettre de cartographier ou
d’analyser l’organisation spatiale de données d’un tableau statistique sans
entité graphique vectorielle associée à l’origine.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
Jointure attributaire géographique
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale
Si l’on inverse le sens de la jointure (le jeu de données des communes devient
la cible et le jeu de données des écoles, le jeu de données joint), on utilisera
également une relation topologique de type inclusion : l’appariement se fera
alors entre une commune et les écoles qui sont incluses dans chaque
commune.
Étant donné qu’une commune peut contenir plusieurs écoles, la jointure aura
pour effet de dupliquer l’enregistrement qui caractérise une commune autant de
fois que celle-ci possède une école. Pour éviter ce type de redondance, la
jointure spatiale est généralement associée à une étape d’agrégation des
données. Dans cette étape, des opérateurs mathématiques comme le nombre,
la somme ou la moyenne sont mobilisés. Parfois ces calculs se font de manière
automatique par défaut.
Chapitre V : Visualisation, interrogation
et enrichissement de l’information
géographique
Jointure spatiale
Dans le cas d’une requête à partir des champs d’une table attributaire
d’un jeu de données vecteur, il est possible de combiner plusieurs
conditions de sélection au sein d’une même requête.
Opérateurs de comparaisons