Académique Documents
Professionnel Documents
Culture Documents
INTRODUCTION AUX
SIG
SYSTEMES D'INFORMATIONS GEOGRAPHIQUES
Octobre 2000
Département AGER
Agronomie-Environnement
J-M Gilliot gilliot@lacan.grignon.inra.fr
Définition : qu’est ce qu’un SIG
La définition pouvant être présentée plutôt dans un sens que dans un autre,
suivant que l'on veut mettre en avant l'aspect données ou l'aspect système et
traitement.
BASE
DE
DONNEES
Cartographie automatique
Statistiques et Géostatistiques
Introduction
Objectifs
Accès séquentiel
Accès multiples
f
III. Base de données relationnelles
1. Structure de la base de données : TABLE
Un ensemble d'opérations peuvent être effectuées sur les relations telles que
: Union, intersection, différence. L'utilisation de ces opérations est définie
par l'algèbre relationnel de Codd (1970).
Commande project
Commande restrict
RESTRICT(relation, condition)
La restriction est une opération unaire, qui appliquée à une relation,
retourne une nouvelle relation comprenant l'ensemble des tuples vérifiant
une condition.
NOM
dupond
martin
JOIN(relation1,relation2:attribut1,attribut2)
La jointure est une opération binaire qui prend deux relations et les combine
en une relation résultat sur la base d'un ou de plusieurs attributs communs.
S.Q.L.
Commande create
Commande select
SELECT communes
FROM base_communale
WHERE population > 3000
SELECT liste-item
FROM table-de-référence
WHERE condition
GROUP BY liste-attributs
HAVING condition
Une des approches les plus largement utilisée pour la modélisation des
bases de données est le modèle entité-relation.
Le MCD est constituée :
- d'entités
- de données associées les attributs
- de relations entre les entités
Notion d'objet
La notion d'objet est centrale à l'approche orientée objet. Elle permet de
prendre en compte, en plus de la composante statique de l'information
(données), une composante dynamique (fonctionnelle). Elle permet de
s'affranchir en partie de la dichotomie classique des langages informatiques
entre :
Données (variables)
Traitements ( procédures, fonctions)
Dans l'approche objet les deux se trouvent regroupés dans une nouvelle
entité : l'objet.
Les variables de l'objet sont ses attributs.
ls fonctionnalités sont ses méthodes.
Un des concepts à la base de cette approche objet est la modularité, pour
permettre la maintenance et la réutilisation des programmes informatiques.
Il s'agit de concevoir un programme comme un ensemble de petits modules
structurels et fonctionnels, fonctionnants comme une boite noire.
Notion d'encapsulation
L'encapsulation est le principe selon lequel les données et les méthodes d'un
objet ne sont pas directement accessibles d'un autre objet. Les objets
communique entre eux par l'intermédiaire de messages.
Notion de classe
Une classe est un "modèle" d'objets. C'est le "type" de l'objet.
Notion d'héritage
classe fille classe fille objet classe fille classe fille objet
objet objet objet objet objet objet objet objet objet objet objet
Les versions les plus récentes des SGBD sont orientées objet : Oracle 8 et
ultérieurs, O2.
Un polygone convexe est tel que tous les angles intérieurs formés par ces
arcs sont inférieurs à 180 degré.
Une chaîne est un ensemble de points ordonnés. Une chaîne est dite
monotone si il existe une droite telle que la projection des points de la chaîne
sur cette droite préserve l'ordre des points.
Un polygone est dit monotone si il peut être décomposé en deux chaînes
monotones.
Un point d'observation est un point d'où on peut voir tous les autres points du polygone.
F. Tessellations régulières
La tessellation d'une surface est une couverture de cette surface par un
arangement de polygones réguliers non recouvrants:
J. Les graphes
définition
Un graphe G est défini comme un ensemble fini de noeuds et d'un ensemble
d'arcs reliant les noeuds deux à deux.
noeud
arc
graphe orienté
Un graphe orienté est un graphe pour lequel on assigne une direction aux
arcs.
graphe labelisé
Un graphe labélisé est un graphe pour lequel à chaque arc est associé une
valeur
chemin dans un graphe
Un chemin dans un graphe entre deux noeuds, est une liste d'arcs connectés
entre ces noeuds.
graphe connecté
Un graphe G, est dit connecté, quand ∀ na et nb ∈ G 2 noeuds quelconques,
il ∃ un chemin entre na et nb.
Graphe cyclique
Un chemin partant d'un noeud na, est dit cyclique, si il repasse par na.
arbre
Un arbre est un graphe connecté et acyclique.
K. Courbes fractales
Courbes de Koch
Egalité
Sous-ensemble
Ensemble vide
Cardinalité
Intersection
Union
Complément
II. La topologie
1. La notion de topologie
La topologie est une description des relations spatiales des objets entre eux,
telles que : "est à côté de", "inclus", "intersecte" … Dans certain système elle
est stockée explicitement, dans d'autre elle est calculée dynamiquement,
selon les besoins de telle ou telle fonction.
2. Voisinage
2. Connexité
3. formule d'Euler
Un arrangement de o objets dans le plan avec a arcs et n nœuds :
o–a+n=1
4. Simplexe et complexe
5. Notion de métrique
OBJET DU SIG
COMMUNE
Attributs Valeurs
INSEE 89102
NOM SENS
SURFACE 12387
POPULATION 45000
X
Contour graphique localisé géographiquement
dans un système de projection cartographique.
Par contre les modifications de la base (insertion, deletions ...) sont très
couteuse en temps, car la modification de la place d'un enregistrement se
répercute sur la place des autres.
D. Tables de hachages
Une table de hachage utilise une fonction de hachage. Sur un ou plusieurs
champs, la fonction de hachage transformat la valeur en une adresse
physique sur le disque. L'adresse peut donc être entièrement calculée et ne
nécessite alors seulement un accès disque pour retrouver l'enregistrement.
Soit un bloque de 1000 emplacements sur le disque, numéroté de 0 à 999.
Soir des enregistrements avec un champ numérique variant de 0 à 1999
Une fonction de hachage très simple: diviser par deux, peut être utilisée.
C'est une technique très optimale, mais qui pose des problèmes pour la
gestion de bloques disques (recouvrement, taille élémentaire des bloques ...),
elle ne peut s'appliquer que sur des champs numériques ou pouvant se
transformer en valeur numérique.
E. Tables d'index notion d'identifiant
Cette technique utilise des tables d'index à la manière de l'index d'un livre.
Le fichier de données lui même n'est pas organisé, mais un second fichier
index est créé, qui lui est ordonné et qui contient un des champs des
enregistrement, que l'on nome l'indexe, ainsi que l'adresse ou pointeur de
l'enregistrement correspondent dans le premier fichier.
Une recherche binaire peut alors être entreprise, sur le fichier indexe.
Pour de très grosses bases de données le fichier index peut lui aussi devenir
très gros et ralentir la recherche. On peut alors créer une table d'index du
fichier index. On parle alors d'index multi-niveaux. Le B-tree (balanced tree)
est un exemple d'indexe multi-niveaux.
Dans la plupart des SIG un champ particulier, que l'on nome identifiant, sert
à construire une table d'index, pour manipuler rapidemment les
enregistrements de la base.
F. Indexations spatiales notion de localisant
Les méthodes de codage et d'accès précédentes faisaient surtout référence
aux données sémantique. Le problème se pose de la même façon pour des
A. Introduction
Le format raster utilise une description matricielle de l'espace géographique.
La matrice est une image, chaque élément de l'image ou pixel (picture
element) contient un niveau donné qui représente une thématique. ces
images sont généralement issues de scanners ou d'images aériennes ou
satellitaires.
Dans le format vectoriel, les objets sont représentés par des primitives
graphiques (point, ligne, polyligne etc ...).
B. Format raster
Définitions des images numériques
y
I(x,y) valeur de la
fonction image I
au pixel de coordonnés
(x,y)
Y
Une image niveau de gris
B
V
R
Image couleur
Voisinage et connexité
Le voisinage est défini par un ensemble de points connexes qui constituent
une forme pré définie entourant le point considéré. On distingue
classiquement :
pixel central
C4 C8
Les types de voisinage classiques
Chain codes
C'est un codage utilisé pour représenter les contours dans une image, il est
basée sur le codage directionnel de Freeman :
d2
d3
d1
d4 d0
d5
d7
d6
Les directions élémentaires d, codent pour le passage d'un pixel de contour à
un autre, un contour est alors entièrement codé par une suite de d.
block code
Il s'agit d'une généralisation du cas précédent au cas bidimensionel.
quadtree
On découpe une image de façon récursive en quadrant jusqu'à obtenir des
régions élémentaires homogènes (de même classe).
C. Format vecteur
Dans le cas d’un codage vectoriel l’espace de représentation est supposé
continu, contrairement au codage raster où l’espace est quantifié et la
précision géométrique est donc limité. En fait la supposition d’un espace
continu ne peut être réellement satisfaite sur les systèmes informatiques, car
les systèmes numériques supposent un codage avec une précision finie des
valeurs numériques. La taille des « mots machines » sur les ordinateurs fixe
la précision des valeurs numériques codées selon leur type mathématique
(entier, réel ...)
codage par primitives graphiques
Cas du codage des polygones
p4 p5
p2
p3 p9
p1 POLY1 POLY2
p10
p8 p7 p6
a1 a2 a3
Dans le premier cas chaque polygone contient tous les points de son
contour, en concéquence les points communs aux deux polygones connexes
sont dupliqués dans P1 et P2.
Dans le second cas les arcs individuels sont codés en tant que tel, on parle
de couverture d'arcs, et les polygones ne contiennent que la liste des arcs les
constituant.
Objets linéaires
PM quadtree
Polygones objets complexes
Segment tree
rectangle englobant
polygone
Modèle objet
Certains systèmes proposent, parfois artificiellement, de s’affranchir de la
représentation par couverture des données géographiques. Des modèles
inspirés des représentations informatiques orientés objets sont implémentées
dans certains SIG. Il faut noter que la terminologie objet est le plus souvent
un peu abusivement utilisée. En effet elle est le plus souvent utilisée pour
souligner un codage différent de celui par couverture, sans reprendre
réellement le formalisme orienté objet.
La topologie n'est pas codée explicitement dans la base. Quand une fonction
a besoin d'information topologique, elle la calcule dynamiquement.
Les coordonnées géographiques utilisant, latitude et longitude sont très utilisées. Ce système
permet de repérer n'importe quel point à la surface du globe, mais il fait référence à un espace
en trois dimensions.
Le système géographique
3. Projections cartographiques
a seule représentation de la terre qui ne comporte pas de distorsions géométriques est le
L globe terrestre lui même. Les cartes que nous utilisons sont planes et servent à représenter
un espace, qui est à trois dimensions. Une projection de l'espace tridimensionnelle, dans
le plan de la carte, est donc nécessaire. La projection ne peut donner une représentation
parfaite. Le passage de la surface terrestre à sa représentation sur une carte plane, passe par
une étape de projection selon la verticale sur l’ellipsoïde de référence. Cette étape est étudiée
par la géodésie et la topographie. Un système de projection cartographique permet ensuite, de
transposer une portion de cette surface de l’ellipsoïde, sur le plan d’une carte.
Le globe terrestre vu comme un ballon que l'on dégonfle pour le ramener à un plan
On peut définir une projection comme un moyen de correspondance analytique entre les
points (latitude, longitude) de la surface à représenter (l’ellipsoïde terrestre) et le points
homologues du plan cartographique (X,Y), tel que cette correspondance soit continue et
biunivoque.
X = f(latitude, longitude)
Y = g(latitude, longitude)
f et g sont deux fonctions continues qui définissent la projection.
Si on considère un cercle sur la surface de l’ellipsoïde, sa projection sur le plan n’est
généralement pas un cercle, sauf au centre de projection, mais une ellipse appelée l’indicatrice
de Tissot. Les déformations en chaque point sont matérialisés par les axes de l’indicatrice.
Projections conformes
On choisit de préserver plutôt les angles donc les formes, en particulier les méridiens et les
parallèles se coupent à angle droit,
Projection conforme
L’indicatrice est une cercle, l’échelle est constante dans toutes les directions au voisinage du
point. L’altération de l ‘échelle augmente au fur et à mesure que l’on s’éloigne du centre de
projection.
Projections équivalentes
Projection équivalente
On choisit de préserver les surfaces, l’indicatrice est une ellipse, l’échelle est variable selon
les directions.
Il existe un grand nombre de projections et différentes façon de les classer, par exemple selon
la forme de la surface de projection utilisée.
Comme les méridiens ne sont pas concourants dans la projection de mercator, les
déformations sont assez importantes aux pôles. La projection de Robinson permet d'atténuer
un peu ces déformations.
D. Projection azimutale
projection azimutale
Projections étoilées
Les altérations sur la carte sont d’autant plus importantes, que la surface terrestre à représenter
est plus importante. Pour les superficies peu importantes ( < 10 km2) le choix du type de
projection n’est pas très important, pourvu qu’elle soit centrée sur la zone à cartographier.
Une simple projection topographique (sur un plan tangent) est suffisante. Plus on s’éloigne du
centre de projection plus les altérations augmentent. Pour la projection conique conforme de
Lambert l’altération linéaire est approximativement :
∆y
2
A 200 km du parallèle de projection le rapport est d’environ 1 / 2000 qui est la valeur limite
de précision sur une distance. Il apparaît ici la notion de champ de projection, c’est l’étendue
pour laquelle le système choisi présente des altérations inférieures à un seuil fixé a priori.
Primitive graphique
vectorielle
Information structurée
en thèmes
éditables modifiables
1 thèmes raster
pixel
2. BD du milieu
De nombreuses cartographies du milieu ont été numérisées afin d’être
intégrées dans les SIG. occupation du sol (Corine), géologie (BRGM) pédologie
(INRA) …
MNT raster
Un MNT raster est une matrice d’altitudes. Il s’agit d’un ensemble de valeurs
numériques, régulièrement espacées . Chaque valeur d’altitude représente
une moyenne d’un élément de surface de terrain. Cette distribution définit
un maillage de la surface, la dimension de la maille définit la résolution
planimétrique du MNT. Chaque point est au centre de la maille. Plus la
résolution est grande plus le MNT est riche en détails topographiques. Les
MNT raster peuvent être produit par différentes méthodes et à partir de
source de données diverses :
à partir de courbes de niveau
On numérise des courbes de niveau d’une carte papier qui donnent un
ensemble d’arcs. On détermine ensuite les intersections de ces arcs avec le
maillage du MNT à produire. On obtient un ensemble de points côtés. Cet
ensemble sert de point de départ à une interpolation des altitudes en chaque
point du maillage afin de produire l’ensemble du MNT recherché. Selon la
densité des courbes de niveau et la méthode d’interpolation utilisée des biais
apparaissent. L’utilisation des points côtés des cartes en plus des courbes de
niveau peut permettre d’améliorer un peu la qualité du MNT. La précision
obtenue correspond en moyenne à la demi équidistance entre les courbes
initiales. Pour des courbes séparées en moyenne de 50 m on obtient un MNT
précis à 25 m.
à partir de photographies aériennes
Il s’agit d’un long travail de photo-interprétation à l’aide de couples d’images
stéréoscopiques et d’un stéréo-restitueur.
à partir d’images numériques, satellitaires le plus souvent
Il s’agit de méthodes automatiques de traitement d’images permettent de
calculer l’altitude à partir d’un couple d’images stéréoscopiques numériques.
Le principe repose sur la recherche automatique pour tout pixel de l’une des
images de son homologue dans l’autre image du couple stéréoscopique.
Connaissant la position des deux pixels on en déduit la parallaxe, puis
connaissant l’altitude et l’angle de prise de vue on en déduit l’altitude du
point.
MNT vecteur
L’alternative à une représentation raster est une représentation vecteur par
une couverture polygonale. Le plus souvent, pour les MNT, le pavage de la
surface est réalisé sur la base de triangles, on parle de triangulation. Ces
MNT sont le plus souvent construit à partir d’un semi de points irrégulier,
dont la densité augmente avec la complexité du relief. Un tel découpage
irrégulier reposant sur des triangles non recouvrant (tessellation de
triangles) est souvent appellée : TIN (Triangulated Irregular Network).
Différentes méthodes de découpage de l’espace peuvent être utilisée pour
produire ces MNT, telle que la triangulation de Delaunay. Pour des données
provenant de courbes de niveau, on préférera d’autres algorithmes afin
d’éviter de relier trois points d’une même courbe pour réaliser la
triangulation.
Une mise à jour des données tout les 1 à 3 ans selon les thèmes. La
coexistence de différentes versions peut toutefois poser certains problèmes
de cohérence logique et géographique.
La couverture du territoire national par la BD carto est actuellement
effective.
Elle peut être fournie en mode objet, c'est à dire structurée topologiquement
et sémantiquement ou en mode dessin.
Les formats informatiques sont : EDIGéO ou ArcInfo pour le format objet et
DXF pour le format dessin.
HT / km2 HT / département moyen 5000
km2
Thèmes dessin objet dessin objet
Elle peut être fournie au format DBase III ou ASCII alphanumérique IGN, des
extractions géographiques sont possibles, le seuil minimum d'achat est le
département.
Le prix de ce produit est :
exemples de prix :
fichier "France par communes" : 41 000 F HT.
fichier "France par départements" : 3 600 F HT
Bases Michelin
Produits SPOT
L es données issues du satellite Spot, sont disponibles sous forme
analogique (tirage papier) mais aussi sous forme numérique (CD-ROM)
pouvant permettre leurs intégrations dans un SIG. Deux
grandes familles de produits existent, les scènes Spot et les
spatiocartes SpotView.
o Format de liv raison : CD Rom au format Export d'Arc/Info (.e00) fourni avec
documentation technique
1. Territoires artificialisés
1.1. Zones urbanisées
2. Territoires agricoles
2.1. Terres arables
2.2.1. Vignobles
2.2.2. Vergers et petits fruits
2.2.3. Oliveraies
2.3. Prairies
2.3.1. Prairies
4. Zones humides
4.1. Zones humides intérieures
5. Surfaces en eau
5.1. Eaux continentales
Couche complète
La couche cadastrale complète dite couche 1, est l'ensemble du contenu du
plan graphique. le fichier existe sur les zones où une convention de
numérisation a été passée avec la DGI.
Le contenu en est :
limites administratives, parcelles, subdivisions fiscales, bâtiments, détails
topographiques, points de canevas, voies, hydrographie, toponymie ...
Le fichier vecteur a une taille de 500 Ko environ par feuille de plan cadastral.
Actuellement, le format d'échange est celui du signataire de la convention
concernée, à terme ce sera le standard de la DGI qui s'appuiera sur EDIGÉO.
Les extractions géographiques sont possibles par sections cadastrales.
Fichier des propriétaires
Il permet d'identifier, au niveau de la commune :
- les personnes physiques ou morales titulaires de droits réels
immobiliers.
- les gestionnaires chargés par ces personnes de régler le montant des
impôts et taxes
afférents à ces immeubles.
- les fonctionnaires ou employés publics logés dans des immeubles
exonérés de taxe
foncière, mais passibles de la taxe d'enlèvement des ordures ménagères.
Une correspondance avec les autres fichiers fonciers est assurée par le
numéro communal de propriétaire.
Programme S IS E
est celle du 1/1 000 000. L'information est issue d'une expertise correspondant à une synthèse
et une généralisation de travaux cartographiques détaillés (en particulier, cartes 1/100 000
dans le cadre du programme CPF). De nombreuses données sont donc issues d'estimation et
ainsi sujettes à critique. Une présentation détaillée de la base de données est proposée comme
exemple d'usage des données cartographiques de sols (accès à l'exemple). Pour le territoire
français, les données sont disponibles auprès du SESCPF après présentation d'un projet et avis
d'un comité scientifique (condition d'accès aux données). Pour le territoire européen, il faut se
renseigner auprès du Bureau Européen de sols (CCR-Ispra).
objets décrits : stations définies sur des cours d'eau (chaque station est
matérialisée par un point de géographiques connues à partir d'une carte au
1:25 000 ou 1:50 000)
attributs : résultats de pêches électriques (poissons), résultats de relevés
hydrobiologiques (invertébrés benthiques), informations sur les captures
(poissons), informations sur les repeuplements (poissons).
IFREMER
Ministère de l'Environnement
Base Hydro
Fidel
Sirene
Sirf
Replic
Météo-France
Aurelhi
Fichier altitude
Fichier pluviométrique
Fichier thermométrique
images radar
normales des stations synoptiques
Satmos master plus
Fichier sol
Distributeurs
Formats compressés
Géotiff
Ce nouveau format graphique intègre des informations de géoréférencement.
Comme on l’a vu il n’existe pas de format universel commun à tous les SIG,
comment dans ces conditions, échanger des données entre systèmes
différents ? C’est la notion de format d’échange. Le format d’échange est un
format simplifié généralement ascii (texte donc éditable avec un simple
éditeur) et dont le format est publique (connu), en effet les formats internes
des sig ne sont pas toujours donnés par les éditeurs de logiciels. Un logiciel
va « exporter » sa base dans un fichier en format d’échange, ou au contraire
créer une BD en « important » depuis un fichier d’échange. Les logiciels ont
en général leur propre format d’échange, mais quelques uns sont assez
universellement reconnus par les différents logiciels (arcview, mapinfo). Des
tentatives de normalisation de ces formats d’échanges ont été tentées
(EDIGEO) mais sans grand succès, une norme de fait est le format d’échange
d’ArcInfo dit « e00 ». Les fichiers du logiciel AutoCad (CAO/DAO) sont
presque toujours reconnus par les SIG et ce format est parfois utilisé comme
un format d’échange.
Pour les donnés sémantiques les sig savent souvent « lire » des données de
tableur (excel pour mapinfo) ou de base de données (Dbase pour ArcView),
dans tous les cas ils peuvent importer des données dans un fichier texte
(ascii) structuré, on parle de fichier texte formaté (une ligne par individu, les
colonnes séparées par des virgules ou autre séparateur).
Format d’échange ArcInfo e00 norme de fait
Format d’échange MapInfo : mif
EDIGéo la norme française
La normalisation Européenne : CEN/TC 287
La normalisation aux Etats-Unis
DIGEST : standard d'échange militaire de l'OTAN
Le format Autocad DXF
Le format ASCII