Vous êtes sur la page 1sur 61

INSTITUT NATIONAL AGRONOMIQUE PARIS-GRIGNON

INTRODUCTION AUX
SIG
SYSTEMES D'INFORMATIONS GEOGRAPHIQUES

Introduction & information spatiale


DAA AGER

Octobre 2000

Département AGER
Agronomie-Environnement
J-M Gilliot gilliot@lacan.grignon.inra.fr
Définition : qu’est ce qu’un SIG

Définition : qu’est ce qu’un SIG

U n S.I.G. est un Système d'information Géographique. De nombreuses


définitions apparaissent dans la littérature pour les SIG, mais souvent
incomplètes, car ne présentant qu'un des aspects des SIG. Selon les
définitions du petit Larousse :

Un système est une "combinaison d'éléments réunis de manière à


former un ensemble"
Une information est un "élément de connaissance susceptible d'être codé
pour être conservé, traité ou communiqué"

Géographique est "relatif à la géographie ayant pour objet la


description de la surface de la terre"

Le terme "système" ici sous-entend généralement système


informatique,
L'inform atique étant "la science du traitement automatique et rationnel de l'information en
tant que support des connaissances et des communications, mettant en oeuvre des
matériels et des logiciels.

Plusieurs aspects sont donc sous-jacent à la notion de SIG.


L'information qui est la donnée. Le géographique, qui qualifie
cette information ,en la supposant localisée dans l'espace. Le
système qui sous-entend que cette information est organisée au
sein d'un système informatique. Toutefois cette description
purement structurelle ne permet pas de cerner clairement la
notion de SIG en particulier par rapport aux systèmes de
cartographie automatique, en effet :

La c arte est la représentation conventionnelle de la répartition dans l'espace


de phénomènes concrets ou abstrait.
La c artographie est l'ensemble des opérations d'élaboration, de dessin et
d'édition des cartes.
La c artographie automatique est la cartographie assistée par ordinateur,
faisant appel aux techniques informatiques.

Un Système d'Information Géographique est un ensembl e de données


numériques, l oc al isées géographiquement et struc turées à l 'intérieur
d'un système de traitement informatique c omprenant des modul es
fonc tionnel s permettant de c onstruire, de modifier, d'interroger, de
représenter c artographiquement, l a base de données, sel on des c ritères
sémantiques et spatiaux.

gilliot@lacan.grignon.inra.fr daa ager ina pg 2 / 139


Définition : qu’est ce qu’un SIG

La définition pouvant être présentée plutôt dans un sens que dans un autre,
suivant que l'on veut mettre en avant l'aspect données ou l'aspect système et
traitement.

L es données géographiques, peuvent le plus souvent, être obtenues sous


forme numérique. Cette nature numérique permet de traiter ces données
sur des systèmes informatiques : les Systèmes d'Informations Géographiques
(SIG) ou Geographic Information Systems (GIS). Ces systèmes issus des
systèmes de gestion de bases de données (SGBD) permettent de créer des
bases de données dans lesquelles les informations peuvent être localisées
géographiquement.

Un Système d’Informations Géographiques est :

Un ensemble de données numériques


Localisées géographiquement

Structurées à l’intérieur d’un système de


traitement informatique

Comprenant des modules fonctionnels


Permettant de :

Créer et modifier d’intéroger de représenter cartographiquement

BASE

DE
DONNEES

Selon des critères


Sémantiques et
spatiaux

gilliot@lacan.grignon.inra.fr daa ager ina pg 3 / 139


Définition : qu’est ce qu’un SIG

« Un Système d’informations géographiques (SIG) est un système


informatique permettant, à partir de diverses sources, de rassembler et
organiser, de gérer, d’analyser et de combiner, d’élaborer et de présenter des
informations localisées géographiquement contribuant notamment à la
gestion de l’espace »
(Définition adoptée par le comité scientifique du colloque intégration de la
photogramétrie et de la télédétection dans les SIG SFPT, Strasbourg 1990).

H istorique du concept de SIG :

SGBD : Système de Gestion de bases de données

Cartographie automatique

Statistiques et Géostatistiques

Traitements d’images : données raster (télédétection, MNA)

gilliot@lacan.grignon.inra.fr daa ager ina pg 4 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

Les bases de données comme fondement des SIG :


introduction aux SGBD
I. Introduction
Les SIG sont issus des Systèmes de Gestion de Base de Données ( SGBD).
Avant de détailler la composition et les fonctionnalités des SIG, une
présentation des principes de base des SGBD est donc nécessaire.

II. Structure et gestion des fichiers dans les SGBD

Introduction

Objectifs

Disques : supports physiques

Indépendance par rapport au support

Accès séquentiel

Accès multiples

Sécurité et protection des fichiers

Gestion et organisation des fichiers

Notions de clé et d’index

gilliot@lacan.grignon.inra.fr daa ager ina pg 5 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

f
III. Base de données relationnelles
1. Structure de la base de données : TABLE

Il existe de nombreux modèles à la base des bases de données tels que :


hiérarchiques, réseaux, relationnelles, orientés objets ... Le modèle
relationnel a été inroduit dans les années 70 par Ted Codd.

La structure d'une base de données relationnelles est relativement simple.


Une base de données relationnelles est une collection de tables relationnelles
ou tables, représentant une relation.
Chaque table relationnelle est décrite par un ensemble d'attributs ou
champs qui sont les colonnes de la table. Chaque ligne de la table est un
ensemble de valeurs, aussi appelées tuple (n-uplets) décrivant un individu de
la table.

2. Les relations entre les tables


Le schéma relationnel est la structure des tables.
Une relation est un ensemble fini de tuple associés à un schéma relationnel
d'une base de données relationnelles.

3. Opérations sur les tables/relations

Un ensemble d'opérations peuvent être effectuées sur les relations telles que
: Union, intersection, différence. L'utilisation de ces opérations est définie
par l'algèbre relationnel de Codd (1970).

Commande project

PROJECT(relation, liste d'attributs)


La projection est une opération unaire, qui appliquée à une relation,
retourne une nouvelle relation comprenant un sous-ensemble des attributs
de la relation de départ. Les tuples apparaissant en double sont fusionnés.

Commande restrict

RESTRICT(relation, condition)
La restriction est une opération unaire, qui appliquée à une relation,
retourne une nouvelle relation comprenant l'ensemble des tuples vérifiant
une condition.

Les deux opérations peuvent être combinées.

gilliot@lacan.grignon.inra.fr daa ager ina pg 6 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

Soit la table relationnelle CLIENT :

NOM PRENOM AGE VILLE


dupond alain 40 Brest
durand marie 24 Paris
martin pierre 60 Nice

PROJECT(CLIENT:NOM) RESTRICT(CLIENT:AGE > 30)

NOM NOM PRENOM AGE VILLE


dupond dupond alain 40 Brest
durand martin pierre 60 Nice
martin

PROJECT(RESTRICT(CLIENT:AGE > 30):NOM))

NOM
dupond
martin

Commande join : JOINTURE

JOIN(relation1,relation2:attribut1,attribut2)

La jointure est une opération binaire qui prend deux relations et les combine
en une relation résultat sur la base d'un ou de plusieurs attributs communs.

En combinant ces opérations on peut facilement constater que l'ordre dans


lequel les opérations élémentaires sont effectuées est important.

IV. SGBD et langages relationnels


Différents Langages de Manipulation de Données (LMD) permettent
d'interroger un Système de Gestion de Bases de Données (SGBD). L'un des
plus répandu est SQL, mais on peut aussi citer QUEL (SGBD Ingre) ou QBE
(Query Bye Example)

S.Q.L.

Le Standard Query Language (SQL) fourni à l'utilisateur un langage de


manipulation des bases de données relationnelles. Il existe un standard
international pour SQL, la norme iso actuelle est le SQL2 (ISO,1992).

gilliot@lacan.grignon.inra.fr daa ager ina pg 7 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

Commande create

La création des schémas relationnels, définissant la structure de la base de


données est réalisé par la commande CREATE. Une fois le modèle de la base
défini, de nouveaux enregistrements peuvent être ajoutés, enlevés, modifiés
...

La manipulation des données de la base est effectuée par la commande


SELECT
Il s'agit de retrouver ( de sélectionner) dans la base les enregistrements
correspondent à une question posée, par exemple l'expression SQL :

Commande select

SELECT communes
FROM base_communale
WHERE population > 3000

permet de retrouver les enregistrements communes, de la base


base_communale, où le champ population est strictement supérieur à 3000.
WHERE permet de réaliser une restriction.
Une jointure peut être réalisée en SQL en spécifiant plusieurs relations dans
la commande FROM.

De manière générale la commande select se présente sous la forme :

SELECT liste-item
FROM table-de-référence
WHERE condition
GROUP BY liste-attributs
HAVING condition

GROUP BY permet les regroupements ar attributs avec une condition


possible par HAVING.

gilliot@lacan.grignon.inra.fr daa ager ina pg 8 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

V. Modèles conceptuels de données : modèle entité-relation


Un modèle conceptuel de données ou M.C.D. est une modélisation de la base
de données indépendante de l'implémentation informatique. Il s'agit de
décrire les propriétés de la base, essentiellement le type des données et leurs
relations.

Une des approches les plus largement utilisée pour la modélisation des
bases de données est le modèle entité-relation.
Le MCD est constituée :
- d'entités
- de données associées les attributs
- de relations entre les entités

La cardinalité permet de définir le nombre d'entités qui peuvent être mise en


jeu par la relation.

VI. L'approche orientée-objet

L'approche orientée objet apparaît comme une alternative au modèle


relationnel.
Les concepts fondamentaux de l'approche objet, que l'on retrouve par delà
les SGBD, dans d'autres langages informatiques (le plus emblématique étant)
C++ sont :

Notion d'objet
La notion d'objet est centrale à l'approche orientée objet. Elle permet de
prendre en compte, en plus de la composante statique de l'information
(données), une composante dynamique (fonctionnelle). Elle permet de
s'affranchir en partie de la dichotomie classique des langages informatiques
entre :
Données (variables)
Traitements ( procédures, fonctions)
Dans l'approche objet les deux se trouvent regroupés dans une nouvelle
entité : l'objet.
Les variables de l'objet sont ses attributs.
ls fonctionnalités sont ses méthodes.
Un des concepts à la base de cette approche objet est la modularité, pour
permettre la maintenance et la réutilisation des programmes informatiques.
Il s'agit de concevoir un programme comme un ensemble de petits modules
structurels et fonctionnels, fonctionnants comme une boite noire.

gilliot@lacan.grignon.inra.fr daa ager ina pg 9 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

L'indépendance maximale et la taille minimale de ces modules, permettant


de les corriger, de les faire évoluer et de les réutiliser dans d'autres
applications.
Ces notions étaient plus ou moins présentes dans les méthodes de
programmation structurée, mais elle se trouve formalisée dans l'approche
objet qui ne sert de cadre méthodologique.

Notion d'encapsulation
L'encapsulation est le principe selon lequel les données et les méthodes d'un
objet ne sont pas directement accessibles d'un autre objet. Les objets
communique entre eux par l'intermédiaire de messages.

Notion de classe
Une classe est un "modèle" d'objets. C'est le "type" de l'objet.

Notion d'héritage

La notion d'héritage vient directement de la notion de classe. C'est la


possibilité pour une classe de transmettre ces propriétés (structure et
méthodes) à des objets ou à des classes descendantes.

Classe mère Classe mère Classe mère

héritage simple héritage multiple

classe fille classe fille objet classe fille classe fille objet

objet objet objet objet objet objet objet objet objet objet objet

Les versions les plus récentes des SGBD sont orientées objet : Oracle 8 et
ultérieurs, O2.

VII. BD partagées et accès concurrentiel


Dans des configuration en réseau, il peut être possible pour plusieurs
utilisateurs d'accéder simultanément à une même Base de Données. Les
SGBD ont parfois la possibilité de gérer des accès concurrentiels à une
même base. Des droits d'utilisation sont alors souvent définis, en lien avec
un utilisateur, identifié par le système informatique. Des droits en lecture
ou/et en écriture peuvent alors être définis. Les accès concurrentiels en
lecture ne posent pas trop de problème, mais les accès concurrentiels en
écriture pourraient gravement altérer la cohérence de la base, si plusieurs
utilisateurs tentent de modifier simultanément la même partie d'une base.
Pour prévenir et gérer cette situation les SGBD ont sécurisés les
manipulations concurrentielles. Elles sont effectuées par des transactions
identifiées, plusieurs stratégie permettent d'empêcher les conflits lors des
accès concurrentiels :

gilliot@lacan.grignon.inra.fr daa ager ina pg 10 / 139


Les bases de données comme fondement des SIG : introduction aux SGBD

L'ordonnancement initial des transactions : estampillage


Verrouillage
La certification
VIII. Communication dynamique SIG / SGBD : Sql et ODBC
On veut parfois pouvoir maintenir une base de données à la fois sur un SIG
et sur un SGBD classique. Soit parce que cela correspondent à deux
utilisations différentes, soit parce que la base sous le SGBD est très grosse et
que le SIG sera moins performant pour réaliser des requêtes "simples" ne
faisant pas intervenir le spatial.
Pour cela on souhaite alors faire communiquer les deux systèmes, cela peut
se faire soit :
Statiquement
Les échanges et les mises à jour se font par l'intermédiaire de fichiers.
dynamiquement
Les deux programmes doivent pouvoir communiquer dynamiquement entre
eux, pour s'échanger de l'information. Sous Unix les SGBD sous SQL
peuvent jouer le rôle de serveur SQL. Une application cliente (le SIG) peut
l'interroger (requête).
Dans le monde de la micro, ces possibilités existent aussi, plusieurs normes
tentent actuellement de s'imposer, citons ODBC proposé par Microsoft et
supporté par Access.

gilliot@lacan.grignon.inra.fr daa ager ina pg 11 / 139


Première partie
L’information spatiale

gilliot@lacan.grignon.inra.fr daa ager ina pg 12 / 139


Structure de l’information spatiale en géomatique

Structure de l’information spatiale en géomatique


I. L'espace en géomatique
1. La notion d'espace : l'espace euclidien et l’espace cartésien

2. Les objets dans l'espace Euclidien


Dans le plan euclidien le SIG va classiquement utiliser les objets
élémentaires :
A. Les objets points
Ils sont définis par leurs coordonnés dans le plan (X,Y)

B. Les objets lignes


Les lignes sont des segments de droite définies par deux points : (X1,Y1)
(X2,Y2)

gilliot@lacan.grignon.inra.fr daa ager ina pg 13 / 139


Structure de l’information spatiale en géomatique

C. Les objets polylignes


C'est un ensemble fini de segments de ligne, tel que le point final d'un
segment soit le point de départ du segment suivant.

Point 1 Point 3 Point 4


Point 2
ligne3
ligne 1 ligne 2

Polyligne quelconque Polyligne simple Polyligne


simple fermée

Reprenant la terminologie des graphes, on parle parfois de noeuds ou de


sommets pour les points et d'arcs pour les lignes.
Une polyligne dont aucun arc ne se coupe est une polyligne simple.
Une polyligne dont le sommet de départ est le même que le sommet d'arrivé
est une polyligne fermée.
D. Les objets polygones
Un polygone est l'espace compris à l'intérieur d'une polyligne fermée

Polyligne fermée Polygone

Polygone convexe chaîne monotone chaîne non


monotone

gilliot@lacan.grignon.inra.fr daa ager ina pg 14 / 139


Structure de l’information spatiale en géomatique

Un polygone convexe est tel que tous les angles intérieurs formés par ces
arcs sont inférieurs à 180 degré.
Une chaîne est un ensemble de points ordonnés. Une chaîne est dite
monotone si il existe une droite telle que la projection des points de la chaîne
sur cette droite préserve l'ordre des points.
Un polygone est dit monotone si il peut être décomposé en deux chaînes
monotones.

L'enveloppe convexe d'un ensemble est le plus petit polygone convexe


englobant cet ensemble.

Enveloppe convexe d'un ensemble de points

Un point d'observation est un point d'où on peut voir tous les autres points du polygone.

point d'observation et intervisibilité

polygone convexe polygone semi-convexe polygone non-convexe

Un polygone est convexe si ∀ un point P du polygone c'est un point d'observation.


Un polygone est semi-convexe si il ∃ au moins un point d'observation dans le polygone.
Un polygone n'est pas convexe si il n'∃ aucun point d'observation dans le polygone.

E. Les grilles ou matrices


Des matrices sont utilisées pour réaliser une partition régulière de l'espace.
Ce peut être une image, un MNT (Modèle Numérique de Terrain)...

gilliot@lacan.grignon.inra.fr daa ager ina pg 15 / 139


Structure de l’information spatiale en géomatique

F. Tessellations régulières
La tessellation d'une surface est une couverture de cette surface par un
arangement de polygones réguliers non recouvrants:

G. Tessellations irrégulières : TIN


Le Triangulated Irregular Network est le plus connue des tessellations
irrégulières, basée sur une couverture de triangles irréguliers, elle est utilisée
pour modéliser des MNT

H. Triangulation de Delaunay et diagramme de Voronoi


Il s'agit d'une triangulation avec des triangles les plus équilatéraux possibles.
diagramme de Voronoi ou polygones de Thiessen

diagramme Voronoi = polygones de Thiessen Triangulation de Delaunay

gilliot@lacan.grignon.inra.fr daa ager ina pg 16 / 139


Structure de l’information spatiale en géomatique

J. Les graphes
définition
Un graphe G est défini comme un ensemble fini de noeuds et d'un ensemble
d'arcs reliant les noeuds deux à deux.

noeud

arc

graphe orienté
Un graphe orienté est un graphe pour lequel on assigne une direction aux
arcs.

graphe labelisé
Un graphe labélisé est un graphe pour lequel à chaque arc est associé une
valeur
chemin dans un graphe
Un chemin dans un graphe entre deux noeuds, est une liste d'arcs connectés
entre ces noeuds.
graphe connecté
Un graphe G, est dit connecté, quand ∀ na et nb ∈ G 2 noeuds quelconques,
il ∃ un chemin entre na et nb.
Graphe cyclique
Un chemin partant d'un noeud na, est dit cyclique, si il repasse par na.
arbre
Un arbre est un graphe connecté et acyclique.
K. Courbes fractales
Courbes de Koch

gilliot@lacan.grignon.inra.fr daa ager ina pg 17 / 139


Structure de l’information spatiale en géomatique

Courbe de Peano, Courbe de Hilbert

3. Opérations géométriques sur les ensembles d'objets du plan.

Les propriétés classiques de la théorie des ensembles s'appliquent à nos


objets :

Egalité
Sous-ensemble
Ensemble vide
Cardinalité
Intersection
Union
Complément

II. La topologie
1. La notion de topologie

La topologie est une description des relations spatiales des objets entre eux,
telles que : "est à côté de", "inclus", "intersecte" … Dans certain système elle
est stockée explicitement, dans d'autre elle est calculée dynamiquement,
selon les besoins de telle ou telle fonction.

2. Voisinage

2. Connexité

gilliot@lacan.grignon.inra.fr daa ager ina pg 18 / 139


Structure de l’information spatiale en géomatique

3. formule d'Euler
Un arrangement de o objets dans le plan avec a arcs et n nœuds :
o–a+n=1

4. Simplexe et complexe

gilliot@lacan.grignon.inra.fr daa ager ina pg 19 / 139


Structure de l’information spatiale en géomatique

5. Notion de métrique

III. Représentations informatiques des données spatiales


1. Introduction
Après avoir présenté une modélisation conceptuelle de l'information dans les
SIG, nous nous intéressons maintenant à l'organisation de bas niveau de
cette information. Cela concerne les structures de données informatiques
utilisées pour coder l'information présente dans les SIG. Les choix qui sont
fait dans les différents systèmes à ce niveau d'organisation ont des
répercutions très importante en termes de performances d'accès aux
données et de taille de stockage des bases.
2. Information graphique et information sémantique
On distingue habituellement deux types d'informations pour les données des SIG: L'aspect sémantique donne
une description dans différents champs ou attributs, comme dans un SGBD classique. L'aspect graphique qui est
le contour de l'objet localisé géographiquement.

OBJET DU SIG

ASPECT SEMANTIQUE ASPECT GRAPHIQUE

COMMUNE
Attributs Valeurs
INSEE 89102
NOM SENS
SURFACE 12387
POPULATION 45000

X
Contour graphique localisé géographiquement
dans un système de projection cartographique.

3. Information objet / information champ


1 information élémentaire correspond à un objet ou à 1 champ (d’une table)
décrivant cet objet.

gilliot@lacan.grignon.inra.fr daa ager ina pg 20 / 139


Structure de l’information spatiale en géomatique

4. Organisation des systèmes de fichiers et méthodes d'accès


A. Introduction
L'organisation élémentaire d'une base de données, est une collection de
fichiers composés d'enregistrement, stockés sur un disque informatique. Des
techniques plus sophistiquées de structurations des bases de données, sur
les disques, ont été imaginées afin d'accélérer les algorithmes (programmes)
de recherche.
B. Organisation simple des fichiers et recherches linéaires
C'est la méthode d'organisation la plus élémentaire, il n'y a pas de
structuration particulière des informations sur le disque, imposée par le SIG.
C'est le système d'exploitation de la machine qui alloue les positions sur le
disque pour les fichiers. Le type de recherche qui est utilisé avec ce type de
structure est qualifiée de linéaire. En effet les données ne sont pas triées en
fonction de l'information, pour rechercher une information il faut donc
balayer tous les enregistrements jusqu'à trouver l'information recherchée.

Pour n enregistrements on va en moyenne faire n/2 recherche avant de


trouver. (on parle de complexité de l'algorithme)

Cette méthode est particulièrement lente pour de grosses bases de données.


Elle a l'avantage, comme elle n'est pas structurée de permettre des
modifications faciles des enregistrement (suppression, insertion ...)
C. Organisation séquentiel des fichiers et recherches binaires
Contrairement au cas précédent, les données sont ici organisées dans le
fichier, en fonction de la valeur de un ou de plusieurs champs. Une
recherche de type binaire peut être appliquée sur ces fichiers. Pour cette
recherche on se place au milieu du fichier, on lit dans l'enregistrement le
champ qui a servi à organiser le fichier. Si la valeur recherchée est inférieur
au champ lu, on recherche alors dans la première moité du fichier, de la
même manière, sinon on recherche dans la seconde moitié du fichier.

Pour n enregistrement la compléxité est cette fois de l'ordre de log2(n)


Par exemple pour 1000 enregistrements, un traitement linéaire necessite en
moyenne 500 accès contre seulement log2(1000) = 10 accès pour une
recherche binaire.

Par contre les modifications de la base (insertion, deletions ...) sont très
couteuse en temps, car la modification de la place d'un enregistrement se
répercute sur la place des autres.

D. Tables de hachages
Une table de hachage utilise une fonction de hachage. Sur un ou plusieurs
champs, la fonction de hachage transformat la valeur en une adresse
physique sur le disque. L'adresse peut donc être entièrement calculée et ne
nécessite alors seulement un accès disque pour retrouver l'enregistrement.
Soit un bloque de 1000 emplacements sur le disque, numéroté de 0 à 999.
Soir des enregistrements avec un champ numérique variant de 0 à 1999

gilliot@lacan.grignon.inra.fr daa ager ina pg 21 / 139


Structure de l’information spatiale en géomatique

Une fonction de hachage très simple: diviser par deux, peut être utilisée.

valeur du champ = 400 ----> FonctionHachage(400) = 200 -------> adresse


sur le disque

C'est une technique très optimale, mais qui pose des problèmes pour la
gestion de bloques disques (recouvrement, taille élémentaire des bloques ...),
elle ne peut s'appliquer que sur des champs numériques ou pouvant se
transformer en valeur numérique.
E. Tables d'index notion d'identifiant
Cette technique utilise des tables d'index à la manière de l'index d'un livre.
Le fichier de données lui même n'est pas organisé, mais un second fichier
index est créé, qui lui est ordonné et qui contient un des champs des
enregistrement, que l'on nome l'indexe, ainsi que l'adresse ou pointeur de
l'enregistrement correspondent dans le premier fichier.

Une recherche binaire peut alors être entreprise, sur le fichier indexe.

Pour de très grosses bases de données le fichier index peut lui aussi devenir
très gros et ralentir la recherche. On peut alors créer une table d'index du
fichier index. On parle alors d'index multi-niveaux. Le B-tree (balanced tree)
est un exemple d'indexe multi-niveaux.

Dans la plupart des SIG un champ particulier, que l'on nome identifiant, sert
à construire une table d'index, pour manipuler rapidemment les
enregistrements de la base.
F. Indexations spatiales notion de localisant
Les méthodes de codage et d'accès précédentes faisaient surtout référence
aux données sémantique. Le problème se pose de la même façon pour des

gilliot@lacan.grignon.inra.fr daa ager ina pg 22 / 139


Structure de l’information spatiale en géomatique

accès à la base par l'information spatiale. Pour cela des méthodes


d'indexations spatiales ont été imaginées, il s'agit de rapprocher
physiquement sur le disque des enregistrement qui sont proche dans
l'espace géographique. Par exemple :

ligne ligne diagonale spirale

Par analogie avec la notion d'identifiant pour les données sémantique, on


parle parfois de localisant pour la façon d'accéder à l'information par le
spatial.

5. Format de l'information graphique : raster ou vecteur

A. Introduction
Le format raster utilise une description matricielle de l'espace géographique.
La matrice est une image, chaque élément de l'image ou pixel (picture
element) contient un niveau donné qui représente une thématique. ces
images sont généralement issues de scanners ou d'images aériennes ou
satellitaires.

Dans le format vectoriel, les objets sont représentés par des primitives
graphiques (point, ligne, polyligne etc ...).

gilliot@lacan.grignon.inra.fr daa ager ina pg 23 / 139


Structure de l’information spatiale en géomatique

B. Format raster
Définitions des images numériques

Un signal s, est le support physique d'une information [Kunt,1981].


Mathématiquement, le signal est représenté par une fonction d'une ou
plusieurs variables (x et y pour une image). Selon la nature de ces variables,
on distingue :
- un signal analogique pour des variables continues;
- un signal discret ou échantillonné pour des variables discrètes.
En outre, l'amplitude du signal (niveau de gris pour une image), peut
également être continue ou discrète.
Un signal analogique, dont l'amplitude est discrète, est un signal quantifié.
Un signal discret dont l'amplitude est discrète est un signal numérique.

gilliot@lacan.grignon.inra.fr daa ager ina pg 24 / 139


Structure de l’information spatiale en géomatique

Une image numérique I, ou image digitale, est un exemple de signal


numérique bidimensionnel, elle résulte de deux étapes :
- l'échantillonnage qui est la discrétisation spatiale sur x et y;
- la quantification qui est la discrétisation de l'amplitude du signal,
donnant le niveau de gris.
Une image digitale est donc représentée par une zone discrète et finie,
d'amplitude discrète. Elle constitue la représentation spatiale d'un objet,
d'une scène bidimensionnelle ou tridimensionnelle ou d'une autre image
[Haralick,1991].
Soit I une fonction image bidimensionnelle : I : N 2 -> N
I : (x,y) -> I(x,y)
où I(x,y) un élément d'image aux coordonnées (x,y) est appelé pixel (picture
element). La valeur de I(x,y) peut être un niveau de gris ou une valeur de
couleur pour les images couleurs, qui comportent généralement trois
composantes, Rouge, Vert, Bleu dans le système RVB par exemple.
x
X

y
I(x,y) valeur de la
fonction image I
au pixel de coordonnés
(x,y)
Y
Une image niveau de gris

B
V
R

Image couleur

Les plans Rouge Vert


Bleu de l'image couleur
Image digitale en niveaux de gris et en couleur

Voisinage et connexité
Le voisinage est défini par un ensemble de points connexes qui constituent
une forme pré définie entourant le point considéré. On distingue
classiquement :

gilliot@lacan.grignon.inra.fr daa ager ina pg 25 / 139


Structure de l’information spatiale en géomatique

- un voisinage en connexité 4 dans le cas où les quatre pixels voisins sont


utilisés;
- un voisinage en connexité 8 dans le cas où les huit pixels adjacents sont
pris en compte.

pixel central

C4 C8
Les types de voisinage classiques

Structure de données informatique des raster


Il existe de nombreuses techniques issues du traitement d'images pour coder
des données sous forme raster.
matrice raster
Un raster est par définition une matrice de points (pixels). On défini aussi les
voxels par analogie au pixel dans un espace à trois dimensions. Le stockage
sous cette forme peut être très coûteux en taille, de nombreuses méthodes
de codage permettant une compression des données sont utilisées :

Chain codes
C'est un codage utilisé pour représenter les contours dans une image, il est
basée sur le codage directionnel de Freeman :
d2
d3
d1

d4 d0

d5
d7
d6
Les directions élémentaires d, codent pour le passage d'un pixel de contour à
un autre, un contour est alors entièrement codé par une suite de d.

Run Length code


Ce type de compression tire partie de la répétitivité de certaine image. En
effet une carte raster peut contenir de larges plages de pixels ayant la même
valeur. Par exemple une ligne de 20 pixels contigus tous à la valeur 6 pourra
être codée :

6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 En codage raster classique ou


20 6 en codage run length.
On code ici sur 2 octets le nombre de pixels de la plage et la valeur de la
plage, soit un taux de compression de 20 / 2 = 10.

gilliot@lacan.grignon.inra.fr daa ager ina pg 26 / 139


Structure de l’information spatiale en géomatique

block code
Il s'agit d'une généralisation du cas précédent au cas bidimensionel.

quadtree
On découpe une image de façon récursive en quadrant jusqu'à obtenir des
régions élémentaires homogènes (de même classe).

Pour une image binaire (2 niveaux : et )

est un noeud hétérogène sont les noeuds homogènes

C. Format vecteur
Dans le cas d’un codage vectoriel l’espace de représentation est supposé
continu, contrairement au codage raster où l’espace est quantifié et la
précision géométrique est donc limité. En fait la supposition d’un espace
continu ne peut être réellement satisfaite sur les systèmes informatiques, car
les systèmes numériques supposent un codage avec une précision finie des
valeurs numériques. La taille des « mots machines » sur les ordinateurs fixe
la précision des valeurs numériques codées selon leur type mathématique
(entier, réel ...)
codage par primitives graphiques
Cas du codage des polygones

Soient deux polygones connexes POLY1 et POLY2, soient pi les points de


contour :

gilliot@lacan.grignon.inra.fr daa ager ina pg 27 / 139


Structure de l’information spatiale en géomatique

p4 p5
p2
p3 p9
p1 POLY1 POLY2
p10
p8 p7 p6

Deux techniques sont utilisées concernant le codage graphique des


polygones :

Codage par couverture d’arcs / codage par couverture de polygones

a1 a2 a3

Couverture de polygones Couverture d'arcs


Polygones points de contour arcs points de
contour
P1 1,2,3,4,9,10,7,8,1 a1 7,8,1,2,3,4
P2 4,5,6,7,10,9,4 a2 4,9,10,7
a3 4,5,6,7
Polygones arcs
P1 a1,a2
P2 a2,a3

Dans le premier cas chaque polygone contient tous les points de son
contour, en concéquence les points communs aux deux polygones connexes
sont dupliqués dans P1 et P2.

Dans le second cas les arcs individuels sont codés en tant que tel, on parle
de couverture d'arcs, et les polygones ne contiennent que la liste des arcs les
constituant.

Structure de données informatique des vecteurs


Les problèmes d'indexation se pose de la même manière que pour les
données raster.
Points
grille régulière
quad-tree de points

gilliot@lacan.grignon.inra.fr daa ager ina pg 28 / 139


Structure de l’information spatiale en géomatique

Objets linéaires
PM quadtree
Polygones objets complexes
Segment tree
rectangle englobant
polygone

Le R-tree est une extension du B-tree en utilisant les rectangles englobants.

D. Passage raster -> vecteur : vectorisation


E. Passage vecteur -> raster : rasterisation
F. La cohabitation raster / vecteur dans les SIG modernes

6. Organisation relative du sémantique et du graphique


Modèle par table : par couche (couverture)
Le codage par couches (layers) est naturel pour la représentation raster. En
effet chaque cellule d’une matrice raster ne peut contenir qu’une seule
valeur, différents attributs géographiques doivent alors être représentés dans
différentes matrices raster géométriquement superposables appelées couches
ou couvertures.

Organisation en couches (couvertures) des données

gilliot@lacan.grignon.inra.fr daa ager ina pg 29 / 139


Structure de l’information spatiale en géomatique

De nombreux systèmes vecteurs utilisent aussi une description par


couverture des données.

Modèle objet
Certains systèmes proposent, parfois artificiellement, de s’affranchir de la
représentation par couverture des données géographiques. Des modèles
inspirés des représentations informatiques orientés objets sont implémentées
dans certains SIG. Il faut noter que la terminologie objet est le plus souvent
un peu abusivement utilisée. En effet elle est le plus souvent utilisée pour
souligner un codage différent de celui par couverture, sans reprendre
réellement le formalisme orienté objet.

7. Représentation de la topologie dans les SIG


On trouve deux catégories de systèmes quant au codage de la topologie :

Codage explicite de la topologie

Dans ce cas lors de la création, suppression ou modification des objets, la


topologie est calculée ou recalculée et conservée dans la base. Les fonctions
utilisant l'information topologique peuvent alors y avoir accès à tout
moment.

Calcul dynamique de la topologie

La topologie n'est pas codée explicitement dans la base. Quand une fonction
a besoin d'information topologique, elle la calcule dynamiquement.

gilliot@lacan.grignon.inra.fr daa ager ina pg 30 / 139


Structure de l’information spatiale en géomatique

IV. Les systèmes de représentations cartographiques


1. Forme de la terre : géoïde et ellipsoïde terrestre
e géoïde est une surface rigoureusement perpendiculaire en tout point à la direction de la
L pesanteur terrestre. La surface des océans est en équilibre, les mouvements de surface
sont négligables par rapport au rayon terrestre, on considère donc que la surface des
océans est confondue avec le géoïde. La surface solide de la terre s'écarte beaucoup plus du
géoïde, toutefois ces déformations sont très faibles, en effet si la terre est représentée par une
sphère de 1,3 m de diamètre, le mont Everest présente à l'échelle, un dénivelé de 0,9 mm. Si
on peut connaître l'altitude en chaque point du globe terrestre, on ne connait
qu'imparfaitement la forme générale du géoïde dans l'espace en trois dimensions.
La surface mathématiquement la plus proche du géoïde est une ellipsoïde de révolution apltie
aux pôles. Plusieurs ellipsoïdes de caractéristiques différentes ont été utilisés au cours du
temps, par les organismes cartographiques nationaux. Chaque réseau géodésique national est
établi à partir d'un point fondamental tel que géoïde et ellipsoïde de référence y sont
tangentes. L'ellipsoïde de Clarke (1880) à été établie à partir du panthéon à Paris. L'ellipsoïde
est définie par son demi-petit axe (rayon équatorial) a et par son demi-grand axe ainsi que par
son aplatissement (a - b) / a. Pour l'ellipsoïde de Clarke :
a = 6 378 249 m
(a - b) / a = 1 / 293,5

2. Localisation géographique des données


Descartésien
Systèmes de coordonnées permettent de localiser un point dans l'espace. Le système
ayant comme origine le centre de la terre n'est pas très utilisé en pratique.

Le système de coordonnées cartésien

Les coordonnées géographiques utilisant, latitude et longitude sont très utilisées. Ce système
permet de repérer n'importe quel point à la surface du globe, mais il fait référence à un espace
en trois dimensions.

gilliot@lacan.grignon.inra.fr daa ager ina pg 31 / 139


Structure de l’information spatiale en géomatique

Le système géographique

3. Projections cartographiques
a seule représentation de la terre qui ne comporte pas de distorsions géométriques est le
L globe terrestre lui même. Les cartes que nous utilisons sont planes et servent à représenter
un espace, qui est à trois dimensions. Une projection de l'espace tridimensionnelle, dans
le plan de la carte, est donc nécessaire. La projection ne peut donner une représentation
parfaite. Le passage de la surface terrestre à sa représentation sur une carte plane, passe par
une étape de projection selon la verticale sur l’ellipsoïde de référence. Cette étape est étudiée
par la géodésie et la topographie. Un système de projection cartographique permet ensuite, de
transposer une portion de cette surface de l’ellipsoïde, sur le plan d’une carte.

Le globe terrestre vu comme un ballon que l'on dégonfle pour le ramener à un plan

On peut définir une projection comme un moyen de correspondance analytique entre les
points (latitude, longitude) de la surface à représenter (l’ellipsoïde terrestre) et le points
homologues du plan cartographique (X,Y), tel que cette correspondance soit continue et
biunivoque.
X = f(latitude, longitude)
Y = g(latitude, longitude)
f et g sont deux fonctions continues qui définissent la projection.
Si on considère un cercle sur la surface de l’ellipsoïde, sa projection sur le plan n’est
généralement pas un cercle, sauf au centre de projection, mais une ellipse appelée l’indicatrice
de Tissot. Les déformations en chaque point sont matérialisés par les axes de l’indicatrice.

gilliot@lacan.grignon.inra.fr daa ager ina pg 32 / 139


Structure de l’information spatiale en géomatique

Projections conformes
On choisit de préserver plutôt les angles donc les formes, en particulier les méridiens et les
parallèles se coupent à angle droit,

Projection conforme

L’indicatrice est une cercle, l’échelle est constante dans toutes les directions au voisinage du
point. L’altération de l ‘échelle augmente au fur et à mesure que l’on s’éloigne du centre de
projection.
Projections équivalentes

Projection équivalente
On choisit de préserver les surfaces, l’indicatrice est une ellipse, l’échelle est variable selon
les directions.

Il existe un grand nombre de projections et différentes façon de les classer, par exemple selon
la forme de la surface de projection utilisée.

A. Projection conique de Lambert


e système Lambert est largement utilisé en France. C'est une projection conforme sur un
L cône tangent à un parallèle. Pour réduire les erreurs de projection quatre zones dénommés
Lambert I, Lambert II, Lambert III, Lambert IV, sur quatre parallèles du nord au sud
(Compiègne, Châteauroux, Avignon, Corse). Pour des échelles plus petites couvrant tout le
territoire, une projection unique dite Lambert étendu est utilisée.

gilliot@lacan.grignon.inra.fr daa ager ina pg 33 / 139


Structure de l’information spatiale en géomatique

Projection conique conforme de Lambert

B. Vers un nouveau système de référence géographique en France

L a réunion plénière du Conseil National de l'Information Géographique


tenue le 29 avril 1997 a approuvé le principe de changement du système
de référence et de la projection réglementaire français. Au titre de l'arrété
de 1948, le système actuel repose sur la NTF, Nouvelle Triangulation de la
France, élaboré de 1898 à 1991 par l'IGN par méthodes classiques. Les
coordonnées géographiques sont définies en grades avec un méridien origine
à Paris et les projections sont la projection Lambert en 4 zones.

La modification réglementaire prévue aura lieu dès que l'ensemble des


mesures d'accompagnement seront prètes (outils logiciels de passage d'un
système à l'autre, supports documentaires informatifs) c'est à dire fin 1998
au plus tard.

Le nouveau système de référence sera RGF93 composante française du système européen


EUREF, totalement similaire pour les usages courants à WGS84. Les coordonnées
géographiques y seront définies en degrés avec origine Greenwich. Une projection unique
Lambert93 couvrira l'ensemble du territoire national.

C. Projection cylindrique de Mercartor


La projection se fait sur un cylindre tangent à l'équateur.

projection cylindrique de Mercartor

gilliot@lacan.grignon.inra.fr daa ager ina pg 34 / 139


Structure de l’information spatiale en géomatique

Comme les méridiens ne sont pas concourants dans la projection de mercator, les
déformations sont assez importantes aux pôles. La projection de Robinson permet d'atténuer
un peu ces déformations.

projection pseudo-cylindrique de Robinson

Projection cylindrique transverse de M ercator : UTM

La projection Universal Transverse M ercator (UTM ) se fait sur un cylindre tangent à un


méridien. Cest le système largement utilisé en Amérique du nord.

D. Projection azimutale

projection azimutale

E. Cas particulier des planisphères


La représentation cartographique de l'ensemble du globe terrestre, sans séparation en fuseau,
hémisphères ou zones n'est possible qu'à condition d'accepter que certaines parties de la carte
seront très déformées.

gilliot@lacan.grignon.inra.fr daa ager ina pg 35 / 139


Structure de l’information spatiale en géomatique

Projections étoilées

Projection interrompue de Goode Projection interrompue de Cahill


Différentes projections planisphériques

Les altérations sur la carte sont d’autant plus importantes, que la surface terrestre à représenter
est plus importante. Pour les superficies peu importantes ( < 10 km2) le choix du type de
projection n’est pas très important, pourvu qu’elle soit centrée sur la zone à cartographier.
Une simple projection topographique (sur un plan tangent) est suffisante. Plus on s’éloigne du
centre de projection plus les altérations augmentent. Pour la projection conique conforme de
Lambert l’altération linéaire est approximativement :

∆y
2

2 avec R le rayon terrestre (6371 km) DY la différence de latitude en km.


2R

A 200 km du parallèle de projection le rapport est d’environ 1 / 2000 qui est la valeur limite
de précision sur une distance. Il apparaît ici la notion de champ de projection, c’est l’étendue
pour laquelle le système choisi présente des altérations inférieures à un seuil fixé a priori.

gilliot@lacan.grignon.inra.fr daa ager ina pg 36 / 139


Les bases de données du marché

Les bases de données du marché


I. Les types de données géographiques
1. Référentiels cartographiques
Raster (cartes scannées) / Vecteur (carte structurées)

Primitive graphique
vectorielle

Information structurée
en thèmes
éditables modifiables

Information structurée / objet =


accès à 1 polygone

1 thèmes raster
pixel

Pas d’information structurée / objet


=
accès à 1 pixel

Les cartes servant de référentiel (ign, michelin, cadastre) existent en format


raster et vecteur. Les cartes raster ne peuvent pas être utilisées pour des
traitements et servent généralement pour localiser les autres thèmes du sig
et pour faire de l’habillage cartographique. Les cartes vecteurs sont
découpées en thèmes (routes, occupation du sol, …) et sont utilisables pour
des traitements (requêtes) car structurées en objet.

gilliot@lacan.grignon.inra.fr daa ager ina pg 37 / 139


Les bases de données du marché

2. BD du milieu
De nombreuses cartographies du milieu ont été numérisées afin d’être
intégrées dans les SIG. occupation du sol (Corine), géologie (BRGM) pédologie
(INRA) …

3. Images satellitales et photographies aériennes


Ces images sont des données privilégiées pour la cartographie des milieux
naturels. Elles
présentent l’avantage de
l’exhaustivité spatiale,
en effet la zone d’étude
est décrite en chaque
point (pixel). Lors d’une
cartographie de terrain,
seuls les points « visités »
sont décrits à charge
pour le cartographe de
spatialiser ces
informations ponctuelles
à travers de ses plages
cartographiques.

Image Spot XS résolution 20m

Par rapport au photo. aérienne, la résolution « modeste » des satellites (10,


20, 30m) en limite l’utilisation pour des cartographies précises, comme en
milieu urbain. Toutefois cette situation est amenée a évoluée rapidement
avec la nouvelle génération de satellite à haute résolution (2,5m à 1m).

Photo. Aérienne résolution 1m

gilliot@lacan.grignon.inra.fr daa ager ina pg 38 / 139


Les bases de données du marché

4. Données cartographiées au GPS

Les systèmes GPS et DGPS ont apportés un grand progrès pour


la localisation précise et « automatique » de données de terrain.
Les cartes de rendement, acquises dans le cadre de l’agriculture
de précision, sont par exemple localisées point à point grâce a ce
système.

carte de rendement parcelle « coin du mur » Grignon 78

5. MNT Modèle Numérique de Terrain : DEM Digital Elevation Model


Le modèle numérique de terrain fournit une information altimétrique, c’est
une représentation numérique simplifiée de la surface du territoire. Intégrée
dans le SIG cette information joue un rôle très important dans les méthodes
d’analyse spatiale en particulier pour la prise en compte de la morphologie
du terrain.
Il existe de nombreuses représentations possible des surfaces sous forme de
MNT dans les SIG, les deux formes essentielles recouvrent celles vues
précédemment à savoir raster et vecteur.

MNT raster MNT vecteur

gilliot@lacan.grignon.inra.fr daa ager ina pg 39 / 139


Les bases de données du marché

MNT raster
Un MNT raster est une matrice d’altitudes. Il s’agit d’un ensemble de valeurs
numériques, régulièrement espacées . Chaque valeur d’altitude représente
une moyenne d’un élément de surface de terrain. Cette distribution définit
un maillage de la surface, la dimension de la maille définit la résolution
planimétrique du MNT. Chaque point est au centre de la maille. Plus la
résolution est grande plus le MNT est riche en détails topographiques. Les
MNT raster peuvent être produit par différentes méthodes et à partir de
source de données diverses :
à partir de courbes de niveau
On numérise des courbes de niveau d’une carte papier qui donnent un
ensemble d’arcs. On détermine ensuite les intersections de ces arcs avec le
maillage du MNT à produire. On obtient un ensemble de points côtés. Cet
ensemble sert de point de départ à une interpolation des altitudes en chaque
point du maillage afin de produire l’ensemble du MNT recherché. Selon la
densité des courbes de niveau et la méthode d’interpolation utilisée des biais
apparaissent. L’utilisation des points côtés des cartes en plus des courbes de
niveau peut permettre d’améliorer un peu la qualité du MNT. La précision
obtenue correspond en moyenne à la demi équidistance entre les courbes
initiales. Pour des courbes séparées en moyenne de 50 m on obtient un MNT
précis à 25 m.
à partir de photographies aériennes
Il s’agit d’un long travail de photo-interprétation à l’aide de couples d’images
stéréoscopiques et d’un stéréo-restitueur.
à partir d’images numériques, satellitaires le plus souvent
Il s’agit de méthodes automatiques de traitement d’images permettent de
calculer l’altitude à partir d’un couple d’images stéréoscopiques numériques.
Le principe repose sur la recherche automatique pour tout pixel de l’une des
images de son homologue dans l’autre image du couple stéréoscopique.
Connaissant la position des deux pixels on en déduit la parallaxe, puis
connaissant l’altitude et l’angle de prise de vue on en déduit l’altitude du
point.

MNT vecteur
L’alternative à une représentation raster est une représentation vecteur par
une couverture polygonale. Le plus souvent, pour les MNT, le pavage de la
surface est réalisé sur la base de triangles, on parle de triangulation. Ces
MNT sont le plus souvent construit à partir d’un semi de points irrégulier,
dont la densité augmente avec la complexité du relief. Un tel découpage
irrégulier reposant sur des triangles non recouvrant (tessellation de
triangles) est souvent appellée : TIN (Triangulated Irregular Network).
Différentes méthodes de découpage de l’espace peuvent être utilisée pour
produire ces MNT, telle que la triangulation de Delaunay. Pour des données
provenant de courbes de niveau, on préférera d’autres algorithmes afin
d’éviter de relier trois points d’une même courbe pour réaliser la
triangulation.

gilliot@lacan.grignon.inra.fr daa ager ina pg 40 / 139


Les bases de données du marché

Choix raster / vecteur


Le choix va surtout dépendre des données dont on dispose et des possibilités
du logiciel utilisé. Tous les logiciels ne savent pas utilisés les TIN alors que la
plupart peuvent lire des images (raster) donc au moins afficher le MNT dans
ce mode. Dans les deux cas il s’agit de données lourdes à manipuler.
Précision d’un MNT
La précision finale du MNT dépend des données utilisées et de la méthode
mis en œuvre pour le fabriquer. Les TIN peuvent s’avérer plus précis que les
raster puisqu’on peut densifier la couverture en fonction du relief.
Visualisation des MNT

Le MNT affiché en niveau de gris

Le MNT affiché avec ombrage

gilliot@lacan.grignon.inra.fr daa ager ina pg 41 / 139


Les bases de données du marché

Le MNT en vue 3D « mode fil de fer »


Informations dérivées
A partir de l’information altimétrique du MNT des cartes dites dérivées vont
pouvoir être calculées, en particulier dans un objectif d’analyse
morphologique du milieu, comme par exemple : cartes de pentes, cartes
d’orientation et d’ensoleillement, cartes d’intervisibilité, Bassins versants,
Profils, coupes de terrain …

II. Les bases de données disponibles en France


Bases de l'IGN
L'Institut Géographique National : IGN

L 'IGN créé en 1940 puis transformé en établissement public en 1967, est


chargé de couvrir la cartographie du territoire français et d'en assurer la
mise à jour. Il est ainsi l'héritier direct du service géographique des armées.
Au début des années 80, L'IGN s'engage résolument dans une véritable
mutation technologique qui débouche sur la réalisation de la cartographie
numérique.
Les produits IGN sont généralement soumis à une TVA de 5,5 %.
La base de données Cartographiques : BD CARTO
G râce à sa précision de l'ordre décamétrique, la BD Carto constitue le
référentiel pour des échelles d'applications de l'ordre du 1/ 100 000e.
Elle est constituée par numérisation des fonds IGN au 1 / 50 000e et par
interprétation des images SPOT et est composée de 9 thèmes :
provenant des cartes IGN au 1/ 50 000
! réseau routier
! réseau ferré
! réseau hydrographique
! intersection des réseaux
! réseau de transport EDF
! limites administratives
! objets isolés, équipements
provenant des images Spot
! occupation du sol
provenant de la BD Alti (optionnel)
! relief

gilliot@lacan.grignon.inra.fr daa ager ina pg 42 / 139


Les bases de données du marché

Une mise à jour des données tout les 1 à 3 ans selon les thèmes. La
coexistence de différentes versions peut toutefois poser certains problèmes
de cohérence logique et géographique.
La couverture du territoire national par la BD carto est actuellement
effective.

Elle peut être fournie en mode objet, c'est à dire structurée topologiquement
et sémantiquement ou en mode dessin.
Les formats informatiques sont : EDIGéO ou ArcInfo pour le format objet et
DXF pour le format dessin.
HT / km2 HT / département moyen 5000
km2
Thèmes dessin objet dessin objet

réseau routier 7,5 21,4 37 500 107 000


réseau ferré 0,7 2,4 3500 12 000
hydrographie 6,9 18,8 34 500 94 000
limites administratives 0,35 1 1750 5000
réseau électrique 1 1 5000 5000
occupation du sol 10 10 50 000 50 000
+ toponymie
Total 26,45 54,6 132 250 273 000

Le volume des fichiers informatiques est de l'ordre de 0,004 MO / km2 pour


la version objet (format ArcInfo) et 0,003 MO / km2 pour la version dessin
(dxf), soit pour un département moyen de 5000 km2, 20 MO et 15 MO
respectivement.

La base de données topographiques : BD TOPO


L a BD Topo est la base la plus détaillée des produits Ign. Elle est réalisée
par saisie photogrammétrique de photographies aériennes de l'IGN au 1 /
20 000, contrôlées par des passages sur le terrain par les opérateurs de
l'IGN. Grâce à sa précision métrique, la BD Topo
ambitionne d'être la référence géographique pour
les applications au niveau de la commune ou du
groupe de communes. La BD Topo fournie l'altitude
de tous les objets, et fournie une information
identique aux cartes Ign au 1 / 25 000.

Vue la précision visée par la BD Topo, sa


réalisation est un travail à long terme, et seul
environ 10% du territoire national est actuellement
couvert. L'Ign projette de terminer la couverture complète vers 2010.
HT/km2 HT HT
département moyen 5000 km2 agglomération
BD Topo O bjet 1775 8 875 000
BD Topo Dessin 3D 1025 5 125 000
BD Topo Dessin 2D 600 3 000 000

Altimétrie objet 425 2 125 000


Altimétrie dessin 300 1 500 000

gilliot@lacan.grignon.inra.fr daa ager ina pg 43 / 139


Les bases de données du marché

Le volume des fichiers informatiques est de 0,8 à 1,1 Mo/km2 pour la


version objet et de 0,3 à 0,7 Mo/km2 en version dessin.

La base de données altimétriques : BD ALTI


La BD Alti est l'ensemble des courbes de niveaux et
des points côtés des cartes IGN numérisées. Elle est
disponible sous forme de Modèle Numérique de
Terrain (MNT), avec un pas de 50 à 1000 m.
Anciennement son utilisation était soumise à
autorisation administrative, mais ce n'est plus le cas
actuellement. Le coût de la BD alti dépend du pas
choisi, pour un département moyen de 5000 km2
cela représente 106 700 HT au pas de 50m.
Les bases de données routières
Ce sont les bases de données dédiées pour les applications routières :
navigation embarquée, gestion de flotte, planification et simulation.
Route 120 et Route 500
Ces deux bases routières sont dérivées de la BD
Carto par généralisation du réseau routier. Elles sont
mise à jour tous les ans. Route 120 comprend 120
000 km de routes, elle est utilisée pour des
applications à l'échelle nationale, son coût est de 20
000 HT pour la France entière.
Route 500 comprend 500 000 km de routes, elle est
utilisée pour des applications à l'échelle régionale,
son coût est de 75 000 HT pour la France entière, 40
000 HT environ pour une région et 10 000 HT
environ pour un département.
Géoroute
Géoroute décrit le réseau routier classé et toute la voirie des unités urbaines
de plus de 100 000 habitants. Elle est réalisée à partir des cartes IGN au 1 /
25 000e, de photographies aériennes et de la BD Topo. Elle est complétée par
des passages sur le terrain d'opérateurs.
En zone rurale elle reprend la BD Carto, en zone urbaine elle intègre les
adresses postales, les sens de circulation et la équipements. Une vingtaine
d'agglomérations sont disponibles.
Elle est disponible au format EDIGéO ou au format DXF.
Son coût pour une agglomération moyenne est d'environ 50 000 HT à 250
000 HT selon les versions.

Base de données des toponymes


Il s'agit de la Base de Données Toponymiques de l'Ign, elle permet de
localiser les toponymes (noms des lieux-dits, des écarts ...) figurant sur la
carte au 1:25 000. Les domaines d'utilisation sont par exemple :
- cartographie
- incendies et secours, livraisons, ramassage : recherche de
localisation des lieux-dits

gilliot@lacan.grignon.inra.fr daa ager ina pg 44 / 139


Les bases de données du marché

Elle peut être fournie au format DBase III ou ASCII alphanumérique IGN, des
extractions géographiques sont possibles, le seuil minimum d'achat est le
département.
Le prix de ce produit est :

- fichier kilométrique : 30 000 FHT/département


- fichier hectométrique : 75 000 FHT/département
les données ne peuvent être utilisées pour une cartographie commerciale
grand-public

GeoFLA Fichier des limites administratives


Le fichier des Limites Administratives donne la description des unités
administratives françaises (de la commune à l'Etat). Les données sont mises
à jour annuellement. Le fichier couvre les quelque 36
000 communes de France. La précision des attributs
est celle des données INSEE

Les unités administratives fournies sont : limites de


communes, cantons, arrondissements,
départements, régions, Etat, les informations
descriptives sont : nom, Ndeg. INSEE, surface,
centroïde, altitude, coordonnées du chef-lieu.

Le système de référence géographique est le Lambert II étendu, avec une


précision de quelques centaines de mètres.

Le fichier de environ 8 Mo, est de nature vecteur topologique


Des produits dérivés du fichier de base existent :
- extractions par département possibles
- fichier limites de communes
- fichier limites de canton
- fichier limites de départements
- option fichiers associés : toponymes, centroïdes, altitudes,
population, surfaces, ...

exemples de prix :
fichier "France par communes" : 41 000 F HT.
fichier "France par départements" : 3 600 F HT

Répertoire géographique des communes


C'est un fichier d'informations numériques géographiques et administratives
des communes françaises (métropole). Il donne principalement la position
géographique (x, y) du chef-lieu de commune (mairie) couplée à des
renseignements d'ordre administratif. le fichier concerne les 36 000
communes de France.

gilliot@lacan.grignon.inra.fr daa ager ina pg 45 / 139


Les bases de données du marché

Le système de coordonnés peut être Lambert II étendu ou Lambert zone, en


mètre, degré ou grade. C'est un fichier alphanumérique d'environ 4 Mo,
format ASCII.
Différentes formes de mise à disposition sont possibles : par ordre
alphabétique, par département, par tranche de population, par classification
administrative, par code INSEE
les données ne peuvent être utilisées pour une cartographie commerciale
grand-public .

Le prix est de 16 000 FHT pour la France entière


Les cartes scannées
Contrairement au produits précédents qui étaient tous sous forme vecteur, il
s'agit ici d'un produit raster (image). Il ne s'agit pas d'un produit structuré
thématiquement mais d'une simple "photocopie" des cartes papiers IGN. Il
peut être utilisé dans les SIG comme image en fond
de plan, pour vectoriser "manuellement" des
thèmes directement sous le sig, avec l'image de la
carte en fond de plan. Comme référence pour le
recallage géographique d'images satellites ou de
photographie aériennes.
Le 1 /50 000 SCAN 50 couleurs
Il s'agit du 1/ 50 000e IGN scanné à 250 dpi, en
couleurs (24 bits), une feuille orange (55x40 cm)
représente 33 Mo de données. Le coût d'une carte
est de l'ordre de 4800 HT.
Le 1/25 000 : ½ série bleue en couleurs
Il s'agit du 1/ 25 000e IGN scanné à 250 dpi, en couleurs (8 bits ou 24 bits).
Un fichier représente une demi feuille de 25 000 soit 33 Mo, son coût est de
l'ordre de 3000HT.
Le 1/25 000 CARTONUM en noir et blanc
Il s'agit du 1/ 25 000e IGN scanné à 1000 dpi, en monochrome, mais
uniquement de la planimétrie et de l'hydrographie. Un fichier représente
10km x 10km et occupe 20 Mo, son coût approximatif est de 5700HT.
Droit de scannage et de vectorisation
En effet, il faut savoir que si un usager entreprend de scanner et de
vectoriser lui même, des cartes IGN, ces opérations sont soumises à un droit
commercial, que l'on doit acquitter à l'IGN.

Produits droit de scannage HT droit vectorisation HT

1/25000 ½ feuille 2000 4000


1/25000 feuille entière 4000 8000
1/25000 TO P 25 4800 9600
1/50 000 3000 6000
1/100 000 2500 5000
1/250 000 1500 3000

gilliot@lacan.grignon.inra.fr daa ager ina pg 46 / 139


Les bases de données du marché

Bases Michelin

D e même que l'Ign, Michelin propose des bases de données vecteurs et


des produits scannées de ces cartes. Les bases sont disponibles en deux
versions : détaillée comprenant tous les objets avec tous leurs attributs;
"light" comprenant tous les objets mais avec seulement une sélection de
certains attributs.
Paris et Banlieu 1/10 000 et 1/15 000

France entière 1/200 000


France entière 1/1000 000
Europe 1/400 000

Produits SPOT
L es données issues du satellite Spot, sont disponibles sous forme
analogique (tirage papier) mais aussi sous forme numérique (CD-ROM)
pouvant permettre leurs intégrations dans un SIG. Deux
grandes familles de produits existent, les scènes Spot et les
spatiocartes SpotView.

Autres produits satellitaires

Inventaire Forestier National : IFN

Institut Français de l'Environnement : IFEN


Corine land cover
P armi les projets du programme de Coordination de l'information sur
l'environnement CORINE de la commission de l'Union Européenne, géré
aujourd'hui par l'Agence Européenne de l'Environnement, l'inventaire "land
cover" a pour objectif de dresser une cartographie numérique de l'occupation
bio-physique des sols à l'échelle du 1 / 100 000e . Cet inventaire est effectué
à partir d'images satellitaires SPOT ou Landsat, par photo-interprétation
assistée par ordinateur. Une nomenclature standard en 3 niveaux a été
adoptée à l'échelle de l'Europe. Un niveau 4 et 5 pour le 50 000e et le 25
000e sont parfois utilisés. Un seuil de précision minimal de 25 ha, est ainsi
obtenue.

L'utilisation des données Corine se développe en France. De nombreux


organismes les utilisent, DIREN, DDAF, DDE, IFREMER ...
Les domaines d'application vont de l'analyse paysagère à la gestion des
risques, des études d'impact globales à la caractérisation de zones
naturelles, ou bien encore de l'aide à la gestion des ressources naturelles en
eau et à l'analyse de la diversité écologique.

gilliot@lacan.grignon.inra.fr daa ager ina pg 47 / 139


Les bases de données du marché

L'interprétation réalisée par une équipe de photo-interprétes regroupés à


l'IFEN, après numérisation, est mise en cohérence spatiale et sémantique
avec la BD Carto de l'IGN, en collaboration avec ce dernier.
Les produits CORINE land cover
L'occupation des terres en France
Cette carte de l'inventaire environnemental
CORINE land cover, présente 44 modes
d'occupation des terres identifiés par photo-
interprétation d'images satellitales.
Reproduite sur ce document à l'échelle du
millionième, la base de données numériquesa été
élaborée au 1:100 000, avec des unités
cartographiées de 25 hectares.

o Poster (Format 100 x 125 cm) :


119 F + 10 F de frais d'envoi

o Carte pliée : 94 F + 10 F de frais


d'envoi

Les cartes au 1:100 000

Ces restitutions papier reproduisent à la demande une zone


extraite à l'échelle du 1:100 000 sous forme de cartes muettesoù
seule figure l'occupation des terres répertoriée dans la base de
données CORINE land cover.
o Format d'extraction (60 x 40 cm) : 84 francs + 10
F de frais d'envoi

La base de données CORINE land cov er

o Source : images satellitales LANDSAT et SPOT (datant de 1987 à 1994)

o Méthode : photo-interprétation des images satellitales, assistance de données


exogènes (photographie aériennes, cartes, ...), nomenclature emboîtée en 3
niveaux, 44 postes au niveau le plus fin

o Contraintes : échelle d'interprétation de 1:100 000, seuil surfacique minimal de 15/25


hectares selon les thèmes, largeur de 100 mètres minimum pour les objet linéaires

o Base de données géographique : couvre le territoire des 22 régions administratives


métropolitaines, contient au total environ 450.000 objets surfaciques topologiques
(décrits par leur superficie, périmètre, code d'occupation du sol tiré de la
nomenclature et par deux identifiants)

o Diffusion commerciale : par département avec zone tampon de 5 kilomètres


entourant chaque département

o Format de liv raison : CD Rom au format Export d'Arc/Info (.e00) fourni avec
documentation technique

o Coût de mise à disposition (par CD Rom) : 1794 F + 10 F de frais d'envoi (par


département)

gilliot@lacan.grignon.inra.fr daa ager ina pg 48 / 139


Les bases de données du marché

1. Territoires artificialisés
1.1. Zones urbanisées

1.1.1. Tissu urbain continu


1.1.2. Tissu urbain discontinu

1.2. Zones industrielles ou commerciales et réseaux de communication

1.2.1. Zones industrielles et commerciales


1.2.2. Réseaux routier et ferroviaire et espaces associés
1.2.3. Zones portuaires
1.2.4. Aéroports

1.3. Mines, décharges et chantiers

1.3.1. Extraction de matériaux


1.3.2. Décharges
1.3.3. Chantiers

1.4. Espaces verts artificialisés, non agricoles

1.4.1. Espaces verts urbains


1.4.2. Equipements sportifs et de loisirs

2. Territoires agricoles
2.1. Terres arables

2.1.1. Terres arables hors périmètres d'irrigation


2.1.2. Périmètres irrigués en permanence
2.1.3. Rizières

2.2. Cultures permanentes

2.2.1. Vignobles
2.2.2. Vergers et petits fruits
2.2.3. Oliveraies

2.3. Prairies

2.3.1. Prairies

2.4. Zones agricoles hétérogènes

2.4.1. Cultures annuelles associées aux cultures permanentes


2.4.2. Systèmes culturaux et parcellaires complexes
2.4.3. Territoires principalement occupés par l'agriculture, avec présence de
végétation naturelle importante
2.4.4. Territoires agro-forestiers

gilliot@lacan.grignon.inra.fr daa ager ina pg 49 / 139


Les bases de données du marché

3. Forêts et milieux semi-naturels


3.1. Forêts

3.1.1. Forêts de feuillus


3.1.2. Forêts de conifères
3.1.3. Forêts mélangées

3.2. Milieux à v égétation arbustiv e et/ou herbacée

3.2.1. Pelouses et pâturages naturels


3.2.2. Landes et broussailles
3.2.3. Végétation sclérophylle
3.2.4. Forêt et végétation arbustive en mutation

3.3. Espaces ouv erts, sans ou av ec peu de v égétation

3.3.1. Plages, dunes et sable


3.3.2. Roches nues
3.3.3. Végétation clairsemée
3.3.4. Zones incendiées
3.3.5. Glaciers et neiges éternelles

4. Zones humides
4.1. Zones humides intérieures

4.1.1. Marais intérieurs


4.1.2. Tourbières

4.2. Zones humides maritimes

4.2.1. Marais maritimes


4.2.2. Marais salants
4.2.3. Zones intertidales

5. Surfaces en eau
5.1. Eaux continentales

5.1.1. Cours et voies d'eau


5.1.2. Plans d'eau

5.2. Eaux maritimes

5.2.1. Lagunes littorales


5.2.2. Estuaires
5.2.3. Mers et océans

gilliot@lacan.grignon.inra.fr daa ager ina pg 50 / 139


Les bases de données du marché

Direction Générale des Impôts (DGI) - Cadastre


Plan cadastral informatisé

D es conventions de numérisation du cadastre ont été conclues dans


certains département entre le conseil général, certaines communes et la
Direction Générale de Impôts, tutelle du cadastre.
couche incomplète
La couche cadastrale incomplète, dite couche 0+, est la numérisation du
plan cadastral (contenu partiel du plan cadastral graphique en particulier,
absence du parcellaire).
Le fichier est constitué à la demande, les objets présents sont :
limites administratives, limites de voies de toute nature, bâtiments,
voies-ferrées, hydrographie, points de canevas, toponymie.
Il s'agit d'un fichier vecteur, d'une taille d'environ 200 Ko par feuille
cadastrale.
Le format est DXF actuellement, EDIGEO à terme. des extractions
géographiques par sections cadastrales sont possibles.

Couche complète
La couche cadastrale complète dite couche 1, est l'ensemble du contenu du
plan graphique. le fichier existe sur les zones où une convention de
numérisation a été passée avec la DGI.
Le contenu en est :
limites administratives, parcelles, subdivisions fiscales, bâtiments, détails
topographiques, points de canevas, voies, hydrographie, toponymie ...

A terme, le fichier couvrira l'ensemble de la France. La zone couverte au


01/01/1993 est celle où des conventions ont été signées, soit 1,8 millions
d'hectares. Il n'y a pas d'échéancier prévu (fonction du rythme des
conventions).

Le fichier vecteur a une taille de 500 Ko environ par feuille de plan cadastral.
Actuellement, le format d'échange est celui du signataire de la convention
concernée, à terme ce sera le standard de la DGI qui s'appuiera sur EDIGÉO.
Les extractions géographiques sont possibles par sections cadastrales.
Fichier des propriétaires
Il permet d'identifier, au niveau de la commune :
- les personnes physiques ou morales titulaires de droits réels
immobiliers.
- les gestionnaires chargés par ces personnes de régler le montant des
impôts et taxes
afférents à ces immeubles.
- les fonctionnaires ou employés publics logés dans des immeubles
exonérés de taxe
foncière, mais passibles de la taxe d'enlèvement des ordures ménagères.

Une correspondance avec les autres fichiers fonciers est assurée par le
numéro communal de propriétaire.

gilliot@lacan.grignon.inra.fr daa ager ina pg 51 / 139


Les bases de données du marché

Les informations sont issues :


- des actes notariés
- de tournées en commune
Les données du fichier correspondent à la situation au 1er janvier de chaque
année.
Le fichier a une couverture nationale depuis 1956 (la formalité de publicité
foncière étant devenue obligatoire).
Ce produit est réservé aux : collectivités territoriales, administrations et
organismes sous contrôle public.
Structuration en base de données relationnelle (système MAJIC, 28 millions
d'enregistrements).
le demandeur doit souscrire à des règles de confidentialité, la cession à des
organismes tiers est interdite, s'agissant d'un fichier nominatif, le
demandeur doit demander l'avis de la CNIL.
Fichier des propriétés bâties et non bâties
Il s'agit du recensement des propriétés : parcelles et locaux
fichier des propriétés bâties (38 millions d'enregistrements):
objet décrit : local donné
attributs : code de la commune, références cadastrales, identification du
local, numéro du propriétaire, caractéristiques physiques du local,
évaluation du local.

fichier des propriétés non-bâties (100 millions d'enregistrements):


objet décrit : parcelle donnée
attributs : code de la commune, références cadastrales, numéro communal
du propriétaire, contenance, nature de culture, classe, revenu.
Il y a des conditions de confidentialité.

Fichier Annuaire Topographique Initialisé Réduit FANTOIR


Fichier ANnuaire TOpographique Initialisé Réduit (FANTOIR). Fantoir
correspond au fichier Rivoli : Répertoire Informatisé des VOies et LIeux-dits.
Il est donc prévu pour une gestion des adresses.
objets décrits : commune, voies, lieux-dits, canaux, rivières, voies-ferrées,
autoroutes, ensembles immobiliers
attributs : codification propre à chaque type d'objet, gestion historique
(entité annulée ou active).
Le fichier contient 6,7 millions d'articles de fichiers dont 900 000 rues, 5,7
millions de lieux-dits.
Stéréominute numérique
C'est le fichier issu de la restitution photogrammétrique des plans
cadastraux de remaniement.
Les objets décrits sont : bâtiments, voirie et détails topographiques divers
(murs, clôtures, talus, pièces d'eau, mobilier urbain, ...)
Le fichier vecteur, d'une taille de quelques kilo-octets par section cadastrale,
est au format LORA (interne à la DGI).

gilliot@lacan.grignon.inra.fr daa ager ina pg 52 / 139


Les bases de données du marché

Bureau de Recherches Géologiques et Minières : BRGM


Banque de données du sous-sol

E lle fournie des informations générales, scientifiques et techniques


relatives aux sondages, forages, puits, gîtes minéraux en France.
Les thèmes couverts sont : géologie, hydrogéologie, gîtes minéraux,
environnement.
Domaines d'utilisation : ressources en eau, aménagement et urbanisme,
construction, recherche de matériaux, recherche de minéraux métalliques.
Sous système de gestion de base de données ORACLE
Banque de données gravimétriques française
Valeur de la gravité et de l'anomalie de Bouguer mesurées lors des
campagnes de gravimétrie.
objet décrit: Stations gravimétriques
attributs : X Y en système Lambert II étendu, altitude du sol, g observé,
Valeur de l'anomalie , de Bouguer, topographique.
Sous système de gestion de base de données ORACLE
Institut National Agronomique : INRA
Inventaire Gestion et Conservation des Sols : IGCS
Le programme IGCS est sous la co-responsabilité de la Direction de l’Espace Rural et de la
Forêt (DERF, M inistère de l’Agriculture), de
l’INRA et des Régions qui y participent.
L’objectif est de disposer d’une couverture
harmonisée à l’échelle du 1:250 000 couplée avec
une connaissance précise de petits secteurs de
références à l’échelle du 1:10 000. Ces secteurs
sont choisis comme représentatifs des principaux
types de sols dans une région. Ils servent de sites
expérimentaux pour des questions agricoles ou des
problèmes environnementaux (voir pour plus de
détails le programme OSR).
L'accès aux données est dépendant d'un accord
entre les différents partenaires. Les demandes
peuvent être faites auprès du SESCPF (condition
d'accès aux données).

Programme S IS E

S ystème d'Information des S ols d'Europe (1/1 000 000)

Le programme SISE est un programme de l'Union


Européenne pour lequel l'INRA-SESCPF
participe d'une part en tant que collaborateur pour
le territoire français et d'autre part en tant qu'animateur
scientifique pour l'ensemble de l'Europe en partenariat avec le
Bureau Européen des Sols de la Commission (CCR Ispra).
Pour la France, l'information sur les sols couvre l'ensemble du
territoire métropolitain sous la forme d'une base de données géographique. L'échelle nominale

gilliot@lacan.grignon.inra.fr daa ager ina pg 53 / 139


Les bases de données du marché

est celle du 1/1 000 000. L'information est issue d'une expertise correspondant à une synthèse
et une généralisation de travaux cartographiques détaillés (en particulier, cartes 1/100 000
dans le cadre du programme CPF). De nombreuses données sont donc issues d'estimation et
ainsi sujettes à critique. Une présentation détaillée de la base de données est proposée comme
exemple d'usage des données cartographiques de sols (accès à l'exemple). Pour le territoire
français, les données sont disponibles auprès du SESCPF après présentation d'un projet et avis
d'un comité scientifique (condition d'accès aux données). Pour le territoire européen, il faut se
renseigner auprès du Bureau Européen de sols (CCR-Ispra).

Programme CPF Carte Pédologique de France (1/100 000)

Le programme CPF est un programme de


connaissances scientifiques sur la diversité et la
distribution des sols de France. Il est sous la
responsabilité de l'INRA mais il engage de
nombreux autres partenaires (CNRS, Universités,
Chambres d'Agriculture, sociétés d'aménagement,
etc.).
Son objectif est d'établir les lois de répartition des
sols sur la base de leurs facteurs de formations que
sont le matériau géologique, la géomorphologie, le
climat, la végétation et les actions anthropiques. Le
choix des secteurs d'étude est réalisé en fonction
des problématiques scientifiques couplées aux
problèmes agricoles et environnementaux
rencontrés. Le programme CPF permet de disposer
de cartes détaillées sur ces secteurs mais il permet
surtout de disposer des connaissances fondamentales nécessaires à des travaux de
généralisation à l'échelle régionale ou nationale.
Les résultats se présentent sous la forme de cartes publiées à l'échelle du 1/100.000 sur fond
topographique IGN, accompagnées de notices explicatives. Ces documents sont en vente
auprès de INRA-Editions (condition d'accès aux données). L'informatisation des données
anciennes est dans une phase expérimentale. Ces données sont donc rarement disponibles sous
cette forme numérique.

Programme CDTA : Programme Cartes Départementales des Terres Agricoles


Programme OSR Opération Secteurs de Référence

Conseil Supérieur de la Pêche : CSP

Banque hydrobiologique et piscicole

L a BHP (Banque hydrobiologique et piscicole) a pour objet de gérer les


données biologiques et piscicoles des cours d'eau, de faciliter la gestion et
le suivi de la qualité des eaux au moyen de l'hydrobiologie.
Le projet lancé en 1987-1988 dans le cadre des groupes de travail sur la
Qualité des Eaux de Surface et à l'initiative du ministère de l'Environnement
et du Conseil supérieur de la pêche.

gilliot@lacan.grignon.inra.fr daa ager ina pg 54 / 139


Les bases de données du marché

Les thèmes couverts sont : faune piscicole (invertébrés benthiques), espèces


végétales, écologie, caractéristiques morpho-dynamiques du milieu
aquatique.
domaines d'utilisation : qualité biologique de l'eau, gestion piscicole, compte
du patrimoine, état de la faune et de la flore aquatiques.

objets décrits : stations définies sur des cours d'eau (chaque station est
matérialisée par un point de géographiques connues à partir d'une carte au
1:25 000 ou 1:50 000)
attributs : résultats de pêches électriques (poissons), résultats de relevés
hydrobiologiques (invertébrés benthiques), informations sur les captures
(poissons), informations sur les repeuplements (poissons).

Lambert II étendu et/ou latitude - longitude


Système de Gestion de Base de Données Informix sous Unix.SCO
Format d'échange : ASCII

IFREMER

Banque de données géophysique

E lle permet d'assurer la conservation et la diffusion de mesures


bathymétriques et géophysiques. Les données
principalement de la flotte océanographique de l'Ifremer.
proviennent

objets décrits : levés bathymétriques de sondeurs multifaisceaux ou


monofaisceaux, données gravimétriques et mesures de champs magnétiques.
attributs : les positions des mesures sont obtenues à partir des fichiers de
navigation et, pour les profondeurs mesurées à partir de sondeurs
multifaisceaux, les positions relatives des sondes par rapport au navire.
Le champ géographique prévu est mondial, le système de référence
géographique est en coordonnées géographiques, les données sont
répertoriées sur une station de travail SUN/UNIX par un SGBD (Oracle), la
taille du fichier est de plusieurs dizaines de Go.
Données d'océanographie physique
Il s'agit d'archiver des données d'hydrologie et de courantologie.
les données seront répertoriées sur une station de travail SUN/UNIX par un
Système de Gestion de Base de Données relationnel (quelques centaines de
Mo).
Réseau National d'Observation (milieu marin)
Le Réseau National d'Observation (RNO) a pour objet d'évaluer les niveaux et
tendances des polluants et des paramètres généraux de la qualité du milieu
marin.
le RNO a été mis en place par le Ministère de l'Environnement. Coordonné à
l'Ifremer par la Direction de l'Environnement et de l'Aménagement du
Littoral, le RNO a de multiples partenaires, le Ministère de l'Environnement,
le ports autonomes, les laboratoires agréés par le Ministère de la Santé, les

gilliot@lacan.grignon.inra.fr daa ager ina pg 55 / 139


Les bases de données du marché

laboratoires universitaires, l'Institut Pasteur de Lille, le centre scientifique de


Monaco, laboratoire de l'Ifremer.
objets décrits : eau, matière vivante, sédiment
attributs : code identifiant paramètre mesuré, une valeur, un code précision
qualifiant la mesure.
Il est géré sous SGBD de type réseau (IDS II) environ 60 MO.
Ministère de l'Agriculture
IGCS
[IGCS] [Girard,1994]
Recensement général de l'Agriculture

Ministère de l'Environnement
Base Hydro

L a base HYDRO permet le recueil, la conservation et la mise à disposition


des données hydrométriques (hauteurs d'eau et débits des cours d'eau
français), c'est une base nationale et interministérielle.
Objets décrits : stations hydrométriques
Attributs : hauteur d'eau, débits, barèmes de tarage.
Le système de référence géographique est en coordonnées Lambert. (3
disques de 600 Mo)
Corine Land Cover
cf IFEN
Course 1,2,3,4
COURSE 1.2.3 : gestion d'une base de données administratives, techniques
et scientifiques sur les cours d'eau, leurs usages et les aménagements
(ouvrages, prises d'eau, extractions de granulats...) et traitements sur ces
données
COURSE 4 : traitement des procès-verbaux dressés au titre de la police de la
pêche (gestion d'un sommier, suivi de la procédure administratives et édition
bureautique associée aux différentes phases de la procédure réglementaire).
les données ont des origines diverses :
- DDAF (ouvrages, usages, classements réglementaires, rejets, procès-
verbaux...)
- DDE et Services de la Navigation (pour les cours d'eau dont ils ont la
police de l'eau ou de la pêche et les données afférentes)
- Conseil supérieur de la pêche (données piscicoles et
hydrobiologiques de synthèse...)
- Agences de l'eau (Objectifs de qualité et qualité origine des tronçons
de cours d'eau...)
objets : cours d'eau, milieu naturel aquatique, ouvrages.
attributs : description du réseau : liste des cours d'eau, arborescence... ,
informations administratives : numéro d'autorisation, date de mise en
service... , informations écologiques (débits moyens, présence d'espèces
piscicoles... ), informations détaillées sur les aménagements existants :
barrages, retenues, prises d'eau, rejets, extractions de granulat, travaux en
rivière...

gilliot@lacan.grignon.inra.fr daa ager ina pg 56 / 139


Les bases de données du marché

COURSE est en Lambert II étendu.


Format d'échange DBase.
INSEE
[insee,1996]
Annuaire statistique de la France
Banque de données locales
Carto
C'est la représentation cartographique du Recensement Général de la
Population de 1990. Elle contient des informations régionales du
Recensement Général de la Population, des données de CIRCE.
Elle concerne l'individu et son logement.
objets décrits : population (rattachement sur fonds de limites
administratives IGN)
attributs : sexe, âge, nationalité, diplômes, situation en matière d'emploi,
lieu de résidence, lieu de travail...
Le Lambert II étendu est le référentiel géographique.
Elle est gérée par un logiciel installé sur PC386 dans les régions (site central
à Orléans qui regroupe toute la France). La taille du fichier est d'environ 5
Go (c'est un sous-ensemble de CIRCE).
Ce sont les données du RGP 90
Circe
C'est le système de diffusion informatique du Recensement Général de la
Population questionnaires remplis par la personne enquêtée, les données
sont datées du 1er mars 1990, l'INSEE vend le droit d'usage de CIRCE. S'il y
a rediffusion de l'information de base, une convention doit être signée. Des
conditions juridiques sont imposées par la Commission Nationale
Informatique et Liberté (CNIL). Les données infracommunales ne sont
délivrées que sur des zones qui comptent plus de 5 000 hts.

Fidel
Sirene
Sirf
Replic

gilliot@lacan.grignon.inra.fr daa ager ina pg 57 / 139


Les bases de données du marché

Météo-France
Aurelhi
Fichier altitude
Fichier pluviométrique
Fichier thermométrique
images radar
normales des stations synoptiques
Satmos master plus
Fichier sol

Distributeurs

DCW Digital Chart of the World

L a carte numérique du monde (DCW) est une base de données spatiales


du monde, à l'échelle du 1 / 1 000 000e sur CD-ROM. Originellement
développée par ESRI pour le DMA (Defense Mapping Agency), DCW offre une
base de données vectorielles uniformisées facilement disponible,
[ESRI,1996]. La carte numérique du monde comprend quatre CD-ROM pour
un total de 2,6 GO d'informations sur tous les continents. Elle fournie une
source de renseignements de base en 17 couches thématiques, limites
internationales, villes, réseau routier, occupation du sol ...

gilliot@lacan.grignon.inra.fr daa ager ina pg 58 / 139


Les bases de données du marché

III. Formats et échange de données géographiques

1. Introduction : données sémantiques et données


graphiques

2. Formats des données vecteurs


Chaque logiciel SIG utilise généralement un format « propriétaire » c’est à
dire qui lui est propre. Il n’existe pas de format standard et universel en la
matière. Toutefois on retrouve généralement sur les différents systèmes :
plusieurs fichiers pour un thème donné, correspondant au graphique (shp
dans arcview map dans mapinfo) et au sémantique (dbf pour arcview et tab
pour mapinfo), des fichiers complémentaires codent aussi pour des tables
d’index, des légendes cartographiques, des palettes de couleurs …
3. Formats des données rasters
Cas des images
Formats graphique image « classique »

Les formats d’images classiquement utilisés dans les logiciels de traitement


d’images (type paint) sont généralement utilisés. Ces fichiers ne contiennent
pas d’information particulière de localisation cartographique et on doit pour
cela leur adjoindre en général en fichier dit d’en-tête contenant cette
information pour géoréférencer.

Les images sont en général :


Binaire : noir et blanc = 2 niveaux
Niveaux de gris généralement sur 8 bits = 256 niveaux
Couleurs palettes sur 4 (16 couleurs) ou 8 bits (256 couleurs)
Couleurs RVB (rouge, vert, bleu) sur 24 bits = 3 x 8 bits = 16 millions
de couleurs

Le format windows bitmap BMP est le format de base de Windows.


Le format GIF : compuserve Graphics Interchange Format
Le format TIFF : aldus Tagged Image File Format
Le format EPS : Encapsulated postScript

Formats compressés

Les données raster donnent des fichiers informatiques de grandes tailles.


Des méthodes de compression de données permettent d’en diminuer
l’encombrement. On distingue essentiellement deux grandes catégories de
méthodes : sans dégradation de la qualité (Tiff compressé) reposant sur la
répétitivité des données et avec perte de qualité (format JPEG).

Géotiff
Ce nouveau format graphique intègre des informations de géoréférencement.

gilliot@lacan.grignon.inra.fr daa ager ina pg 59 / 139


Les bases de données du marché

Cas des grids


Si les SIG savent « lire » les formats graphiques standards ils « travaillent » en
général dans un format interne plus efficace on parle souvent de grid (grille).

4. Normalisation échange de données : formats d’échange,


import/export

Comme on l’a vu il n’existe pas de format universel commun à tous les SIG,
comment dans ces conditions, échanger des données entre systèmes
différents ? C’est la notion de format d’échange. Le format d’échange est un
format simplifié généralement ascii (texte donc éditable avec un simple
éditeur) et dont le format est publique (connu), en effet les formats internes
des sig ne sont pas toujours donnés par les éditeurs de logiciels. Un logiciel
va « exporter » sa base dans un fichier en format d’échange, ou au contraire
créer une BD en « important » depuis un fichier d’échange. Les logiciels ont
en général leur propre format d’échange, mais quelques uns sont assez
universellement reconnus par les différents logiciels (arcview, mapinfo). Des
tentatives de normalisation de ces formats d’échanges ont été tentées
(EDIGEO) mais sans grand succès, une norme de fait est le format d’échange
d’ArcInfo dit « e00 ». Les fichiers du logiciel AutoCad (CAO/DAO) sont
presque toujours reconnus par les SIG et ce format est parfois utilisé comme
un format d’échange.

Pour les donnés sémantiques les sig savent souvent « lire » des données de
tableur (excel pour mapinfo) ou de base de données (Dbase pour ArcView),
dans tous les cas ils peuvent importer des données dans un fichier texte
(ascii) structuré, on parle de fichier texte formaté (une ligne par individu, les
colonnes séparées par des virgules ou autre séparateur).
Format d’échange ArcInfo e00 norme de fait
Format d’échange MapInfo : mif
EDIGéo la norme française
La normalisation Européenne : CEN/TC 287
La normalisation aux Etats-Unis
DIGEST : standard d'échange militaire de l'OTAN
Le format Autocad DXF
Le format ASCII

IV. Droit et information géographique


Le droit d’auteur
Limite d’utilisation : notion de donnée dérivée
Droit de numérisation et de vectorisation
Directive européenne

gilliot@lacan.grignon.inra.fr daa ager ina pg 60 / 139


Les bases de données du marché

Introduction & information spatiale......................................................................................................1


Définition : qu’est ce qu’un SIG..........................................................................................................2
Les bases de données comme fondement des SIG : introduction aux SGBD.................................................5
I. Introduction ..............................................................................................................................5
II. Structure et gestion des fichiers dans les SGBD...............................................................................5
III. Base de données relationnelles ....................................................................................................6
IV. SGBD et langages relationnels ...................................................................................................7
V. Modèles conceptuels de données : modèle entité-relation.................................................................9
VII. BD partagées et accès concurrentiel .......................................................................................... 10
VIII. Communication dynamique SIG / SGBD : Sql et ODBC............................................................. 11
Première partie L’information spatiale................................................................................................ 12
Structure de l’information spatiale en géomatique................................................................................. 13
I. L'espace en géomatique ............................................................................................................. 13
II. La topologie........................................................................................................................... 18
III. Représentations informatiques des données spatiales ..................................................................... 20
IV. Les systèmes de représentations cartographiques .......................................................................... 31
Les bases de données du marché........................................................................................................ 37
I. Les types de données géographiques ............................................................................................ 37
II. Les bases de données disponibles en France ................................................................................. 42
Programme SISE ........................................................................................................................ 53
Programme CPF Carte Pédologique de France (1/100 000)................................................................. 54
III. Formats et échange de données géographiques ............................................................................. 59
IV. Droit et information géographique............................................................................................. 60

gilliot@lacan.grignon.inra.fr daa ager ina pg 61 / 139

Vous aimerez peut-être aussi