Vous êtes sur la page 1sur 42

Chap.

3 LES DONNEES
UTILISEES DANS LE SIG
Pr. Rabarimanana Mamy
Mention IGAT/ESPA
Introduction
• Données sont :
– un composant du SIG
x
– matière première dans la x
x
construction SIG
Villes
– Information Géographique (IG)
• Les données sont stockées sous
la forme de couches
d’information monothématique Rivière

superposables
• Objectif de ce chapitre est Route
l’inventaire et la classification,
de toutes les catégories
d’information et données Adm
pouvant être manipuler et gérer
dans un SIG
Types de données exploitables
• 3 catégories
– Les données graphiques
• Les données cartographiques (ex: cartes topographiques et
thématiques diverses)
• Les données de télédétection spatiale et aéroportée (ex :
divers types d’image des satellites et photographies
aériennes
• Les données techniques (ex : plans de détails (recollement),
plans d’aménagement (architecture), schéma (coupes/profils)
– Les données attributaires ou sémantiques
• Le vocable d’attribut, fréquemment utilisée dans les SIG
• est appelé variable en statistique
• est l’équivalent de N-uplet dans le langage des bases de
données.
• est stocké en fichier tabulaire
– Les données documentaires
• Exemples : images fixes (photographies) ou animées (films)
voire des enregistrements sonores,etc.
Composants de l’Information
Géographique (IG)
• Sont :
– Les thèmes
• Un système de classification des IG
• Permet d’appréhender les phénomènes complexes et
variables dans le temps et l‘espace
– Les systèmes de localisation (coordonnées ou
de référence)
• exprimée en fonction d’un système de repérage utilisé
système de coordonnées bidimensionnelles
– un réseau cartésien (quadrillage exprimant le système de
projection rectangulaire d’un pays).
– un réseau curviligne (longitude et latitude).
Architecture des données dans un SIG
Architecture des données dans un SIG

• Les informations sont structurées sous la forme


de couches d’information monothématique
(couvertures/fichiers/entités) dans une base de
données géoréférencées.
• Un SIG manipule deux types d’entité :
– des entités spatiales référencées (couche) que l’on
peut représenter dans un plan (carte).
– des entités descriptives porteuse de l’information
qualitative et quantitative, se rapportant aux entités
spatiales (attributs).
NIVEAU GEOMETRIQUE
• Le géolocalisation permet :
– le passage d'un système de coordonnées à un autre.
– la combinaison de données multi-sources et de
modèles graphiques différents (cartes, images,
fichiers de coordonnées, relevés GPS, etc.)
– le changement d’échelle
• Les principaux systèmes de référence font appel
soit:
– à des coordonnées
– à des adresses
– à la topologie (relations des objets les uns par rapport
aux autres)
Référentiel géométrique
• Le vocable « Référencer », est une méthode
permettant de décrire l’emplacement relatif ou
absolu d’un objet ou de sa représentation.
• La localisation des objets nécessite
l’établissement préalable d’un canevas de points
d’appui dont les coordonnées sont déterminées
dans un système connu.
• L’utilisation d’un référentiel géométrique
commun permet d’avoir un référentiel
géométrique unique sur toute la zone de travail
et une cohérence dans la localisation des
données.
• Le référentiel géométrique commun est en
général les données qui serviront de fond de
plan (référence) aux applications.
Le système d’adresse
• L’adressage est une technique qui consiste à
relier des fichiers attributaires de type
recensement au abonné, à des données
géographiques telle que les îlots.
• Les liens les plus utilisés fréquemment sont les
numéros de voie (adresses postales) et les
codes postaux mais on peut aussi utiliser les
coordonnées géographiques.
• Ils sont mis en oeuvre pour le traitement des
recensements, dans les applications de
géomarketing, de gestion des abonnés etc.
Le système de rattachement
• Il est possible de référencer les objets les
uns des autres par rattachement
géométrique ou logique.
• On cherche alors à positionner les objets
par des valeurs ou des relations telle
distance, dans tel périmètre, à droite, à
gauche, au Sud, au Nord.
• On retrouve certaines de ces notions dans
un codage de type topologie.
La précision de la localisation
• Pendant la mise a jour, veiller à ce que les
nouvelles informations aient une précision de
localisation compatible avec celle de la couche.
• Le croisement d'informations ne peut s'opérer que
parmi les couches appartenant au même système
de coordonnées.
• Lorsqu'il s'agit de superposer des documents
cartographiques de différentes natures, il est
toujours possible d'effectuer un calage local.
• le positionnement relatif des objets est déduit de
leur localisation dans un système de coordonnées.
• La position relative des détails figurant sur un
document graphique est souvent plus importante
que la position absolue d'un détail.
Niveau topologique

LES DONNEES STOCKEES EN


MODE VECTEUR
Définition
• Le mode de représentation vecteur est le mode
de gestion dans lequel le dessin ou le plan est
constitué de composantes géométriques
(segments, lignes, cercles, etc.) s’appuyant sur
un certain nombre de points connus en (X,Y) ou
(X,Y, Z) et constitués de ce fait d’un ensemble
de vecteurs élémentaires.
• La géométrie de l’IG est stockée sous forme de
primitive point, polyligne, et polygone)
Organisation des données.

• Les données géographiques vectorielles


présentent quatre niveaux d’organisation :
– les primitives graphiques,
– la topologie
– les objets géographiques,
– les couches thématiques.
Les primitives graphiques
Les primitives graphiques.
• Point (nœud) : définit des localisations discrètes pour
des objets ou phénomènes géographiques trop petites
pour être représentés par des lignes, ou n’ont pas de
surface réelle (ex : points cotés).
• Polyligne (arc) : pour représenter des objets linéaires,
qui ont une longueur mais pas de surface ou trop étroits
pour être représentés en surface (ex : hydrographie).
• Une polyligne va d’un noeud de départ à un noeud
d’arrivée. Elle est constituée de segments de droite ou
de courbes successives. Un polygone, par rapport a une
polyligne, confond ces deux nœuds.
• Polygone (surface) : ligne fermée (occupation du sol)
La topologie
• La topologie structure les primitives graphiques en décrivant les relations
spatiales entre ces dernières (face à gauche/droite d’un arc, noeud
initial/final d’un arc, etc.).
• On peut définir une information topologique comme une information sur
– la superposition (définir la règle de l’intégrité d’un objet géographique) ou
– la mitoyenneté de deux détails topographiques (gérer les frontières entre les
objets géographique).
• La topologie devra être mise à chaque modification et permettra de :
– générer les noeuds manquants la où des arcs se croisent ;
– capturer un noeud par un arc ou un noeud par un noeud dans un "rayon de
capture"
– construire la topologie des polygones en déterminant les surfaces ou les
périmètres limités par des arcs
– créer la liste des arcs fermant les polygones
– numéroter les diverses entités
– préciser le noeud initial et le noeud final d'un arc, les polygones à droite et à
gauche de l'arc
– créer ou mettre à jour les fichiers spéciaux destinés aux attributs des entités.
– effectuer des opérations de mise à jour
– élaborer des objets géographiques à partir des géométries non structurées (ex :
création de polygone à partir des arcs)
• Les objets géographiques :
✓ Les objets géographiques sont par exemple des unités
de routes, des communes, des départements, des
parcelles.
- une route est une succession de polylignes
successives,
- un département peut être décrit par un ensemble
de polygones jointifs des communes aussi bien que par
le simple contour englobant de ces polygones.
• Les couches thématiques (entité) :
✓ Les objets géographiques sont organisés en plans
appelés « couches ou couvertures ou thèmes» qui est
un ensemble des fichiers (structure variables suivant le
logiciel).
✓ Chaque plan correspond à un thème particulier par
exemple le plan des routes, plan d’occupation du sol,
etc.
LES DONNEES STOCKEES EN
MODE RASTER
Définition
• Les données en mode raster sont également
appelées données maillées, données tramées,
ou données matricielles pour former un plan ou
couches.
• Elles donnent une information ponctuelle
localisée au centre des mailles de grille
régulière.
• Cette information est en général une synthèse
(valeur moyenne, intégrale) des valeurs
intensives enregistrées ou calculées par chaque
maille (altitude, radiométrie, etc.).
• Ex : la taille de la maille est la résolution (10 à
20 mètres par le satellite SPOT).
Organisation des données en
mode raster
• La cellule ou le pixel est l’unité constitutive d’une
image.
• Elle est caractérisée par sa position au sein de la
maille défini par le numéro de ligne et de colonne et
son attribut (valeur attribuée au pixel par unité de
valeur définit par le thème étudiée).
• Une image est caractérisée par :
– le nombre de ligne/colonne de la trame,
– la résolution (taille du pixel par unité cartographique)
– les coordonnées du point inférieur gauche ou supérieur
droit,
– l’unité de mesure de l’attribut de chaque cellule
– le thème étudiée,
– la clé d’interprétation de l’image
Le codage des données raster
• Nombre en entier variant de 0-255 (8bit) :
cas des valeurs de réflectance dans une
bande d’une image satellite (variation
continue).
• Nombre en entier variant de -32000 a
+32000 : cas des données thématiques
comme l’occupation du sol ou les sols (16bit)
• Nombre réel (16 ou 32bit) : cas du Modèle
Numérique de Terrain, indices de végétation
• 0-1(bitmap) montrant la présence ou
absence des éléments géographiques,
création des masques
Thème de l’image

• Il est facile de constater que, dans ce modèle, il n’y a pas


de correspondance avec les objets géographiques connu
dans le cas du modèle de données vecteur.
• Les objets géographiques ne pourront être reconnus qu’à
travers le thème de l’image et la valeur de l’attribut de
chaque cellule.
Comparaison entre les deux
modèles
Vecteur Raster
• Meilleure représentation des • Meilleure représentation des
éléments géographiques phénomènes à variation
discrets continue
• Meilleur soin et précision • Simplicité de la structure
• Demande moins d’espace • Facilité inter-change entre
pour le stockage de différent logiciel
données sur le disque • Possibilité de comprimer les
• Facilité de transformation données
des données (projections) • Efficience dans la modélisation
• Meilleure efficience dans des phénomènes réels avec le
l’analyse des réseaux SIG (fonction de superposition)
(relation topologiques)
• Meilleure représentation
graphique des éléments
Niveau sémantique

Données attributaire dans une


Base de données
Définition
• Les données attributaires caractérisent les
objets géographiques.
• Il y a des attributs quantitatifs (ex : nombre
d’habitant de la commune) et des attributs
qualitatifs (ex : nom ou photo du maire de la
commune).
• Le critère utilisé permettant de distinguer les 2
familles de caractères est que la moyenne d'un
caractère quantitatif a un sens alors que la
moyenne d'un caractère qualitatif est impossible
à réaliser ou bien n'a aucune signification.
Caractère qualitatif
• Les modalités d’un caractère qualitatif traduit des états
distincts, des catégories
• Les modalités d’un caractère qualitatif peuvent (ou non)
présenter une relation d’ordre
• Le caractère est qualitatif nominal en l’absence de
hiérarchie (ex : code postal)
• Le caractère est qualitatif ordinal quand les modalités
peuvent être ordonnées (nombre de population, qualité
des eaux, etc.)
• NB : Qu’il soit nominal ou ordinal, un caractère qualitatif
peut être composé de chiffres. Ex : codes postaux,
numéro de département, etc. Les outils informatiques
(tableurs, etc.) ne reconnaissent pas la nature qualitative
de certaines données et proposent parfois des
traitements ou des modes de représentation prévus pour
les données quantitative avec le risque de résultats
aberrants !
Caractère quantitatif
• Un caractère est quantitatif si :
– ses modalités s’expriment par des nombres (condition
nécessaire mais non suffisante)
– Et si la moyenne de ces nombres à un sens.
• Un caractère quantitatif peut être
– discret ou les modalités sont définies sur des intervalles
finis et démontrables de valeurs
– continu ou les modalités sont définies sur un intervalle
continu (modalités en nombre potentiellement infini)
• NB:
– Les modalités expriment des quantités issues de mesures
de dénombrements ou de calculs.
– Dans la pratique, lorsque les modalités sont nombreuses,
certains caractères discrets peuvent être assimilés à des
caractères continus.
Caractère quantitatif de stock et
d’intensité
• Un caractère quantitatif est dit de stock
lorsque la somme de ses modalités a un
sens (quantités concrètes)
• Un caractère quantitatif est dit d’intensité
dans le cas contraire (rapports, taux, etc.)
• NB : un caractère exprimé en % n’est pas
toujours un taux. Exprimer la part d’une
population en % est un caractère de stock,
la somme (100 %) a un sens.
Caractère quantitatif repérable
ou mesurable
• Un caractère quantitatif est dit de
repérable lorsque la valeur 0 a une
signification sur l’échelle de variation
(latitude, température, taux
d’accroissement, etc.)
• Un caractère quantitatif est dit mesurable
lorsque la valeur 0 signifie l’absence du
phénomène (population, précipitations,
taux de chômage, etc.)
Nominal
Qualitatif
Ordinal

Discret

Repérable
Continu

Intensité
Discret

Mesurable
Continu
Quantitatif

Discret

Repérable
Continu
Stock

Discret
Mesurable
Continu
Organisation des données attributaires
• La gestion des données attributaires est effectuée par
un gestionnaire de base de données sous forme de
tables.
• L’organisation des données qui permet de mettre en
oeuvre les liens entre les données attributaires et leur
représentation cartographique est appelée la
géocodification :

– des données attributaires vers les données graphiques: il


s’agit de représenter graphiquement des attributs
alphanumériques (commande étiquette des logiciels), ou de
répercuter sur la carte ou le plan des actions ou des
analyses menées sur les données attributaires (commande
analyse thématique).
– des données graphiques vers les données attributaires: il
s’agit de répercuter en mode attributaire des données
déduites de la géométrie, modifiées par mise à jour ou par
l’analyse spatiale (commande topologie).
LES MÉTADONNÉES
• Les métadonnées décrivent les sources de
données et les opérations effectuées pour
construire la (ou les) base(s) de données.
• Il est indispensable de préserver l’information
concernant les données.
• Les métadonnées permettent d’évaluer la qualité,
la pertinence et la validité des données.
• Elles servent à documenter les données afin de
permettre une utilisation appropriée (catalogage).
QUALITÉ DES DONNÉES
• L’AFNOR la définition comme un « ensemble des
propriétés et caractéristiques d’un produit ou service
qui lui confèrent l’aptitude à satisfaire des besoins
exprimés ou implicites ».
• Il faut savoir distinguer:
– l’utilisateur : qui est-il ? (SIG producteur; SIG utilisateur)
– le produit : quel est-il ? (format d’échange)
– le conditionnement : il définit en particulier, le règle de
passage entre le modèle conceptuel, des données et celui
du format d’échange.
– qui peut évaluer la qualité ?
• C’est la possibilité de répondre à la question de
l’utilisateur: quelle confiance sera accordée à ce jeu
de données ?
Ce qu’il faudrait vérifier?
• On peut classer la qualité en six domaines:
– généalogie: quand, d’où et comment l’information a t elle été saisie ?
Par exemple : la date la saisie et de la dernière révision de la carte, le
processus de saisie etc.
– précision géométrique : pour un objet donné, quel est l’écart entre sa
position (et/ou sa forme) nominale et celle issue du jeu de données.
– précision sémantique : pour une information donnée est-elle contenue
dans le jeu de donnée, est-elle la valeur nominale? L’information
sémantique est-elle vraie ou fausse ?
– exhaustivité : pour un type d’information donnée, les objets du terrain
nominal sont-ils dans le jeu de données ? Les objets du jeu de données
existent-ils réellement sur le terrain nominal ? Pourcentage ?
– cohérence logique : les contraintes logiques imposées dans le jeu pour
modéliser le terrain sont-elles respectées ? (Vérification généralement
par des processus automatiques)
– actualité: pour un type d’information donné, quelle peut être l’ampleur
des changements intervenus entre, le jeu de données et le terrain
nominal à une date donnée ?
– Les six domaines proposés ne sont pas indépendants, car une même
cause peut engendrer des erreurs de plusieurs types.
Méthodes de mesure de la qualité des
données
• Ce qu’il faudra chiffrer:
– précision géométrique: un ordre de grandeur de la
précision à attente (ou un % hors standard)
– précision sémantique: une probabilité de bonne réponse
– exhaustivité: un % d’oublis, d’additions
– actualité: une probabilité de changement
• Comment donner les chiffres?
– quel chiffre est-il raisonnable de se fixer pour tel paramètre
de qualité?
– quel seuil de rejet se donner pour garantir raisonnablement
qu’un jeu de donnée est conforme à la spécification fixée ?
• La théorie qu’on peut utiliser postule que le jeu de
données suit la loi des statistiques. On cherchera
alors la probabilité ou le % des données non
conforme aux spécifications par sondages à partir
d’un échantillon représentatif.

Vous aimerez peut-être aussi