Académique Documents
Professionnel Documents
Culture Documents
net/publication/310749385
CITATION READS
1 215
3 authors, including:
Jean-Michel Follin
Conservatoire National des Arts et Métiers
33 PUBLICATIONS 73 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Jean-Michel Follin on 23 November 2016.
e
38 Revue XYZ • N° 131 – 2 trimestre 2012
calculée selon deux techniques : une Le COGIT est un laboratoire de l’IGN couverture géométrique s’est
comparaison statistique et une qui étudie les problématiques liées à améliorée de 18,6 % entre mars 2009 et
comparaison visuelle. La comparaison l’utilisation des données topogra- mars 2010 tandis que la progression
statistique est basée sur une analyse phiques vectorielles. De récentes des renseignements attributaires n’a
effectuée par (Zulfiqar N. 2008) où la publications du laboratoire témoi- atteint que 9,6 %. La raison principale
précision de localisation est déter- gnent de l’intérêt grandissant de l’IGN est qu’il est nécessaire de faire un levé
minée en comparant un échantillon de pour les projets collaboratifs comme sur le terrain pour trouver le nom
segments d’autoroutes OSM à des OpenStreetMap. d’une rue (sinon il y a violation des
données bien plus précises : celle de copyrights).
Dans leur article (Girres etTouya, 2009)
l’“Ordonnance Survey”. Elle consi-
présentent leur étude de la qualité Dans les villes couvertes, des produits
dère qu’une analyse point par point ne
d’OSM. Ils expliquent leur démarche : tels que “sightwalk”8 vont s’avérer très
peut être menée en raison des diffé-
l’appariement5, le calcul de distance utile pour renseigner toutes ces bases
rences géométriques entre OSM et les
moyenne6 et de Hausdorff7 et analy- de données, les contributeurs pourront
bases de données de l’Ordonnance
sent leurs résultats. En comparant les retranscrire les noms inscrits sur les
Survey. Elle opte donc pour une
thèmes linéaires routiers, ils obtien- plaques des rues. Pour la France, la diffi-
analyse basée sur une technique de
nent une distance de Hausdorff culté est moindre puisque le Cadastre
zones tampon (Figure 2) développée
moyenne de 13,57 m, donc supérieure permet la copie de ses attributs.
par (Goodchild et Hunter, 1997). Elle
à la précision de la base de données de Dans (Girres et Touya, 2010), la “préci-
crée deux zones tampon : la ligne à
référence dont l’erreur moyenne sion” attributaire correspond à la
tester ayant un petit rayon (générale-
quadratique est de 2 m. Par exemple, qualité interne du jeu de données. Pour
ment 1 m) et la ligne de référence en
en étudiant les carrefours des thèmes son évaluation, les auteurs utilisent
ayant un plus fort. Elle calcule ensuite
routiers, ils obtiennent une distance de soit une approche quantitative avec
le recouvrement de ces deux surfaces.
Hausdorff moyenne de 6,65 m soit une l'indicateur du taux de renseignement
Selon la taille du “buffer”* choisi et le
erreur de position moyenne trois fois de cet attribut9, soit une approche
pourcentage de recouvrement, elle
supérieure à celle garantie par la BD qualitative.
détermine la précision. Par exemple,
TOPO®. En menant des calculs de Selon eux, la précision attributaire est
pour un “buffer” de 20 m et l’autre de
distance euclidienne ils obtiennent des réduite en raison de “l'absence de
1 m, elle obtient un recouvrement de
résultats nettement inférieurs. En effet, spécifications précises avec peu de
80 %. (Haklay M., 2008) montre quant
le principe de la distance de Hausdorff valeurs remplies pour les attributs
à lui que pour une zone tampon de 6
est de ne conserver que les résultats secondaires10 (29 %) et 40 % d'erreurs
m, approximativement 80 % des
les plus “désavantageux”. pour les attributs principaux comme le
données autoroutières des deux jeux
nom des lacs ou la nature de routes.”
se superposaient. Même si leurs méthodes et leurs jeux
de données sont différents, le COGIT et Pour l'évaluation de la précision
Aamer Ather, reprend cette méthode
les universitaires anglais obtiennent sémantique, les auteurs font corres-
dans (Ather A., 2009). Il utilise des zones
des ordres de grandeur similaires. pondre les classes de deux jeux de
tampon de 10 m pour les données du
données (ils associent les tags
“Integrated transport Layer” (données La précision attributaire
“motorway” et “primary” dans OSM
routières anglaises) et de 1 m pour Dans ses dernières recherches (Haklay q
OSM, et obtient entre 98 et 100 % de M., 2010) a évalué la quantité d’attri-
(5) L’appariement est une étape presque
recouvrement. En abaissant le “buffer” buts sur l’ensemble de l’Angleterre. Il a indispensable lorsque l’on souhaite
à 5,6 m, il descend à une classe de [96 - remarqué que cette dernière était très réaliser une étude de qualité
comparée. Son but est de mettre en
98 %] de recouvrement. Il conclut que la faible et progressait beaucoup plus correspondance des objets homo-
précision d’OSM est bonne. lentement que la géométrie. En effet, la logues, représentant la même réalité
afin d’effectuer une comparaison.
(6) La distance moyenne est un rapport
entre la surface séparant deux poly-
lignes et leur longueur moyenne.
(7) La distance de Hausdorff est un indica-
teur de similarité entre deux formes,
elle calcule la plus petite des distances
maximales entre les deux géométries.
Il s’agit donc d’un estimateur de qualité
défavorable.
(8) Concurrent allemand de Google Street
View : http://www.sightwalk.com. La
licence de Street View (Google Maps)
n’autorise pas les produits dérivés à
l'inverse de Sightwalk.
(9) Ce terme apparaît dans (Maué et
Schade, 2008) et dans (Guptill et
Morrison, 1995).
Figure 2 : Principe (10) Pour le réseau routier, les attributs
de la méthode secondaires peuvent être par exemple le
nombre de voies, la vitesse maximum, la
des buffers. nature du revêtement, les sens unique.
L’exhaustivité
Pour estimer l’exhaustivité, (Zielstra et Figure 4. Écart (%) du nombre de km de voirie entre le cadastre vecteur et
Zipf, 2010) de l’université de OpenStreetMap par commune - (auteurs : Frédéric Rodrigo et Sylvain Letuffe13).
e
40 Revue XYZ • N° 131 – 2 trimestre 2012
données dans OSM. Ce qui prouve que d’OSM sont issues de contributeurs sur quel axe il faut se baser. Nous
la communauté OSM crée ses propres volontaires qui ne bénéficient pas des avons été contraints de partir de l’hy-
données et a bien pour but de cartogra- mêmes moyens, mais qui œuvrent pothèse qu’OSM et le RGE avaient la
phier l’intégralité du territoire. pour créer une information dédiée au même notion d’axe de voirie afin d’ef-
SIG, accessible et utilisable pour tous. fectuer nos calculs de comparaison,
En France, des initiatives comparables
Ces deux bases de données n’ont donc mais cette absence de spécification
ont été menées par des contributeurs à
pas la même finalité. doit être prise en compte pour l’ana-
l’image de la carte de l’exhaustivité du
Par ailleurs les deux jeux sont diffé- lyse des résultats.
réseau routier OSM français (Figure 4).
rents aussi bien dans la structuration
Ici la référence est un réseau issu du
des données que dans les spécifica- Les Indicateurs
cadastre, résultant de l’interpolation à
tions (géométrie, attributs). Pour estimer la qualité, nous avons
partir des limites de parcelles. Cette
Dans le RGE, les relations topolo- effectué l’appariement des deux
carte permet aux contributeurs de
giques sont appuyées, comme pour la réseaux à l’aide du plugin Roadmatcher
repérer les communes moins bien
plupart la plupart des données géogra- du logiciel libre OpenJump. Nous
cartographiées dans OpenStreetMap.
phiques, sur une structure de graphe. avons ainsi pu obtenir des liens entre
Dans OpenStreetMap, les données des segments homologues que nous
Proposition d’une sont organisées en “primitives”. Il en avons pu exploiter à la fois pour le
existe trois types : calcul de l’exhaustivité, de l’exactitude
méthodologie d’évaluation
- les nœuds avec un identifiant, des tags géométrique, et de la précision attribu-
appliquée à des données et des coordonnées géographiques taire (taux de renseignement et compa-
sur la Sarthe - les chemins formés d’une succession raison sémantique). Pour effectuer les
Il existe une définition européenne de de nœuds avec un identifiant et des comparaisons OSM/RGE, le décou-
la qualité des données géographiques, tags, page des données a suivi le découpage
cependant, selon les pays, les - les relations rassemblant une ou communal. Cette unité de comparaison
méthodes pour l’estimer sont diffé- plusieurs primitives, chacune ayant est différente de celle de Hakley qui a
rentes. Les contributeurs ont élaboré en plus un attribut type “rôle”. Les opté pour un maillage du territoire.
leurs propres outils d’autocontrôle, relations permettent de lier ou de
Pour l’exhaustivité, un calcul de
comme QualityStreetMap, afin de modéliser des objets sans avoir à
densité du réseau a été mené selon la
produire des informations géogra- dupliquer des géométries (par
formule :
phiques fiables. Ces outils sont essen- exemple un parcours de bus).
Nombre de km de voie dans OSM/
tiellement dédiés :
Afin de normaliser l’acquisition de Nombre de km de voie dans le RGE *100
• à l’évaluation de la complétude attri-
données, l’IGN a mis en place un
butaire, Pour l’exactitude géométrique nous
cahier des charges sur lequel sont indi-
• à la vérification de la cohérence avons retenu la distance de Hausdorff
quées toutes les spécifications pour le
logique, (cf figure 5) utilisée par Girres etTouya.
levé. En ce qui concerne OSM il existe
• au suivi des modifications. La formule est la suivante, pour deux
également un document qui a pour but
Peu d’outils permettent le contrôle de polylignes composées de séries de
d’homogénéiser la représentation du
l’exactitude géométrique et pour sommets A= {a1, …, aNA } et B= {b1, …,
tracé, mais il n’existe pas de spécifica-
cause : des données de référence sont bNB }, la distance de Hausdorff H est :
tions concernant le levé. Par exemple,
nécessaires. Pour cette étude du
pour les tronçons de routes, le RGE H(A, B) = max(h(A,B), h(B,A))
réseau sarthois, la référence choisie est
s’appuie sur l’axe de la voie en tenant Où h(A,B) et h(B,A) sont les distances
le référentiel français : le RGE. Nous
compte du bas-côté, tandis que les euclidiennes entre les deux jeux de
comparerons donc le linéaire routier
spécifications OSM n’indiquent pas données.
d’OpenStreetMap au linéaire du RGE, q
dont la précision est métrique.
e
42 Revue XYZ • N° 131 – 2 trimestre 2012
sentant que 15 % du réseau RGE en
janvier 2011 à l'échelle du département,
il n’était exploitable qu’au sein des
villes majeures comme la Flèche (45 %)
ou le Mans (55 %). Cependant les
manques sont comblés progressive-
ment puisqu’en janvier 2012 la couver-
ture monte à près de 35 % du RGE et
Le Mans est complet à près de 80 %.
q Statistiques (m) Autoroute Voies piétonnes Voies secondaires Voies tertiaires Voies primaires Rue
Nb 2 621 3 532 13 577 15 383 4 385 21 062
Max 27,2 29,8 29,8 29,9 29,2 29,9
Min 0,0 0,0 0,0 0,0 0,0 0,0
Moyenne 4,0 3,6 3,2 2,5 2,5 2,0
Écart type 4,0 5,3 3,6 2,9 2,5 2,9
Tableau 2. Tableau des précisions relatives d'OSM en fonction du type de voie sur l’ensemble du département
Ces cartes nous montrent le défaut
d’homogénéité que peuvent avoir les
données d’OSM, directement corrélé à
la qualité du travail du contributeur. Si
plusieurs contributeurs travaillent sur
la même zone, ils vont pouvoir se
corriger entre eux et ainsi améliorer au
fur et à mesure l’exactitude des
données. Sinon, si un seul contribu-
teur cartographie une zone, l’exacti-
tude des données dépendra
directement de son travail.
En s’intéressant à la source des écarts
(Tableau 2), il est apparu que les auto-
routes et les voies piétonnes étaient les
plus éloignées du RGE. Plusieurs
hypothèses peuvent être élaborées
pour expliquer ce phénomène :
• Les phénomènes de masques (GPS)
plus fréquents pour les voies
piétonnes (rues étroites en centre ville,
sous couvert forestier en milieu rural).
Figure 10. Exactitude géométrique par distance euclidienne • La largeur de la chaussée pour les
autoroutes : notre référence le RGE,
représente l’axe de la chaussée. En
l’absence de spécifications pour la digi-
talisation ou le lever des autoroutes,
nous pouvons supposer que les contri-
buteurs n’intègrent que la voie de
droite ou la voie de gauche. Au calcul,
ce biais serait donc mis en évidence.
Par ailleurs, nous ne constatons pas de
différence flagrante d’exactitude entre
zones rurales et zones urbaines.
e
44 Revue XYZ • N° 131 – 2 trimestre 2012
ment les attributs non automatiques à
savoir le type et le nom ou la référence.
Ainsi sur les routes secondaires,
tertiaires et résidentielles on atteint plus
de 50 % d’attributs renseignés ce qui est
comparable voire supérieur au RGE.
Contribution à OSM :
La digitalisation offre une bonne
exactitude géométrique
De la même manière que nous avons
étudié les données d’OSM sur le
département de la Sarthe, nous avons
réalisé des tests pour estimer la qualité
des données pour lesquelles nous
avons contribué. Nous avons pour cela Figure 13. Pourcentage d'attribut “nom” renseigné dans le RGE selon la nature de voie
conservé le même protocole. Les
données qui servent de référence sont
toujours celles du RGE.
Pour la Chapelle Saint-Aubin, dont le
réseau routier a été digitalisé à partir
de la superposition du cadastre (PCI) et
des orthophotos de Bing, nous avons
obtenu les résultats résumés dans le
tableau 3.
Voierie
Statistiques (m)
(orthophoto + PCI)
Nb de nœuds 866
Max 10,5
Min 0,0
Moyenne 1,2
Écart type 1,1
Figure 14. La répartition des erreurs sémantiques dans OSM
Tableau 3. Précision géométrique la précision de la référence, ce qui rend Voierie (image
pour la méthode de contribution par plus difficile l’interprétation des résul- Statistiques (m)
satellite + PCI)
digitalisation sur la Chapelle Saint Aubin tats. On pourrait très bien imaginer que
Nb de nœuds 817
nos données sont plus précise que la
En termes d’exactitude géométrique, Max 25,6
référence, mais rien ne nous permet de
nos résultats dépassent toutes nos
l’affirmer, il aurait fallu pour cela bénéfi- Min 0,0
attentes. En effet, la précision relative
cier d’un jeu de données plus précis. Moyenne 2,4
des données est de 1,2 m ± 1,1 m. Il faut
de plus se rappeler que la précision du Sur la commune de Cogners, nous ne Écart type 2,3
RGE au sein de la commune est de disposons pas d’orthophotos. La réso-
1,5 m environ. Nous obtenons donc une lution des images satellites de Bing est Tableau 4. Précision géométrique par
précision relative qui est meilleure que nettement moins bonne. digitalisation sur la commune de Cogners q
Revue XYZ • N° 131 – 2e trimestre 2012 45
SIG
e
46 Revue XYZ • N° 131 – 2 trimestre 2012
dernier problème résulte probable- Guptill, S.C., Morrison, J.L. (edited by), Neis P., Zielstra D., Zipf A., 2011 The
ment de l’absence de spécifications 1995. Elements of Spatial Data Quality, 1st Street Network Evolution of Crowdsourced
précises pour le levé comme pour la ed. Elsevier Science, pp 1-135. Maps: OpenStreetMap in Germany 2007–2011
digitalisation. En imposant le levé de Langaas, S., “Cartographical Data and Data Van Der Biest F., 2008 OpenStreetMap : un
l’axe des voies, en définissant une Quality Issues”, UNEP et CGIAR Cooperation, état des lieu, Géomatique Expert - N° 62 -
échelle de référence et une résolution disponible sur www.nlh.no/ikf/gis/dcw/ Avril-Mai 2008
minimale pour la digitalisation, la arendal-base-data.pdf, pp. 1-8 (1995).
précision géométrique pourrait être Flavin, R.W., Andrews A.J., Kronvang B.,
Muller-Wohlfeil D., Demuth S., and
Contact
non seulement améliorée mais aussi
homogénéisée. Birkenmayer A., (1998). ERICA European Ophélie PETIT
Rivers and Catchments, pp 4-102 . ophelie.petit.chevalier@gmail.com
Néanmoins la précision des données
VGI est tout à fait respectable pour une Haklay M. 2008. How good is volunteered Pierrick BILLON
utilisation SIG et nous formons de geographical information? A comparative p.billon@ageis-ge.fr
grands espoirs d’amélioration grâce à
study of OpenStreetMap and Ordnance Jean-Michel FOLLIN
Survey datasets. jmfollin@cnam.fr
Bing et au cadastre français.
Les données du RGE qui nous ont servi
Haklay M., 2010. Openstreetmap École Supérieure des géomètres topographes
completeness evaluation,
de référence tout au long de notre (ESGT)
http://povesham.wordpress.com/2010/04
étude bénéficient d’une précision
/04/openstreetmap-completeness-
meilleure que les données d’OSM, evaluation-march-2010/
mais ces données n’ont pas les mêmes
finalités. Nous considérons donc qu’il
Haklay M., 2011. OpenStreetMap and ABSTRACT
Ordnance Survey Meridian 2 comparison –
n’y a pas de concurrence entre les 2008 – 2011, The concept of Volunteered
deux jeux de données. http://povesham.wordpress.com/2011/05 Geographic Information (VGI) makes
Il n’existe pas à l’heure actuelle de /20/openstreetmap-and-ordnance-survey- sense for 7 years with the
métadonnées de qualité sur OSM. Il meridian-2-comparison-2008-2011/ development of OpenStreetMap
pourrait être intéressant de créer un Zulfiqar N, 2008. A Study of the Quality of (OSM). OSM follows the peer
indicateur composite de qualité qui OpenStreetMap.org maps: A comparison of production model that created
aurait une fonction de “certification” et OSM data and Ordnance Survey Data, Thèse Wikipedia: its principles are to create
regrouperaient les différents para- MEng, Londres, Collège universitaire de and support vector geographic
mètres de qualité que nous avons Londres, p.54. databases covering the entire planet
présentés. Cet indicateur pourrait être Goodchild M.,F. et Hunter G,J, 1997. under "free" license, that is to say
intégré dans un fichier de métadon- A simple positional accuracy measure for freely usable and editable.
nées associé à chaque téléchargement linear features. Journal International de la In line with studies by COGIT
depuis la plateforme OpenStreetMap. science de l’information géographique, laboratory in France, and German or
11(3), 299 -306. English researchers, this paper
OpenStreetMap est encore un petit Goodchild M.,F. et Hunter G,J, 1996. evaluates the quality of OSM road
monde. Mais grâce à son organisation, Communicating uncertainty in spatial data for a French Department:
à la volonté et à la motivation de ses databases, Transactions in GIS Sarthe. Various aspects of spatial
membres qui s’activent pour commu- Aamer A., 2009. A Quality Analysis of data quality (geometric, semantics,
niquer sur le projet (l’association OpenStreetMap Data, MEng, Londres, completeness) have been studied,
OpenStreetMap France a vu le jour Collège universitaire de Londres. through comparisons with the French
début octobre 2011), il devrait conti- Girres J.-F. et Touya G., 2009. Première reference data (RGE of the IGN), and
nuer à séduire les collectivités, les évaluation de la qualité des données libres the accuracy of OpenStreetMap has
entreprises et le grand-public. ● d'OpenStreetMap en France, Colloque
been estimated. Furthermore, two
International de Géomatique et d’Analyse
methods of contribution: digitizing
Spatiale SAGEO'09, 25-27 novembre, Paris
(France). and GPS survey were compared in
Bibliographie order to provide clues to contributors.
Girres J.-F. et Touya G., 2010. Quality
Assessment of the French OpenStreetMap Geometry and literal data are
Auber M., Billon P., Petit O., 2011.
Les données routières d’OpenStreetMap Dataset. Transactions in GIS 14 (4), 435-459. consistent with GIS users. The
dans la Sarthe : comparaison avec le RGE et Maué P. et Schade S., 2008. Quality Of weakness of OSM lies rather in a lack
contribution au projet (2011), Rapport Geographic Information Patchwork, 11th of attributes information as well as
de projet; AGILE International Conference on geometry. However the number of
Van Oort P., 2006. Spatial data quality: Geographic Information Science 2008, contributors amounts each day and
from description to application, Wageningen University of Girona, Spain; the recent possibilities of digitizing
Universiteit, Nederland , Zielstra D., Zipf A., 2010. A Comparative from Bing Maps and Cadastre web
Joos G., 2006. Data Quality Standards, Study of Proprietary Geodata and map services provides important
Shaping the Change XXIII FIG Congress Volunteered Geographic Information outlooks.
Munich, Germany, October 8-13, 5/10. for Germany;