Vous êtes sur la page 1sur 2

QUALITÉ DES DONNÉES ET OPEN DATA

Charlotte Maday

A.D.B.S. | « I2D - Information, données & documents »

2016/4 Volume 53 | pages 58 à 58


ISSN 2428-2111
DOI 10.3917/i2d.164.0058
Article disponible en ligne à l'adresse :
--------------------------------------------------------------------------------------------------------------------
https://www.cairn.info/revue-i2d-information-donnees-et-
documents-2016-4-page-58.htm
© A.D.B.S. | Téléchargé le 21/09/2021 sur www.cairn.info via Paris School of Business (IP: 164.177.26.251)

© A.D.B.S. | Téléchargé le 21/09/2021 sur www.cairn.info via Paris School of Business (IP: 164.177.26.251)
--------------------------------------------------------------------------------------------------------------------

Distribution électronique Cairn.info pour A.D.B.S..


© A.D.B.S.. Tous droits réservés pour tous pays.

La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les
limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la
licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie,
sous quelque forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de
l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est précisé que son stockage
dans une base de données est également interdit.

Powered by TCPDF (www.tcpdf.org)


LA QUALITÉ : VARIATIONS AUTOUR D’UNE NOTION ESSENTIELLE

Mise en œuvre et mesure


3 de la performance

Qualité des données


et Open data
[ zoom ] La qualité des données dans un contexte d’Open data est un sujet d’autant
plus d’actualité qu’il questionne le fondement même de l’ouverture des données : la
réutilisation.
Charlotte MADAY est
archiviste, chef de projet
archives électroniques

L
pour Saint-Gobain
Archives, et experte pour es effets bénéfiques sur la transpa- a produites  ? Pour quels usages? Quel est le
le comité normatif 11 du rence administrative et sur la dyna- format de production et d’extraction susceptible
TC46 de l’ISO relatif à la mique économique de l’ouverture d’être retraité de manière optimale ?
gestion des documen­ts des données sont évidents, comme
À l’heure actuelle, les systèmes informatiques uti-
d’activité et des archives. la loi pour une République numérique,
lisés pour produire des données administratives
charlotte.maday@saint- adoptée récemment, l’a démontré. Cependant,
sont encore loin de pouvoir répondre à l’ensemble
gobain.com l’ouverture des données ne saurait se passer
de ces exigences, surtout du point de vue fonc-
d’intégrer la notion de qualité de la donnée,
tionnel et opérationnel, ne serait-ce que parce
notion essentielle si l’on veut respecter le contrat
que la donnée dans un système informatique
moral de l’Open data : une réutilisation optimale
n’est pas envisagée globalement, c’est-à-dire
des données.
en fonction de sa valeur informative et de son
1. www.iso.org/iso/ cycle de vie, mais du point de vue de la durée
Produire des données de qualité
iso_technical_committee. de vie du logiciel qui la produit et qui la gère.
html?commid=48856 Pour bien comprendre ce que la notion de qua-
lité de l’information apporte à l’ouverture des Organiser l'ouverture des données
données, prenons une image. L’Open data peut
Il faut désormais organiser l’ouverture des don-
être comparée à la pêche des chaluts de fond :
© A.D.B.S. | Téléchargé le 21/09/2021 sur www.cairn.info via Paris School of Business (IP: 164.177.26.251)

© A.D.B.S. | Téléchargé le 21/09/2021 sur www.cairn.info via Paris School of Business (IP: 164.177.26.251)
nées du point de vue fonctionnel, dans une pers-
de très larges filets, de plusieurs centaines de
pective d’amélioration continue : c’est l’objectif
mètres, raclant les fonds marins pour aller cher-
que s’est donné un groupe de travail internatio-
cher la ressource, peu importe son état, vivante
nal agissant au sein du groupe ISO/TC46/SC11
ou non, mutilée par les filets ou non ; ceci n’a
dédié au records management et aux archives1.
aucune importance. La ressource est ramenée
Le but est d’industrialiser les moyens de fournir
à la surface pour y être transportée et présentée
des données de qualité, en intervenant dès la
au consommateur.
conceptualisation de systèmes informatiques :
Mais que m’importe, en tant que consommateur, en rationalisant la production des données, en
qu’on me présente un poisson dans un état tout identifiant celles qui sont éligibles à l’Open data
juste bon à faire des nuggets alors que j’ai besoin et leurs métadonnées, en organisant leur cycle
de filets entiers ? Que m’importe, en tant que de vie et leur archivage, ainsi que le passage de
citoyen, qu’on me présente des déclarations de système à système.
patrimoine de députés en PDF image alors que
Si faire de la pêche au gros en haut fonds en
ce sont des fichiers CSV recensant par député
sélectionnant les poissons par leur espèce et en
les montants déclarés qui me seraient utiles ?
conservant leur intégrité est hélas impossible,
Que m’importe aussi que ma collectivité mette
produire des données ouvertes de qualité est
en ligne des données qui n’ont été ni vérifiées,
largement à notre portée. 
ni certifiées, ni mises à jour ?

Agir sur le plan de la qualité


Face à ces enjeux, quel est le coût du retraite-
ment de données mises en Open data ? Tous Il faut organiser l’ouverture
les citoyens, voire même toutes les entreprises,
sont-ils égaux devant les moyens à mettre
en œuvre pour « nettoyer » les données afin
des données dans
qu’elles soient réutilisables ? une perspective
Ce n’est donc pas sur le plan de la quantité
de ressources qu’il faut agir pour l’Open data, d’amélioration continue.
mais bien sur le plan de leur qualité  : d’où
proviennent-elles  ? Qui ou quel système les

58 I2D - Information, données & documen­ts - 2016, n°4

Vous aimerez peut-être aussi