Vous êtes sur la page 1sur 1

OPINIONS

CARTE BLANCHE

Comment exploiter la mine dor des donnes publiques


DENIS BERTHAULT, coanimateur du groupe donnespubliques auGroupementfranaisdesindustriesdelinformation,sinterroge surlesmoyensdamliorer,aumoindrecot, la qualit des donnes sans attendre que lAdministration ait les outils ncessaires.

Avec la cration dEtalab, la tari cation des donnes publiques devient un sujet tabou. Certes, les textes encadrant la rutilisation des informations publiques, quils soient actuels (directive de 2003, loi de 1978, dcret de mai 2011) ou venir (projet de rvision de la Commission europenne), autorisent explicitement cette tari cation. Toutefois, nombreux sont ceux qui pensent que, limpt ayant dj pay la production des donnes, il est anormal que la rutilisation des informations publiques soit tarife. Hlas, si limpt a bien nanc la production, il na que trs rarement subventionn la di usion et encore moins les moyens de rendre rutilisables ces donnes. Pour comprendre le problme, il su t de regarder les sites publics (ministres, tablissements publics, autorits administratives...): les informations textuelles sont restitues en PDF, un format propritaire qui interdit toute rutilisation, les donnes tabulaires, en format propritaire (Excel). Cette tendance se retrouve, bien sr, sur Data.gouv.fr o moins de 1 % des donnes est en format ouvert.

Nous proposons une usine interministrielle dextraction et de conversion des donnes


administrations dans le monde, mais peut-tre plus encore cause dune organisation hirarchique et dun fort souci de con dentialit, lAdministration franaise nest ni prpare, ni organise, ni, a fortiori, quipe pour di user et/ou rendre rutilisables ses informations. Cela nentre pas dans la mission pour laquelle elle a t cre. Il y a donc un abme entre la ralit et les dsirs des acteurs politiques europens ou franais, relays par de nombreuses associations en France, de disposer de donnes dans un format lisible par la machine et accompagnes de mtadonnes . Comment, alors, permettre aux administrations de diffuser rapidement, dans un format rutilisable et au plus juste cot leurs informations ? Pour rsorber ce goulet dtranglement constitu par la question du format, nous proposons la cration dune structure technique centralise, sorte de data factory mutualise , charge de collecter les donnes en ltat, cest--dire sans imposer lAdministration un quelconque changement ou investissement, puis

de les convertir, moindre cot, dans des formats correspondant aux besoins des rutilisateurs. Cette usine de conversion de donnes serait interministrielle, permettant la fois aux administrations, quelles soient centrales ou dcentralises, riches ou pauvres, de dvelopper de nouvelles applications rpondant leurs besoins propres, tout en favorisant la rutilisation de leurs informations. Pour traiter et lever le niveau de service sur les donnes quelles soient ou non dj di uses , cette structure devrait en priorit sinterfacer avec les sites publics existants lchelon national (dont Data.gouv.fr), voire lchelon local. La data factory proposerait des fonctionnalits la demande de transformation de format, dajout de mtadonnes, voire danonymisation ou de nettoyage dinformations. Elle serait aussi en mesure de proposer des services de stockage, dintgration et daccs aux donnes (API, services web).

DR

01BUSINESS & TECHNO I 8/03/2012 I 01net-entreprises.fr

Une structure centralise pour rsoudre le problme du format Ce constat sou re, videmment, dexceptions : des administrations dont la di usion a toujours fait partie intgrante de la mission (Dila, IGN, Inpi, Insee, Mto France) se sont depuis une vingtaine dannes organises pour rediffuser leurs donnes. Quelques administrations traditionnelles sy sont rcemment essayes (Finances, Intrieur, Justice), avec des bonheurs divers et aprs des investissements trop importants. Comme limmense majorit des

Le financement par la taxe ? Ainsi, cette data factory permettrait la sphre publique de disposer dune structure habilite stocker, amliorer et di user les donnes publiques ouvertes franaises. Comment nancer une telle structure ? Trs simplement ! En prlevant une taxe (25 % ?) sur le chi re da aires peru par les administrations qui vendent leurs informations. Il est en e et paradoxal que seules les administrations disposant de donnes vendables retirent 100 % des revenus alors quune vraie politique dopen data consiste justement mettre disposition un maximum dinformations, en laissant au march (entreprises, associations, dveloppeurs) le soin de dvelopper des services autour. La France aurait alors lopportunit de se doter de modalits daccs communes toutes les donnes libres dans lHexagone, gage de cacit et dconomies dchelle pour tous les rutilisateurs. M
DENIS BERTHAULT

38