SNAT
SESSION ORDINAIRE DE 2013-2014
RAPPORT DINFORMATION
FAIT
(1) Cette commission est compose de : M. Jean-Pierre Sueur, prsident ; MM. Jean-Pierre Michel, Patrice Glard,
Mme Catherine Tasca, M. Bernard Saugey, Mme Esther Benbassa, MM. Franois Pillet, Yves Dtraigne, Mme liane Assassi,
M. Nicolas Alfonsi, Mlle Sophie Joissains, vice-prsidents ; Mme Nicole Bonnefoy, MM. Christian Cointat, Christophe-Andr
Frassa, Mme Virginie Kls, secrtaires ; MM. Alain Anziani, Philippe Bas, Christophe Bchu, Franois-Nol Buffet, Grard
Collomb, Pierre-Yves Collombat, Jean-Patrick Courtois, Mme Ccile Cukierman, MM. Michel Delebarre, Flix Desplan, Christian
Favier, Ren Garrec, Gatan Gorce, Mme Jacqueline Gourault, MM. Franois Grosdidier, Jean-Jacques Hyest, Philippe Kaltenbach,
Jean-Ren Lecerf, Jean-Yves Leconte, Antoine Lefvre, Mme Hlne Lipietz, MM. Roger Madec, Jean Louis Masson, Michel
Mercier, Jacques Mzard, Thani Mohamed Soilihi, Hugues Portelli, Andr Reichardt, Alain Richard, Simon Sutour, Mme Catherine
Troendl, MM. Ren Vandierendonck, Jean-Pierre Vial, Franois Zocchetto.
-3-
SOMMAIRE
Pages
SYNTHSE ...............................................................................................................................
AVANT-PROPOS .................................................................................................................... 13
TITRE LIMINAIRE UNE RFLEXION NCESSAIRE ...................................................... 15
A. LOPEN DATA : UN MOUVEMENT OFFENSIF ...............................................................
1. Les origines de lopen data .................................................................................................
a) Un concept venu du monde anglo-saxon ....................................................................
b) Essai de dfinition ........................................................................................................
2. La stratgie franaise douverture et de partage des donnes publiques .................................
a) Les tapes de llaboration de la stratgie franaise dopen data................................
b) Les instruments de lopen data : la mission Etalab, le portail data.gouv.fr et les
licences ..........................................................................................................................
c) Vers une obligation douverture et de partage des donnes publiques pour les
collectivits territoriales ? ............................................................................................
3. Une forte demande de la part de la socit civile et des entreprises ........................................
a) Un enjeu dmocratique de transparence et de bonne administration .......................
b) Un enjeu de valorisation conomique et sociale des donnes ...................................
B. LOPEN DATA ET LA PROTECTION DES DONNES PERSONNELLES : UNE
INTERROGATION LGITIME ...........................................................................................
1. Une ncessit : se garder de certains simplismes ...................................................................
a) Un problme rsolu, avant mme de le poser ? ..........................................................
b) Une interrogation secondaire ou encore prmature ? ..............................................
2. Concilier le dveloppement de lopen data et la protection des donnes personnelles :
une proccupation partage en France et au niveau europen ..............................................
15
15
15
16
17
17
18
21
22
22
23
24
24
24
26
28
31
32
33
33
37
37
37
37
39
41
31
-4-
II. - UNE PROTECTION TOUTEFOIS FRAGILISE PAR UNE DOUBLE FAILLE ......... 43
A. PREMIRE FAILLE : LE RISQUE DE R-IDENTIFICATION ...........................................
1. Un risque avr ...................................................................................................................
a) Les techniques danonymisation .................................................................................
b) Des techniques qui ne sont pas infaillibles .................................................................
2. Des risques jusqu prsent limits, mais des consquences susceptibles dtre graves
pour les personnes concernes comme pour ladministration ................................................
B. SECONDE FAILLE : DES ADMINISTRATIONS PARFOIS DMUNIES FACE AU
DFI DE LOUVERTURE DES BASES DE DONNES ......................................................
1. La ncessit, pour les administrations, de sadapter la nouvelle donne de lopen data .......
2. Un dfaut de pilotage et daccompagnement pour garantir la protection des donnes
personnelles .........................................................................................................................
a) Etalab : un rle dimpulsion plus que de direction .....................................................
b) Des administrations qui sorganisent empiriquement, faute
daccompagnement suffisant .......................................................................................
43
44
44
46
49
51
51
52
52
52
60
60
61
63
66
67
67
69
70
CONCLUSION ......................................................................................................................... 73
EXAMEN EN COMMISSION ................................................................................................. 75
LISTE DES PERSONNES ENTENDUES ............................................................................... 81
-5-
SYNTHSE
SYNTHSE
La France sest rsolument engage sur la voie de louverture et du
partage des donnes publiques, plus connue sous le nom dopen data.
Deux ides animent cette politique. Comptables de leur gestion
auprs des citoyens, les administrations leur ouvrent leurs fichiers. Elles leur
donnent ainsi le moyen de mieux les contrler. Par ailleurs, lre du
numrique, o linformation est source de richesse, elles leur offrent
lopportunit dexploiter le formidable gisement que constituent ces
donnes.
En crant une mission dinformation charge dtudier lopen data et
la protection de la vie prive de nos concitoyens, la commission des lois a
souhait poursuivre sa rflexion sur les nouveaux usages numriques et la
faon dont ils peuvent se concilier avec les principes fondamentaux que le
lgislateur a poss ds la fin des annes 1970.
Lopen data soulve cet gard une question spcifique : en principe,
il exclut toute diffusion de donnes caractre personnel, mais bien souvent,
les donnes dtenues par les administrations ont t labores partir
dinformations individuelles, qui peuvent tre retrouves grce aux
importantes capacits de traitement que permet linformatique moderne.
Limpratif de protection de la vie prive est-il en mesure de toujours
prvaloir ? Comment sen assurer ?
lissue de leurs travaux, les rapporteurs de la mission
dinformation, les snateurs Gatan Gorce (Soc. Nivre) et Franois Pillet
(ratt. UMP Cher) jugent aujourdhui ncessaire de faire dune exigence
fondamentale la protection de la vie prive de nos concitoyens une
opportunit pour donner une nouvelle impulsion au dploiement de lopen
data.
Lopen data : en dpit dun cadre rglementaire protecteur
des donnes personnelles, une double faille corriger
Mouvement rcent, lopen data est aujourdhui un des axes
importants de la modernisation de laction publique de nombreux pays
dEurope et des tats-Unis.
Il recouvre deux principes : le premier est la mise en ligne, par les
administrations, des donnes quelles dtiennent ; le second, la libre
rutilisation par les citoyens ou les entreprises des donnes ainsi publies. Il
est inspir par deux objectifs : garantir la transparence de laction publique
en permettant chacun de consulter les donnes relatives laction de
ladministration et les informations sur lesquelles elle fonde ses dcisions ;
offrir tous la possibilit dexploiter ces donnes et den tirer un profit pour
soi ou le bien commun.
-6-
SYNTHSE
-7-
-8-
*
*
-9-
- 10 -
- 11 -
Recommandation n 10
Assurer aussi cette veille sur les donnes publies par des tiers sur
les sites publics
Recommandation n 11
Prvoir que ladministration dfinisse une stratgie de rapatriement
ou de suppression des jeux de donnes compromis, afin de remdier
rapidement la diffusion accidentelle dinformations personnelles
* Renforcer la protection offerte par la licence de rutilisation
Recommandation n 12
Exclure expressment les donnes personnelles du champ
dapplication de la licence ouverte utilise par les administrations pour la
rutilisation des donnes publiques
Recommandation n 13
Interdire expressment dans le contrat de licence toute rutilisation
abusive qui aboutirait lever lanonymisation des donnes
Recommandation n 14
Intgrer au contrat de licence, une clause de suspension lgitime du
droit de rutilisation, ainsi que de suppression ou de rapatriement des jeux
donnes compromis lorsquun risque de r-identification est apparu
Adapter la gouvernance de lopen data aux exigences de la protection
des donnes personnelles
* Renforcer lassistance aux acteurs de lopen data
Recommandation n 15
Mettre en place, auprs de la mission Etalab, une structure ddie la
protection des donnes caractre personnel et charge dassister les
administrations :
- dans llaboration de ltude dimpact pralable la mise
disposition des donnes ;
- dans lanonymisation ventuelle de la base ;
- dans la mise en place dun mode daccs restreint
- 12 -
Recommandation n 16
Confier, cette mme structure, un rle de veille sur les rutilisations
abusives au regard de la protection des donnes personnelles, en la
chargeant de recueillir les alertes ventuelles, den informer la CNIL, et de
coordonner, le cas chant, le retrait ou la reconfiguration de la base de
donne litigieuse
Recommandation n 17
Rassembler et diffuser les bonnes pratiques et les recommandations
en matire de protection des donnes personnelles dans lopen data
Recommandation n 18
Investir les CIL et les PRADA dattribution de coordination et de
veille en matire de protection des donnes caractre personnel dans le
cadre de lopen data
* Garantir le financement des mesures danonymisation
Recommandation n 19
Garantir le financement par ltat des mesures danonymisation des
donnes personnelles contenues dans des jeux de donnes publiques
Ne pas renoncer par principe au prlvement dune redevance en
prsence de cots danonymisation levs
Encourager le financement coopratif de lanonymisation
* Clarifier le droit applicable
Recommandation n 20
Prciser que, lorsque des donnes personnelles sont mises en ligne en
vertu de la loi, cette publication doit se limiter la stricte mesure ncessaire
au respect de lobjet vis par cette loi
AVANT-PROPOS
- 13 -
AVANT-PROPOS
Mesdames, Messieurs,
Notre pays sest rsolument engag sur la voie de louverture et du
partage des donnes publiques, plus connue sous le nom dopen data.
Deux ides animent cette politique. Comptables de leur gestion
auprs des citoyens, les administrations leur ouvrent leurs fichiers. Elles leur
donnent ainsi le moyen de mieux les contrler. Par ailleurs, lre du
numrique, o linformation est source de richesse, elles leur offrent
lopportunit dexploiter le formidable gisement que constituent ces
donnes.
En crant une mission dinformation charge dtudier lopen data et
la protection de la vie prive de nos concitoyens, votre commission des lois a
souhait poursuivre une rflexion dj engage par la prcdente mission
dinformation confie M. Yves Dtraigne et Mme Anne-Marie Escoffier
consacre La vie prive lheure des mmoires numriques 1 . Cette rflexion
porte sur les nouveaux usages numriques et la faon dont ils peuvent se
concilier avec les principes fondamentaux que le lgislateur a poss ds la fin
des annes 1970.
Lopen data soulve cet gard une question spcifique : en principe,
il exclut toute diffusion de donnes caractre personnel, mais bien souvent,
les donnes dtenues par les administrations ont t labores partir
dinformations individuelles, qui peuvent tre retrouves grce aux
importantes capacits de traitement que permet linformatique moderne.
Limpratif de protection de la vie prive est-il en mesure de toujours
prvaloir ? Comment sen assurer ?
La vie prive lheure des mmoires numriques. Pour une confiance renforce entre
citoyens et socit de linformation, rapport dinformation n 441, (2008-2009), de M. Yves
Dtraigne et Mme Anne-Marie Escoffier, fait au nom de la commission des lois (disponible
ladresse suivante : http://www.senat.fr/notice-rapport/2008/r08-441-notice.html).
1
- 14 -
Telles sont les interrogations qui ont guid vos deux rapporteurs,
MM. Gatan Gorce et Franois Pillet, retenant langle exclusif de la
protection des donnes personnelles, et renvoyant les questions plus
gnrales la mission commune dinformation, prside par notre collgue
Jean-Jacques Hyest et rapporte par notre collgue Corinne Bouchoux,
consacre laccs aux documents administratifs et aux donnes publiques1.
Aprs avoir recueilli, au cours de plus dune trentaine dauditions,
les avis et analyses dexperts et de reprsentants de lensemble des acteurs
de lopen data administration, associations de citoyens, entreprises, autorit
de rgulation , vos rapporteurs jugent aujourdhui ncessaire douvrir la
voie un dploiement raisonn de lopen data, protecteur de la vie prive de
nos concitoyens et conforme aux ambitions de transparence et dintrt
gnral qui laniment.
- 15 -
- 16 -
Cf. Eight Principles of Open Governement Data , 8 dcembre 2007, disponible ladresse
suivante : www.opengovdata.org
1
- 17 -
- 18 -
Circulaire du 26 mai 2011 relative la cration du portail unique des informations publiques de
ltat data.gouv.fr par la mission Etalab et lapplication des dispositions rgissant le droit de
rutilisation des informations publiques.
2 Cf. le communiqu de presse du Premier ministre en date du 31 octobre 2012.
1
- 19 -
- 20 -
- 21 -
- 22 -
fonctionnement des administrations qui sont les premires utilisatrices des donnes
publiques , enfin conomique en visant faciliter le dveloppement
conomique et notamment la cration de services innovants et contribuer au
rayonnement et lattractivit conomique des collectivits territoriales . On
retrouve ici les trois bnfices attendus de lopen data.
3. Une forte demande de la part de la socit civile et des
entreprises
Les auditions conduites par vos rapporteurs ont dmontr que la
mise en uvre par ltat et les collectivits territoriales de stratgies dopen
data rpond effectivement une demande exprime par la socit civile et les
entreprises, quelle soit davantage oriente vers un objectif politique (a) ou
conomique (b).
a) Un enjeu dmocratique de transparence et de bonne administration
Certaines associations telles Regards citoyens mettent en avant
quen dmocratie, les prises de dcisions publiques sont transparentes . Mettre
disposition les donnes publiques mais galement autoriser leur libre
rutilisation permettrait au citoyen dexercer un meilleur contrle de laction
de leurs reprsentants mais aussi de ladministration, en adquation avec
larticle 15 de la Dclaration des droits de lhomme et du citoyen qui
proclame : la Socit a le droit de demander compte tout Agent public de son
administration. Dans la ligne des lois de transparence adoptes dans les
annes 1970, lopen data contribuerait rendre ladministration moins opaque
et plus accessible.
En outre, les promoteurs de lopen data voient en celui-ci un moyen
damliorer linformation des citoyens et, partant, leur participation aux
processus dcisionnels. La rutilisation des donnes publiques par les
usagers du service public peut en effet aller de leur simple enrichissement au
dveloppement de nouveaux services. Cette dernire modalit de
participation des citoyens serait dailleurs, davantage que la transparence, le
principal objectif poursuivi par les collectivits territoriales, selon M. Simon
Chignard.
Ainsi, les donnes mises disposition les plus utilises et les plus
prometteuses en termes dapplications innovantes lheure actuelle seraient
les donnes de mobilit ou encore les donnes vnementielles en temps rel,
comme la indiqu lassociation Open Data France qui regroupe les
collectivits territoriales engages dans une dmarche douverture des
donnes publiques. Si les donnes budgtaires font lobjet dune forte
demande, les associations font tat de la difficult de les exploiter du fait
dun dfaut de normalisation des documents budgtaires qui empcheraient
les comparaisons entre diffrentes collectivits.
- 23 -
Cf. Ouverture des donnes publiques Les exceptions au principe de gratuit sont-elles
toutes lgitimes ?, rapport remis au Premier ministre par M. Mohammed Adnne Trojette, juillet
2013.
1
- 24 -
- 25 -
- 26 -
- 27 -
- 28 -
- 29 -
http://www.drees.sante.gouv.fr/IMG/pdf/rapport-donnees-de-sante-2013.pdf.
Sminaire Open data, quels enjeux pour la protection des donnes personnelles du
9 juillet 2013 dont un compte-rendu peut tre consult ladresse suivante :
http://www.cnil.fr/fileadmin/documents/approfondir/dossier/OpenData/CR_Workshop_Open_Data_
9_juillet_2013.pdf.
3 Colloque interdisciplinaire du 12 novembre 2013 lopen data et les donnes personnelles, organis
par luniversit Panthon-Assas Paris II, le CNRS et le CERSA.
4 http://ec.europa.eu/justice/data-protection/article-29/documentation/opinionrecommendation/files/2013/wp207_en.pdf.
1
2
- 30 -
- 31 -
Loi n 78-753 du 17 juillet 1978 portant diverses mesures damlioration des relations entre
ladministration et le public et diverses dispositions dordre administratif, social et fiscal
2 Loi n 78-17 du 6 janvier 1978 relative linformatique, aux fichiers et aux liberts
1
- 32 -
- 33 -
Ces administrations sont : ltat, les collectivits territoriales et les autres personnes de droit
public ou les personnes de droit priv charges dune mission de service public.
1
- 34 -
1 CADA, avis n 20082716 du 31 juillet 2008, Maire de Chelles. La CADA note dabord que la
directive 2003/98/CE du 17 novembre 2003 prcite, dont la loi CADA assure la transposition,
exclut de son champ dapplication non seulement les documents qui, conformment aux rgles
daccs en vigueur dans les tats membres, ne sont pas accessibles , mais galement les
cas, dans lesquels, conformment aux rgles daccs, les citoyens ou les entreprises
doivent dmontrer un intrt particulier pour obtenir laccs aux documents . Elle en dduit
donc que les rgles prvues au chapitre II du titre Ier de [la] loi ne sappliquent quaux
informations dont la communication constitue un droit pour toute personne, en application
dune disposition lgislative, et non celles qui ne sont accessibles qu certaines personnes
raison de leur qualit ou de leur intrt .
- 35 -
- 36 -
Cf. conseil de la CADA, n 20062674 du 29 juin 2006, Prsident du conseil gnral de lIsre
et CAA Lyon, 3 me chambre, 4 juillet 2012, Dpartement du Cantal.
1
- 37 -
- 38 -
- 39 -
- 40 -
- 41 -
- 43 -
- 44 -
1. Un risque avr
a) Les techniques danonymisation
Lanonymisation peut tre dfinie comme lopration de suppression
de lensemble des informations permettant didentifier directement ou
indirectement un individu, contenues dans un document ou une base de
donnes.
Selon les informations fournies par la CNIL vos rapporteurs, trois
mthodes peuvent tre employes pour parvenir ce rsultat : la
substitution parfois appele aussi pseudonymisation , la suppression ou le
masquage , et, enfin, lagrgation.
La substitution ou la pseudonymisation
Cette mthode consiste remplacer lidentifiant initial dune
personne par un autre identifiant arbitraire, un pseudonyme1.
Pour garantir la traabilit et la mise jour des informations dans la
base et viter dassocier un individu les donnes relatives un autre, faute
de disposer dun identifiant prenne, il est ncessaire que, pour chaque
personne, ce pseudonyme soit unique.
cette fin, il peut tre tabli de trois manires diffrentes.
Une table de correspondance secrte peut tre gnre, qui associe
une fois pour toutes, lensemble des identifiants avec les pseudonymes qui
leur ont t attribus. Le niveau de scurit de cette technique
danonymisation est faible. Lopration est en effet rversible, puisquon
peut retrouver lidentifiant partir du pseudonyme et que celui qui dtient
la table lit livre ouvert dans la base donne : lanonymisation nest garantie
quautant que cette table reste secrte.
La seconde faon de procder la pseudonymisation est dutiliser
un algorithme de chiffrement : lensemble des identifiants initiaux sont
transforms en des pseudonymes uniques. Lopration est, l encore,
rversible, puisque lon peut retrouver lidentifiant partir du pseudonyme,
pour peu que lon sache quel algorithme de chiffrement a t utilis.
La dernire faon de procder la substitution dun pseudonyme
lidentifiant initial est de recourir une fonction dite de hachage , qui
prsente la particularit, par rapport aux algorithmes de chiffrement
standards, de ne pas tre rversible : il nest pas possible de retrouver
lidentifiant initial partir du seul pseudonyme, mme si lon connat la
fonction de hachage utilise.
Ce pseudonyme peut parfois tre un nom de code, le risque tant alors quil y ait une
correspondance implicite entre lidentifiant initial et ce nom de code. Le plus souvent, il sagit dune
suite arbitraire de caractres alphanumriques.
1
- 45 -
- 46 -
Lagrgation
Cette dernire mthode consiste rassembler plusieurs donnes de
mme type, afin de produire une donne agrge qui conserve linformation
dont on a besoin, mais rend impossible lidentification de la part
dinformation agrge qui correspond un individu donn.
Par exemple, plutt que de retenir les deux informations selon
lesquelles M. Dupont sest prsent au guichet de telle administration 10h
et M. Durand 11h, on retiendrait linformation agrge selon laquelle deux
personnes se sont prsentes dans la matine au guichet concern, ce qui
permet de connatre, avec une certaine prcision, le taux de frquentation de
cette administration, sans poser de problme didentification des administrs
en cause.
Ce procd est dusage courant en matire statistique. Plus le niveau
dagrgation est lev, moins il y a de risques de r-identification, mais, dans
le mme temps, moins linformation est prcise. Lautorit en charge de la
base de donnes doit donc trouver un quilibre satisfaisant entre la
robustesse de lanonymisation garantie par le niveau dagrgation et la
prcision des donnes quelle autorise. Dune manire gnrale, la CNIL
recommande de ne pas faire figurer de statistiques conues partir dune
agrgation infrieure dix lments.
b) Des techniques qui ne sont pas infaillibles
Comme la indiqu le reprsentant de linstitut national de la
recherche en informatique et en automatique (INRIA), M. Claude Kirchner,
lors de son audition, aucune technique danonymisation nest en thorie
infaillible.
Ainsi, la scurit offerte par les procds de pseudonymisation
dpend, comme on la vu prcdemment, de la confidentialit des outils de
codage utiliss (algorithme, cl secrte, table de correspondance). Il peut
toutefois tre facilement remdi ce dfaut, en levant le niveau de
confidentialit de ces instruments.
En ralit, la principale faille de lensemble de ces procds
danonymisation tient aux donnes mmes auxquelles ils sont appliqus.
Les liens tablis entre elles, qui constituent la raison dtre des bases
informatiques qui les rassemblent sont parfois aussi identifiants que chacune
de ces donnes prise isolment.
Prenons lexemple dune base de donnes rassemblant le nom, la
date de naissance, le lieu de naissance et le niveau dimposition. Elle pourrait
tre anonymise en ne retenant que linitiale du nom et lanne de naissance
(anonymisation par suppression ou masquage). Cependant si lon croise ces
informations dgrades avec le lieu de naissance, il est possible de
r-identifier certains individus, en particulier, ceux ns dans des communes
- 47 -
- 48 -
Ainsi, il suffirait, pour retrouver dans la base le dossier dune personnalit, de savoir quelles
dates elle a t hospitalise et o (les autres informations domicile, ge et sexe, tant trs facile
connatre), pour identifier le pseudonyme qui lui a t attribu et avoir potentiellement accs
lensemble de ses informations mdicales.
2 Pierre-Louis Bras, Andr Loth, Rapport sur la gouvernance et lutilisation des donnes de
sant, remis la ministre des affaires sociales et de la sant, septembre 2013, p. 27. Le rapport est
consultable ladresse suivante : http://www.drees.sante.gouv.fr/rapport-sur-la-gouvernance-et-lutilisation-des-donnees-de,11202.html.
1
- 49 -
En effet, ils se sont aperus que la seule information donne par le croisement entre
lapprciation porte sur trois films, et la date laquelle ils ont t lous, tait suffisante
pour retrouver lauteur de ces apprciations, sil avait fait tat dapprciations identiques
aux mmes dates, sur un autre site ou dans un forum de discussion dans lequel il
apparaissait sous sa vritable identit. Lidentification pouvait mme tre accomplie avec
moins dinformations si le film en question tait relativement rare1.
- 50 -
- 51 -
- 52 -
sorganisent
empiriquement,
faute
- 53 -
- 54 -
- 55 -
- 56 -
- 57 -
Recommandation n 1
Poser le principe que ladministration est tenue de mettre en ligne
progressivement, en les anonymisant si ncessaire, toutes les bases de
donnes quelle dtient et qui seraient susceptibles dtre communiques
un citoyen sil en fait la demande ou qui font lobjet dune diffusion
publique sur un autre support
Ladministration ne pourrait sy opposer quen raison des cots
draisonnables de gestion que cette mise en ligne imposerait (notamment
les cots danonymisation ventuelle), ou du risque avr, quen dpit des
prcautions prises, des informations personnelles puissent tre ridentifies
- 58 -
Pour tre utile, cette phase transitoire doit tre organise : chaque
service doit procder, de manire plus systmatique quaujourdhui, la
recension des bases de donnes quil dtient. La mise en ligne des jeux de
donnes susceptibles de ltre doit tre programme, en tenant notamment
compte du temps ncessaire leur anonymisation ventuelle.
Ce chantier conduit par les administrations doit tre plac sous la
vigilance des citoyens : sauf exception, lies par exemple des impratifs de
scurit publique, la liste de lensemble des bases de donnes labores ou
dtenues par chaque service doit tre publie sur le site du ministre, de
ltablissement public ou de la collectivit en cause. Pour chaque base,
mention devrait tre porte de la date prvisible laquelle elle sera mise en
ligne, ou, si cette mise en ligne est refuse, de la raison de ce choix. Ainsi les
citoyens pourront plus facilement contester devant la CADA ou le juge
administratif la dcision de ladministration.
Vos rapporteurs relvent cet gard, que dores et dj, larticle 17
de la loi CADA fait obligation aux administrations de tenir la
disposition des usagers un rpertoire des principaux documents dans
lesquelles figurent les informations publiques susceptibles de faire lobjet
dune rutilisation.
Force est toutefois de constater, que peu dadministration respectent
cette rgle et tiennent jour une telle liste sur leur site internet. Etalab a en
principe lanc un vaste mouvement de recension. Il est absolument
ncessaire de le faire aboutir.
Recommandations nos 2 et 3
Afin de permettre aux administrations de satisfaire lobligation
prcdente, mettre en place une phase transitoire, pendant laquelle elles :
- opreraient une recension complte des jeux de donnes quelles
dtiennent et dcideraient de leur mise en ligne ;
- publieraient un calendrier pluriannuel des mises dispositions
programmes
Imposer aux administrations dindiquer, pour chaque jeu de
donnes, en marge du registre publi sur leur site internet les numrant,
sil fera ou non lobjet dune mise en ligne et, dans ce dernier cas, la raison
pour laquelle elles sy opposent
- 59 -
Recommandation n 4
Le cas chant, examiner lopportunit dtendre les cas, dfinis
par la loi, dans lesquels, compte tenu de lintrt gnral qui sy attache,
des jeux de donnes incluant des donnes personnelles peuvent, par
exception, tre diffuss en ligne et ouverts aux rutilisations
Dcret n 2013-414 du 21 mai 2013 relatif la transparence des avantages accords par les
entreprises produisant ou commercialisant des produits finalit sanitaire et cosmtique destins
lhomme.
2 Avis CADA, n 20121581 du 19 avril 2012, Directeur de la CNAMTS.
1
- 60 -
Recommandation n 5
Prvoir, ds la conception de la base, dans la perspective de sa
possible ouverture :
- les modalits de son anonymisation ventuelle ;
- le cas chant, le marquage des jeux de donnes afin dtre en
mesure de suivre les rutilisations ventuelles et dnoncer les msusages
- 61 -
Recommandation n 6
Procder, pralablement tout examen de lopportunit douvrir
une base de donnes, ainsi, le cas chant, qu intervalles rguliers, une
analyse du risque de r-identification et des consquences possibles dune
telle r-identification
Cf. CNIL, Guide : Grer les risques sur les liberts et la vie prive, disponible ladresse
suivante :
http://www.cnil.fr/fileadmin/documents/Guides_pratiques/CNILguide_Securite_avance_Methode.pdf.
2 Sur cette stratgie, cf. le guide pratique de lICO, Anonymisation : managing data protection risk
code of pratice, disponible ladresse suivante :
http://ico.org.uk/~/media/documents/library/Data_Protection/Practical_application/anonymisationcodev2.pdf.
1
- 62 -
Recommandations n 7 et 8
En cas de risque avr sur les donnes personnelles, impossible
liminer par des procds danonymisation, refuser louverture des
donnes ou, si le bnfice social attendu de cette ouverture est jug trop
important, procder une ouverture restreinte de cette base
Concevoir cette fin un continuum de solutions daccs aux
donnes, allant de lopen data, jusquaux modes daccs les plus slectifs
- 63 -
Enfin, ont seulement accs aux donnes agrges, les fdrations professionnelles
rgionales, ou les associations membres des collectifs associatifs prcdemment voqus1
Les accs ponctuels correspondent laccs, limit dans le temps, une sous-base du
SNIIRAM, ou lobtention dune extraction des donnes, des fins de recherche
principalement. Seules les demandes but non lucratif sont recevables.
Selon le cas, lautorisation daccs doit tre valide par linstitut des donnes de sant (accs
temporaire aux donnes agrges ou lchantillon des bnficiaires) ou par cet institut et
la CNIL (extraction de donnes du SNIIRAM). Les demandes sont instruites selon une
procdure complexe qui peut aussi faire intervenir, outre ces deux institutions, le comit
consultatif sur le traitement de linformation en matire de recherche dans le domaine de la
sant ou le conseil national de linformation statistique.
Laccs aux donnes des enqutes de lINSEE
Les fondements de la protection des donnes des enqutes statistiques conduites par
lINSEE ont t poss ds les annes 50, par la loi n 51-711 du 7 juin 1951 sur lobligation,
la coordination et le secret en matire de statistiques, qui a cr, en contrepoint de
lobligation de rpondre aux enqutes statistiques, la garantie du secret sur les informations
ainsi communiques.
Cette loi a institu un comit du secret statistique, plac auprs du conseil national de
linformation statistique, et charg de se prononcer sur toute demande daccs aux donnes
individuelles collectes dans le cadre denqutes de lINSEE, formule par une quipe de
recherche.
Afin de faciliter laccs ces donnes, en conservant le mme degr de protection des
donnes personnelles, lINSEE a mis en place un dispositif technique, le centre daccs
scuris distant aux donnes (CASD), qui permet au service producteur des donnes de
surveiller les oprations effectues sur les donnes, dviter certains croisements ou
extractions de donnes, tout en apportant au chercheur lensemble des lments dont il a
besoin.
Les quipes de recherche ont aussi la possibilit daccder des donnes anonymises, soit
publies directement sur le site de lINSEE sous forme de statistiques agrges, soit
extraites la demande et anonymises, sous condition de licence dusage, interdisant
notamment la rediffusion destination de tiers.
- 64 -
Article 6 de la loi n 2004-575 du 21 juin 2004 pour la confiance dans lconomie numrique.
- 65 -
Recommandations n 9 et 10
Assurer une veille sur la diffusion et les rutilisations des donnes
publiques, en facilitant notamment les procdures par lesquelles un
rutilisateur peut alerter ladministration comptente
Assurer aussi cette veille sur les donnes publies par des tiers sur
les sites publics
Recommandation n 11
Prvoir que ladministration dfinisse une stratgie de
rapatriement ou de suppression des jeux de donnes compromis, afin de
remdier rapidement la diffusion accidentelle dinformations
personnelles
- 66 -
Recommandations n 12, 13 et 14
Exclure expressment les donnes personnelles du champ
dapplication de la licence ouverte utilise par les administrations pour la
rutilisation des donnes publiques
Interdire expressment dans le contrat de licence toute
rutilisation abusive qui aboutirait lever lanonymisation des donnes
Intgrer au contrat de licence, une clause de suspension lgitime
du droit de rutilisation, ainsi que de suppression ou de rapatriement des
jeux de donnes compromis lorsquun risque de r-identification est
apparu
- 67 -
Recommandations n 15 et 16
Mettre en place, auprs de la mission Etalab, une structure ddie
la protection des donnes personnelles et charge dassister les
administrations :
- dans llaboration de ltude dimpact pralable la mise
disposition des donnes ;
- dans lanonymisation ventuelle de la base ;
- dans la mise en place dun mode daccs restreint
Confier cette mme structure un rle de veille sur les
rutilisations abusives au regard de la protection des donnes
personnelles, en la chargeant de recueillir les alertes ventuelles, den
informer la CNIL, et de coordonner, le cas chant, le retrait ou la
reconfiguration de la base de donnes litigieuse
- 68 -
Recommandation n 17
Rassembler et diffuser les bonnes pratiques et les
recommandations en matire de protection des donnes personnelles dans
lopen data
- 69 -
Recommandation n 18
Investir les CIL et les PRADA dattribution de coordination et de
veille en matire de protection des donnes personnelles dans le cadre de
lopen data
Cf. Ouverture des donnes publiques Les exceptions au principe de gratuit sont-elles
toutes lgitimes ?, rapport remis au Premier ministre par M. Mohammed Adnne Trojette, juillet
2013.
- 70 -
Recommandation n 19
Garantir le financement par ltat des mesures danonymisation
des donnes personnelles contenues dans des jeux de donnes publiques
Ne pas renoncer par principe au prlvement dune redevance en
prsence de cots danonymisation levs
Encourager le financement coopratif de lanonymisation
- 71 -
Recommandation n 20
Prciser que, lorsque des donnes personnelles sont mises en ligne
en vertu de la loi, cette publication doit se limiter la stricte mesure
ncessaire au respect de lobjet vis par cette loi
CONCLUSION
- 73 -
CONCLUSION
Louverture et le partage des donnes publiques reprsentent, pour
les administrations, un dfi de taille, et pour les citoyens ou les entreprises,
une opportunit considrable. Rien ne serait pire, cependant, que de
manquer lun ou lautre, faute de stre assur que cette ouverture respecte
bien lintrt de chacun.
Notre pays sest honor placer lexigence de protection de la vie
prive au cur de la rvolution numrique. Les fondements solides de notre
droit devraient, en principe, garantir que lopen data se droule sans heurt,
car les lois de 1978 excluent que les administrations puissent diffuser autre
chose que des informations publiques.
Les premiers dveloppements de lopen data franais peuvent
sembler rassurants, de ce point de vue : de rares exceptions prs, les
donnes mises en ligne paraissent se conformer aux exigences juridiques.
Toutefois, ce cadre protecteur est fragilis par deux failles : un risque
avr de r-identification et un dfaut de gouvernance qui laisse souvent les
administrations dmunies face des problmatiques quelles ne matrisent
pas toutes avec la mme aisance.
Loin de vouloir freiner un mouvement dont lutilit sociale est
acquise, votre mission dinformation a plutt vu lopportunit de donner un
nouvel lan louverture et au partage des donnes publiques, la condition
que soient mises en uvre une doctrine et une mthode qui garantissent la
meilleure protection des donnes personnelles possible. Car, une fois cette
protection assure, aucun obstacle au dploiement de lopen data nest plus
lgitime.
La mission dinformation de votre commission recommande donc de
poser le principe dune obligation de mise en ligne des donnes dtenues par
les administrations, moins que le cot en soit trop important ou que les
risques pour la vie prive ne puissent tre levs par une anonymisation
efficace.
Les administrations de ltat et des collectivits territoriales doivent
sinvestir dans cette voie et mettre en uvre une doctrine de protection des
donnes personnelles, en anticipant et valuant les risques, en y adaptant les
formats de diffusion des donnes et en exerant une veille vigilante.
Elles doivent tre secondes dans cette tche par ltat, qui devra
veiller leur apporter, par une structure ddie, une assistance technique,
organisationnelle et juridique, et garantir le financement des chantiers
quengage lopen data, notamment en matire danonymisation.
Trouver dans la protection des donnes personnelles le levier pour
porter plus haut lexigence de transparence de laction publique : le pari est
audacieux, mais il est conforme lambition que notre pays a dmontre
depuis les lois pionnires de 1978.
EXAMEN EN COMMISSION
- 75 -
EXAMEN EN COMMISSION
M. Jean-Pierre Sueur, prsident. prsent, MM. Gorce et Pillet
nous prsentent le rapport dinformation quils ont ralis sur lopen data et la
protection de la vie prive.
M. Gatan Gorce, rapporteur. Langlicisme open data dsigne la
mise disposition dun maximum de donnes dtenues par les
administrations dans des conditions techniques, juridiques et financires
favorables leur rutilisation par des tiers. Techniques : en les rendant
accessibles dans des formats non propritaires. Juridiques : en limitant les
obstacles leur rutilisation. Financires : en ne soumettant pas leur
rutilisation au paiement dune redevance. Tels sont les principes retenus
par la plupart des gouvernements. Cette nouvelle notion est intressante,
mais pose un certain nombre de problmes.
Dabord, lobjectif de lopen data est encore incertain. Pourquoi
diffuser largement des donnes servant au bon fonctionnement des services
publics ? Dans les annes 1990, la demande de libration des donnes
manait essentiellement duniversitaires soucieux de ne pas rserver le
produit de leurs recherches leurs seuls commanditaires ; daucuns y ont
ensuite vu, aux tats-Unis, une source de richesse ; depuis quelques annes,
lopen data est dfendu au nom de principes politiques et dmocratiques, et
justifi par larticle 15 de la Dclaration des droits de lhomme et du citoyen
de 1789.
Les textes existants, comme la circulaire Fillon ou le dcret de
fvrier 2011 instituant Etalab reposent sur ces principes de transparence et de
contrle, ainsi que sur une exigence renouvele de modernisation de laction
publique. Tous ces fondements, relativement confus, gagneraient tre
prioriss. Au nom du dbat public, le portail tabli par Etalab accueille ainsi
des donnes prives, sans que cela soit clairement mentionn ni quait t
pralablement dfinie la responsabilit de lhbergeur
Cette politique souffre ensuite dune certaine complexit juridique.
La principale base juridique laccs largi aux donnes publiques est
fournie par la loi du 17 juillet 1978 relative laccs aux documents
administratifs. Or nous sommes passs dune logique de la demande une
logique de loffre. La loi distingue dsormais les documents que
ladministration a lobligation de communiquer, de ceux quelle a la facult
de mettre disposition des usagers. En 2005, le droit de rutilisation de ces
donnes a t prcis par ordonnance, sous rserve des dispositions de la loi
Informatique et liberts du 6 janvier 1978. Cette sdimentation rend
lensemble peu cohrent et suscite des difficults dinterprtation.
- 76 -
EXAMEN EN COMMISSION
- 77 -
- 78 -
Yves Dtraigne dans leur rapport de mai 2009 sur la protection de la vie
prive lheure du numrique.
Adapter la gouvernance de lopen data impose galement de garantir
le financement des mesures danonymisation. Une redevance nest pas
ncessairement quelque chose de diabolique. Le financement priv ne doit
pas tre exclu, non plus que le financement coopratif. Enfin, il conviendrait
de clarifier le droit applicable aux donnes publiques lorsque des donnes
personnelles sont mises en ligne en vertu de la loi : cette publication se
limiterait la stricte mesure ncessaire au respect de lobjet vis par la loi.
M. Jean-Jacques Hyest. La mission commune dinformation
relative laccs aux documents administratifs, que je prside et dont la
cration a t demande par le groupe cologiste, touche tous ces sujets.
Les documents administratifs, ce nest plus seulement du papier Nous
abordons galement la jurisprudence de la CADA dont vous navez pas
parl, mais je ne doute pas que le rapport crit sy intresse. Vous auriez pu
insister encore plus sur les risques pesant sur les donnes personnelles dans
le secteur de la sant. La semaine dernire encore, le Monde a consacr une
double page aux risques de rutilisation des donnes de connexion des fins
commerciales En outre, Etalab, compte tenu de sa structure, ne me semble
pas en mesure de jouer un rle de rgulateur. Lui confier des missions plus
vastes ne me parat pas simposer.
M. Yves Dtraigne. Je flicite nos deux rapporteurs pour leur
remarquable travail, et peux attester que celui de la mission commune
dinformation prside par Jean-Jacques Hyest, dont jai suivi quelques
auditions, lest tout autant.
La France a jou un rle pionnier en matire daccs aux documents
administratifs avec la loi CADA. Conservons notre avance dans ce domaine.
Nous savons que les enjeux conomiques et financiers de lopen data sont
normes, en termes de dveloppement dapplications et de crations
dentreprises. Nous sous-estimons mme sans doute leur ampleur. Je salue le
travail du Snat pour viter que le ncessaire dveloppement de la
circulation des donnes ncessaire, car nous sommes dans un monde
ouvert ne porte atteinte aux donnes prives.
Il reste beaucoup faire. De nouveaux champs seront sans doute
investis. Je suis un peu inquiet sur lavenir du libre-arbitre, dans une socit
o tout ce qui touche chacun dentre nous sera accessible tous sur la toile.
M. Jean-Pierre Sueur, prsident. Vaste question. Nous y
reviendrons lorsque la mission commune dinformation prside par JeanJacques Hyest aura remis son rapport.
M. Franois Pillet, rapporteur. Monsieur Hyest, nous proposons
de crer une structure auprs dEtalab ddie la protection des donnes
caractre personnel et charge dassister les administrations. Etalab manque
dagents pour le faire.
EXAMEN EN COMMISSION
- 79 -
- 81 -
pour
les
questions
- 82 -
Mission Etalab
M. Henri Verdier, directeur de la mission
Mme Suzanne Vergnolle, charge de mission affaires publiques
et juridiques
Oprateur public
Institut national de linformation gographique et forestire (IGN)
M. Pascal Berteaud, directeur gnral
M. Franois Baudet, secrtaire gnral
Collectivits territoriales
Open Data France
Mme Erwane Monthubert, conseillre municipale de Toulouse,
dlgue aux Technologies de linformation et de la communication
Mme Sandrine Mathon, chef du service administration, direction
des systmes dinformation, mairie de Toulouse et Toulouse
Mtropole
Associations
Association franaise des correspondants la protection des donnes caractre
personnel (AFCDP)
M. Paul-Olivier Gibert, prsident
- 83 -
prsident,
directeur
des
archives
Regards Citoyens
M. David Gayou, administrateur, ingnieur recherche et dveloppement
M. Tangui Morlier, administrateur, consultant en informatique
UFC-Que choisir
M. Mathieu Escot, charg dtudes sant
M. Antoine Autier, charg de mission nouvelles technologies
- 84 -
Entreprises
Data Publica
M. Franois Bancilhon, prsident-directeur gnral
Google France
M. Benot Tabaka, directeur des politiques publiques
GrDF
M. Anthony Mazzenga, dlgu du ple stratgie
M. Sylvain Chapon, dlgu des affaires publiques
OpenDataSoft
M. Jean-Marc Lazard, prsident-directeur gnral
Journalistes
M. Antoine Champagne, directeur de la rdaction de Reflets.info
M. Nicolas Kayser-Bril, journaliste
M. Jean-Marc Manach, journaliste
- 85 -
Personnalits qualifies