Vous êtes sur la page 1sur 71

LES AVIS

DU CONSEIL
CONOMIQUE,
SOCIAL ET
ENVIRONNEMENTAL

Les donnes numriques :


un enjeu dducation
et de citoyennet
ric Peres
Janvier 2015

2015-01
NOR : CESL1500001X
Lundi 19 janvier 2015

JOURNAL OFFICIEL
DE LA RPUBLIQUE FRANAISE
Mandature 2010-2015 Sance du 13 janvier 2015

LES DONNES NUMRIQUES :


UN ENJEU DDUCATION ET DE CITOYENNET
Avis du Conseil conomique, social et environnemental
prsent par
M. ric Peres, rapporteur
au nom de la
section de lducation, de la culture et de la communication

Question dont le Conseil conomique, social et environnemental a t saisi par dcision de


son bureau en date du 13 mai 2014 en application de larticle 3 de lordonnance no 58-1360 du
29 dcembre 1958 modifie portant loi organique relative au Conseil conomique, social et
environnemental. Le bureau a confi la section de l'ducation, de la culture et de la communication
la prparation dun avis intitul : Les donnes numriques : un enjeu d'ducation et de citoyennet.
La section de lducation, de la culture et de la communication, prside par M. Philippe Da Costa, a
dsign M.Eric Peres comme rapporteur.

Sommaire
Avis ________________________________________

Introduction

Constats et enjeux

Enjeux et usages du Big Data: le traitement des donnes numriques


au cur des transformations conomiques et sociales

Big Data: Origine et dfinition

Caractristiques de la donne

Explosion, massification et stockage des donnes

11

Production et traitement des donnes:

les caractristiques du Big Data

14

Des donnes numriques aux mtadonnes

15

Le Big Data et la rgle des 3V: volume, varit, vitesse

16

Big Data et systme dcisionnel

16

La donne numrique: valorisations sociales,


conomiques et environnementales

17

La donne numrique, nouvelle ressource conomique

17

Opportunits du Big Data:

de la sant la matrise nergtique

19

Le domaine de la recherche en gnral et mdicale

en particulier

20

Transition numrique et dveloppement durable

22

De la ville intelligente (smart city) la mobilit connecte

23

La citoyennet lre du numrique, un nouveau pouvoir dagir

24

Culture, ducation et nouveaux accs aux savoirs

lre du numrique

24

Nouveaux pouvoirs de cration et dchanges:

des FabLabs lconomie collaborative


Accs aux donnes publiques: un nouveau regard citoyen

30
31

Les nouveaux enjeux sociaux et culturels de la fracture numrique 35

Lenjeu de la souverainet numrique

37

La valeur conomique capte par les GAFA

(Google, Apple, Facebook, Amazon)


Lillusion du tout gratuit
2 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

38
39

Les liberts lre du numrique:

une relation sous tension

40

La collecte exponentielle des donnes


face aux risques de lhypersurveillance

41

De la collecte de donnes au fichage gnralis:

de laffaire Safari laffaire Snowden


Big Data ou Big Brother?

41
42

Vie prive et protection des donnes personnelles

45

La protection de la vie prive: risques et inquitudes

46
48

Open Data et donnes personnelles


Objets connects et algorithmes:

nouveaux enjeux et nouveaux risques

Puissance des plateformes et pouvoir des algorithmes

51
55

Protection et matrise des donnes:


nouveaux enjeux et nouvelles approches

58

La protection des donnes caractre personnel:


un impratif dmocratique

59

La loi Informatique et Liberts

59

Les diffrents textes et accords-cadres:

de la Convention 108 la Directive 1995


Le projet de rglement europen

63
65

La protection des donnes personnelles:


entre rgulation et autorgulation

65

Complmentarits de la loi et de la technologie

66

La matrise des donnes personnelles:

entre confiance et rciprocit

67

Prconisations

71

Promouvoir lducation au numrique

71

Accompagner et soutenir le rle ducatif


de la famille dans la transition numrique

72

Promouvoir des campagnes publiques de sensibilisation

la protection des donnes personnelles

Renforcer la protection des mineurs

72
73

Soutenir le dploiement dune ducation


au numrique de la maternelle lenseignement suprieur

74

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 3

Favoriser lacquisition dune ducation lesprit critique

du dveloppement et de la matrise des techniques numriques


Renforcer lducation au numrique dans les programmes scolaires
Promouvoir la certification renforce
via le brevet informatique et internet B2i
Renforcer la formation au numrique
au sein de lEducation nationale et de lenseignement suprieur
tablissements scolaires et le dploiement des outils numriques

75
75
76
77
79

Lutter contre les nouvelles fractures numriques

80

Redynamiser les politiques publiques sur les territoires

81
81

Revitaliser les Espaces publiques numriques (EPN)


Repenser un service universel ddi aux actions

daccompagnement des citoyens vers la matrise


des donnes numriques
Soutenir les initiatives des tiers-lieux pour renforcer
les rseaux daccompagnement la matrise du numrique
Lutter contre lenfermement de linternet
en renforant le lien intergnrationnel.

84
85
86

Entreprises, administrations: quelle ducation au numrique?

87

Promouvoir une politique de scurit et de protection des donnes


au sein des entreprises et des administrations

87

Faire de la protection des donnes personnelles

un nouvel avantage comptitif de lentreprise.


Dvelopper le Privacy by design
comme facteur de diffrenciation comptitive
Promouvoir une thique numrique
au sein des entreprises et des administrations

Btir une politique publique du numrique


et construire une stratgie industrielle
Dvelopper une stratgie numrique pour les donnes
et les technologies de ltat
Etablir de nouveaux principes Design et ergonomie
pour la dmocratie lre numrique
Dvelopper une politique publique du numrique
articule une politique industrielle
en faveur notamment des jeunes pousses.
Matriser les impacts nergtiques
pour une meilleure protection des donnes
Btir un cadre raliste et exigeant
de protection des donnes lre du numrique

4 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

88
90
91
93
93
94

95
97
99

Crer un cadre de protection des donnes


au niveau international

100

Promouvoir un cadre protecteur au niveau international

100

Favoriser une culture europenne du numrique

garante de larchitecture du net


Amliorer et soutenir le projet de rglement europen
sur la protection des donnes
Scuriser les transferts de donnes linternational

103
104

Renforcer les pouvoirs de rgulation


et promouvoir la co-rgulation

105

Renforcer les pouvoirs de rgulation de la CNIL

Protger les donnes personnelles au sein de lopen data

105
109
109
110

Rechercher les voies et moyens pour une maitrise


par les individus de leurs donnes personnelles

111

Promouvoir la prospection et la labellisation


Revoir lencadrement des nouvelles donnes sensibles

101

Revoir les Conditions gnrales de vente (CGV)

et les Conditions gnrales dutilisation (CGU)


De la rcupration au partage des donnes,
le rle des tiers de confiance

113
115

Dclaration des groupes __________________ 116


Scrutin __________________________________ 133
Annexes ______________________________________

135

Annexe n 1 : composition de la section de lducation,


de la culture et de la communication ______________ 135

_________________

137

________________________________

138

____________________________

141

_____________________________

142

Annexe n 2 : liste des personnes auditionnes


Annexe n 3 : glossaire

Annexe n 4 : table des sigles


Annexe n 5 : bibliographie

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 5

LES DONNES NUMRIQUES :


UN ENJEU DDUCATION ET DE CITOYENNET1

Avis
Introduction
Data-driven management, data marketing, dsintermdiation, prescription
algorithmique... pour qui veut simmerger dans lunivers du Big Data, le passage oblig par
une explication de texte est requis. Dans les annes quatre-vingt-dix, linternet tait encore
un outil taille humaine et les rsultats qui apparaissaient la suite dune requte taient
le rsultat davis dexperts humains identifiables . Prs dun quart de sicle plus tard, une
requte sur un moteur de recherche peut gnrer lanalyse des donnes de 200 millions
de sites web. Face cet imposant volume de donnes en circulation, seule une poigne
dentreprises ont su dployer une infrastructure de type Big Data capable de servir des bases
dutilisateurs suprieures 500 millions de personnes (plus dun milliard pour Google et
Facebook, plus de 900 millions pour Microsoft ou plus de 600 millions pour Apple...). La
dsintermdiation est un des risques les plus importants du Big Data, en ce sens que dores
et dj, ces entreprises et autres plateformes du numrique proposent, comme Google
la suite dune requte et de manire quasiment instantane, leur propre panneau de
rponses . Se mouvoir dans cet espace numrique requiert alors une capacit grer et
matriser les donnes qui nous entourent.
La production des donnes a pour lessentiel de notre histoire t le fruit de travaux
complexes auxquels participaient de nombreux acteurs administratifs, culturels ou
conomiques. Le recueil des donnes lchelle dune population entire ncessite des
comptences multiples et souvent des moyens considrables. Larchivage des donnes
constitue aussi un lment dlicat et coteux du processus de transmission des savoirs.
Les plus grandes bibliothques du monde peuvent au mieux conserver quelques millions
douvrages2 et la prennisation de ces lieux ncessite dimportants moyens humains et
techniques. Les processus ainsi mis en uvre induisent une raret des lieux de savoirs et une
obligation de ne conserver de manire durable que les savoirs jugs indispensables. Quil
sagisse des administrations, des entreprises ou des individus, pendant lessentiel de lhistoire
de nos socits, loubli tait la rgle et la mmoire tait lexception. Or, les technologies
numriques ont transform ce rapport linformation en rduisant drastiquement les cots
de stockage et de traitement des informations. Cette conservation massive des donnes
1
2

Lensemble du projet davis a t adopt au scrutin public lunanimit des votants (voir le rsultat
du scrutin en annexe).
La bibliothque du Congrs des tats-Unis considre comme la plus importante au monde rassemble
23 millions douvrages. Lquivalent numrique des ouvrages stocks dans cette bibliothque pourrait
aujourdhui tre stocke sur 20 terabits (soit lquivalent de quelques disques durs de haute capacit). Source
Library of Congress,25 avril 2012 A Library of Congress Worth of Data: Its All In How You Define It.
http://blogs.loc.gov/digitalpreservation/2012/04/a-library-of-congress-worth-of-data-its-all-inhow-you-define-it/

6 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

est devenue un vecteur de changement pour lensemble des organisations, mais elle induit
aussi des changements dans nos modes de vie mesure que les informations personnelles
sont traites et stockes. Face lessor du Big data, les rvlations dEdward Snowden sur les
pratiques mises en place par la NSA ont permis lopinion publique mondiale de prendre
conscience de la vulnrabilit des individus face aux dispositifs qui taient mis en place
sur Internet pour leur apporter des services nouveaux et qui pouvaient dans une logique
inverse devenir un risque pour eux-mmes et pour leurs liberts. Ces rvlations sont ainsi
apparues comme un ncessaire rappel la lucidit pour les citoyens et les organisations
dans la gestion des donnes personnelles et dans la protection des donnes sensibles des
entreprises. Suivant les tudes du CREDOC3, avant mme laffaire Snowden, le premier sujet
dinquitude des internautes reste le risque datteinte aux donnes personnelles. 86% des
mobinautes franais souhaitent pouvoir interdire la transmission de leur golocalisation
des entreprises commerciales.
La matrise des donnes numriques est dsormais devenue un lment crucial de la
participation la vie sociale, culturelle et politique. Dans un premier temps, les usagers des
technologies ont bnfici de la dcentralisation de la puissance de traitement en passant
dordinateurs centraux connects des terminaux, puis des micros ; nous assistons
dsormais la recentralisation dimportantes masses de donnes via les technologies de
linformatique en nuage (Cloud) et bientt la monte en puissance de services associs
aux capteurs et aux objets. Avec ces changements de dispositifs technologiques, cest la
nature des donnes (en plus du volume des informations changes) qui est amene
voluer. En effet, si pour lessentiel, les donnes qui transitent sur internet sont aujourdhui
cres par les humains, dans un avenir proche ce sont les objets connects, leurs capteurs
et autres robots qui gnreront la majorit du trafic sur les rseaux4. La capacit qui sera
donne aux citoyens de matriser ces nouveaux flux de donnes pourrait devenir lune des
caractristiques les plus cruciales de larchitecture informationnelle de nos socits.
Dans le mme temps, lenjeu des donnes numriques est plus que jamais au cur
des questions conomiques et des modles qui les sous-tendent. Pour certains dentre eux,
il sagit de valoriser les donnes des utilisateurs des fins publicitaires, et pour dautres
danalyser ces donnes afin dtablir de nouveaux services valeur ajoute. Ces services
concernent des domaines aussi divers que la sant, la matrise de lnergie, les transports,
le tourisme ou la culture. terme, de nouveaux services se mettront en place en lien avec
de nouvelles gnrations dobjets connects. Lintrt pour les acteurs de lconomie
numrique dintervenir dans la fabrication des objets de grande consommation sera
dautant plus important que ces technologies permettront leur tour de crer des services
nouveaux dans la quasi-totalit des secteurs industriels.
3
4

http://www.arcep.fr/uploads/tx_gspublication/rapport-credoc-diffusion-tic-2012.pdf
La croissance combine du nombre dutilisateurs dInternet et des dbits de connexion a conduit
une explosion du volume des donnes transitant sur les rseaux. En 2012, le trafic mensuel a t de 43
exaoctets par mois, cest--dire 43 milliards de milliards doctets (1018); cest 20 000 fois plus quen 1996.
Le taux de croissance du trafic est encore de 40 % par an, ce qui quivaut un quasi-doublement tous
les deux ans. La monte en puissance de lInternet des objets pourrait en outre donner un essor accru
cette expansion, les donnes transmises par les objets connects sajoutant celles issues des activits des
internautes humains. tude annuelle 2014 du Conseil dtat: Le numrique et les droits fondamentaux
http://www.ladocumentationfrancaise.fr/rapports-publics/144000541-etude-annuelle-2014-duconseil-d-tat-le-numerique-et-les-droits-fondamentaux

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 7

Lconomie mondiale des produits et services numriques reprsente dj plus dun


sixime de lconomie des biens et produits traditionnels (estimes respectivement
15000et 100000milliards deuros)5. Cette part devrait bientt rattraper celles des industries
et services traditionnels et le cur de mtier de lensemble des entreprises industrielles
pourrait ainsi voluer vers des services informationnels.
Ces mutations des usages lis aux donnes numriques correspondent aussi des
changements importants dans les formes culturelles, sociales et politiques que prennent
nos socits. Ces mutations de nos socits ne peuvent (et ne doivent) pas tre induites
mcaniquement par la capacit des technologies ou la volont de quelques acteurs
industriels. Les personnes doivent en effet participer non pas en tant quutilisateurs mais
bien en tant que co-architectes de cette nouvelle socit numrique. En plus de leur
impact conomique, les mesures qui permettront de rendre intelligibles et matrisables les
donnes et les services de linternet, revtent un caractre politique et stratgique pour
lensemble de nos socits. Autant dire que cette transition numrique pose la question
des enjeux dmocratiques dans une socit o la relation entre la surveillance et lEtat de
droit est rinterroge la lumire des moyens mis en uvre pour assurer un contrle et une
surveillance lgitime de ces flux de donnes.

Source Oxford Economics et Citybank, 2011.


http://www.citibank.com/transactionservices/home/docs/the_new_digital_economy.pdf

8 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Constats et enjeux
Enjeux et usages du Big Data:
le traitement des donnes numriques
au cur des transformations conomiques
et sociales
Pas un jour, et ce depuis plusieurs annes, sans quun quotidien, une mission radio,
un ouvrage, une confrence ne relate une discussion, une analyse autour du Big Data. Si la
traduction littrale franaise du Big Data (la grosse donne) est moins sduisante, son
pouvoir de transformation rvle une force dattraction que lon pourrait croire sans limite.
Mais do vient cette donne? De quoi parle-t-on quand daucun voque le nouvel or
noir de lconomie que nous manipulons chaque jour?

Big Data: Origine et dfinition


Si lexpression Big Data , que lon peut traduire par exploitation de trs grands
volumes de donnes, nest apparue quen 2010, le concept est plus ancien et remonte
plus dune dizaine dannes, lorsque les donnes sont devenues trop volumineuses pour
tre stockes et manipules laide des techniques classiques. Dans tous les cas, lorsquon
voque le Big Data, le cur du sujet demeure celui de la donne et de son traitement.

Caractristiques de la donne
La donne nest quun matriau brut de base. Pourtant sa collecte et son traitement
peuvent conduire au savoir entendu comme une information tablie au rang de vrit
provisoire scientifiquement accepte et la connaissance entendue comme ce que chacun
de nous construit partir des interactions avec son environnement. Parler de data voque
alors une information numrique ou alphanumrique, code, lisible par la seule machine, en
vue de son enregistrement, traitement, conservation et communication. Les processus nont
pas contemporain. La codification, la fixation et la transmission dinformations sont une srie
doprations anciennes, qui est lorigine du dveloppement de lcriture, des changes
marchands, de la comptabilit, de limposition, de la monnaie, des transports, des sciences
et, en consquence, de la richesse des Nations. Lobservation de la structure des rvolutions
scientifiques6 suggre quelles suivent souvent un mme droulement : la collecte de
donnes met mal la thorie scientifique dominante, qui entre en crise avant dtre
remplace par une nouvelle thorie, cadre qui est mieux mme dexpliquer les donnes
problmatiques. Le meilleur exemple reste luvre de lastronome danois Tycho Brahe7 qui,
prnant un retour lobservation, a collect le premier une masse tendue de donnes qui
6
7

Thomas Khun, La structure des rvolutions scientifiques, Ed. Flammarion, coll. Champs, 1962..
Tycho Brahe, n Tyge Ottesen Brahe (1546-1601), est un astronome danois. Il prend grand soin de la fabrication
et de la mise au point de ses instruments qui lui permettent de recueillir un nombre considrable de donnes.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 9

a permis dtablir une cartographie fiable du ciel et de formuler des prvisions correctes sur
les mouvements des astres. Dans ce travail du XVIe sicle, la problmatique de la donne est
dj prsente: la collecte massive de donnes et le traitement de celles-ci permettent des
prdictions fiables. En ce sens, mme si la donne est une notion ancienne, cest au dbut de
lpoque moderne que les sciences entament un mouvement de datafication dont luvre
de Brahe est un exemple.
Datification: une donne code, fige et transmissible
La datafication est plus que la simple mesure ou transformation du rel en datas qui
peuvent tre recueillies et analyses. Cest la perception quil y a, dans les grands volumes
de donnes, plus de valeur que dans les petits volumes de datas. Cela tant, mme si Brahe
et dautres peuvent tre prsents comme des exemples de ce mouvement, la datafication
reste jusquau XXe sicle quelque chose de rare. Le dveloppement rcent de linformatique
change cela, en permettant de simplifier, dacclrer et de massifier la collecte et le
traitement des donnes.
Une donne est, par dfinition, une information code, fige et transmissible. La donne
ncessite une codification, ce qui permet la fois sa collecte et son rapprochement avec
dautres donnes formules dans le mme rfrentiel. Par exemple, une date de naissance
possde un format, et peut tre compare une autre date de naissance. La donne est
fige: la donne doit tre gale elle-mme, sinon sa collecte et son traitement deviennent
impossibles. Deux dates de naissances distinctes ne peuvent tre une donne qui change:
ce sont deux donnes. Enfin, la donne est transmissible : cela signifie quelle peut tre
mmorise, confie un systme denregistrement, pour traitement immdiat ou ultrieur.
La donne numrique est quant elle la donne dont la mmorisation a t confie
un systme informatique (et non un papier, par exemple). Cette dfinition, en raison de sa
simplicit, est dune grande extension et permet de dsigner des ralits trs diffrentes:
une donne numrique peut tre cre et non collecte mme si, le plus souvent, on
entend dsigner par donne numrique des donnes qui ont t collectes.
La donne personnelle
cet gard, le terme franais de donne est trompeur : il sous-entend que cette
information est donne volontairement. Or, une part importante des donnes ne sont pas
perues par leurs propres utilisateurs comme des donnes. Par exemple, nos donnes de
navigation sur Internet sont des donnes conomiques prcieuses, que nous ne percevons
souvent pas comme telles. Enfin, certaines donnes qui nous paraissent anodines, peuvent
si elles sont rapproches fournir des informations personnelles, que nous ne dsirons pas
partager. Bien que ces informations ne soient pas des donnes numriques lmentaires,
elles peuvent par diffrents procds de traitement devenir des donnes part entire. En
ce sens, la donne ne procde pas toujours du don: elle peut tre absorbe et construite.
Afin de ne pas entretenir de confusion sur le caractre volontaire ou involontaire de la
donne, on peut lui prfrer le terme de data.
Il faut noter que la donne personnelle est la fois une information dclarative sur la
personne et un ensemble dinformations non dclares, mais recueillies automatiquement
notamment lors de la navigation sur les sites web. Concrtement, quand un individu sinscrit
sur un site pour accder un produit ou un service, il donne son adresse lectronique
et, accessoirement, son nom, son prnom et parfois quelques autres informations. Elles
contiennent ainsi lensemble des coordonnes, traces que nous laissons sur les sites,
10 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

moteurs de recherche, rseaux sociaux mais galement dans le monde physique (muses,
htels). Elles nous dfinissent et refltent, parfois notre insu, notre personnalit, nos gots,
nos aspirations, nos proccupations, notre vie prive , pour reprendre les propos de Laure
Kaltenbach du Forum dAvignon.
Lexploitation des donnes personnelles8 nest pas rcente. En revanche, la capacit
exponentielle doutils de collecte, de stockage et la puissance des algorithmes de traitement
ont pour caractristique de circonscrire la vie prive, de prdire nos comportements et
motivations notamment dachat.
La question du stockage et indirectement celle de la protection des donnes numriques
concerne directement trois types dacteurs: le citoyen, lentreprise, ltat. Pour le citoyen se
pose la question de lhbergement de ses donnes personnelles hors du territoire, chez des
acteurs qui ne relvent pas forcment dune juridiction nationale, dans des conditions de
scurit non garanties. Pour lentreprise, cette question se pose galement et est couple
une sorte de dilemme: externaliser le stockage des donnes ou le grer en interne avec
les risques inhrents cette activit. Enfin, pour ltat, sajoute aux enjeux prcdents la
question du besoin nergtique et celle du dveloppement durable : les infrastructures de
stockage des donnes ncessitent, entre autres, des quipements de distribution lectrique.

Explosion, massification et stockage des donnes


Depuis les origines de lhumanit et jusquen 2003, lhumanit avait produit 5 exaoctets
de donnes numriques, soit 5milliards de milliards doctets9. En 2010, il suffisait de 2 jours
pour produire le mme volume et depuis six ans, le poids de la data dans les communications
lectroniques augmente de 5 points par an10. Les socits Internet ont ainsi t submerges.
Pour exemple, Google traite quotidiennement plus de 24 ptaoctets de donnes, ce qui
correspond en volume des milliers de fois la quantit de tous les documents imprims de
la Bibliothques du Congrs amricain.11
Chaque minute, 350 000 tweets, 15 millions de SMS et 200 millions de courriels sont
envoys au niveau mondial. lhorizon 2018, le trafic gnr par les tlphones mobiles
devrait tre douze fois plus important que celui qui est constat aujourdhui. La socit
franaise Criteo12 avance ainsi que 90% de la data qui est disponible aujourdhui dans le
monde a t cre depuis deux ans. En aot 2012, Facebook fait savoir que, chaque jour,
taient enregistrs sur ses rseaux 70 000 requtes, 300 millions de photographies et
2,5 milliards dobjets documentaires changs. Si lon tient compte de toutes les sources
de donnes, il faut, en 2013, dix minutes pour produire 5 exaoctets dinformations. Il fallait
deux jours en 2011 pour gnrer une volumtrie comparable, selon Eric Schmidt, lancien
PDG de Google.13
8
9
10
11
12
13

Nominatives lexclusion des donnes sensibles que sont notamment les donnes relatives ltat de
sant, aux orientations sexuelles, aux origines ethnique et lappartenance politique, syndicale ou religieuse.
Stphano Lupieri, journalistes, Les Echos :
http://archives.lesechos.fr/archives/2012/Enjeux/00294-036-ENJ.htm#
Op.cit.
Viktor Mayer-Schonberger, Kenneth Cukier. Big Data. Editions Robert Laffont, Paris 2013, p.17.
Criteo est une entreprise franaise de reciblage publicitaire personnalis sur Internet, fonde Paris en 2005.
Elle est cote au NASDAQ depuis 2013. Source Wikipdia 2014.
Google Inc. est une socit fonde le 4 septembre 1998 dans le garage Google dans la Silicon Valley, en
Californie, par Larry Page et Sergue Brin, crateurs du moteur de recherche Google.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 11

Les raisons de cette explosion de donnes tiennent la monte en puissance des


microprocesseurs et de la mmoire informatique, la gnralisation du haut dbit, la
rduction des cots de collecte, de stockage et de traitement des informations qui sen est
suivie, aux rseaux sociaux, au Web 2.0, aux smartphones, aux appareils photos numriques,
lInternet des objets, aux nouvelles rgles dutilisation des moyens informatiques avec le
cloudcomputing. Paralllement, le cot de la mmoire numrique sest effondr: le prix du
mgaoctet14 tait valu en 1980 300 dollars. Il vaut aujourdhui 0,00022 dollar.
Nouvelles sources de donnes: Open Data et objets connectes
Depuis lmergence de la statistique publique, ctait lacteur public qui se trouvait en
charge et qui reprsentait lexpert des donnes. Il avait ses services et ses experts de donnes.
Manipuler les donnes, cest faire merger du sens, et faire merger des actions, cela avait
un rapport trs troit avec le pouvoir. Or aujourdhui les donnes numriques ne sont pas
seulement produites dans le cadre dun service public mais par toutes nos applications
et nos machines intelligentes (ordinateur, tablette, smartphone, GPS, puces RFID -Radio
Frequency Identification-, texte, photo, traces numriques laisses par un objet). La varit
correspond donc la multitude de sources qui produisent ces donnes. Cela change
la source de production de la donne, cela change galement les sources potentielles
danalyse et dexploitation de celles-ci et cela change enfin les capacits dexpertise. Car ces
donnes ne sont pas structures et sont donc difficilement stockables et analysables avec
des outils informatiques traditionnels.
 Les objets connects

Pour lheure, une grande partie des donnes transmises par les individus aux machines
passent par des terminaux fixes ou mobiles dont les individus souponnent la propension
collecter des donnes, mme si les usages ne mesurent pas le volume et la valeur des
donnes quils transmettent. Le dveloppement dinterfaces naturelles, comme les objets
connects dont on estime le nombre dici 2020 50 milliards, laisse penser que le volume, la
varit et la vlocit de la collecte et du traitement vont encore augmenter, notamment pour
bnficier non plus seulement lactivit professionnelle, mais aux activits personnelles
des individus. Ce mouvement est dj luvre dans le life-hacking, littralement, la prise
de contrle de lexistence , un mouvement qui encourage lusage des applications, non
pas pour se divertir du quotidien, mais, au contraire, pour enrichir et contrler le quotidien.
Les activits les plus touches sont donc celles de tous les jours: la sant, lalimentation,
lconomie domestique, les dplacements, les transports, les loisirs, lducation, la culture.
Ainsi, mme si la rvolution des objets connects est distincte de celle du Big Data, ces deux
innovations se soutiennent: les bnfices apports par le Big Data poussent ladoption des
objets connects, avec cette promesse que les grands nombres pourront nous aider mieux
vivre, plus longtemps.
 LOpen Data ou la libration des donnes publiques

LOpen Data est un mouvement visant gnraliser la mise disposition des


internautes des informations dtenues par le secteur public; un mouvement qui considre
que louverture et le partage des donnes publiques est un bien commun. Il sagit alors de
14

1 mgaoctet = 106 octets. Loctet est lunit de mesure qui est utilise pour indiquer une quantit de donnes,
quantifier la mmoire dun disque dur ou la taille dun fichier. Un octet est compos de 8bits, le bit tant
lunit de base en informatique (un 0 ou un 1).

12 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

rendre ces donnes, quelles aient t cres par des tats ou des entreprises qui oprent
des dlgations de service public, accessibles tous, facilement et gratuitement, afin de
favoriser une meilleure information des citoyens et de susciter des innovations conomiques
sur la base de ces informations.
En France, ce mouvement samorce la fin des annes 70 avec le droit daccs aux
documents administratifs (loi du 17 juillet 1978, loi dite CADA), rig en libert publique
par le Conseil dtat en 2002. Cette loi sinscrit dans la suite de la loi relative linformatique,
aux fichiers et aux liberts (dite loi Informatique et liberts du 6 janvier 1978) qui dispose
que lutilisation de linformatique ne doit pas porter atteinte aux droits de lhomme et aux
liberts individuelles et publiques et de la directive europenne de 2003 sur la rutilisation
des informations du secteur public. En 2008 ltat dfinit, dans le plan France numrique
2012, une stratgie pour diffuser les donnes publiques et favoriser leur rutilisation. Cette
stratgie est mise en uvre par lAgence du patrimoine immatriel de ltat (APIE) qui est,
entre autres, charge de rdiger les licences fixant les conditions de diffusion et dutilisation
des donnes publiques. La mission Etalab, cre en 2011 auprs du Secrtariat gnral du
gouvernement (place maintenant auprs du Secrtariat gnral pour la modernisation
de laction publique) succde lAPIE pour mettre en uvre concrtement louverture et le
partage des donnes publiques.
Rcemment mises disposition de tous - via le portail data.gouv.fr qui les hberge et
qui est administr par Etalab - pour information et traitement, lusage a fini par rserver ce
terme dOpen Data aux seules donnes produites et rendues disponibles par la puissance
publique, ce qui dsigne, terme, une partie limite des donnes disponibles en ligne. Ces
donnes diffuses uniquement aprs autorisation et anonymisation15 sont rutilises dans
un cadre prcis qui peut tre dfini par une licence. Actuellement deux licences principales
en France, la Licence Ouverte (inspir de celui des Creative Commons - CC -) et lOpen
Database Licence, encadrent cette source de donnes et permet la reproduction, la diffusion,
la transformation et lexploitation des donnes.
Le stockage des donnes: les data centers (DC)
En matire de numrique, le processus de dmatrialisation renvoie couramment pour
le sens commun celui dimmatrialit. Le cloud en est le parfait exemple. Or, il est bon de
rappeler que les donnes numriques sont physiquement stockes. Et les data centers sont
ces lieux de stockage. En 2011, on en compte 2087 dans le monde.16
Ltude globale Datacenter Dynamics 2012 indique que linvestissement dans les data
centers, majoritairement situ dans les rgions Asie-Pacifique17, a augment de 22 % dans
le monde par rapport 2011. Malgr les progrs technologiques en termes de compression
et de virtualisation, il sera ncessaire de multiplier par 10 le nombre de serveurs physiques
dici 10 ans.18 Le data center (DC)19 est un emplacement de quelques centaines quelques
dizaines de milliers de mtres carrs. Il comporte des serveurs pour le traitement des
15
16
17
18
19

Ces donnes susceptibles dtre rendues publiques par ltat ou les collectivits territoriales sont dabord
dordres dmographique, territorial ou financier mais, selon chaque administration, elles peuvent tre trs
diffrentes
Fabrice Coquio in http://pro.01net.com/editorial/605472/
http://www.globalsecuritymag.fr
Christophe Brasseur, Enjeux et usages du Big Data, technologies, mthodes et mise en uvre, Lavoisier, Herms
Science, 2013.
Prsentation dtaille dans Data center et Dveloppement Durable, juin 2011, Syntec Numrique.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 13

donnes, des quipements de stockage, de transmission et de communication permettant


les changes internes et externes, des systmes de refroidissement, des quipements pour
fournir llectricit.
 La consommation nergtique de la donne

La consommation lectrique des data centers a fortement augment du fait de la


densification des sites, environ 1500W/m220 aujourdhui; ainsi un data center de 10000m2
peut avoir une consommation quivalente celle dune ville de 50000 habitants; ceux de
Google aux USA21 reprsentent une puissance de 300 MW ; dans le monde on considre
quil y a quelques dizaines de milliers de lieux de stockage pour une puissance lectrique
quivalente la production de 30 centrales nuclaires; ils reprsentent environ 2% de la
consommation dlectricit mondiale, avec un taux de progression annuelle de plus de
10%22. Une tude de luniversit de Stanford estime quentre 2005 et 2010, la consommation
lectrique de ces usines a reprsent 1,5 % de la consommation mondiale des installations
de refroidissement.
 b) Data center et dveloppement durable

Pour les oprateurs de data center, limpratif est de garantir une disponibilit maximale
leurs clients, ce qui ncessite la redondance des quipements critiques. Il sagit de tout ce
qui assure un approvisionnement lectrique suffisant et de qualit, ainsi que les systmes
de refroidissement du data center. Ce qui fait que les data centers sont surquips et que
lefficacit nergtique nest pas souvent au rendez-vous. Selon le cabinet Mc Kinsey 23, la
plupart des serveurs utilisent en moyenne moins de 10% de lnergie quils consomment
pour traiter les donnes, le reste est utilis pour maintenir les systmes prts ou se dissipe
en chaleur! Mme chose pour le stockage ou pour les autres quipements. Cela est aussi en
lien avec les possibilits sans limite qui ont t donnes aux utilisateurs/consommateurs,
savoir davoir tout, tout de suite, nimporte o et indfiniment!

Production et traitement des donnes:


les caractristiques du Big Data
Il serait erron de croire que le phnomne Big Data ne se rfre quaux nouvelles
donnes , notamment celles issues des blogs, des rseaux sociaux. Une grande part de
la croissance exponentielle constate concerne les donnes traditionnellement traites par
les entreprises, quelles soient issues des secteurs bancaires, mdia, ou rseaux publics tels
que lnergie ou les transports. Pour exemple, pas moins de 165 millions de transactions
bancaires sont ralises quotidiennement dans la zone euro; le nombre moyen de contacts
clients dune banque franaise a t multipli par 10 en moins de dix ans, les 2/3 dentre eux
concernant le canal Internet et plus de 1/3 provenant des smartphones.
Mais pour Christophe Brasseur24, si jusqu prsent on avait tendance ne stocker que
les donnes a priori utiles et oublier les autres, avec les nouvelles capacits de stockage
et danalyse, il nest plus ncessaire dchantillonner pour exploiter les donnes. Toutes les
donnes peuvent tre prises en considration.
20
21
22
23
24

Idem.
James Glanz, New York Times, 22/09/2012.
How dirty is your data, Greenpeace, 2011.
James Glanz, op. cit.
C. Brasseur, op.cit.

14 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Le Big Data peut tre dfini comme lensemble des technologies, des infrastructures et
des services qui permettent la transformation des donnes numriques en information, et
la transformation de cette information en connaissance.25 Lorigine du Big Data se trouve de
fait dans lexplosion mme du volume de ces donnes numriques. Mais il est aussi et avant
tout un moment de lhistoire de la collecte et du traitement des donnes qui est marqu
par la possibilit conjointe de la collecte massive de donnes et de leur traitement rapide.

Des donnes numriques aux mtadonnes

Y]

Les donnes numriques sont dsormais enchsses dans des architectures


logicielles qui leur permettent de devenir intelligibles lensemble des usagers de lInternet.
Ainsi, des donnes qui ntaient accessibles qu un petit nombre de professionnels peuvent
prendre sens auprs du grand public.
Ces architectures, ces cathdrales logicielles , reposent aussi sur des donnes
de description des donnes (ou mtadonnes) qui sont essentielles au traitement des
informations et peuvent parfois reprsenter une valeur conomique plus importante encore
que la donne dont elles sont issues. Les mtadonnes sont ainsi des informations structures
qui dcrivent, expliquent, localisent ou encore facilitent la dcouverte, lutilisation ou la
gestion dune ressource informationnelle (exemple des fichiers videos, musicaux, etc..). Ds
lors, devient un enjeu capital la dfinition dun ensemble de mtadonnes communes
diverses communauts, suffisamment simple pour que des non-spcialistes puissent les
crer nimporte quel point du cycle de vie de la ressource, mais suffisamment structures
pour quelles puissent rendre les moteurs de recherche plus performants et donc faciliter la
recherche et la rcupration des ressources.
Ainsi, Kenneth Cukier27 dcrivait en ces termes limportance du traitement des
mtadonnes pour lensemble des organisations : Linnovation et la cration de valeur
proviennent dsormais de nouvelles formes de re-structuration des informations, lies au
dveloppement de linformation sur les informations ou mtadonnes. Celles-ci permettent
aux organisations de rorganiser leurs rseaux plus facilement afin deffectuer de nouvelles
tches, et cela signifie pour ces organisations accrotre leur capacit dapprendre en permanence
et ainsi de sadapter aux changements.
En dautres termes, les mtadonnes organisent et suivent lensemble du cycle de vie
numrique des informations importantes, y compris les procdures, les processus et les
utilisateurs qui les tches sont affectes. Elles offrent ainsi une traabilit prcise dans le
cadre de la protection et lorganisation des donnes mais permettent galement de gnrer
leur tour les donnes relatives aux gots et prfrences des utilisateurs qui deviennent la
base de systmes de recommandation en ligne. L encore, des donnes issues du recueil des
donnes individuellement introduites ou collectes auprs des utilisateurs peuvent gnrer
des informations lies des tendances gnrales dans une population.
25
26
27

Commissariat gnral la stratgie et la prospective, Internet: prospective 2030, note danalyse n2, juin
2013.
Ne dites plus Big Data, mais mgadonnes (Le Point, 22/08/2014)
http://www.lepoint.fr/high-tech-Internet/ni- dites-plus-big- data-mais-megadonne
es-22-08-2014-1855721_47.php
Report of the 2007 Rueschlikon Conference on Information Policy,
http://www.cukier.com/writings/Rueschlikon2007-infogov-cukier.pdf. Kenneth Cukier est aussi le coauteur avec Viktor Mayer-Schonberger de Big Data, la rvolution des donnes est en marche (Lafont, fvrier
2014).

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 15

Le Big Data et la rgle des 3V: volume, varit, vitesse


Le Big Data est avant tout le point de rencontre entre la multiplication des donnes
non structures, les besoins danalyse de ces donnes et les progrs de la technologie. On
le dfinit souvent partir de 3 V (volume, varit, vlocit), auxquels Christophe Brasseur
adjoint un quatrime pour valeur (ou valorisation).
Selon Wikipdia, le Big Data se caractrise de la faon suivante:
les donnes ny sont pas organises sous forme de tables et leurs structures
peuvent varier (textes, vidos, photos, sons); elles sont souvent non structures;
elles sont produites en temps rel;
elles arrivent en flot continu et doivent pouvoir tre intgres quasiment
instantanment;
elles sont mta-tagues, mais de faon disparate (localisation, heure, date);
elles proviennent de sources trs diversifies (PC fixes ou portables, smartphones,
tablettes, capteurs numriques, tlviseurs connects, puces RFID, GPS, camras,
sites, blogs, rseaux sociaux, donnes publiques de lOpen Data), de faon
dsordonne et non prdictible.
Cette ncessit du volume a toutefois un revers. Elle peut inciter les agents collecteurs
vouloir acqurir beaucoup dinformations, notamment des informations personnelles. Il
en va de mme pour la varit des donnes collectes car le Big Data repose sur la mise
en rapport entre donnes de natures diffrentes issues notamment de lhistorique de
navigation, des donnes personnelles dclares, ou issues de procds de golocalisation.
Comme dans le besoin de volume, il y a l un danger dans cette ncessit dacquisition de
donnes. Ce premier danger se double dun deuxime cueil: il nest pas ais de savoir
lavance quelles seront les donnes signifiantes.
Il serait cependant erron de caractriser une situation de type Big Data partir du
seul critre de la volumtrie. Les outils et les volumes de donnes gres ne sont pas
identiques dun secteur conomique lautre. Il est vraisemblable que, sous leffet de
lvolution technologique, les Big Data de 2020 nauront pas la mme dfinition quen 2013.
On peut ainsi penser que, pour les annes venir, les Big Data devraient correspondre
des volumtries allant de plusieurs dizaines de traoctets plusieurs ptaoctets selon les
secteurs. Ds lors, un cinquime lment, la vracit, simpose comme une caractristique
majeure et stratgique pour le Big Data, tant il est vrai quune information errone peut avoir
des consquences prjudiciables tous points de vue.

Big Data et systme dcisionnel


Face ce dluge de donnes, les entreprises sont conduites dvelopper sans cesse des
technologies qui permettent de stocker et de traiter en temps rel toutes ces informations
disponibles, structures ou non, provenant de multiples sources28. Lenjeu est alors de les
croiser et de les enrichir trs rapidement, avec un seul but: mieux connatre et comprendre
la ralit et anticiper les besoins futurs en validant des intuitions. On parle dsormais de
modles prdictifs, dans lesquels des variables connues, dites explicatives, vont tre utilises pour
dterminer des variables inconnues, dites expliquer.
28

Christophe Brasseur, Enjeux et usages du Big Data, technologies, mthodes et mise en uvre, Lavoisier, Herms
Science, 2013.

16 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Le Web smantique, qui propose de poser des mtadonnes sur lensemble des
ressources du Web, est un alli de taille pour les Big Data, ds lors que les deux mouvements
poursuivent le mme objectif: faire parler les masses de donnes.
Le changement se manifeste dans une inversion des critres qui guident habituellement
nos actions. Traditionnellement, nous agissons en nous appuyant sur la connaissance causale
de phnomnes. Nous savons que la concomitance de deux phnomnes ne signifie pas
leur liaison logique: leur concomitance peut tre une concidence. Donc, nous cherchons
savoir pourquoi ou comment les choses arrivent. Le Big Data, en un sens, nous fait revenir
un stade antrieur: il est un retour la concomitance. Le Big Data permet de relever des
corrlations statistiques et donc de faire une prdiction probabiliste. Concrtement, avec le
Big Data, on ne sait pas toujours pourquoi telle chose va se produire, mais on peut la prvoir
avec une forte probabilit. Par exemple, on peut, en temps rel, et avec une gographie
prcise, savoir o se trouvent les personnes qui, dans un moteur de recherche, se renseignent
sur les symptmes de la grippe. Et lon peut tablir, en quelques minutes, la cartographie de
lpidmie de grippe. Les donnes peuvent tre compares dans le temps, dans lespace. Les
sries statistiques peuvent tre rapproches. Le Big Data ne peut pas tout prdire, mais il est
un outil nouveau, dune puissance incomparable, qui change notre manire dagir.
Ceci tant sans vouloir mettre un coup darrt ce qui relve dune rvolution
technologique dont la porte et la puissance sont fonctions du nouvel entrant conomique
que reprsente la multitude, nous avons besoin dune culture, dune ducation qui fasse
bien comprendre quune donne nest pas quelque chose de naturel, mais de construit. Les
donnes sont construites, produites, et le processus de fabrication est aussi important que
la donne en elle-mme.

La donne numrique: valorisations sociales,


conomiques et environnementales
La donne numrique est ainsi une ressource qui devient de plus en plus dterminante
du point de vue conomique, et le succs de Google dmontre lefficacit dune valorisation
systmatique des donnes collectes. Au-del des questions lies aux capacits de stockage
et des types dapplications pour exploiter ce flux ininterrompu doctets, les questions clefs
pour les entreprises seront de savoir comment intgrer et valoriser leurs donnes pour en
faire leur modle conomique.

La donne numrique, nouvelle ressource conomique


Si lobjectif de la production de cette masse de donnes extrmement varies et
non structures est leur exploitation, lanalyse des donnes numriques, en vue de
leur valorisation, est devenue un enjeu de comptitivit tout particulirement pour les
entreprises. Plus que les caractristiques du Big Data, ce sont les possibilits danalyse des
informations que recouvrent les donnes numriques, qui deviennent ds prsent et plus
encore lavenir lenjeu stratgique de lconomie de la data.
Christophe Brasseur explique quen matire de marketing, nous sommes en train de
passer dun modle classique de segmentation un modle de caractrisation comportementale.
[] Le profiling des clients apporte sans aucun doute une valeur ajoute lentreprise qui peut
alors affiner et personnaliser ses produits et ses offres. Ainsi, dans la publicit, le Big Data

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 17

permet doffrir de nouveaux outils disposition des PME et TPE, leur donnant la possibilit
de dvelopper leur activit dune manire indite.
Donnes et valorisation capitalistique
La donne - et plus encore la donne personnelle - est devenue en quinze ans le
critre principal de valorisation des entreprises de la nouvelle conomie. La valorisation
capitalistique de certaines entreprises nest dailleurs pas lie leur chiffre daffaire actuel, ou
leur rentabilit, mais aux profits qui sont escompts par leur croisement entre leur capacit
gnrer du trafic sur leur plateforme (traction) et leur capacit recueillir des donnes
personnelles.
Les premires informations donnes par les clients et les usagers des sites sassimilent
aux informations ncessaires pour constituer une base clients, qui est une premire source
de valeur pour une entreprise. Cest lexemple dAmazon pour la vente de livres en ligne
qui, en 1997, employait une quarantaine de personnes pour faire de la recommandation
personnalise ses acheteurs. Un jeune chercheur leur indique que le vritable actif de cette
entreprise ne rside pas dans ces quarante libraires , mais dans les donnes rcoltes
sur les clients de cette librairie. Il postule lhomognit des pratiques dachats entre
utilisateurs similaires et suggre de demander aux clients de noter, en aveugles, la qualit
de la recommandation humaine et celle de la machine. Massivement, les clients plbiscitent
les recommandations de la machine et lentreprise finit par licencier ces quarante personnes.
Les premires exprimentations de Big Data en 2012 concernent entre 2 et 5 % des
grandes et moyennes entreprises, entre 17 et 30 % des trs grandes entreprises et plus de
90% chez les 500 premires entreprises amricaines29. Pour information, le chiffre daffaires
du march mondial du Big Data est estim 6,3 milliards de dollars en 2012 et devrait
atteindre 8,9 milliards de dollars en 2014 et 24,6 milliards de dollars en 2016.30 Quant
la croissance des revenus du march, elle est estime plus de 40 % par an en moyenne,
reprsentant 100 millions de dollars en 2009 et pourraient approcher les 50 milliards de
dollars lhorizon 2018.31
Ce sont ces donnes dun second type qui permettent daffiner le profil de lindividu.
Cet affinement permet deux premires valorisations conomiques.
Dune part aux yeux de la publicit, cela permet de cibler avec, en thorie, une grande
prcision, les individus : au lieu dengager des moyens tendus pour toucher une cible
limite, les campagnes publicitaires peuvent tre ajustes leur cible relle, ce qui peut
la fois rendre plus efficaces les grandes campagnes, et ouvrir laccs au march publicitaire
des TPE et des PME, qui peuvent dsormais, aves des budgets moindres, atteindre leur
public.
Dautre part, cette datafication des usagers semble exaucer un vieux rve du
marketing : la possibilit dajuster loffre la demande, en dterminant avec exactitude
la taille de la cible. Cette volution est la fois au bnfice des grandes entreprises, qui
peuvent optimiser leur investissement, et au bnfice des TPE et PME qui peuvent employer
des outils ou ressources qui leur taient interdites dans le pass. Deux des entreprises les
29
30
31

Source : Talend, Gartner Group et Deloitte.


Source : Transparency Market Research Big Data Market Global Scenario, Trends, Industry Analysis, Size,
Share and Forecast 2012-2018
Source : Deloitte 2013

18 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

plus exemplaires de la nouvelle conomie ont tir leur croissance de leur capacit mettre
le Big Data au service de la publicit et du marketing: Google et Facebook.
Dans cette perspective, le Big Data est une tape nouvelle dans lautomatisation et la
robotisation du monde. Cest une manire de confier la machine ce qui tait auparavant
aux mains dagents humains.
Le caractre disruptif de la rvolution numrique
Lorsquon voque Internet, on parle souvent - notamment pour le champ conomique
- dune technologie de rupture (disruptive technology) selon le sens quen donne Clayton
Christensen dans son ouvrage The Innovators Dilemma publi en 1997 et dont le concept
est aujourdhui repris et dvelopp par de nombreux acteurs du numrique comme Henri
Verdier et Nicolas Colin, auteurs de Lge de la multitude32. Pour ces deux auteurs, voquer
le caractre disruptif renvoie la dimension innovante du numrique dont les effets sur
le paysage conomique peuvent tre radicaux. Lorsque Joseph Schumpeter33 parlait de
destruction cratrice, on peut ici parler de rupture avec certains modles existants. La
dmatrialisation des donnes, laccroissement vertigineux des capacits de stockage, tout
comme laugmentation de la vitesse de transmission instantane, rompant avec lunit de
lieu et de temps, remettent en question les modles classiques.
Tous les secteurs de laction, quelle soit publique ou prive, peuvent tre datafis
et, en ce sens, tirer des bnfices du Big Data. Ces bnfices peuvent prendre la forme
dinnovations incrmentales, qui permettent daffiner des outils, ou dinnovations radicales,
que lon nommera aussi innovations disruptives , qui vont restructurer le secteur
auquel elles sappliquent. Et ces innovations peuvent tre soit aux mains des acteurs qui
interviennent dans ces secteurs, comme ltat ou des socits dj existantes, ou aux
mains de socits intermdiaires qui peuvent se spcialiser soit dans la collecte, soit dans
le traitement des donnes. Concrtement, quel que soit le secteur concern, le Big Data
peut permettre un affinement de laction, grce une dtection et une prdiction plus
justes. Leffet disruptif majeur du Big Data est la possibilit dautomatisation quil apporte, en
transmettant la machine des fonctions qui taient auparavant confies des personnes.
Pour les grands acteurs de linformatique, comme par exemple Bill Gates, cest le propre du
progrs informatique: automatiser ce qui peut ltre, de manire ce que ltre humain
puisse se concentrer sur ce qui lui est propre et qui ne peut tre automatis . Cette
volution est parfois dcrite comme une volution dune socit people-based (dont la
majeure partie des oprations est traite par des humains) une socit software-based
(dont la majeure partie des oprations est traite par des automates). Dun point de vue
social, le Big Data allonge la liste des fonctions qui deviennent automatisables.

Opportunits du Big Data:


de la sant la matrise nergtique
Les opportunits les plus grandes du Big Data sont probablement dcouvrir. Cela
tant, cette nouvelle faon dapprhender la donne a dj ouvert des perspectives, la
fois au secteur public et au secteur priv. En un sens, le Big Data est un grand rvlateur
32
33

Henri Verdier, Nicolas Colin, Lge de la multitude, Entreprendre et gouverner aprs la rvolution numrique,
Editions A. Colin, 2012.
Joseph Alos Schumpeter (1883 1950 ) est un conomiste autrichien du milieu XXe sicle, connu pour ses
thories sur les fluctuations conomiques, la destruction cratrice et linnovation.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 19

de rel: laction, quelle soit publique ou prive, ne repose plus sur lexprience des agents,
sur leurs intuitions, sur leurs croyances rationnelles, mais sur des faits statistiques. Il existe
de nombreuses perspectives de rutilisations innovantes partir des donnes publiques
de sant. Lanalyse de ces Big Data sant repose sur plusieurs bnfices majeurs : une
meilleure prise en charge du patient (passer dune logique curative prventive), assurer
lefficience des dpenses publiques (doublement de la population senior dici 2030) et
offrir de nouveaux terrains danalyses et exprimentations la communaut de recherche
scientifique (pidmiologie, maladies chroniques, pharmacovigilance).
De mme dans le milieu sportif o les capteurs biomtriques permettent dvaluer
les performances des joueurs en quantifiant les donnes lies aux distances parcourus,
aux diffrentes phases dacclration et de dclration, ou encore celles lies au rythme
cardiaque afin notamment de pouvoir anticiper des risques de blessures et galement
de vrifier limpact de la fatigue sur le jeu pour ladapter en consquence. Dans un autre
domaine o laffrontement nest plus synonyme de comptition mais de conflit arm, le
Big Data offre aux organisations civiles ou militaires lopportunit de fonder leurs dcisions
sur une reprsentation fidle de leur environnement tout en crant il est vrai une forme de
dpendance essentielle lgard de ces systmes dinformation et de commandement. Il en
rsulte que les sources de vulnrabilit qui affectent ces systmes mauvais traitements,
paramtrage des algorithmes, scurit - cre un nouveau champ de conflictualit qui nobit
pas ncessairement aux principes stratgiques tablis dans dautres espaces stratgiques,
quils soient conventionnels ou nuclaires.
Autant dire que rares sont les domaines qui chappent aux applications lies aux
capacits danalyses offertes par le Big Data. Toutefois les domaines de la sant et de
lnergie que nous avons dlibrment retenus ici sont certainement les plus significatifs
des transformations opres par le Big Data.

Le domaine de la recherche en gnral et mdicale


en particulier
Grce au numrique, la mdecine progresse pas de gant. Les techniques biomdicales
permettent de vivre mieux et plus longtemps, et les problmatiques de sant prennent
aussi en compte des dimensions de confort, de bien-tre et de longvit notamment par
lactivit sportive.
Prvention, prdiction, participation, personnalisation : tels sont les enjeux de la
mdecine, qui tire parti des progrs de la science pour mieux comprendre la complexit du
corps humain, prvenir les maladies mais aussi amliorer laccompagnement des patients
par une personnalisation des soins et un meilleur partage entre mdecins, patients et
mdecins-patients. Avec le numrique et limagerie mdicale, notamment, de nouveaux
outils sont apparus qui permettent daller encore plus loin dans la comprhension du
vivant, lanalyse des cas et les interventions; on sait aujourdhui modliser des organes sur
ordinateur, tudier des systmes biologiques complexes, dtecter des maladies, et mme
optimiser des gestes chirurgicaux avec la ralit augmente et des robots spcialiss.
En mme temps, le stockage et la puissance de calcul ont rendu le gnome complet
dun tre humain plus facile analyser et stocker et ce un cot drisoire. Le cot de
20 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

squenage du gnome humain approche les 100 dollars34 et le temps pour lanalyser a
chut de 13 ans moins de 3 jours. Les donnes de plusieurs millions de personnes peuvent
ainsi tre gres et traites dans des bases de donnes plusieurs niveaux de stockage. Le
vritable dfi est alors de combiner ces ensembles de donnes dans diffrentes archives et
de les croiser avec les dossiers de patients, les traitements et les rsultats pour permettre de
gurir de nombreuses maladies, dont le cancer.
De nombreux dfis restent relever mais, dans les pays dvelopps, o lesprance et la
qualit de vie se sont nettement amliores, la recherche de confort et de bien-tre prend
aussi de plus en plus dimportance. L galement, lapport du numrique est stratgique,
avec le dveloppement de la sant domicile ou le quantified self, par exemple, qui
amliorent laccs des soins plus personnaliss35.
Dans le secteur mdical, la dtection des pathologies et la prvention peuvent tre
ralises avec plus de russite par lobservation des corrlations statistiques entre facteurs
en apparence sans lien, que par laction concerte des mdecins. Ainsi, une tude rcente
de Microsoft Research a permis de montrer partir de donnes rcupres sur la base de
25000 lits en hpital comment, en matire de lutte contre les maladies nosocomiales, on
pouvait laide dune cartographie grer les emplacements diffrencis des patients pour
limiter les risques.
cet gard, le Big Data ouvre la possibilit dautomatiser une partie du secteur mdical
- tout comme les recommandations de lectures fournies par lautomate dAmazon sont
considres par les utilisateurs dAmazon comme plus efficaces que des recommandations
humaines. Deux acteurs majeurs Apple et Samsung viennent de crer des bases de donnes
sur la sant. Aux tats-Unis, plusieurs hpitaux sont partenaires dApple pour accder
aux donnes des futurs patients. Il est toutefois prvu un accord pralable de lutilisateur.
Automne 2012, en encourageant louverture et lexploitation des donnes publiques,
le gouvernement amricain a permis IBM de crer un logiciel de mdecine prdictive :
Patient Care and Insights. Le logiciel puise dans lhistorique du systme de sant en analysant
et en recoupant des centaines de milliers de donnes - traitement, rsultats, procdures,
morphologies, gographies, climats, etc. - pour permettre aux mdecins danticiper les
futures pathologies de leurs patients en dtectant certaines similitudes, et ainsi assurer une
prise en charge prventive.
Si la recherche ne doit pas tre entrave, sa conduite et les finalits doivent tre
particulirement encadres, notamment en ce qui concerne la donne mdicale et la
scurisation de celle-ci. Ces traitements massifs de donnes doivent concourir renforcer
de vritables politiques de sant et de prvention. La dtention de ces donnes par des
entreprises prives impose un encadrement rigoureux au-del des rgles thiques et qui
ne puisse souffrir daucune remise en cause pour des raisons de profitabilits financires.
Car les risques ne sont pas loin de voir des dispositifs chapper tout contrle et porter
par l mme atteinte tant la vie prive et au respect de la dignit humaine qu lexigence
dun accs au soin pour tous. En France, Axa a annonc que les assurs qui accepteraient
de porter des capteurs pourraient se voir appliquer des tarifs dgressifs. Aux tats-Unis, les
assureurs nhsitent pas diffrencier les tarifs de leur complmentaire sant en fonction
du profil de lassur avec un risque non ngligeable de non-couverture pour les profils les
34
35

http://investor.illumina.com/phoenix.zhtml?c=121127&p=irol-newsArticle&ID=1890696
Source : INRIA, rapport 2012.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 21

plus risque. En outre, si le partage de linformation mdicale est aujourdhui reconnu par
tous comme la garantie dune meilleure prise en charge des malades, comme un moyen
de remdier aux dsquilibres croissants de la dmographie mdicale et doptimiser les
dpenses de sant, tout en offrant au patient une meilleure matrise de ses donnes de
sant, le dploiement de solutions de scurit effectives et de haut niveau est une condition
imprative. Mais le dveloppement du cloud computing, cest--dire doffres de service,
consistant hberger des donnes dans des serveurs dont on ignore o ils sont installs, et
qui deviennent difficilement contrlables, peut dfaut dune rponse lgislative adapte
tre une menace pour la protection de donnes personnelles.

Transition numrique et dveloppement durable


Aucun domaine nchappe au Big Data, pas mme le domaine de lagriculture, lui aussi
concern par cette volution du numrique. Loin des seules approches productivistes, la
collecte et le traitement de donnes autour de capteurs, de pulvrisateurs automatiques, de
drones et de satellites, mtamorphosent le travail de lagriculteur.
Le numrique devient ainsi un outil au service de lagriculteur pour assurer une
meilleure irrigation, limitant les gaspillages, appliquant une juste dose dengrais et en
assurant une gestion cologique des eaux douces dun territoire. Aux tats-Unis, le projet de
lorganisation amricaine de protection de lenvironnement The Nature Conservancy, sest
appuy sur un systme dirrigation assiste par ordinateur, pour rduire la consommation en
eau et rcuprer leau des champs afin de moins puiser dans les rivires. En deux ans, cest
ainsi plus dun milliard de litres deau qui a t conomis.
Lors dune confrence lUnesco en mars 2012 intitule Le mariage du numrique
et de lnergtique: vers un Internet de lnergie,36 Jol de Rosnay dclarait lavenir de
lnergtique repose sur un mariage avec le numrique. Un partage de llectricit en P2P devient
possible, grce des smart grids, rseaux de distribution intelligents capables de sadapter loffre
de production dnergies renouvelables et la demande des entreprises et des consommateurs.
Une voie nouvelle souvre vers la dmocratie nergtique et lcomobilit .
Jeremy Rifkin37 ne dit pas autre chose lorsquil prsente les 5 piliers de ce quil appelle la
troisime rvolution industrielle:
y le passage aux nergies renouvelables;
y la transformation du parc immobilier en ensemble de microcentrales nergtiques qui
collectent sur site des nergies renouvelables;
y le dploiement de la technique de lhydrogne et dautres techniques de stockage des
nergies intermittentes;
y la transformation des rseaux lectriques actuels en rseaux lectriques intelligents ou
smart grids;
y le passage des moyens de transport aux vhicules lectriques et il conclut: Au XXIe
sicle, des centaines de millions dtres humains vont produire leur propre nergie verte
dans leurs maisons, leurs bureaux et leurs usines et la partager entre eux sur des rseaux
36
37

Le mariage du numrique et de lnergtique : vers un Internet de lnergie


http://www.scenarios2020.com/2012/05/le -mariage - du-num%C3%A9rique - et- de l%C3%A9nerg%C3%A9tique-vers-un-Internet-de-l%C3%A9nergie.html
Smart grid, Interview intgrale de Jeremy Rifkin, Futuremag , ARTE
http://www.youtube.com/watch?v=OhWNUUKHahc

22 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

intelligents dlectricit distribue, exactement comme ils crent aujourdhui leur propre
information et la partagent sur Internet.
Cette transformation numrique de la production et de la gestion de lnergie au cur
des rseaux lectriques de demain peut apparatre comme une douce lubie, voire un horizon
lointain. Pourtant, larrive des compteurs Linky est dj une ralit pour de nombreux foyers
qui ouvrent un compte auprs dun fournisseur dlectricit. Et dans un avenir proche, chacun
pourra sabonner lnergie numrique qui lui est ncessaire et modifier son abonnement
en fonction de lvolution de ses besoins. Ces besoins, essentiellement de consommation
aujourdhui, volueront progressivement, au fur et mesure de lquipement des foyers.
Un mouvement qui doit cependant saccompagner dune exigence en matire de
protection des donnes et notamment de donnes personnelles. La capacit de ces
compteurs Linky danalyser finement la consommation lectrique ouvre une voie daccs
au domicile priv et lensemble des activits domestiques du foyer. La prsence ou non
de personnes au sein du domicile peut alors tre constate, des dispositifs en lien avec les
distributeurs dnergie peuvent aussi permettre dans certains cas de couper distance tel
ou tel appareil lectrique. On peut alors aisment imaginer que sans une rglementation
adapte cette volution de la gestion numrique de lnergie et aux attentes des citoyens
dans leur accs lnergie, des offres commerciales permettent des mnages aux revenus
levs de disposer dun accs nergtique illimit, rservant aux mnages les plus modestes
des forfaits limits ou adapts leurs besoins minimaux. La sobrit nergtique serait
ds lors supporte par les seuls mnages les plus fragiliss.

De la ville intelligente (smart city) la mobilit connecte


Autre exemple, la smart city. Lquipement dune ville, comme Santander en Espagne,
de plusieurs dizaines de milliers de capteurs permet de recueillir des informations de
diffrentes sources (parking disponible, bruit, temprature) sur les comportements des
usagers. Ces donnes sont transmises aux oprateurs publics et privs de la ville en Open
Data pour optimiser les services. Leur analyse permet davoir une meilleure comprhension
de la structure sociale dune ville et de favoriser les initiatives publiques et prives.
Loriginalit de la smart city est donc dimpliquer autour dun projet commun les acteurs
sociaux, techniques, politiques et conomiques de la ville.
Avec le dveloppement des objets connects, cest la mobilit elle-mme qui est
revisite. Il est alors possible de piloter au mieux ses dplacements chez soi et ailleurs. Trouver
le meilleur mode de dplacement, devient ds lors possible avec une application consacre
au transport connect qui gre la mobilit avant, pendant et aprs un trajet. Lapplication
centralise toute une srie dinformations sur le rseau de transports (voiture, bus, velib, taxi)
et rpond des questions comme combien de places assises reste-t-il dans le bus, quelle
station dessence est la moins chre. Orienter, guider le piton ou le conducteur laide dun
GPS intgr dans la semelle comme chez E-sole ou dans la bague dIgoobook, facilite les
dplacements sans manipulation, ni checking faire sur le smartphone. Le propritaire est
comme pris en charge par lobjet.
Quelle que soit la technique retenue, ces dispositifs peuvent galement permettre de
dresser une cartographie des relations familiales, professionnelles, amicales, des centres
dintrts et types de comportement (sdentaire, mobile), en retraant les dplacements
des intresss.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 23

Lintgration croissante de dispositifs de traage dans les usages du quotidien peut


alors conduire une modification importante des comportements et remettre en question
le principe de la libert daller et venir anonymement. Latteinte aux droits et liberts induit
par la golocalisation varie toutefois en fonction de la catgorie de personne concerne
(salaris, transports routiers, client dune compagnie dassurance, enfants, etc.) et du secteur
impliqu.

La citoyennet lre du numrique,


un nouveau pouvoir dagir
Le numrique change incontestablement, pour ne pas dire radicalement, les relations
entre individus en matire de citoyennet. Cela interroge immanquablement notre vie
en dmocratie. Avec la production des donnes dont on ne sait pas toujours qui en sont
les pourvoyeurs, lexpertise est beaucoup plus largement partage. Dans le mme temps,
Google ou dautres prennent des postures de domination avec la mainmise sur un nombre
immense de donnes leur donnant un pouvoir danalyse sur la socit.
La captation de lexpertise collective constitue une difficult dmocratique majeure
laquelle nous sommes confronts et que labsence dducation au numrique ne fera
quaccrotre. Paralllement, la transformation numrique offre lacteur public les moyens
de donner du pouvoir dagir, de captation de lexpertise collective afin daccompagner une
encapacitation, un empowerment des individus38.

Culture, ducation et nouveaux accs aux savoirs


lre du numrique
Lhistoire a permis le dveloppement dune multiplicit de lieux de savoirs. Les muses,
les bibliothques, les universits, les coles sont les plus illustres des reprsentants de ces
lieux de savoirs. Le dveloppement du numrique au cours des 15 dernires annes, qui
ont vu lmergence de la mise en rseau lchelle mondiale comme une norme possible
dchanger des informations, est en train de remettre en cause non seulement les lieux, mais
aussi les modalits daccs aux informations, aux savoirs, et aussi la connaissance.
Internet est incontestablement un facteur de diffusion du savoir. Grce aux milliers de
bases de donnes connectes, les tudiants peuvent par exemple, consulter des millions
de documents dans leur bibliothque mais aussi celles dautres universits, lire des revues
dans une autre langue dites dans un autre pays et les complter par des confrences en
ligne (type Ted). Citons galement Gallica, la bibliothque numrique de la Bibliothque
nationale de France qui propose ce jour la consultation en ligne plus de plus de 3 millions
de documents dont 550 390 livres, 1 347 078 fascicules de presse et revues, 981 659 images,
44 358 manuscrits, 72 291 cartes, 24 015 partitions, et 3 513 documents sonores.39
En bouleversant laccs linformation et les modes de communication, la rvolution
numrique a dvelopp une culture de lchange et de la libert dexpression qui est en
38
39

Audition de Mme Amandine Brugire, Fondation Internet Nouvelle Gnration (FING), devant la section de
lducation, de la culture et de la communication du Conseil conomique, social et environnemental le 1er
juillet 2014.
Source: Wikipedia. Site Gallica accessible viahttp://gallica.bnf.fr

24 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

elle-mme un acte de rsistance dans beaucoup de pays. Lactualit rcente a dmontr la


puissance des rseaux sociaux dans le domaine de la propagation des ides. Pour certains
pays, laccs au monde numrique dmocratise indniablement laccs au savoir: les livres
sont rares et chers, les bibliothques dsertes, les cinmas sinistrs, les tlvisions navrantes.
Avec Internet, il est alors possible de combler dun clic le dcalage culturel et entrer de plainpied dans les modes, les musiques et les faons de penser dune gnration.
ducation au numrique et accs la connaissance
Si les technologies numriques dmultiplient les accs la connaissance, avec le risque
non ngligeable dune uniformisation de ces derniers, dcloisonnent certains espaces
jusque-l rservs une certaine lite, pour accder en temps rel, partout dans le monde,
la connaissance (collections de muse, photos, presse, livres, films, etc.), il reste que cet accs
instantan la connaissance nest pas synonyme de savoir. Car en plus de la ncessit de
comprendre linformation qui souvre nous, nous devons garder lesprit quelle nest pas
propose de faon alatoire mais de faon conditionne par les fonctionnalits des moteurs
de recherche.
En proposant un ordre prfrentiel de rponses, voire en en cartant certaines, les
moteurs de recherche et autres plateformes numriques imposent leurs modles de pense
ou dans le pire des cas modlent notre pense et nos perceptions du monde. Si laccs
instantan la connaissance donne, en quelque sorte, un moyen dagir pour le citoyen,
encore faut-il que ce dernier soit capable de dcrypter cette connaissance. De la donne
brute la donne traite, il convient de dconstruire le processus ou le traitement qui
uvre cette transformation. Aux cts des acteurs de la socit civile plus que jamais le
rle de lcole et celui des enseignants est capital pour assurer ce passage. Car cest lun des
lieux essentiels pour acqurir les fondamentaux dune vie en socit et btir ldifice de la
citoyennet.
 Numrique et pdagogie: de la classe inverse aux cours ouverts massifs en ligne

(MOOCs)
Quest-ce que lducation numrique ? Est-ce informer ou donner des comptences sur
lexploitation qui est faite des donnes quon produit ? Il faut sans doute aller beaucoup
plus loin car le numrique change tout. Cela bouleverse la thorie mathmatique. Le
mathmaticien Giuseppe Longo, spcialiste de Turing40, montre ainsi comment le support
numrique transforme les conditions mmes du savoir mathmatique. En astrophysique,
le Big Data produit par les observatoires dans lespace modifie totalement les conditions
de la production dune plantologie. Idem pour la biotechnologie ou mme la langue. Le
numrique avec Google transforme toutes les langues. Notre comprhension de tout cela
est faible, essentiellement pour des raisons de vitesse.
Les cours ouverts en ligne (MOOCs) transforment les modes denseignement en
sadressant un effectif dapprenants beaucoup plus important quune classe dtudiants et
en leur permettant dinteragir entre eux et lenseignant sur le contenu de cette connaissance
(Cf. sur ce sujet lavant-projet davis La pdagogie numrique : un dfi pour lenseignement
suprieur prpar par Mme Danile Dubrac et M. Azwaw Djebara).
40

Alan Mathison Turing, (23 juin 1912 - 7 juin 1954), est un mathmaticien, cryptologue et informaticien
britannique. Il est lauteur, en 1936, dun article de logique mathmatique qui est devenu plus tard un texte
fondateur de la science informatique.Il donnera en 1950 son nom au fameux test dintelligence artificielle
fonde sur la facult dimiter la conversation humaine.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 25

La classe inverse - ou flipped classroom en anglais est un modle dorganisation


scolaire qui tend se populariser depuis quelques annes. Le principe: les lves regardent
chez eux des vidos de leurs cours enseigns par le professeur et consacrent leur temps
en classe aux exercices et aux travaux de groupe encadrs par lenseignant. Le rle de
lenseignant change assez radicalement : il accompagne les lves de manire plus
personnalise et devient un pilote dans une classe autonome. Il intervient donc pour
donner des explications et sadapter chaque lve.
Si la classe inverse bouleverse les fondamentaux du systme scolaire, les enseignants
qui ont dcid dadopter le modle sont unanimes: les lves sont beaucoup plus engags
dans les cours et leur apprentissage dune manire plus gnrale. Sans doute y a-t-il l une
opportunit qui doit tre laisse la discrtion de lenseignant pour favoriser autour de
projets pdagogiques une ducation la collecte et au traitement des donnes numriques.
Toutefois, ce type dorganisation ncessite de disposer des outils et des supports
denseignement adapts. Outre les vidos des enseignants que les lves doivent regarder
chez eux supposer quils aient tous accs un ordinateur , la forme des exercices en
classe change galement: les lves peuvent donc tre amens choisir entre des exercices
traditionnels, lapprentissage sur des jeux vido ou encore des travaux de groupe. Cette
innovation se prsente comme une remise en question de mthodes pdagogiques
fondes sur le retrait du transmissif et la promotion de lactivit de llve, le tout dans un
contexte numrique sans lequel cette innovation ne serait pas possible. Nous devons y voir
de plus prs partir des exemples pour savoir quels sont les enjeux et les limites dune telle
approche.
 Le numrique lcole: bref tat des lieux

Sil est possible de remonter 1970 pour trouver trace dune premire rflexion sur le
numrique lcole avec une circulaire de mai de cette anne, et au plan Informatique pour
tous en 1985 qui a permis de commencer doter lensemble des coles, collges et lyces,
il faut attendre 2011 pour que la plupart des coles, y compris rurales, en soient dotes.
Les dernires annonces dun plan numrique par le prsident de la Rpublique devraient
permettre de finir dquiper toutes les coles dun accs Internet.
Les comptences numriques font partie intgrante du socle commun de comptences
et de connaissances actuel en attendant la refonte de ce socle.
Selon les programmes officiels, les lves sont censs dvelopper les consignes et
connaissances suivantes:
lcole maternelle, les enfants dcouvrent les ordinateurs et comprennent leur
usage et leur fonctionnement.
lcole lmentaire, les enfants apprennent lcriture au clavier et lutilisation
dun dictionnaire. Ils commencent acqurir les comptences constitutives
du brevet informatique et Internet (B2i) en utilisant les fonctions de base de
lordinateur. Ils sont sensibiliss aux usages dInternet et aux risques y affrent.
Lusage raisonn de linformatique, du multimdia et de linternet est de rgle.
5 domaines dfinissent le B2i : sapproprier un environnement informatique de
travail ; adopter une attitude responsable ; crer, produire, traiter, exploiter les
donnes; sinformer, se documenter; et enfin communiquer et changer.
Les lves devraient tudier le respect de lintgrit des personnes et linterdiction des
atteintes autrui y compris lis lusage dInternet.
26 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

la fin du CM2, llve serait capable de:


utiliser loutil informatique pour sinformer, se documenter, prsenter un travail;
utiliser linformatique pour communiquer;
faire preuve desprit critique face linformation et son traitement.
Au collge, la matrise des outils informatiques serait mise en uvre dans lensemble
des disciplines. Lanalyse critique serait essentielle avec le tri des informations et en matire
dutilisation des outils informatiques. Des principes de base sont censs tre enseigns
sur lalgorithmique lmentaire, la manipulation dimages, couleurs, textes et sons, la
comprhension des principes et des bons usages dInternet, des messageries
Un rapport de 2013 sur La standardisation de la filire numrique ducative : un enjeu
pdagogique et industriel rappelle que lutilisation des outils numriques reste trop faible
dans lcole primaire car elle remet en cause des pratiques pdagogiques ; de ce fait
lapprentissage au numrique reste trs marqu par lducation aux outils. Dans le cadre
de la formation tout au long de la vie, au niveau europen, il faut noter que la comptence
numrique fait partie des comptences cls (recommandation du Parlement europen et
du Conseil europen du 18/12/2006). Cette comptence met laccent sur lapprentissage
de lutilisation et de la critique des utilisateurs des Technologies de linformation et de la
communication (TIC) comme sources dchanges, de crativit, et dinnovation.
La loi dorientation et de programmation pour la refondation de lcole de la rpublique
a instaur un service public du numrique avec la cration dune direction du numrique
ducatif et la nomination dun dlgu acadmique du numrique dans chaque acadmie.
Cela doit permettre de mettre disposition des ressources numriques pour la russite des
lves, de renouveler les programmes dvaluation au numrique et de mettre en place
une vritable formation des enseignants au numrique au sein des coles suprieures du
professorat et de lducation (ESPE).
Ces ESPE proposent quelques heures dapprentissage du numrique centres sur la
pratique de supports. Mais lessentiel de lenseignement doit amener lobtention du C2i2e
qui permet la matrise de lenvironnement numrique professionnel (identification des
ressources, utilisation des ressources de lespace numrique de travail, organiser ses propres
ressources); le dveloppement de comptences pour la formation tout au long de la vie
(utilisation de formation distance, veille pdagogique travers des rseaux dchanges) et
la responsabilit professionnelle dans le cadre du systme ducatif (scurit informatique,
protection des liberts individuelles et publiques, protection des mineurs, confidentialit
des donnes, proprit intellectuelle).
Il sagit galement dacqurir les comptences ncessaires lutilisation du numrique
dans la pratique denseignement (travail en rseau, prparation de contenus denseignement
et de situation dapprentissage, mise en uvre pdagogique et dmarches dvaluation).
Cette formation des matres reste souvent trop abstraite au regard de lutilisation
pdagogique des ressources numriques et de la transversalit des usages au sein des
diffrentes disciplines et les heures denseignement spcifique sont insuffisantes (9 heures
seulement).
Les recherches sur les usages pdagogiques des TIC sont aujourdhui insuffisantes. La
faiblesse de la formation continue ne permet pas de sadapter de nouveaux enjeux tels
que lutilisation du numrique.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 27

Lavis du CESE sur Les ingalits lcole41 rappelait le poids des disciplines dans la
formation continue des enseignants.
Les tiers-lieux, nouveaux espaces de transmission des savoirs
Lvolution, dans le monde entier, des lieux de savoirs, accompagne par le trs rapide
dveloppement des usages du numrique, met sur le devant de la scne le questionnement
sur lapprentissage et sur les modles qui traditionnellement les portent: dsormais dans
un muse, on trouve des librairies, des dispositifs pdagogiques, dans une bibliothque on
trouve des expositions, des agoras, des spectacles de jazz, etc. Et dans les collges les lyces,
nombre de personnel ducatif dont notamment les professeurs documentalistes ont pris en
charge cette ouverture. Mais dans les faits, la reconnaissance explicite de cette volution est
encore faible.
 Les Espaces publics numriques (EPN)

Parmi ces espaces novateurs daccs aux nouvelles technologies numriques, on notera
lexemple des EPN issus en 1998 du programme Pacsi42.
Les EPN tmoignent de cet engagement de la puissance publique en faveur dune
diffusion trs large des accs et pratiques numriques. Initialement organiss et soutenus
plus troitement par le ministre de la Culture et par celui de la Jeunesse et des sports, les
EPN se sont dvelopps partir de la fin des annes 1990 de multiples faons: certains grce
un programme national, impuls par un ministre ou un organisme public, dautres dans le
cadre de programmes rgionaux, dpartementaux, de villes ou de syndicats de communes
qui sassocient parfois dautres programmes plus axs sur la formation professionnelle et
lautoformation. Dautres enfin sont issus dinitiatives associatives locales. Lensemble forme
une carte diversifie de lieux daccs, daccompagnement et de formation aux services
numriques, souvent regroups en rseaux autour de centres de ressources.
Il arrive que les EPN soient intgrs dautres espaces ressources comme les
mdiathques qui sont par ailleurs les plus grands espaces fournisseurs de ressources
numriques. Or certaines dentre elles ont limit louverture de leurs ressources numriques
aux strictes applications documentaires. On observe galement la prsence des EPN dans
les centres sociaux. Dans certains cas le lieu daccueil peut tre mis disposition par une
cole, ou encore par la mairie. Les formateurs sont mis disposition par la ville ou par une
association.
Plus de 4500 lieux publics daccs Internet sont ouverts en France. En leur sein un ou
plusieurs animateurs multimdia (appels aussi mdiateurs numriques) accompagnent,
initient, aident chacun matriser et bien utiliser ces outils et services offerts par Internet
et plus largement par les Technologies de linformation et de la communication (TIC).
Trois labels nationaux : les ECM (espaces culture multimdia) les cyber-bases (label de la
Caisse des dpts et de consignations en 2000), et les Points Cyb, sont venus complter les
nombreux labels des collectivits locales qui ont su avant ltat prendre des initiatives dans
le cadre du dveloppement de la culture numrique.
41
42

Conseil conomique, social et environnemental, Les ingalits lcole, avis prsent par M. Xavier Nau au nom
de la section de lducation, de la culture et de la communication, septembre 2011.
Programme daction gouvernementale pour la socit de linformation fut annonc par Lionel Jospin en aot
1997, au cours des rencontres Hourtin.

28 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Labsence dune vritable politique publique de mise en cohrence des actions multiples
des EPN na pas toujours permis ces espaces de saisir les opportunits de lanimation du
numrique local. Dans ce domaine, trs peu de projets de formation au numrique sont
arrivs maturit. Une difficult due labsence dinitiatives pour faire merger des projets
innovants et pertinents. cette difficult sajoute un vritable souci de formation des
personnels aux enjeux du numrique pour toutes les instances dconcentres de ltat et
tout particulirement dans les DRAC.
En 2008, les financements publics consacrs au numrique que ce soit travers le
programme Pacsi ou ceux allous par la Caisse des dpts et consignation (CDC) en direction
des EPN ont t supprims. Bien que les structures soient demeures, labsence de fonds
publics sest avre beaucoup plus prjudiciable pour le maintien des postes danimateurs
et des actions dployes par ces espaces. Les difficults de financement des actions ont
renforc les difficults de recrutement ou de maintien des postes initiaux. A cela sajoute un
dfaut de hirarchisation des comptences et des niveaux de formation insuffisants.
Ces manques sont prjudiciables la revitalisation des EPN dont les missions sont
amenes changer au regard de la vitesse laquelle le numrique transforme les pans
entiers de nos activits sociales et conomique. Sans stratgie de changement il sera
difficile daccompagner la revitalisation des EPN comme nouveaux espaces dinnovation
et de production dinformation et de donnes numriques. Dans cette revitalisation, les
associations ont sans aucun doute un rle spcifique jouer.
 Un nouveau rapport aux uvres

La culture numrique se rfre la production dune uvre culturelle grce aux


technologies de linformation et de la communication. Elle renvoie la matrise des outils
alors que la culture lre du numrique renvoie limpact des outils sur la manire de crer.
Un univers qui renvoie notamment la numrisation des uvres et aux relations entre
le public et les artistes et qui dsigne aussi la production et la diffusion de nouvelles formes
dexpression culturelle. Lutilisation dInternet et des appareils mobiles (smartphones,
tablettes) acclre de ce point de vue la mtamorphose des pratiques culturelles,
bouleverse le modle conomique des industries culturelles et les politiques publiques de
soutien la cration. Lavis Pour un renouveau des politiques publiques de la culture43 a dcrit
ce mouvement en proposant des pistes de rforme pour adapter nos normes traditionnelles
la culture numrique.
Plus gnralement, la culture numrique renvoie au partage de linformation, son
dcloisonnement et la dmarche collaborative des rseaux. Le dveloppement, dans les
annes 1990, du Web 2.0 et des wikis est une illustration de la progression de cette culture: les
wikis sont des sites Internet dont les pages sont modifiables par les internautes sous lgide
dun modrateur (lexemple du site Wikipedia en est le plus abouti). Les utilisateurs peuvent
ainsi collaborer lcriture et modifier, de faon anonyme pour le public, les informations
que le site contient. Lorsquils sont anonymes, le site les identifie par leur adresse IP
(Internet Protocol)44. Les modifications juges indsirables sont repres et annules par
43
44

Conseil conomique, social et environnemental, Pour un renouveau des politiques publiques de la culture, avis
prsent par M. Claude Michel au nom de la section de lducation, de la culture et de la communication,
avril 2014.
Numro didentification qui est attribu de faon permanente ou provisoire chaque appareil connect
un rseau informatique.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 29

des procdures sociales et techniques propres au site. La culture numrique de cration


collaborative limage des wikis met la multitude des regards et des changes possibles
au cur mme du projet. Le Web 3.0, permet un logiciel danalyser le comportement
de linternaute et den dduire ses besoins. Aujourdhui, limmersion du citoyen dans un
environnement o le Web est trs prgnant caractrise la culture numrique (Web 4.0 o
lhomme peut travailler avec des outils uniquement en ligne).
La culture lre du numrique, cest donc un accs privilgi la connaissance, grce
la facilit daccs pour le plus grand nombre aux moyens de communication nationaux
et internationaux et aux bases de donnes qui y sont connectes. Internet et tous les outils
numriques quil dveloppe ouvre ainsi par le partage et la cration collaborative les voies
et moyens dune expression de la libert et de la confrontation des points de vue. La mise en
place de centres de ressource ddis la mmoire et la cration, notamment audiovisuelle,
deviennent alors une vidence et militent pour un Droit la mmoire, ils valorisent ainsi
de nombreux territoires comme lieux dune culture en devenir au profit du respect des
diffrences comme source de richesse.

Nouveaux pouvoirs de cration et dchanges:


des FabLabs lconomie collaborative
Depuis quinze ans, il est apparu quInternet nest pas seulement un moyen de diffusion,
mais aussi un moyen de production, un lieu dacquisition de comptences rdactionnelles
collaboratives pour les contributeurs qui, dans lexemple de Wikipedia, seraient cinquante
mille en France45. Sur ce mouvement de production virtuelle, qui reste un des plus grands
moteurs de lInternet actuel, sest ajout un mouvement de rematrialisation du virtuel, qui
peut prendre toute sorte de forme.
Ltape suivante de cette volution devrait correspondre la capacit donne aux
usagers de participer llaboration tangible de leur environnement, en particulier via les
technologies dimpression 3D. Les donnes changes sur le rseau participeront alors
littralement la cration physique de lenvironnement des usagers.
Des tiers-lieux aux FabLabs
Cette rematrialisation prend principalement deux formes: la cration de lieux o les
usagers se runissent pour un travail virtuel, et la cration de lieux o une valeur cre en
ligne est rematrialise. Ces deux formes peuvent tre combines: lusager vient la fois se
rapprocher du virtuel, et rapprocher le virtuel du rel.
Les FabLabs sont souvent des lieux de production et dinnovation, au regard des
lieux classiques et traditionnels de la production industrielle par exemple. En effet, si lon
regarde lhistoire des deux cents dernires annes, on voit quont succd des mthodes
traditionnelles des techniques industrielles fondes sur le travail individuel. Cette phase
industrielle laisse la place une nouvelle phase: les moyens de production industrielle sont
mis la porte des individus et non plus seulement des entreprises. En encourageant une
organisation sociale de plus en plus software-based ou automatise, le numrique acclre
cette mise disposition des individus doutils traditionnellement rservs aux entreprises
et donne un pouvoir de production indit aux particuliers. Mais une partie de ce pouvoir
nouveau est un pouvoir qui est en fait retir au monde du travail, et notamment aux PME et
45

Source : Wikipdia

30 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

TPE, qui peuvent se trouver parfois fragilises par lmergence dun secteur de production
informel qui ne sembarrasse pas des contraintes habituelles du monde de lentreprise.
Ainsi, Internet nest donc pas seulement un lieu de diffusion, mais aussi un lieu de
production.
Le dveloppement de lconomie collaborative
Lconomie collaborative concerne aussi bien lchange de biens physiques, que
la finance (crowdfunding, financement participatif ), ou encore la production (FabLabs,
makerspaces, lieux ouverts tous o sont mis disposition des machines pour fabriquer).
Elle repose sur lchange en pair--pair46 via une plateforme.
Cette possibilit de produire propre lInternet est lie au phnomne dit de la richesse
des rseaux . On trouve aussi des formes de collaborations qui ne sont pas massives et
ouvertes, mais qui nauraient pas pu se dvelopper dans lre industrielle qui sachve: par
exemple, il existe des produits culturels qui sont issus de collaborations purement virtuelles
entre artistes, qui seront rmunrs la hauteur exacte de leur contribution. Cest ainsi que
des agences de design ou de communication crent de nouvelles polices de caractres,
ou des contenus rdactionnels. Enfin, il existe toute une conomie collaborative qui nest
pas directement lie au secteur marchand et qui peut reposer sur des choses aussi diverses
que lchange de services, que ce soit entre particuliers ou entre entreprises, ou lchange
dobjets, ou la production de biens, services ou vnements qui ne sont pas destins au
secteur marchand.

Accs aux donnes publiques: un nouveau regard citoyen


Les diffrents outils mis dsormais la disposition des citoyens ouvrent de nouvelles
opportunits dimplication des citoyens dans les processus de dcision des pouvoirs
publics et des collectivits territoriales. Tout dabord, le dveloppement dune socit
qui soriente davantage en fonction des faits statistiques (data-driven) peut avoir un effet
positif sur la comprhension que les citoyens ont de ce quest ltat et de ce quil fait. Or,
mettre disposition des citoyens, que ce soit en ligne, dans des administrations, ou dans
des tiers-lieux, des donnes publiques et doutils, prsente diffrentes limites. Dune part,
lappropriation de ces moyens est ingale, si bien que certains citoyens peuvent tre
exclus ou certains peuvent tre plus ou moins carts de ces processus. Dautre part, les
administrations peuvent tre rtives partager des donnes, confier des outils, et
accompagner ces expriences, qui peuvent tre perues comme inutiles, ou porteuses de
dysfonctionnements ou de ralentissements.
LOpen Data et transparence de la dcision publique
Du partage des rsultats de recherche scientifique, lOpen Data renvoie aujourdhui plus
largement la publication des donnes des administrations pour les rendre accessibles la
socit. Ce mouvement dont nous avons vu prcdemment quil se diffuse ds les annes
70, participe de la construction de la transparence de la dcision publique et favorise la
participation citoyenne. Les Etats-Unis, le Canada, le Royaume-Uni et les Pays-Bas font
notamment office de figures de proue de ce mouvement n en Europe de libration des
informations du secteur public. Une littrature spcialise se constitue dores et dj
46

Pair--pair (peer to peer), cest--dire changer des fichiers sans passer par un serveur extrieur.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 31

(rflexions philosophiques et perspectives espres par les acteurs concerns, relayes par
la presse) et les premires modifications des cadres juridiques affrents interviennent depuis
le dbut des annes 200047. En France, ce concept a t initi depuis 2010 par les collectivits
locales, avant que le gouvernement ne rejoigne le mouvement48. En effet, la mission
Etalab a t cre en 2011 avec pour objectif la mise en place du portail gouvernemental
data.gouv.fr49, pour runir les diffrentes donnes produites par les dpartements
ministriels et autres institutions publiques, et dsormais destines une mise disposition
gratuite sur Internet. Rsultat de la mobilisation de la puissance publique, la France vient de
se hisser de la 16ime place en 2013 la 3ime place de lOpen Data Index pour lanne 2014.
De ce point de vue, lOpen Data est donc un mouvement distinct du Big Data. Leurs
origines historiques et intellectuelles sont diffrentes. On considre gnralement que
la source de lOpen Data est chercher dans larticle 15 de la Dclaration des droits de
lHomme et du citoyen de 1789 comme le rappelle Henri Verdier50qui stipule que la socit
a droit de demander compte tout agent public de son administration. En un premier sens,
lOpen Data est dabord une aspiration dmocratique la transparence. En un second sens,
ce mouvement sest trouv acclr depuis une vingtaine dannes, sous le double effet du
dsir de participation des citoyens ladministration et la gestion quotidienne de leurs
territoires, et de la possibilit de dvelopper des projets collaboratifs en ligne. Enfin, en un
dernier sens, lOpen Data peut se relier au Big Data car les donnes rendues publiques par
lOpen Data peuvent nourrir des dispositifs Big Data.
LOpen Data permet aux services publics de publier des donnes publiques et la
socit civile de les enrichir, modifier, interprter, en vue de coproduire des informations
dintrt gnral. Lhistoire du mouvement multi-factoriel de lOpen Data montre quil est
la fois un signe de vitalit dmocratique, un champ dinnovation conomique et social et un
outil pour affiner laction publique.
A titre dillustration, il est possible de rcuprer des statistiques judiciaires sur une ou
plusieurs fourchettes annuelles, les horaires de bus parcourant un territoire, la cartographie
des forts domaniales ou de toute autre zone protge. Toutes ces donnes sont rendues
accessibles, par accs direct depuis le portail Open Data ou par des liens pointant vers
dautres sites.
Les oprateurs privs comme publics ont dj pris la mesure du potentiel conomique
li aux exploitations innovantes des informations publiques, notamment sous limpact de
lexplosion du march des applications pour smartphones. Dautres exemples comme les
dfricheurs que sont les rseaux citoyens ou les journalistes dinvestigation permettent de
mesurer la porte de la libration des donnes. Les dveloppements de projets issus de
lOpen Data sduisent par leur modernit, les capacits dinnovation quils reclent, et les
promesses de croissance qui en dcoulent.
47
48
49
50

Par exemple: modification du Freedom of Information Act de 1996 pour les Etats-Unis, rvision en cours de la
directive europenne 2003/98/CE Public Sector Information dite PSI.
La mission interministerille Etalab a t cre par dcret n2001-194 du 21 fvrier 2011 du Premier ministre,
Franois Fillon. Cette mission dsormais prside par Henri Verdier, est actuellement intgre au Secrtariat
gnral la modernisation de laction publique (SGMAP).
Le portail data.gouv.fr, a t cr par circulaire en date du 26 mai 2011 et a t mis en ligne le 4 dcembre
2011.
Audition de M. Henri Verdier, Directeur dEtaLab, devant la section de lducation, de la culture et de la
communication du Conseil conomique social et environnemental, le 28 mai 2014.

32 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Connatre la qualit de leau dans sa ville, dcouvrir les sites dcotourisme dans sa
rgion, consulter la rglementation en vigueur sur lnergie solaire. Autant dinformations
vertes disponibles sur le portail toutsurlenvironnement.fr. Cr dans le sillage du Grenelle
de lenvironnement, en juillet 2009, ce site du ministre de lcologie rassemble prs de
44000 ressources sur lenvironnement, mises disposition par environ 170 administrations.
On y trouve aussi bien des cartes que des rapports, des bases de donnes ou encore des
documents multimdias. Lobjectif est de rendre linformation publique environnementale
accessible au plus grand nombre de citoyens, comme limpose la convention dAarhus, ratifie
par la France en 2002, explique ric Bonmati, responsable du portail. Le site, qui est pass de
20000 36000 visites par mois, mne en outre depuis octobre une campagne pour inciter
les collectivits collaborer en ouvrant leurs bases de donnes. Une initiative qui sinscrit
dans la tendance louverture des donnes publiques, lOpen Data, lance par ltat avec
data.gouv.fr.
Malgr les progrs accomplis par ladministration en termes de transparence, la mission
commune dinformation du Snat sur laccs aux documents administratifs constate
linertie persistante des administrations sur louverture des donnes publiques et la
qualit ingale des informations publies51. Les pratiques actuelles des principaux acteurs
de lOpen Data ne permettent nanmoins pas de satisfaire pleinement les objectifs initiaux
de ce mouvement de libration des donnes publiques. En effet, la multiplicit actuelle des
portails Open Data ne facilite pas laccs direct linformation par les citoyens. Compte tenu
du format brut des donnes mises dispositions, lintervention dun intermdiaire semble
en outre invitable. Cette mdiation, source dactivits conomiques, tempre ds lors
lobjectif de transparence directe lgard des administrs.
De mme, la diversit des formats52 utiliss pour mettre disposition les donnes et la
ncessit induite par certains dutiliser des logiciels spcifiques, voire payants, complexifient
laccessibilit aux donnes et tendent faire perdre le caractre gratuit de cet accs. Enfin,
la qualit des donnes mises disposition peut-tre altre par labsence dexplication sur
les mthodes de production de la donne (par exemple, en matire de statistiques, sur les
sources utilises, etc.). Ces dficits dans la cohrence des dbuts de lOpen Data srigent en
obstacles laccessibilit des informations du secteur public.
Par ailleurs, il convient dintgrer dans la rflexion porte sur lOpen Data, laccs aux
donnes des entreprises mises disposition des reprsentants des salaris dans le cadre des
bases de donnes uniques. Si ces donnes ne sont pas considrer comme ouvertes,
elles contribuent cependant donner aux reprsentants des salaris, des lments
danalyses pour mieux connatre la situation de lentreprise, et ainsi conforter le dialogue
social, ainsi que la dmocratie sociale.
51
52

Rapport au nom de la mission commune dinformation sur laccs aux documents administratifs et aux
donnes publiques prsid par M. Jean-Jacques Hyest, snateur, prsent par Mme Corinne Bouchoux,
snatrice, juin 2014.
Sur le site data.gouv.fr, 15 formats de donnes diffrents sont utiliss pour diffuser en Open Data. Parmi ces
formats, la plupart ncessitent lutilisation dun logiciel pour consulter les donnes. La plupart des formats
sont difficilement comprhensibles en ltat. Cest le cas notamment du format [.XML].

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 33

La cration dun administrateur gnral des donnes (quivalent du chief data officer
anglo-saxon) laisse esprer la dfinition dune politique nationale de la donne au-del de
la seule dimension de lOpen Data.
Cependant il convient de rester prudent: le croisement des fichiers dOpen Data peut
permettre daccder des donnes individuelles qui menaceraient la vie prive des citoyens.
Une transparence absolue ne peut tre atteinte et nest pas forcment toujours souhaitable;
notamment de la part des Etats, condition que ce soit pour des raisons lgitimes de
protection des liberts individuelles (par exemple: secret dfense, secret de linstruction...).
Ds lors le dogme politique de lOpen Data avec louverture des donnes risque fort bien de
dplacer la mdiation et lexpertise vers les dtenteurs dun capital technologique.
Si louverture des donnes doit tre encourage, elle doit saccompagner dans le mme
temps de toutes les garanties de respect de lanonymat. Doivent galement tre exclues de
ce mouvement dOpen Data les donnes relevant du secret industriel et commercial et de
la scurit publique.
La rvolution numrique et ladministration lectronique
La France a t dsigne, par lONU, premire en Europe et quatrime dans le monde
pour ladministration numrique. La transformation numrique permet aux Franais de
simplifier leurs dmarches administratives. titre dexemple, 53% des Franais paient
leur impt sur Internet. 86% des agriculteurs effectuent des demandes daide au titre
de la politique agricole commune. Le site Legifrance a reu 100 millions de visites et
service-public.fr plus de 200 millions en 201353.
Les technologies numriques permettent aux citoyens de faciliter leurs dmarches
quotidiennes. Les relations administration-citoyens sont de plus en plus dmatrialises
grce aux sites Internet ou aux applications mobiles des administrations. Un des enjeux du
dveloppement de ladministration numrique est de rendre ces services ergonomiques
pour tre utilisables par tous. En effet, une tude de lAgence nationale des solidarits
actives (ANSA) montre que lergonomie de ces services participe la rduction de la
fracture numrique qui concerne particulirement les jeunes en difficult, les personnes en
recherche demploi et les seniors54.
Mais le dfi de la transformation numrique de ltat rside aussi en la capacit des
pouvoirs publics permettre tous de pouvoir tre connect, ce qui nest pas le cas
actuellement au vu du cot dun abonnement ou dune connexion ponctuelle. LANSA
recommande ainsi de dvelopper le WiFi55 public dans les lieux frquents par ces
populations: foyers de jeunes travailleurs, missions locales, centres dhbergement, centres
sociaux

53
54
55

Compte-rendu du Conseil des ministres du mercredi 17 septembre 2014.


Agence nationale des solidarits actives, Laccs aux tlcommunications pour tous, la parole aux personnes en
situation de prcarit, avril 2012.
Le WiFi est un ensemble de rgles de communication permettant de relier sans fil plusieurs appareils
informatiques.

34 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Les nouveaux enjeux sociaux et culturels


de la fracture numrique
Alors que lillettrisme a t dclare Grande Cause nationale 201356, son avatar
numrique lillectronisme toucherait 15% de la population. Lillectronisme est une difficult
qui peut se traduire autant par la manipulation de ces nouveaux outils - computer illiteracy que par une incapacit accder aux contenus de linformation numrique et les comprendre
- information illiteracy .57 Un obstacle technique et intellectuel, en somme.
Les recherches menes sur le sujet dmontrent une corrlation entre la varit de
lusage du numrique et le niveau dducation; et le fait de se trouver en marge des circuits
sociaux, ducatifs, et professionnels est un facteur dexclusion numrique considrable. En
2013, selon le CREDOC, 82% des franais de plus de 10 ans taient internautes au moins
occasionnellement. 81% des foyers sont quips domicile. En ce qui concerne linternet
mobile le CREDOC dcompte 39 % dutilitaires. Les ingalits daccs sont fondes sur lge
(au-del de 65 ans), le niveau de diplme, et lexistence denfants dge scolaire au sein des
foyers qui induit un plus fort quipement.
Le CREDOC identifiait 4 populations dont le taux daccs internet restait infrieur ou
gal 60 %: les plus de 70 ans, les retraits, les membres des mnages dont le revenu tait
infrieur 900euros par mois et les non diplms,
Parmi les internautes, 91 % des 18-24 ans et 87 % des diplms du suprieur utilisent
internet tous les jours, contre la moiti des plus de 70 ans et des non diplms. Les trois
quart des moins de 24 ans et les deux tiers des diplms du suprieur utilisent internet hors
de chez eux contre 6 % des plus de 70 ans et 13 % des non diplms.
En matire dutilisation dinternet, les rseaux sociaux sont frquents majoritairement
parmi les 12-39 ans et trs minoritairement par les plus de 60 ans; les services administratifs,
de mme que les achats sur internet sont utiliss par les diplms (83 %) et les jeunes de
25 39 ans (78 %). Internet est un mdia pour les jeunes diplms alors que le reste de
la population continue couter la radio et regarder la tlvision. Enfin, la pratique du
numrique est corrle avec la taille de population du lieu de rsidence et lutilisation est
maximale dans les trs grandes agglomrations de plus de 100000 habitants.
On rappellera que les avis du CESE Pour une politique de dveloppement du spectacle
vivant : lducation artistique et culturelle tout au long de la vie et Pour un renouveau des
politiques publiques de la culture ont dmontr que lusage intensif dinternet est fortement
corrl avec lintensit des pratiques culturelles. On nomettra pas dajouter les zones
gographiques qui restent non couvertes par internet notamment les zones rurales et de
montagne. Le gouvernement sest engag dans un plan numrique permettant la connexion
terme de la totalit de la population.
Sil existeun lien entre public en difficult avec les acquis simples, les savoirs de base et
lillectronisme- Internet est constitu de 90 % dcrit -, comme le relve Frdric Rampion,
charg de projet au sein de lassociation rouennaiseducation & Formation, qui vise
former les publics peu ou pas qualifis lacquisition des comptences cls, les individus en

56
57

Selon une tude de lInsee parue en dcembre dernier, la France compte 2,5 millions de personnes illettres.
7% des adultes de 18 65 ans ayant t scolariss en France, mais ayant perdu les acquis de base, souffrent de
ce handicap.
Elisabeth Nol, Ecole nationale suprieure des sciences de linformation et des bibliothques

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 35

situation de prcarit sociale ou conomique, les seniors, les non-diplms ou encore les
grands ruraux font aussi partie des populations touches.
Toujours selon une tude du CREDOC surla diffusion des technologies de linformation
et de la communication dans la socit franaise , 42 % des Franais non connects
invoquent comme frein principal le cot de labonnement et de lordinateur, ainsi que la
complexit de loutil. Il sagit dune machine qui change de configuration en permanence.
Contrairement un toaster ou un fer repasser, o un bouton est gal une fonction, sur Internet
un bouton correspond une multitude de fonctions,dtaille ainsi Bernard Benhamou.
Le numrique est souvent prsent et peru comme la solution toutes les difficults,
en somme une baguette magique. Le numrique ne peut pas gommer lui seul la barrire
de laccs au savoir quest le milieu social ? Laccs aux savoirs et plus encore aux savoirs
numrique et par le numrique ncessite un effort de mdiation et de partage sur lensemble
du territoire. Ce qui pour notre assemble oblige de construire autour de ces nouveaux
outils de recherche et dexploration des projets dont lambition doit demeurer la mise en
relation citoyenne et lmancipation des personnes.
mesure que ces technologies sont devenues accessibles un plus grand nombre de
foyers58, le besoin daccompagnement, loin de steindre, sest au contraire amplifi tout en
se diversifiant. La pense qui prvalait alors tait qu mesure que les foyers franais seraient
quips en micro-ordinateurs connects, les citoyens se formeraient progressivement et les
besoins daccompagnement diminueraient mcaniquement. Force est de constater que
cette prvision sest rvle fausse et cela pour plusieurs raisons parmi lesquelles on pourra
citer:
lexplosion en volume des services mis disposition des citoyens sur Internet
ainsi que leur importance croissante dans lensemble des dmarches sociales,
culturelles et professionnelles a ncessit un accompagnement pour permettre
aux citoyens deffectuer en ligne certaines dmarches qui pour les plus importantes
dentre elles (comme la recherche demploi) ncessitent la matrise des usages de
lInternet.
dans le mme temps, la numrisation de lensemble des mtiers et des filires
a rendu plus indispensable la matrise de ces technologies au-del des seuls
mtiers lis linformatique. Les risques sociaux lis labsence de matrise des
technologies et des usages de lInternet sont devenus dautant plus importants
que ces comptences ne sont pas toujours quantifiables.
la monte en puissance des rseaux sociaux a pu donner en particulier aux plus
jeunes utilisateurs une fausse sensation de matrise de ces technologies qui
devenaient pour beaucoup un substitut la consultation des mdias audiovisuels
traditionnels sans quelle saccompagne ncessairement de bnfices sociaux ou
professionnels.
lessor des terminaux mobiles qui permettent de simplifier laccs aux ressources
de lInternet (en particulier pour les primo ou no-utilisateurs) pose aussi des
questions nouvelles sur la matrise des dmarches administratives ou sociales
58

La France se situe au 8e rang europen, avec 82% des mnages connects lInternet domicile en 2013,
contre 74% en 2010 et 62% en 2008. Elle est prcde notamment par lAllemagne et le Royaume-Uni (88%
pour chacun) (Observatoire du Numrique DGCIS)
http://www.observatoire-du-numerique.fr/u+6sages-2/grand-public/equipement

36 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

en particulier lorsque le terminal mobile constitue, comme cest le cas pour de


nombreux foyers dfavoriss, lunique moyen de connexion lInternet.
la complexit et le manque dergonomie des premiers outils, notamment les
micro-ordinateurs ont rebut les utilisateurs nophytes.
La fracture numrique nest alors plus seulement une affaire entre ceux qui ont accs
linformatique et ceux qui ne lont pas. Le matriel informatique est aujourdhui devenu
un produit de consommation de masse, mme dans les pays pauvres. La nouvelle fracture
se fait et se fera plus encore lavenir entre ceux qui sauront trier linformation, la vrifier,
lorganiser, bref lutiliser pour en faire un vritable outil de savoir, et ceux qui faute dune
ducation au numrique nauront pas les moyens de le faire. Comme le rappelle le CESE,
cest lambition du socle commun.
Lappropriation des techniques dutilisation du numrique et du mode dusage dInternet
est aujourdhui une dimension tout aussi discriminante au regard des rpercussions dans le
monde du travail, le dveloppement professionnel, la consommation, la communication et
lexercice de la dmocratie.
Lutilisation des logiciels, la comprhension de linformation pour sen servir, la
comprhension de la structure dun fichier ou du fonctionnement dun site Web ncessitent
des connaissances et des comptences. Tout cela, le CESE le rappelle dans ses avis rcents
sur lducation, renvoie notamment la matrise du socle commun de connaissances, de
comptences et de culture.

Lenjeu de la souverainet numrique


Pour tre utilisables par le plus grand nombre, les vastes ressources numriques
accessibles sur Internet ncessitent que soient mis en place des services de diffrentes
natures; des moteurs de recherche, des rseaux sociaux, des services de golocalisation,
des plateformes dchanges dimages ou de vidos. Ces plateformes qui centralisent et
organisent linformation reprsentent des intermdiaires obligs pour la quasi-totalit
des utilisateurs de lInternet. ce titre, ces plateformes disposent dun pouvoir dinfluence
considrable sur les citoyens. Face la monte en puissance des grandes plateformes qui
agrgent et organisent linformation sous ses diffrentes formes, des questions nouvelles
sont dsormais poses quant la capacit des citoyens en tirer parti et aussi den bnficier
de manire transparente.
Ces plateformes sont en particulier la face visible par les citoyens des technologies de
Big Data. Par leur importance dans la vie quotidienne de limmense majorit des usagers de
lInternet, ces plateformes ont la fois un pouvoir conomique sur lensemble des secteurs
dactivit mais elles reprsentent aussi un vecteur dinfluence politique dans le cadre de
la formation des opinions publiques. En effet, le cadre dutilisation des donnes issues de
ces plateformes devrait aussi slargir mesure quelles accompagneront les dmarches de
sant, les dispositifs de matrise de lnergie ainsi que la culture ou les transports. Mme si
la matrise des technologies en ce domaine correspond des mtiers part entire, il est
chaque jour plus important que les citoyens et les entreprises aient une forme de matrise
des technologies qui sous-tendent ces plateformes, pour permettre tant leur contrle que
la transparence en ce domaine.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 37

Face la domination des acteurs conomiques amricains et la captation de la valeur


produite en France qui en dcoule (faute de rponses conomiques et fiscales adaptes),
la question de lindpendance conomique et politique est pose. Sans offre de notre part,
cest la fois des pans entiers de nos industries qui en souffriront et une approche de la
gestion des donnes loppos de nos exigences thiques qui lemportera, avec les risques
que nous connaissons en matire de protection de la vie prive et des donnes sensibles
caractre personnel ou pas.
Il faut raffirmer lexigence dune rponse politique, mme daccompagner les
transformations en cours en adaptant la fois nos comportements, et en encourageant
linnovation et laudace. Sous-estimer les enjeux du numrique, cest prendre le risque de
perdre une vision globale des atouts de notre pays et une capacit de redployer les efforts
indispensables.

La valeur conomique capte par les GAFA


(Google, Apple, Facebook, Amazon)
Cette valeur conomique prsente actuellement trois difficults. Tout dabord, elle est
trs inquitable, au sens o la richesse apporte par les particuliers ntant pas rmunre,
elle nest pas valorise sa juste valeur et permet une grande marge aux socits qui savent,
notamment dans le cadre du Big Data, exploiter ces donnes. Cet cart entre valeur relle
et valeur perue explique que ces socits attirent massivement de linvestissement car leur
modle conomique permet, en thorie, un passage grande chelle, renforant la capacit
dadaptation et de croissance des performances, ce que les investisseurs en capital nomment
parfois une scalabilit. Concrtement, si une application ou un service sont bien conus
et gnrent une forte attraction, les cots fixes de leur fonctionnement, bien quaugmentant
avec lusage, augmentent beaucoup plus faiblement que leurs rsultats, permettant une
trs forte marge dexploitation. Sans cette forte marge dexploitation, ces entreprises, et
notamment les startups, ne pourraient que difficilement attirer de linvestissement. Ensuite,
cette valeur conomique est capte par un trs petit nombre dacteurs quun essayiste
comme Jaron Lannier, dans son ouvrage Who Owns the Future, nomme des siren servers, des
sirnes, qui attirent les particuliers et leurs donnes. Par exemple, le fait que nombre de
services emploient pour identifier leurs usages une application comme Facebook Connect
tend renforcer la centralit de Facebook dans lconomie gnrale des usages en ligne:
Facebook finit par tre le passeport ncessaire pour un nombre signifiant dactivits en ligne.
Donc, non seulement nos donnes personnelles ne sont pas rmunres, mais, en outre,
nous ne percevons pas que ces donnes sont aux mains dun nombre limit dentreprises
concentres sur une aire gographique, qui nest pas tant les tats-Unis que la stricte Silicon
Valley; ce qui nest pas sans poser une srie de problmes, conomiques, stratgiques et
politiques.
y conomiques: la valeur conomique capte se retrouve capte par la Silicon Valley.
y Stratgiques: les autres cosystmes de startups lorgnent vers la Silicon Valley, que
leur objectif soit seulement de lmuler, ou dy transfrer leur direction, notamment
pour devenir des entreprises globales.
y Politiques : les solutions manant de la Silicon Valley sont dotes, en creux, dun
outillage mental spcifique, qui, en raison de la domination de ces solutions dans les
usages des internautes, tendent pntrer limaginaire des usages.
38 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Crer un discours critique de ces pratiques est possible, limposer devient difficile.
Pourtant nous devons poursuivre ce combat car nous sommes au commencement de la
mtamorphose numrique du monde, o la souverainet forme un tout : souverainet
des donnes prives; souverainet des donnes dentreprise; souverainet des donnes
conomiques: le pouvoir dinfluence sur les marchs des oprateurs en position dominante
(Google, Apple, Amazon, etc.) ; souverainet fiscale : le secteur du numrique chappe
aux rgles fiscales usuelles ; souverainet politique : vis--vis des tats-Unis, le pouvoir
dinfluence politique de lEurope est dtermin par sa position de force ou de faiblesse dans
les domaines conomique, fiscal ou priv.
Aussi pour promouvoir un cosystme numrique rgul, il est ncessaire de maintenir
loutil de la fiscalit en rendant oprant les principes sur lesquels elle repose comme par
exemple la capacit faire de la redistribution.

Lillusion du tout gratuit


La question de la gratuit est rcurrente sur Internet. Les internautes ont adopt
la gratuit comme rgle. Lesprit de partage et de mise disposition gracieuse, par des
particuliers, de ressources et de documents, est une des raisons du dploiement massif
de lInternet dans les vingt-cinq dernires annes. Cette habitude de la gratuit provoque,
depuis longtemps, des usages problmatiques, comme par exemple le piratage massif de
certains produits. Ce piratage est souvent li au fait que la valeur de lobjet pirat nest pas
perue, et que laction de piratage nest pas perue comme potentiellement nuisible. Dans le
cadre du Big Data, cette habitude de la gratuit joue potentiellement contre les particuliers
qui souscrivent un trs grand nombre de services gratuits en ligne. Ils devinent bien que ces
services sont produits par des socits commerciales et que la possession de leur adresse
de messagerie est une richesse potentielle. Toutefois, ils sous-estiment ltendue et la valeur
des donnes personnelles quils confient ces socits en change de la possibilit de jouir
gratuitement du service qui les intresse. Mme en limitant les donnes dclaratives quils
confient lentreprise, ils finissent, lusage, par confier des informations nombreuses et
prcises sur ce quils sont, ce quils font, ce quils apprcient. Ces donnes personnelles
ont une grande valeur conomique pour ces entreprises, qui peuvent valoriser chaque
utilisateur de leur service entre cinquante et cent euros par an59, voire davantage. En un
sens, l o certaines entreprises, lies des conomies traditionnelles, devaient dployer
des ressources pour lutter contre limpression de gratuit afin de maintenir des modles
conomiques classiques comme lachat de produits et services, la majeure partie des acteurs
du Web sappuient sur cette impression de gratuit et finissent par masquer aux internautes
la valeur relle de leurs donnes personnelles : par exemple, le slogan de Facebook est,
depuis ses dbuts:Facebook est gratuit et le restera toujours.
Cette ouverture et cette libert ont videmment leurs revers et leurs dangers. La
dcouverte de ltendue des donnes collectes par la National Security Agency (NSA)
auprs des gants de lInternet via le programme PRISM a constitu un sisme pour les
opinions publiques et aussi pour lensemble des acteurs de lInternet. Ceux-ci ont en effet
dcouvert que leurs infrastructures taient devenues transparentes pour les agences
gouvernementales.
59

Il y a plusieurs mthodes pour estimer la valeur des donnes, on peut prendre la capitalisation de Facebook
et diviser par le nombre dabonns, ce qui fait de 40 50 dollars par personne selon la valeur de laction.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 39

Les liberts lre du numrique:


une relation sous tension
Pour la premire fois depuis la cration de lInternet, les rvlations dEdward Snowden
ont cr les conditions dun schisme entre les industriels de lInternet et le gouvernement
amricain. En effet, si elles posent, juste titre, des questions lies aux risques dmocratiques
issus de la surveillance de masse, cest la remise en cause de la confidentialit des donnes
des entreprises qui a constitu le volet le plus inquitant pour lensemble des acteurs
conomiques. Ainsi, les gants de la Silicon Valley ont fait savoir Barack Obama quel point
la NSA pouvait remettre en cause la clef de vote de lInternet: la confiance de ses usagers60.
Mark Zuckerberg, PDG de Facebook, dclarait mme rcemment : Le gouvernement
amricain est devenu une menace pour lInternet61
La notion de surveillance de masse est devenue une ralit pour lensemble des
opinions publiques mondiales. Au-del de lappropriation individuelle du fonctionnement
des services et des technologies des fins sociales, culturelles ou professionnelles, cest
aussi lappropriation collective de ces technologies et donc la capacit de nos socits
difier une architecture numrique conforme leurs principes et leurs valeurs qui
sera dterminante pour lvolution de nos socits ; or cest prcisment cette capacit
dappropriation collective qui est remise en cause par laffaire Snowden. Les rvlations de
lancien contractant de la NSA ont en effet dmontr lensemble des opinions publiques
que certains de leurs prjugs avaient gravement t branls:
la volont des acteurs technologiques de protger les donnes de leurs usagers
serait un invariant conomique ;
la surveillance ne concernerait que des enqutes et des individus isols et pas
lensemble des citoyens dun tat ;
seuls les contenus directement issus des usagers devraient tre protgs (les
mtadonnes issues de la navigation des internautes sont moins sensibles que
le contenu des changes eux-mmes) ;
les entreprises auraient les moyens de protger leurs donnes sensibles face des
intrusions ;
aucun tat ne prendrait le risque de fragiliser lensemble de linternet.
Les consquences sociales et politiques long terme de laffaire Snowden commencent
peine tre mesures. Dj, certains prjugs sur la nature des changes sur les rseaux
sociaux commencent tre remis en cause. Ainsi, contrairement la perception commune,
les mdias sociaux semblent tre moins mme de permettre lchange dopinions, surtout
lorsque ces opinions paraissent tre en dsaccord avec celles des personnes pour lesquelles il
peut tre tabli un lien de proximit notamment dans les sphres sociale ou professionnelle.

60
61

Tech executives to Obama: NSA spying revelations are hurting business (Washington Post, 17/12/2013)
http://wapo.st/1kfMSAZ
ditorial de Mark Zuckerberg post sur Facebook le 13/03/2014
http://on.fb.me/1nVf2Cc

40 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

La collecte exponentielle des donnes


face aux risques de lhypersurveillance
Le cot du stockage de donnes, la certitude que la valeur est dans la donne, et les
bnfices apparents que lindividu peut tirer du partage de ses informations sont de nature
encourager une collecte maximale et indiffrencie des donnes, partir de deux sources:
les donnes que nous fournissons en employant des applications ou en navigant sur le
Web, et les donnes qui sont collectes travers les objets connects que nous portons ou
sommes appels porter. Mme si, dans chaque interface, les donnes sont collectes des
fins prcises et lgitimes, deux problmes demeurent. Dune part, il est tentant, pour chaque
entreprise, de changer lusage de ces donnes, car cet usage, et donc la valeur des donnes,
peut ne pas apparatre lors de leur collecte initiale. Dautre part, mme si les donnes que
je transmets sont initialement anonymises, le grand nombre dapplications et dinterfaces
collectrices de donnes permettent terme le ridentification des utilisateurs une
ridentification quils ne dsirent pas, mais rendent possible en confiant des entreprises
distinctes des informations qui, recoupes, dessinent un profil si prcis quil finit par dsigner
un seul individu.

De la collecte de donnes au fichage gnralis:


de laffaire Safari laffaire Snowden
La conscration de la vie prive des individus a entran le dveloppement de nombreux
moyens destins protger les donnes personnelles recueillies par les professionnels. Tout
professionnel, au gr de lexpansion de son entreprise, se constitue un fichier-clients via
un outil informatique qui aura la particularit de regrouper de nombreuses informations
confidentielles devant faire lobjet dune protection maximale.
En 1973, le projet gouvernemental de Systme automatis pour les fichiers
administratifs et le rpertoire des individus connu sous le nom de SAFARI envisageait de
runir tous les fichiers nominatifs de ladministration franaise. En mars 1974, la rvlation
de cette information par le journal Le Monde a contraint le gouvernement crer une
Commission nationale dinformatique et des liberts (CNIL) dans le but de veiller ce que
cet archivage de donnes personnelles ne porte pas atteinte la vie prive des administrs.
La loi Informatique et liberts de 1978 est ainsi ne.
Depuis cette poque, lide dune utilisation massive des donnes par ltat et les
services de renseignement revient rgulirement dans lactualit. Cest ainsi que les rcentes
rvlations dEdward Snowden sur PRISM ont dmontr que la collecte dinformations des
services de renseignement amricains tait effectue grande chelle sur les infrastructures
comme la fibre optique et les cbles sous-marins, dans les centres de commutation des
donnes mais aussi sur les rseaux et en exploitant les failles des protocoles comme la faille
Heartland dans le protocole Open SSL62.
62

Une importante faille de scurit qui a t dcouverte en avril 2014 dans OpenSSL, la bibliothque opensource qui configure la scurit dans certains systmes dexploitation comme Linux, OS X ou encore iOS
et Android. Prsente depuis 2012 elle aurait permis de subtiliser des donnes personnelles censes tre
chiffres. Ce systme de chiffrement est utilis par la plupart des sites web pour les connexions HTTPS.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 41

Selon Edward Snowden, les services de renseignement sattaquent galement aux


technologies de chiffrement. Le programme PRISM a permis lAgence nationale de
scurit des tats-Unis (NSA) de rpertorier toutes les donnes dtenues par les gants du
net (Facebook, Microsoft, Yahoo et Google) au nom de la loi antiterroriste (Patriot Act) et ce,
en contradiction du safe harbor63 ngoci avec lUnion europenne qui encadre le transfert
international de donnes. Par ailleurs, M. Antonio CASILLI, lors de son audition au CESE, nous
indiquait que le gouvernement britannique pratiquait une surveillance grande chelle de
toutes les personnes prsentes sur le territoire du Royaume-Uni.
Mais ces rvlations montrent aussi trs clairement lambivalence de la surveillance
opre qui tient la fois de la lutte contre la criminalit organise et de la lutte conomique.
Elle montre aussi un changement radical dans lapproche de la surveillance lie la capacit
de calcul disponible. On passe dune surveillance cible en fonction de suspicions (
lancienne) une surveillance globale sans motif. Cette logique est celle du Big Data. On
amasse et on voit ce qui peut servir ultrieurement.

Big Data ou Big Brother?


proprement parler, la problmatique des fichiers nest pas ne avec le Big Data, mais,
l encore, les innovations apportes par le Big Data ouvrent des perspectives de contrle
et de surveillance nouvelles pour les institutions en charge de la scurit intrieure ou
extrieure. Le Big Data pousse une collecte indiffrencie et massive afin doprer des
traitements automatiss des fins de prdiction et de profilage. Il pousse recueillir des
donnes en volume, et recueillir des donnes varies, de manire indistincte, dont la
finalit napparat souvent pas au moment de la collecte. Paralllement, les particuliers
peuvent tre amens contribuer cette collecte, pour profiter eux-mmes des bnfices
du Big Data, par exemple, en renvoyant des applications de remise en forme des donnes
mdicales les concernant qui, compares aux donnes dautres utilisateurs, permettront
une personnalisation des recommandations dispenses par lautomate. Les particuliers, en
un sens, collectent des volumes de donnes qui attirent la convoitise des entreprises prives
comme des institutions de scurit.
Linterception et la surveillance des tlcommunications, quelles soient ralises dans
un cadre administratif, dans un cadre judiciaire, ou hors de tout cadre clair, nest pas une
nouveaut. Mais, l encore, le Big Data apporte une innovation incrmentale double qui
encourage certaines institutions, amricaines comme europennes, amplifier leurs efforts
de surveillance, voire despionnage. Cette innovation est double et est lie aux possibilits
de prdiction et de profilage que permet le Big Data. Concrtement, il est devenu possible
voire souhaitable, aux yeux de certaines institutions, de se livrer un espionnage massif et
sans distinction, et dautomatiser le traitement de ces donnes, afin, par exemple, de reprer
des corrlations qui pourraient tre signifiantes dans le cadre dune mission de surveillance
ou de prvention dattaques terroristes.
Cette tentation de devenir Big Brother, grce au Big Data, se heurte heureusement
deux difficults. Tout dabord, cette collecte et ce traitement peuvent tre en contradiction
avec les principes qui fondent nos dmocraties. Ensuite, lefficacit de cette collecte nest
63

Le Safe Harbor est un cadre juridique o sont runis les principes de la Sphre de scurit (Safe Harbor)
permettant une entreprise amricaine de certifier quelle respecte la lgislation de lEspace conomique
europen (EEE) afin dobtenir lautorisation de transfrer des donnes personnelles de lUnion europenne
vers les tats-Unis.

42 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

pas assure car, dans le cadre dune mission de prvention dactes terroristes, le Big Data
conserve un dfaut: il est utile pour prdire la reproduction ou les rptitions dvnements,
mais il demeure mal arm pour dtecter les vnements indits. Cela tant, les partisans
dune surveillance accrue pourraient rpondre cet argument consquentialiste que
lautomatisation partielle de la veille permet de librer des ressources pour un travail plus
classique de surveillance. Mais, quelle que soit lefficacit pratique de cette datafication
de la scurit, elle demeure une infraction aux lgislations des pays dmocratiques, et une
entorse leurs principes. Toutefois, il faut noter deux points importants: la double promesse
de prdiction et de profilage exerce logiquement une forte sduction sur les agences
charges de missions de surveillance et la concentration des principales ressources de
Big Data dans les mains dun petit nombre dacteurs tous situs aux tats-Unis prsente un
danger, dans la mesure o ces acteurs sont soumis une forte pression de la part dagences
comme la NSA.
Lessor de la biomtrie
Dans le mme temps, on voit se dvelopper depuis quelques annes des techniques
biomtriques en vue de la reconnaissance, de lauthentification ou de lidentification des
personnes. Les principales pratiques automatises sont lies aux empreintes digitales
ou liris et des reconnaissances du visage. Dautres modes de reconnaissance sont lis
aux dynamiques de frappe sur le clavier dun ordinateur, la reconnaissance vocale et la
dynamique des signatures.
Cette volution technologique qui sinscrit dans le prolongement de la rationalisation
des techniques policires didentification prend forme bien avant la Troisime Rpublique
et sacclre partir du dernier tiers du XIXe sicle64. Cest alors quAlphonse Bertillon
commence identifier les rcidivistes ou prsums rcidivistes partir de leurs corps :
relev des tatouages et des marques particulires, mensuration du crne, de la coude, etc.
Il tente aussi de recourir lidentification par liris. Il y a une certaine continuit, mais il y a
aussi une rupture dans les pratiques du fait de lvolution des technologies. La biomtrie
(que lon pourrait aussi appeler anthropomtrie), cest en ralit du bertillonnage ou de
la dactyloscopie, mais coupl aux capacits considrables quautorise dsormais loutil
informatique en matire de traitement des donnes.
Les consquences doivent tre apprhendes au regard de ce que les pouvoirs publics
font de ces marqueurs. Avec lempreinte digitale se pose la question de la trace, car nous
laissons tous nos empreintes partout et tout moment. Do la possibilit de croiser ces
traces laisses un endroit avec les empreintes des demandeurs de cartes didentit qui
seraient centralises dans un fichier unique.
Se pose aussi la question de la propension et de la capacit des services de ltat
croiser ces marqueurs. On peut ici voquer la tentative des institutions de police amricaines
de recourir lidentification faciale lors du Superbowl de Tampa en Floride pour dtecter,
grce des camras, des individus potentiellement dangereux dj fichs. Ce que permet
ici ventuellement le recours la vido des fins de surveillance ou de contrle grce
lidentification faciale (et linsu des individus) serait inimaginable avec les empreintes
digitales. On voit les avantages quune telle possibilit offre dans la logique qui est celle
notamment de ltat. On peroit aussi les risques quelle est toujours susceptible de faire
64

Cf. notamment sur ce point les diffrents travaux de Vincent Denis in Lidentification biomtrique sous la
direction d Ayse Ceyhan et de Pierre Piazza. ditions de la Maison des sciences de lhomme. Paris 2011

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 43

encourir aux individus: il suffit pour sen convaincre de discuter avec danciens rsistants
ayant t amens recourir aux faux papiers durant lOccupation.
Daucuns considrent que cette technologie amne plus de garanties en matire
dauthentification et davantage de possibilits de reprer les tentatives de fraudes en cas
de perte de carte, notamment bancaire. Cest aussi pour dautres un moyen de rendre
plus fluides les contrles didentit, dans les aroports par exemple, en recourant des
machines scannant le corps humain. A contrario, les risques inhrents ces dispositifs de
contrle high tech accordant la primaut la biomtrie sont levs. En plus du risque de
rification de lindividu, ramen la simple dimension dune donne, transmissible, qui peut
dire actuellement si une base de donnes contenant des millions dindividus autorisera
des contrles biomtriques fiables ? Que se passera-t-il pour les individus en cas de faux
rejets ? Le plus de garanties ne risquerait-il pas alors rapidement de se transformer en
plus de suspicions? Quelles procdures sont prvues dans un tel cas, quels recours ? Plus
gnralement, il faudrait peut-tre aussi engager, avant de dcider de les mettre en uvre,
une profonde rflexion sur limpact (positif ou ngatif ) de ces dispositifs sur les rapports
sociaux.
Les rcentes applications en matire daccs la cantine scolaire, de contrle des
horaires de salaris et en matire de scurit dmontrent un dsquilibre prjudiciable
lexercice des droits et liberts fondamentaux. Pour citer quelques exemples de drives, la
CNIL a sanctionn des responsables de traitements qui filmaient des employs sur leur lieu
de travail ou des tablissements scolaires filmant en permanence des enseignants et des
lves, des camras visualisant lintrieur dimmeubles.
Le CESE rappelle que dans le domaine de la biomtrie, la collecte, la transcription ou
la reconnaissance de la donne pose problme. Les donnes biomtriques permettent un
traage des individus et ces donnes inhrentes lindividu ne sont pas rvocables.
Lessor de la vidosurveillance et de la golocalisation
Dans la rue, dans les magasins, les transports en commun, les bureaux, les immeubles
dhabitation, difficile dchapper aux camras installs en France. Bien moins nombreuses
quau Royaume-Uni o les CCTV (Closed-circuit tlvision ou camra de surveillance) sont
lgion65, la France compte en 2011 935000 camras.
Dans un communiqu de presse publi le 21 juin 2012, la CNIL illustre parfaitement
lempreinte dans notre vie quotidienne de la vidosurveillance: Ds que lon sort de chez
soi, on peut tre film dans le hall de son immeuble, puis sur le chemin du bus pour se rendre au
travail. Des camras peuvent galement tre prsentes dans les transports en commun. son
arrive sur son lieu de travail, on peut aussi tre film par les camras installes par lemployeur.
Lors de la pause djeuner, le magasin o lon achte sa salade, ou celui o lon fait ses courses,
possde galement des camras pour viter les vols. Retour au travail pour laprs-midi o une
camra est situe dans le hall dentre de la socit. Le soir, mme chemin pour rentrer chez soi,
avec des arrts au distributeur automatique pour retirer de largent, sous lil dune camra, et
la boulangerie pour acheter son pain avec une camra surveillant la caisse.
65

On compte prs de 4,200,000 camras de surveillance dans tous le Royaume-Uni et prs de 500,000 rien qu
Londres. Mme si il est prouv que seulement 3% des crimes sont rsolus grce aux camras de surveillance
(daprs la police britannique), le nombre de ces camras ne fait quaugmenter dannes en annes, faisant de
du Royaume Unis, le pays le plus film au monde. On compte une camra pour 14 personnes.

44 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

La vidosurveillance relve directement des dispositions de la loi dite Informatique


et liberts, et concerne la mise sous surveillance de lieux non accessible par dfinition au
public (bureau de travail par exemple). La vidoprotection relve quant elle de larticle
10 de la loi du 21 janvier 1995 dOrientation et de programmation relative la scurit, et
concerne les lieux accessibles au public (hall dentre dun immeuble, portail dune cole,
dun tablissement public ou dune entreprise).
La CNIL a reu en 2011 plus de 360 plaintes relatives la vidoprotection et la
vidosurveillance, ce qui reprsente une augmentation de 32 % par rapport 2010.
60 % de ces plaintes concernaient la vidosurveillance au travail, soit une augmentation de
13 %. La vidosurveillance ou vidoprotection, pour reprendre un euphmisme qui a
pour fin dattnuer laspect intrusif de ce genre de dispositif, a suscit, au sein mme des
institutions charges de la scurit publique, des dbats. Est-ce un dispositif de prvention ?
Ou une aide la rsolution des affaires ? Est-ce quil nencourage pas un simple dplacement
gographique des actes dlictueux, hors de la zone couverte ? Est-ce que ce dispositif nest
pas trop coteux ? Car le cot rel de ce dispositif ne tient pas seulement son installation
matrielle, mais surtout aux moyens humains quil requiert pour fonctionner: il faut mobiliser
des personnels pour regarder les flux capts par ce dispositif sans oublier les quipes de
maintenance.
Le dveloppement rapide de la vidosurveillance dans des lieux quotidiennement
frquents par chacun dentre nous induit de nombreuses donnes conserves par des
entreprises, des collectivits publiques ou des tablissements publics comme les collges,
les lyces mais aussi les coles et les crches.
Quant la golocalisation, il sagit dun outil majeur de contrle des individus et la
sensibilit de ce type dinformations nest souvent pas perue par les utilisateurs. Son
importance peut, linverse, tre perue par des institutions. Par exemple, lors des meutes
de Londres de 2011, les forces de police britanniques, dbordes lors des meutes par
lusage des meutiers des rseaux sociaux, ont su utiliser, aprs les vnements, loubli
par les meutiers de leur golocalisation dans diverses applications, comme Four Square,
qui les plaaient sur les lieux dun dlit, lheure dudit dlit. linverse, la golocalisation
dune personne peut tre employe pour dterminer quelle nest pas chez elle et que son
domicile peut tre cambriol. Cela tant, ces usages ne relvent pas du Big Data. L o le Big
Data a un rapport direct avec cette problmatique rside dans la valeur que reprsente la
golocalisation comme information, permettant par exemple de reprer des phnomnes
et des corrlations dans les transports urbains, et de piloter de manire plus fine la gestion
de ces transports, en termes dhoraires, de moyens matriels et de moyens humains. Mme
anonymise, cette information reste sensible et elle demeure, par recoupement, un outil
ais de ridentification de lindividu.

Vie prive et protection des donnes personnelles


72% des Franais pensent que le numrique a un effet ngatif sur la vie prive (Sondage
TNS-Sofres 2me dition mars 2014). Ce constat rvl par la deuxime dition du Baromtre
Inria pose la question de la responsabilit des Franais face au numrique. Mais qui est
responsable de la protection et du respect de nos vies prives ?

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 45

Ce constat est surtout li laugmentation des usages. Auparavant les Franais utilisaient
peu le numrique et ce quils voyaient essentiellement dans les outils numriques ctait la
complexit. Aujourdhui ils utilisent le numrique au quotidien, ils nen comprennent pas
tout, mais ils se considrent comme dfinitivement impliqus dans ce monde-l et donc
sinterrogent sur ce qui se passe vraiment.

La protection de la vie prive: risques et inquitudes


Dans le domaine de la protection des donnes personnelles, tout porte croire que notre
socit devient schizophrne. Elle garantit, au moins formellement, pour chaque citoyen la
libert de sexprimer et de communiquer, en particulier sur les rseaux lectroniques et le
respect, dans le cadre de la loi, de sa vie prive. Chacun veut surfer en toute libert sur le Net,
envoyer des mails qui bon lui semble et souhaite rarement la transparence complte sur sa
vie personnelle et ses affaires. Mais il veut galement accder toute linformation en ligne,
remplir les dossiers administratifs en quelques clics - ce qui videmment sous-entend que
les informations indispensables la connaissance de sa situation personnelle disperses
entre diverses administrations soient interconnectes - et profiter des avantages de
lachat en ligne auprs de socits qui lui font des offres en fonction de son profil - donc
des informations quelles possdent sur lui. Lhomme politique, devant la complexit de la
lgislation et de la paperasserie administrative prche pour ladministration lectronique,
le guichet unique et veut connatre les demandes de la socit pour y rpondre plus
efficacement, do la multiplication des fichiers sociaux et laccumulation de donnes
sur les personnes en difficult. De mme, devant le sentiment de la monte de linscurit
et la poursuite de la rationalisation des forces de police, la solution de facilit est de ficher
tout suspect, tout comportement dviant et de gnraliser laccs ces informations
tous les policiers asserments. Cest galement la tentation de la surveillance du courrier
lectronique, lenregistrement des internautes accdant certains sites, la chasse aux
pirates et aux hackerset aux groupes criminels. Les entreprises ne sont pas en reste.
Elles veulent dresser des profils de leurs clients, les fidliser par des offres personnalises,
et agrandir leur terrain de prospection en achetant et en changeant des fichiers avec des
officines spcialises dans ce travail. Une tendance lourde traverse donc toute la socit et
le citoyen bien que mfiant au dpart, est en partie consentant car quelque part, il espre
bnficier des retombes de ce quadrillage virtuel. Une rgulation simpose, sinon un
jour prochain nous serons suivis en permanence grce un implant enfoui au plus profond
de notre corps, comme dans le film de Steven Spielberg, Minority report.
Donnes personnelles et interoprabilit des rseaux
La rvolution numrique sest accompagne dune irrversibilit croissante des
interactions et des changes avec des dispositifs technologiques de plus en plus
sophistiques. Linteroprabilit croissante de ces dispositifs, linterconnexion plus grande
des fichiers de donnes et la confusion des temps sociaux et intimes avec les temps lis
la sphre professionnelle et celle des loisirs que limportance du travail en rseau, amplifie
contribuent remettre en cause la notion mme de sphre prive.
Mme si celle-ci ne se dfinit plus aussi aisment en opposition avec la sphre publique,
il nen demeure pas moins que lexigence de transparence quexige la socit du numrique
invite la plus grande prudence sur le dvoilement de soi. Sous linfluence du libralisme
politique, le pacte social prvoyait le contrle de ltat en change du respect de la sphre
intime. Or aujourdhui les technologies sont telles quelles ont vite fait de remettre en cause
46 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

cet quilibre en simmisant dans notre sphre intime via le prlvement et la collecte
des donnes personnelles. Le traage par les rseaux, la biomtrie, la golocalisation,
les nanotechnologies, la vidosurveillance participent dune mise en visibilit publique
dinformations qui relvent du domaine priv.
Cette volution technologique conduit replacer la protection de la vie prive au cur
des rflexions de la dfense des liberts lre du numrique.
Privacy paradox
Face lirruption des rseaux sociaux, lindividu serait inquiet de lutilisation de
ses donnes mais paralllement divulguerait de plus en plus de donnes personnelles
volontairement ou non. On parle alors de paradoxe de la vie prive. En fait il sagit plus
dun double sentiment parallle denvie dutilisation et de perte de contrle. Plus les
Franais utilisent le numrique, plus ils se demandent comment a fonctionne et veulent
tre rassurs, et cette tendance ne peut que se poursuivre. La dure de conservation des
donnes et le droit loubli sont alors au cur de leur rflexion. Pourquoi des lors cette
apparente incohrence est-elle devenue en quelques annes un lment incontournable
du dbat sur la vie prive?
Pour les grands acteurs du net, et notamment Google, les dbats propos de la vie
prive seraient rvolus et la vie publique devenue la norme sociale. Lvangliste
en chef de Google, Vint Cerf, parle mme de publitude , en opposition la vie prive
source de solitude. La vie prive naurait donc t quune anomalie de lhistoire lie la
socit industrielle du XIXe sicle. Or le concept de vie prive est li consubstantiellement
laffirmation des droits de lHomme et du citoyen et la dmocratie.
Si la vie prive telle que nous la connaissons historiquement est destine disparatre
dans un contexte de communication connecte, les rvlations dEdward Snowden nont
pas sign pour autant sa disparition mais ont plac la socit face un besoin imprieux de
protger la vie prive du citoyen.
Selon Antonio Casilli, la conception dominante de la vie prive est toujours marque
par lide quelle est un cur isol absolu dans la droite ligne de concept amricain de
right to be left alone (le droit dtre laiss tranquille). Cette vision demeure la plupart du
temps alors quen fait la tendance est confondre secret et priv. Yves Pouillet et Ccile de
Terwang ont insist sur ce changement dans la notion de zone personnelle en citant
larrt Rotaru de la CEDH de 2000: Ce que vous faisiez chez vous, montrer des photos, des
vidos, grer lagenda se retrouve dans le cloud. Cela reste personnel mais ncessite des
acteurs techniques intermdiaires. En dautres termes, le dveloppement technique opre
une gestion fonctionnelle de notre vie prive. Le droit simmisce donc chez les individus
via des outils impliquant des intervenants. Pour prserver totalement la vie prive au sens
dun cur isol, la solution de la dconnexion de tout rseau apparat la solution la plus
efficace sauf considrer lobsolescence des donnes numriques comme une voie possible
pour une meilleure protection. Mais elle a un cot: celui de se retirer du rseau. Ou alors
louverture sur les donnes numrique conduit ouvrir notre notion de sphre personnelle
et crer dans la foule des responsabilits pour ces tiers. Tout lenjeu est donc darriver
marier demain cette ngociation permanente avec des outils numriques comme par
exemple ceux des services de rseaux sociaux.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 47

La vie prive, un problme de contextualisation


Les utilisateurs des rseaux sociaux, notamment les plus jeunes, savent changer
didentit par lutilisation des pseudonymes et apprennent restreindre laccs leurs
profils. Quant aux gants du web, ils changent de discours en abandonnant la rhtorique de
la fin de la vie prive qui avait t leur cheval de bataille depuis des annes. La vie prive - ce
que je veux publier sur moi et ce que jautorise les autres publier sur moi - cesse dtre un
droit individuel pour devenir une ngociation collective.
La vie prive devient alors un problme de contextualisation dont la valeur principale
rside dans la capacit darbitrage entre lintime et le secret. La formule de la Fondation
Internet Nouvelle Gnration (FING) rsume assez bien ce constat: La vie prive serait dfinie
comme la possibilit de pouvoir choisir sa vie publique sans renoncer lintime et au secret.
Le refus du partage de certaines donnes (secret), le droit tre laiss seul (la tranquillit)
et lautonomie individuelle (garder la matrise de certaines donnes) apparaissent comme
essentiels mais ces droits effectifs ne peuvent que sappuyer sur des complmentarits entre
la loi et la technologie.
Aussi il est ncessaire pour assurer cette matrise de rtablir ce pouvoir de ngociation
collective entre les groupes de citoyens et les acteurs du numrique pour assurer une
matrise de cette vie prive. Il est essentiel que les lois redonnent un nouveau pouvoir de
ngociation collective face ltat et aux acteurs commerciaux
Cela passe notamment par le renouvlement de lencadrement lgal de ces ngociations
o lon passe dun web de publication un web dmission et de production de donnes.
Dans tous les cas, le respect du droit la vie prive comme un droit constitutionnel doit tre
maintenu.

Open Data et donnes personnelles


Depuis la loi n78-753 du 17 juillet 1978, toute personne peut avoir accs aux documents
dtenus par une administration dans le cadre de sa mission de service public. Modifie en
2005 pour transposer en droit franais une directive de 2003, cette loi permet galement
depuis cette date la rutilisation des informations publiques dautres fins que celles pour
lesquelles elles sont labores ou recueillies.
A titre gnral, lOpen Data ne concerne pas directement la protection des donnes
caractre personnel : la majorit des informations du secteur public mises disposition
des internautes ne comportent aucune donne personnelle (exemples de la localisation et
horaires douverture des services publics, des vnements culturels et sportifs, des mesures
sur la qualit de lair, sur la pollution des eaux, etc., des informations touristiques ; etc.).
Nanmoins, les organismes publics dtiennent une trs grande varit de donnes pour
constituer des informations du secteur public (donnes administratives, donnes mdicales,
tat civil, adresses, etc.). Ces informations ont toutes vocation, dans le cadre de lOpen Data,
tre mises disposition sur Internet.
Dans ce cadre, il existe deux hypothses dans lesquelles lOpen Data implique,
directement ou indirectement, le traitement de donnes caractre personnel.
Le traitement de donnes personnelles et lOpen Data: deux hypothses
La premire hypothse est lie la situation o les informations du secteur public se
composent elles-mmes de donnes caractre personnel.
48 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Les acteurs publics en charge de raliser une mission de service public disposent de
trs nombreuses informations, dont certaines comprennent videmment des donnes
caractre personnel relatives aux administrs. Il peut sagir en premier lieu de donnes
caractre personnel publies pour rpondre une obligation explicite du lgislateur,
notamment pour assurer la publicit lgale dune information publique et produire ainsi
les effets juridiques lis lacte administratif. Exemples : arrt de nomination dun agent
public, arrt dattribution dune mdaille du travail ; permis de construire ; annuaires des
agents des administrations ; rsultats dexamen ; etc.
Il peut galement sagir de donnes caractre personnel dont la communication et la
rutilisation sont encadres (les destinataires bnficiant de ce droit daccs linformation
complte sont lors qualifis de tiers autoriss ), ou au contraire interdites. Exemples :
relevs de proprit ; salaires des hauts fonctionnaires ; avis dimposition ; liste lectorale ;
actes de ltat civil; archives publiques ; donnes cadastrales ; etc.
Enfin, les administrations disposent de trs nombreuses informations contenant
dautres donnes caractre personnel identifiantes, directement ou indirectement, dont
la mise disposition sur Internet ou la communication des tiers non autoriss ne peut
tre opre sans avoir t pralablement anonymises. Nanmoins, il est envisageable que
certaines de ces donnes caractre personnel soient mises disposition, non de faon
intentionnelle, mais cause dune anonymisation insuffisante. Exemples : statistiques
judiciaires avec units trop faibles ; statistiques fiscales avec une attache gographique trop
troite; base gographique de rfrence [cf. cadastre.gouv.fr]; etc.
La seconde hypothse concerne la rutilisation des informations publiques qui peut
permettre, par recoupement, lidentification ou la ridentification de personnes.
Sans mme contenir initialement de donnes identifiantes, les informations publiques
peuvent, par recoupement, soit avec dautres informations publiques mises disposition,
soit avec dautres donnes disponibles sur Internet, permettre lidentification ou la
ridentification de personnes physiques. Cette identification pourrait ainsi intervenir par le
biais du recoupement dinformations en Open Data ou du recoupement entre informations
Open Data et informations Big Data. Le caractre personnel de la donne est alors attribu
aux informations publiques mises disposition, non par nature, mais par destination. Plus
que sa qualit intrinsque, cest bien lusage fait de la donne initiale qui lui confre son
caractre personnel.
Prenons lexemple des parcelles cadastrales. Le site cadastre.gouv.fr met disposition la
rfrence et ladresse de la parcelle cadastrale, sans autre donne personnelle. Des mesures
sont prises pour limiter au maximum la diffusion de donnes caractre personnel, ce qui
matrialise le droit dopposition des personnes concernes la diffusion sur Internet de
donnes les concernant : les photographies des maisons individuelles et des personnes sont
occultes, ainsi que les mcanismes de scurit des entres ; les donnes de thermographie
sont agrges au niveau dun quartier ; etc. Nanmoins, lidentit de ces personnes est
susceptible dtre rvle par une simple recherche annuaire invers.
Lautre exemple similaire est celui du portail Paris Data , qui diffuse de nombreuses
donnes cartographiques, par exemple la carte des 70 espces darbres prsentes Paris,
utile pour les allergiques. Les donnes mises disposition sur ce portail peuvent nanmoins
permettre lidentification des personnes via le plan parcellaire quil propose. Fort de ces
informations anonymes conjugues des donnes personnelles dj structures ou
simplement accessibles, tout responsable de traitement, et plus largement encore tout

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 49

internaute, pourra aisment complter le profil des personnes dont il dtient dj des
donnes identifiantes. De faon paradoxale, cette seconde hypothse est donc la fois la
plus probable (les administrations nont pas la volont premire de diffuser directement des
donnes caractre personnel) et la moins prvisible: les ridentifications de personnes
vont souvent intervenir de manire incidente, cest--dire sans volont particulire du
rutilisateur qui va simplement enrichir son patrimoine informationnel prexistant. Quelle
que soit lorigine ou la modalit dune telle ridentification, il sagira alors dun traitement de
donnes caractre personnel.
A cet gard, il y a lieu de rappeler lacception large des notions de donne caractre
personnel et de traitement de donnes que la CNIL66, comme le G2967, a toujours retenus :
toute information est susceptible de constituer une donne caractre personnel, ds lors
que, combine avec dautres informations, elle est susceptible de permettre lidentification
de personnes physiques. Cette acceptation large est dailleurs maintenue dans le cadre du
projet de rglement communautaire concernant la protection des donnes personnelles68.
Les problmatiques de vie prive souleves par lOpen Data
En postulant que les traitements lis lOpen Data impliquent la mise en uvre de
traitements de donnes caractre personnel, et la mise disposition et la rutilisation
dinformations publiques, force est de constater que lOpen Data soulve, par essence,
des difficults importantes du point de vue de la protection des donnes personnelles,
et plus globalement de la vie prive. Si ces risques sont difficiles apprcier a priori, du
fait du manque de recul et des possibilits infinies de traitement et de retraitement des
informations publiques, il nen demeure pas moins pour le CESE quil est ncessaire de les
anticiper.
La seconde difficult majeure cristallise par lOpen Data est de raisonner en termes de
collecte et de traitement alors quest en cause la rutilisation.
Ce quintroduit lOpen Data, cest prcisment la dconnexion entre le temps de
la collecte des donnes brutes et du traitement lui-mme, et celui de la rutilisation des
donnes lors des multiples traitements ultrieurs. On voit alors que les notions de finalits,
destinataires, donnes pertinentes, etc. perdent une partie de leur sens.
En ralit, lOpen Data fait peser, par nature, des interrogations sur lensemble des
principes cardinaux de la protection des donnes personnelles, au premier rang desquels
le principe fondateur de finalitque nous avons parcouru plus haut. En effet, le seul objectif
dune plateforme Open Data est de rendre accessible linformation du secteur public au
plus grand nombre. On pourrait ds lors considrer que la mise disposition dinformations
publiques a pour finalit dassurer le service public de diffusion de linformation ,
contribuant ainsi la transparence du fonctionnement des organismes publics. Il nen
demeure pas moins que cette finalit trs gnrale ne rpond que difficilement lexigence
dune finalit dtermine.
Le principe de finalit est dautant plus mis mal que lobjectif de lOpen Data est
prcisment dalimenter des traitements de rutilisation in(d)finie. Ces traitements seront
en effet dvelopps au gr des innovations que les donnes ouvertes ne manqueront pas
de susciter auprs de leurs lecteurs. Les finalits espres par le mouvement de lOpen Data
66
67
68

Commission Nationale de lInformatique et des liberts


Groupement des CNILs europennes
Le rapport du parlementaire europen ALBRECHT confirme la ncessit de maintenir une telle dfinition large

50 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

sont donc in(d)finies avant toute utilisation par des personnes autres que le producteur des
informations publiques69.
Toutefois lOpen Data nintervient pas en labsence de tout cadre juridique: depuis 1978,
la loi Cada et la loi Informatique et Liberts articulent laccessibilit linformation
publique et la protection des donnes personnelles. Larticle 13 de la loi du 17 juillet 1978
prvoit que les informations publiques comportant des donnes caractre personnel
peuvent tre rutilises si lintress y a consenti, ou si lautorit dtentrice est en mesure
de les rendre anonymes ou encore, dfaut danonymisation, si une disposition lgislative
ou rglementaire le permet70. Elle prcise aussi que cette rutilisation est subordonne au
respect des dispositions de la loi n78-17 du 6 janvier 1978 dite Informatique et liberts .
Cependant, la rvolution technique et le changement dchelle introduits par lOpen
Data modifient la donne. Le volume des informations accessibles en Open Data sur support
aisment exploitable permettant dtre combines dautres donnes, est susceptible de
remettre en cause lquilibre prcaire entre ces deux droits fondamentaux. Plus que lOpen
Data lui-mme, cest bien le contexte dans lequel il sinscrit (informatisation complte
de la socit, administrations comme acteurs privs ; diffusion spontane de donnes
personnelles par les internautes ; indexation sur des donnes nominatives par de puissants
moteurs de recherche; dveloppement du Big Data ; etc.) qui rend ncessaire la recherche
dun nouvel quilibre entre protection de ladministr (et notamment de ses donnes
personnelles) et transparence de ladministration (accs linformation publique).
Il importe ds lors de dfinir un encadrement adapt qui, tout en tant suffisamment
flexible pour permettre lessor de lOpen Data, garantira des mesures efficaces pour protger
les administrs et leurs donnes personnelles.

Objets connects et algorithmes:


nouveaux enjeux et nouveaux risques
Dans les premiers temps du dveloppement de lInternet auprs du grand public, les
donnes qui taient changes taient souvent dcrites comme celles dun rseau distinct
du monde physique crant une forme de ralit parallle ou virtuelle. Dsormais, les
donnes qui transitent sur le rseau sont intgres (ou issues) de lensemble des activits
quotidiennes des citoyens. Lvolution prochaine vers ce que lon nomme dsormais
lInternet des objets devrait amplifier ce phnomne dindistinction entre le rseau et les
activits humaines.

69

70

Exemples de finalits des rutilisations actuellement observables : nosdeputes.fr ; dentistedegarde.net (site


rcemment ferm pour cause dinterruption de la source) ; ameli.fr ; etc. Autre exemple : en 2012, nombre de
services publics darchives ont largement diffus sur Internet les images et donnes des actes de ltat civil
devenus librement communicables .
Cest ce second volet de la loi qui devra tre modifi pour le rendre conforme la nouvelle directive de
2013/37/UE du 26 juin 2013 modifiant la directive 2003/98/CE concernant la rutilisation dinformations
dtenues par le secteur public. La nouvelle directive ne remet pas en cause ce principe, bien au contraire. Elle
carte en effet explicitement du droit rutilisation les documents dont laccs est exclu ou limit pour des
motifs de protection des donnes caractre personnel ou dont la rutilisation a t dfinie par la loi interne
de lEtat membre comme incompatible avec la lgislation protgeant les donnes caractre personnel. Les
Etats membres de lUnion Europenne disposent dun dlai de deux ans pour transposer cette directive.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 51

Hyper-connexion et banalisation de la captation des donnes


La distinction qui existe encore aujourdhui entre connexion et dconnexion vis--vis
de lInternet devrait tendre disparatre mesure que les capteurs et objets connects
transmettront des informations en permanence dans notre environnement. Cest dj le cas
de nombreux services issus des capteurs prsents dans les terminaux mobiles (smartphones
et tablettes) qui analysent les activits de leurs utilisateurs71. Cette volution vers un usage
massif des donnes issues des capteurs sera encore plus visible avec la monte en puissance
des objets connects qui seront pour la plupart dots de capteurs. En effet, une fois
quips de capteurs et de dispositifs de transmission, les objets deviennent leur tour des
vecteurs de nouveaux services valeur ajoute72. La prise en compte de la dynamique de
fonctionnement de ces objets connects (depuis leur conception jusqu leur destruction)
constituera lune des nouvelles frontires de lducation numrique. Cette rvolution
numrique se traduit par une banalisation de la captation automatique de donnes
personnelles. Cest ainsi le concept de ville intelligente, o le domaine des transports repose
sur une golocalisation permanente des individus, afin de rpondre aux besoins de chacun
et conduire une politique de dveloppement durable au profit du bien commun.
La numrisation de nos activits humaines na ds lors plus de limites. Elle peut
concerner notre voiture, nos appareils lectromnagers mais galement notre corps et ce
que nous en faisons.

Cartographie mondiale des objets connects ralise par le moteur Shodan73

71

72
73

Les mouvements des smartphones pourraient rvler aux automobilistes les emplacements disponibles (MIT
Technology Review, 15 septembre 2014).
http://www.technologyreview.com/news/530671/smartphone-movements-could-reveal-emptyparking-spots/
20% des grandes entreprises investissent dans lInternet des objets (Proxima Mobile - 21 aot 2014)
http://www.proximamobile.fr/article/20-des-grandes-entreprises-investissent-dans-lInternetdes-objets
http://www.proximamobile.fr/article/une-cartographie-mondiale-de-lInternet-des-objets

52 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Du quantified self au systme de sant74


Lun des champs les plus complexes et les plus prometteurs mais parfois aussi les plus
inquitants dans lutilisation des donnes personnelles concerne la sant et la prvention.
Ce mouvement qui repose sur une utilisation croissante de capteurs corporels connects
bracelets, podomtres, balances, tensiomtres, etc. et dapplications sur mobiles,
saccompagnent de pratiques volontaires dauto-quantification qui se caractrisent par des
modes de captures de donnes de plus en plus automatiss, et par le partage et la circulation
de volumes considrables de donnes personnelles. Un phnomne qui se dveloppe
linitiative des individus eux-mmes et aussi, en raison des modles conomiques des
acteurs investissant ce march.
Ainsi, la monte en puissance de nouveaux dispositifs de suivi et de diagnostic pourrait
transformer lensemble du systme de sant. La chute des cots des capteurs et larticulation
des objets connects avec les terminaux mobiles (smartphones, tablettes, voire bientt les
lunettes et les montres connectes) permettent la mise en place de capteurs permanents
auprs des patients afin de suivre leurs activits et dtecter les premiers signes de certaines
pathologies. Selon une tude de Bloomberg de 2013, les capteurs intgrs devraient passer
de 100 millions dunits en 2014 2800 milliards en 2020.
Cette volution vers lacquisition de donnes mdicales au dtour des activits
quotidiennes constitue lun des marchs cls pour les technologies mobiles. Selon les tudes
de march sur la sant mobile, lensemble de ces technologies pourrait ainsi reprsenter
en 2017 un march mondial de 26 milliards de dollars, dont plus du quart proviendrait
de lEurope75. Au-del des innovations qui seront mises en place auprs des patients, les
technologies de la sant mobile devraient transformer lensemble des infrastructures de
sant. Ainsi au niveau des centres de soin elles permettront de transformer les missions de
ces structures la fois pour orienter celles-ci vers la prvention des pathologies. La gestion
des donnes pourrait ainsi devenir le cur de mtier des structures de sant. Ainsi, ric
Topol, professeur de gnomique au Scripps Research Institute dclare : Except pour
certaines fonctions cls comme les soins intensifs et la chirurgie, les hpitaux seront entirement
transforms en centres de surveillance des donnes. Les gens souriront en repensant aux
visites chez leur mdecin avec le lgendaire stthoscope ainsi que lensemble des pratiques qui
existaient avant lre numrique76.
Pour accompagner ces volutions, il conviendra de permettre aux citoyens de
sapproprier les nouvelles formes que prendront les institutions sanitaires et le systme de
sant. Leur permettre aussi de mieux comprendre les volutions de nos socits face ces
volutions.
Les acteurs du secteur prudentiel sont aussi directement impliqus dans lquation
conomique de la sant mobile77. En effet larticulation entre les acteurs des technologies
de la sant mobile et les socits dassurances a dautant plus de sens que ces nouveaux
74
75
76
77

Aujourdhui nous appelons ces technologies mesure de soi (quantified self) demain nous les appellerons
systme de sant The Body-Data Craze (Newsweek, 26 juin 2013).
http://research2guidance.com/the-market-for-mhealth-app-services-will-reach-26-billionby-2017/
Eric Topol, On the Future of Medicine Wall Street Journal 7 juillet 2014.
http://online.wsj.com/articles/eric-topol-on-the-future-of-medicine-1404765024, voir aussi son
ouvrage The Creative Destruction of Medicine (Ed. Basic Books - janvier2012).
Wearable Tech Is Plugging Into Health Insurance (Forbes, 19 juin 2014).
http://www.forbes.com/sites/parmyolson/2014/06/19/wearable-tech-health-insurance/

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 53

capteurs pourraient permettre la dtection prcoce des pathologies et ainsi repousser


dans le temps la ncessit pour les assureurs davoir prendre en charge dans la dure des
pathologies lourdes et coteuses.
Le traitement distance des donnes des patients nest pas encore intgr dans
lquation conomique de la sant en France linverse de nos voisins britanniques o les
mdecins peuvent prescrire des applications mobiles ou des objets connects ddis la
sant78. Cette volution nest que le premier pas vers des transformations beaucoup plus
radicales de lconomie de la sant. Le Nouvel conomiste rsumait ainsi les raisons qui ont
jusquici prvalu pour expliquer les enjeux lis aux volutions de la mdecine numrique
ainsi quaux difficults faire voluer le systme de sant en France: Blocages dfensifs,
crispations corporatistes, carence de comptences, de management surtout , se conjuguent
pour contrarier ces mutations majeures, plus certainement que largument traditionnel du
manque de ressources financires. Et labsence dimpulsion politique au plus haut niveau ne fait
que rajouter la difficult79
Les dbats sur la ncessit pour les citoyens de matriser lusage qui est fait de leurs
donnes personnelles ont conduit certains acteurs envisager un droit de proprit
sur ces donnes. Cela conduirait par voie de consquence envisager la cessibilit de ces
donnes, en particulier pour des raisons conomiques80. Cette perspective a t juste titre
considre par le Conseil dtat81 comme un risque pour les citoyens. En effet, la multiplication
des opportunits offertes par les acteurs conomiques en particulier dans le domaine de
la sant de valoriser ces donnes pourrait mener des situations de risques accrus pour
les liberts individuelles. La publication des donnes relatives la forme et la sant (par
exemple sur les rseaux sociaux) peut aussi devenir un outil de contrle conomique et
social voire de profilage des risques associs un individu. Les craintes concernant
lutilisation des donnes personnelles mdicales sont dautant plus lgitimes que des
donnes personnelles en apparence anodines peuvent tre intgres dans des algorithmes
dvaluation des risques de sant. Ainsi, lachat dune friteuse ou la consommation de
substances riches en graisse pourraient participer llvation des risques cardio-vasculaires
dun usager bien avant quil soit besoin de vrifier quune personne participe un groupe de
discussion sur une pathologie particulire sur les rseaux sociaux82. Lorsque les dispositifs
de captation dinformation de sant seront intgrs dans lensemble des terminaux mobiles
et objets connects (comme les nouvelles gnrations de montres connectes) ou les
vtements ou accessoires sportifs, le recueil de ces informations pourrait devenir encore
plus sensible en termes dvaluation prcise du profil des risques associs une personne.
Ainsi, la transmission non contrle de ces informations des annonceurs pourrait avoir
78
79
80
81

82

Le ministre de la Sant britannique incite mdecins et patients utiliser des applications mobiles
http://www.proximamobile.fr/article/le-ministre-anglais-de-la-sante-demande-aux-medecinsdinciter-leurs-patients-utiliser-des-a
e-Sant: les technologies sont l, les mentalits pas encore (Patrick Arnoux, Le Nouvel conomiste - 5 aot
2014)
http://www.lenouveleconomiste.fr/e-sante-les-technologies-les-mentalites-pas-encore-23635/
How Much Is Your Privacy Worth? (MIT Technology Review, 26 aot 2014).
http://www.technologyreview.com/news/529686/how-much-is-your-privacy-worth
Le droit sur les donnes personnelles, un droit lautodtermination plutt quun droit de proprit, tude
annuelle 2014 du Conseil dtat: Le numrique et les droits fondamentaux (p264)
http://www.ladocumentationfrancaise.fr/rapports-publics/144000541-etude-annuelle-2014-duconseil-d-tat-le-numerique-et-les-droits-fondamentaux
The creepy side of data mining: Selling sick lists (CBS Moneywatch 11 septembre 2014) http://www.cbsnews.
com/news/the-creepy-side-of-data-mining-selling-sick-lists/

54 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

des consquences imprvisibles. Ces proccupations de matrise des donnes de sant lies
aux objets connects sont telles que la socit Apple vient dannoncer que les donnes qui
transiteront via son systme de centralisation des donnes de sant ne devraient pas tre
transmises (ou revendues) des annonceurs publicitaires83.

Puissance des plateformes et pouvoir des algorithmes


Cependant, lun des enseignements de laffaire Snowden aura t de montrer
quel point ces mtadonnes, quelles soient tlphoniques ou lies la navigation des
internautes, peuvent tre souvent plus rvlatrices des individus que le contenu mme des
messages changs. En effet, la puissance de traitement dont disposent ces plateformes
et les algorithmes en permanence amliors pour tirer parti de ces vastes collections de
donnes permettent dinterprter les comportements des utilisateurs ainsi que leurs
prfrences au point de prdire certaines de leurs actions.
Ces algorithmes deviennent dautant plus cruciaux quils sappliquent des services
intgrs chacune de nos activits quotidiennes, via les terminaux mobiles qui deviennent
progressivement nos exo-cerveaux et cela avant mme lessor des objets connects
comme les lunettes ralit augmente ou les accessoires mdicaux mobiles. Lensemble
des activits professionnelles qui auront recours des technologies prdictives bases sur
lanalyse de donnes en masse ne pourront faire lconomie dune rflexion thique sur la
responsabilit des crateurs de ces algorithmes et des entreprises qui les emploient. Ainsi,
mesure que sont dveloppes les voitures autopilotes, des questions nouvelles se posent
quant au degr de responsabilit des personnes qui programmeront ces algorithmes
lorsque des vies humaines auront t mises en danger84.
Des questions de nature politique se poseront aussi lorsque lanalyse des donnes
lchelle dune population pourra aboutir des ciblages ethniques, politiques ou religieux85.
Ainsi, lanalyse des donnes lies aux crimes et dlits passs est dsormais utilise pour
prvoir les lieux les plus probables pour les activits criminelles venir. Aux tats-Unis, les
units de police dotes de ces systmes prdictifs commencent mme en mesurer les
effets sur la diminution de la criminalit urbaine86. Ds lors la poursuite lgitime ou juge
comme telle de la diminution du risque peut conduire la mise sous surveillance de tous,
faisant de chacun un suspect potentiel, dans lespoir ou lassurance danticiper la survenance
du fait poursuivi.
La mise en donne: du monde du profilage la prdiction
La datafication de toute chose est un phnomne rcent, mme si la mise en nombres
et mesures du monde est un phnomne ancien, qui sest acclr lpoque moderne.
83

84
85
86

Apple tells developers they may not sell personal health data to advertisers. The company has tightened its
privacy rules in run up to announcements of new technology expected in September.
http://www.theguardian.com/technology/2014/aug/29/apple-health-data-privacy-developersadvertisers
The Feds Stall Self-Driving Cars (Wall Street Journal - 24 aot 2014).
http://online.wsj.com/articles/gordon-crovitz-the-feds-stall-self-driving-cars-1408919700
Big Data Can Be Used for Good in theCommunity (New York Times 6 aot 2014
http://www.nytimes.com/roomfordebate/2014/08/06/is-big-data-spreading-inequality/big-datacan-be-used-for-good-in-the-community
Predictive Policing Technology Lowers Crime In Los Angeles (Huffington Post Greg Risling 7janvier 2012)
http://w w w.huffingtonpost.com/2012/07/01/predic tive -policing-technology-losangeles_n_1641276.html

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 55

La mise en donne, non seulement des personnes, mais des choses, sest rcemment
intensifie, notamment car nous nous sommes dots doutils denregistrement et de capture
de ces donnes: l o, dans le pass, la mesure tait une fonction confie certains, elle
est dsormais aux mains de tous et, le plus souvent, de manire involontaire et indistincte.
Involontaire, car nous enregistrons en permanence ces informations, par nos pratiques
de navigation ou nos usages de nos terminaux mobiles. Indistincte car, paralllement aux
donnes dont nous connaissons lusage, nombre des donnes, personnelles ou non, qui
sont collectes, le sont pour un usage futur possible, que nous ne connaissons pas encore.
titre dexemple, on pourrait montrer le renversement qui sest opr entre un ge o
raliser une tude consistait collecter volontairement des donnes, aprs coup, pour tester
une hypothse, et un ge, notre ge, o ltablissement de corrlations entre deux faits
statistiques peut tre tabli sur-le-champ grce aux grands nombres qui ont t collects
indistinctement par les individus et les entreprises.
Cette datafication est une progression quantitative qui a un effet qualitatif
permettant deux actions auparavant difficilement accessibles: la prdiction et le profilage.
La possibilit de prdiction apporte par le Big Data repose principalement sur lide que
le Big Data permet de relever des corrlations statistiques rgulires et rcurrentes entre
des phnomnes, en faisant lconomie de la comprhension exacte de ce qui cause tel
ou tel phnomne. Concrtement, la prdiction, de causale, devient statistique. L o
auparavant, nous mettions des hypothses (si telle chose se passe, telle autre chose devrait
se passer), nous faisons dsormais le pari, rgulirement juste, que si telle chose et telle
chose se produisent habituellement ensemble (et mme si la raison de leur corrlation
nous chappe), alors, la survenance dune des deux choses mindique limminence de
lautre. Dun point de vue logique, les deux formes de prdiction sont problmatiques. La
prdiction causale est logiquement problmatique car elle isole souvent une cause en la
dsignant comme dterminante. Alors que chaque phnomne est multifactoriel et que
nous pouvons donc nous tromper dans le choix de la cause dterminante: un problme
quillustre la difficult de prdiction en conomie. La prdiction statistique est logiquement
problmatique car elle nous permet de faire lconomie de comprendre le pourquoi
dun phnomne et elle ne permet que de prdire la rptition, et nous rend aveugles
lmergence de phnomnes radicalement nouveaux. Mais, dans le cadre de phnomnes
rcurrents, la prdiction statistique fonctionne mieux que la prdiction causale. La force de
la prdiction statistique repose sur le fait que si quelque chose se passe trs rgulirement
dune certaine faon, il est probable que, si les conditions sont comparables, elle se passera
de nouveau de la mme faon. Or, ce probabilisme ntait pas possible dans une priode
de relative misre numrique. Lattachement aux causes tait une manire de suppler
ce manque de donnes. La donne massive permet la prdiction. Elle permet aussi autre
chose : le profilage. En effet, la vie dans les socits modernes, mme si elle nous laisse
croire que nous sommes trs diffrents les uns des autres, accentue, par la proximit sociale,
quelle soit physique ou virtuelle, lhomognisation de nos pratiques et de nos penses.
Pour mmoire ces effets de ressemblance de nos pratiques taient auparavant lobjet dune
typologisation par la sociologie, qui reposait la fois, bien souvent, sur des dclarations,
et sur des critres en nombre limits, critres qui avaient t jugs signifiants. Dsormais,
la varit des informations personnelles que nous donnons, souvent involontairement,
permet un profilage prcis, pour les entreprises prives, de qui nous sommes, de ce que
nous pensons, de comment nous vivons. Il faut noter, en revanche, que ce profilage
peut entraner lidentification, rebours. Mme si ces entreprises nont que faire de nous
56 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

identifier comme personnes, puisque la valeur de nos donnes, leurs yeux, nest pas notre
singularit, mais notre appartenance un groupe prcis, qui est une cible, le nombre de
donnes quelles manient sur notre personne peuvent permettre notre individualisation,
terme, notre identification. Pour autant si nous pouvons consentir cder certaines de
nos donnes personnelles en change dun droit daccs des services, nous entendons
souvent conserver un droit la vie prive, que le profilage peut rendre fragile.
La nouvelle rvolution scientifique
Ce nest plus dmontrer, les nouvelles technologies changent la manire dont on
fait de la recherche, ainsi que la manire dont on enseigne. Toutefois, au sein du simple
cadre du Big Data, lenseignement et la recherche peuvent se trouver transforms de
deux faons, au moins. Dun point de vue de la recherche, le Big Data, que ce soit avec les
donnes publiques, ou les donnes collectes, permet de changer compltement une
des manires traditionnelles de tester une hypothse. En effet, une manire classique de
procder consiste notamment mettre une hypothse, tablir ltendue des moyens quil
faudrait pour la tester, recueillir un financement pour cette tude et relever des corrlations
statistiques entre faits. Ce mode de recherche prsente deux difficults. Dune part, la collecte
dinformations est faite aprs coup, aprs la formulation dune hypothse et souvent sans
tudier le lien de causalit. Dautre part, cette collecte est oriente par une hypothse, si
bien que, si cette dernire est mal formule et que lanalyse causale est absente, ltude peut
tre un chec: elle ne permettrait ni de confirmer, ni dinfirmer une hypothse. En outre, les
rsultats obtenus ne sont pas ncessairement rutilisables pour dautres tudes. Pourtant ce
mode de recherche domine encore aujourdhui: pour montrer quelque chose, on postule la
possibilit que son existence est si importante quelle permet un enregistrement statistique.
En un sens, ce procd pistmologique a prpar la voie au triomphe du Big Data car,
bien souvent, ces tudes font lconomie dune comprhension des causes dun phnomne,
au bnfice de sa seule quantification. Or, le Big Data a plusieurs avantages sur ce type de
recherche. Tout dabord, le Big Data accumule un volume et une varit de donnes qui
seraient impossibles assembler sans les outils actuels de collecte. Ensuite, cette collecte
nest pas oriente: le corpus de donnes se constitue comme une ressource dont lutilisation
peut tre dcide ensuite. Enfin, la vitesse de traitement que rend possible le Big Data
permet des manipulations beaucoup plus aises et rgulires. Dans des domaines comme
la sociologie, la mdecine ou lconomie, la recherche se transforme, sous leffet du Big Data.
Avec une rserve: comment les chercheurs peuvent avoir accs aux donnes, si ces donnes
sont publiques (mais parfois payantes) ou aux mains dentreprises prives (donc payantes,
voire inaccessibles).
Dun point de vue de la recherche, le Big Data peut aussi tre un outil de dploiement
du crowdsourcing: en effet, il est possible de confier lanalyse de documents sur lesquels les
robots peuvent manquer de finesse, comme les cartes, les photos, ou les phrases en langues
naturelles (comme le franais ou langlais) des foules. Linnovation radicale, en ce cas
relve de leffet rseau, qui comme pour un processus scientifique permet une innovation
incrmentale, en profilant les utilisateurs et pondrant, dans la masse des rponses, les
rponses de certains. Du point de vue de lenseignement, l encore, le Big Data nest pas
lorigine dune innovation radicale, qui vient davantage de la dmatrialisation et de la
massification, comme dans le cas des MOOCs, mais il permet un affinement, notamment
en permettant la personnalisation dun enseignement massifi, o le profilage permet de
proposer chaque utilisateur, soit des cours plus susceptibles de lintresser, soit, lintrieur

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 57

mme dun cours, un parcours dapprentissage plus adapt. Concrtement, que ce soit du
point de vue de la recherche ou du point de vue de lenseignement, le Big Data change notre
manire de faire.
Labsence de matrise et perte de la dcision politique
Certaines entreprises comme Google estiment que la mise en donne du monde
est la source de lefficience des dcisions politiques ou dinvestissement. Cette vision
totalisante du monde se traduit par le rachat par Google de toutes les startups qui peuvent
permettre de dvelopper des applications dans tous les domaines essentiels nos socits.
Lenjeu sera alors celui de la dpossession ou non du politique en terme de dcision:
lexpertise de lordinateur sera-t-elle la seule source daide la dcision ou au contraire
permettra-t-on le dbat et la discussion des citoyens autour des solutions proposes par les
algorithmes ? En octobre 2008, Alan Greenspan est auditionn par le Snat amricain suite
la crise des subprimes. Lancien directeur de la FED reconnat publiquement stre trompe
en expliquant que les prix Nobel dconomie ont affirm devoir automatiser absolument tout
et que ds lors nous avions plus de savoir conomique. cette poque, le terme Big Data
nexistait pas encore, mais cest bien le Big Data quAlan Greenspan remet en cause. Quand
on na plus de savoir conomique, on ne peut plus critiquer le systme. On nen voit pas les
limites et cela peut conduire une catastrophe.
Laide la matrise des technologies et des services autour du Big Data apparat plus
que jamais comme un enjeu capital pour la citoyennet de demain. Les citoyens devront tre
mme de bnficier de formations leur permettant de faciliter la comprhension par les
usagers des technologies et plateformes bases sur lanalyse des donnes en masse. Un volet
de ces formations devra tre consacr lanalyse des usages des donnes ainsi collectes.
De plus, les concepteurs de ces plateformes devront faire connatre de manire simple
leurs utilisateurs ltendue exacte des donnes collectes et les modalits dutilisation et de
restriction de lusage de ces donnes.

Protection et matrise des donnes:


nouveaux enjeux et nouvelles approches
Si le Big Data reprsente une opportunit formidable de progrs, et il ne sagit pas ici de
rsumer ni de rduire celui-ci seulement la publicit toujours plus cible, il faut confronter
les implications de celui-ci nos valeurs, nos principes fondamentaux. La collecte et lusage
des donnes personnelles ne devraient pouvoir se faire sans un niveau de confiance lev
des citoyens dans ces dispositifs. Dj en 2002, Bill Gates avait crit un mail tous les salaris
de Microsoft sur le Trustworthy Computing, indiquant que le dveloppement du numrique
passerait par la confiance et la transparence.
Or, force est de constater, comme la illustr laffaire Prism, et pour reprendre une formule
de lancienne ministre lconomie numrique, Fleur Pellerin, Big Data peut devenir Big
Brother . La collecte exponentielle des donnes personnelles travers le Big Data et la
rutilisation quasi immdiate de ces donnes sont porteuses de tensions sur les liberts
individuelles et le respect des droits de lhomme. Ces tensions reposent le problme de la
dfinition de la vie prive, de lencadrement rglementaire et du contrle des entreprises
et administrations qui utilisent ces donnes. terme, le pouvoir des algorithmes pourrait
58 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

amener ce que la machine prenne des dcisions sans intervention humaine, voire la
place des autorits politiques.
Si la donne est au cur de la socit au plan individuel, dune collectivit, dune Nation,
prsente sous diffrentes formes, revtant un caractre conomique, social et culturel, sa
matrise est en revanche et sans conteste un impratif dmocratique. Nous voyons bien que
cette donne est une ressource dont la matrise offre un pouvoir. Une situation qui peut
conduire demain parler de pillages des donnes, de vol de donnes, de blanchissement de
donnes pour reprendre Pierre Bellanger87. Matriser ses donnes devient rapidement une
ncessit pour envisager de se mouvoir dans lunivers numrique et si possible sans risque.

La protection des donnes caractre personnel:


un impratif dmocratique
La loi Informatique et Liberts
La conscration de la vie prive des individus a entran le dveloppement de nombreux
moyens destins protger les donnes personnelles recueillies par les professionnels.
Cest le cas de la Commission Nationale de lInformatique et des Liberts (CNIL) autorit
administrative indpendante dont nous avons vu prcdemment les raisons qui ont conduit
le lgislateur dcider de sa cration.
La CNIL constitue dsormais le socle de la protection des donnes personnelles faisant
lobjet dun traitement informatis et a pour objectif de recenser toute cration de fichier
regroupant des donnes personnelles et dautoriser la constitution de dossiers comportant
des donnes dites risque.
Tout fichier clients informatis quest amen constituer un professionnel constitue,
au regard de la loi, un fichier de donnes caractre personnel, un ensemble structur et
stable de donnes caractre personnel accessible selon des critres dtermins, et se doit
donc de respecter les prconisations de la CNIL. Cest ce que rappelle larticle 34 de ladite loi
en prcisant que Le responsable du traitement est tenu de prendre toutes prcautions utiles,
au regard de la nature des donnes et des risques prsents par le traitement, pour prserver
la scurit des donnes et, notamment, empcher quelles soient dformes, endommages, ou
que des tiers non autoriss y aient accs.
Pour tre en rgle, tout archivage de donnes personnelles de la part dun professionnel
doit faire lobjet dun certain nombre de dmarches. En effet, pour la constitution dun fichier
clients, il est obligatoire: dobtenir laccord pralable de la personne qui y sera enregistre,
de mettre en uvre des moyens de scurisation efficaces, dimposer une limite de temps au
registre conserv et enfin de pralablement le dclarer la CNIL.
Pour exemple, de nombreuses dcisions administratives de la CNIL sont dailleurs
venues sanctionner pcuniairement des agences prives de recherche pour non-respect
des obligations prescrites par la loi de 1978.
En revanche, pour les professionnels soumis au secret professionnel, larticle 21 de
cette mme loi prcise que lindividu qui fait lobjet dun contrle de la CNIL peut opposer
87

Pierre Bellanger, Op.cit.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 59

le secret professionnel auquel il est soumis pour sabstenir de fournir tout renseignement.
Pour le cas des enquteurs privs, ce principe a dailleurs t confirm par une dcision du
Conseil constitutionnel du 29 juillet 2004, pour qui ces derniers peuvent opposer le secret
professionnel au cours dun contrle sans que ceci ne porte en aucun cas atteinte aux
pouvoirs de la CNIL.
Les trois principes fondamentaux de la loi du 17 juillet 1978
Aujourdhui, la CNIL est comptente sur les donnes caractre personnel et sur la mise
en place des fichiers informatiques, avec ou sans traitement automatis. Ce qui entrane la
neutralit technologique ou plutt linsensibilit aux changements techniques qui permet
la CNIL dapprhender toutes les mutations sociales dans leurs aspects technologiques et
dinterroger le dispositif bas sur cette technologie au regard de la finalit quelle est cense
poursuivre pour en apprcier la proportionnalit du dispositif au sens de la loi Informatique
et liberts. Dans ce cas elle peut tout fait refuser dautoriser la mise en uvre dun dispositif
souhait par un responsable de traitement.
La CNIL utilise les moyens que lui confre le lgislateur et les sanctions quelle inflige
peuvent tre rendues publiques. La CNIL a dailleurs impos Google la publication de sa
sanction sur son moteur.
La rgulation telle que la CNIL la prconise, avec un principe de droit prcis autour
de la protection de la vie prive, est un lment fort au service des acteurs du numrique.
Un lment de diffrenciation comptitive qui peut fortement servir la restauration
dune confiance ncessaire dans lusage du numrique. A la CNIL, cette gamme doutils
de rgulation comporte plusieurs volets dirigs vers des publics diffrents : des outils de
communication et dinformation, des normes simplifies et des autorisations uniques
pour traiter les cas les plus frquents de traitement et qui prfigurent la tendance lourde
de lallgement des formalits, des packs de conformit pour une application plus adapte
des secteurs professionnels avec un travail de concertation et des documents purement
techniques permettant le dploiement au niveau des systmes dinformation de la
dimension privacy.
Les autorisations de la CNIL pour les traitements de donnes risques ou sensibles
sont soumis autorisation. Les responsables de fichiers qui ne respectent pas ces formalits
sexposent des sanctions pnales. Pour les traitements ou fichiers de donnes personnelles
les plus courants et les moins dangereux, la CNIL labore des textes-cadres auxquels les
responsables de donnes personnelles doivent se rfrer pour accomplir des formalits
dclaratives allges ou en tre exonrs.
lheure ou certaines entreprises font de la gestion du risque contre la fraude par
exemple un acte fort de management, les tentations de recourir des dispositifs bien
souvent en contradiction avec les principes de la loi Informatique et liberts sont grandes.
Le rle de la CNIL est alors de veiller au respect de la loi tout en travail en amont sur un rle
dinformation et de conseil.
En ce qui concerne les traitements automatiss qui relvent de la puissance publique, la
CNIL ne peut mettre quun avis. Ses pouvoirs sont assez limits. Ces avis sont rendus avant
ceux du Conseil dtat. Il arrive galement que la CNIL ne soit pas consulte en amont de la
mise en place de certains dispositifs alors mme que cela devrait tre le cas. On peut citer
lexemple de la loi de programmation militaire 2013.
60 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Dans tous les cas, trois principes fondamentaux de droit structurent le raisonnement
juridique de la CNIL et prcisent un ensemble dexigence lgale dont le respect simpose au
responsable du traitement sous peine de sanctions pnales.
 Principe de finalit

Le premier de ces principes est le principe de finalit. Ce principe pos par la loi tient
ce que les donnes personnelles doivent tre collectes pour des finalits dtermines,
explicites et lgitimes et ne sont pas traites ultrieurement de manire incompatible avec
ces finalits. La loi impose ici en ralit deux obligations : dune part, raliser une collecte
pour des finalits dtermines, explicites et lgitimes, ce qui contraint le responsable du
traitement tablir de manire prcise la finalit pour laquelle un traitement va tre ralis.
On peut comprendre galement cette rgle a contrario, celle-ci sanctionnant alors des
finalits vagues, ou inexistantes, inscrites lors des formalits pralables (telle que collecte
pour exploitation , collecte pour conservation , rcupration de donnes pour tout
usage , etc.). Dautre part, la loi impose galement de ne pas dtourner le traitement des
finalits initiales. Une exception est toutefois prvue pour les traitements raliss des fins
statistiques, historiques ou scientifiques condition quun tel traitement soit ralis dans le
respect des autres dispositions lgales et quil ne soit pas utilis pour prendre des dcisions
lgard des personnes concernes (art. 6, 2).
 Principe de loyaut

La loi impose que les donnes [soient] collectes et traites de manire loyale et licite
(article 6), dictant ainsi au responsable du traitement un principe de transparence lors du
traitement. Ce devoir de loyaut est excut entre autres loccasion de linformation des
personnes lors de la collecte des donnes, autant que lors de lexercice potentiel du droit
dopposition des personnes sur les donnes qui les concernent. Cette rgle de droit trouve
son versant pnal dans larticle 226-18 du Code pnal qui dispose que : Le fait de collecter
des donnes caractre personnel par un moyen frauduleux, dloyal ou illicite est puni de
cinq ans demprisonnement et de 300.000 damende (ou 1.500.000 euros lorsque lauteur
de linfraction est une personne morale).
 Principe de proportionnalit

Le troisime principe impose que les donnes soient adquates, pertinentes et non
excessives au regard des finalits pour lesquelles elles sont collectes et de leurs traitements
ultrieurs .Sans doute lune des illustrations les plus significatives de lapplication de ce
principe tient aux demandes de mise en uvre de dispositifs biomtriques que la CNIL a
assez largement rcuses en particulier lorsque ceux-ci permettaient la constitution de
bases de donnes dempreintes digitales, sans justification particulire.
Le droit loubli: de la loi du 17 juillet 1978 larrt Google Spain de la CJUE
Le droit loubli est une garantie fondamentale des liberts, ainsi quune ncessit
humaine et socitale. Sous langle Informatique et Liberts , le droit loubli se matrialise
aujourdhui en France dans des concepts juridiques issus de la directive 95/46/CE du
24 octobre 1995 relative la protection des personnes physiques lgard du traitement des
donnes caractre personnel et la libre circulation de ces donnes, de la convention 108
du 28 janvier 1981 et de la loi n 78-17 du 6 janvier 1978 relative linformatique, aux fichiers
et aux liberts, modifie en 2004. Il sagit, notamment, au-del des principes de finalit, de

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 61

loyaut, dexactitude et de mise jour des donnes, de lobligation de dfinir et de respecter


des dures de conservation et de prise en compte des demandes de droit dopposition.
La loi Informatique et Liberts impose en effet un principe de dure ou plus exactement
de conservation des donnes. Ce principe impose que les donnes soient conserves
pendant une dure limite, au-del de laquelle les donnes caractre personnelles
doivent tre effaces. Larticle 6 de la loi du 6 janvier 1978 prcise ce titre que les donnes
sont conserves sous une forme permettant lidentification des personnes concernes
pendant une dure qui nexcde pas la dure ncessaire aux finalits pour lesquelles
elles sont collectes et traites. En pratique cette dure est fixe par le responsable du
traitement qui doit procder une estimation au regard des finalits indiques. Avec le droit
dinformation, de modification et dopposition prvu par la loi 7888, cet lment de dure
constitue le fondement du droit loubli.Toute personne a le droit de savoir si elle est
fiche et dans quels fichiers elle est recense. Ce droit de regard sur ses propres donnes
personnelles vise aussi bien la collecte des informations que leur utilisation. Ce droit dtre
inform est essentiel car il conditionne lexercice des autres droits tels que le droit daccs
toute personne a le droit dinterroger le responsable dun fichier pour savoir sil dtient
des informations sur elle89 - ou le droit dopposition toute personne a la possibilit de
sopposer, pour des motifs lgitimes, figurer dans un fichier90.
Trs rcemment deux arrts de la CJUE sont venus complter au plan europen le droit
loubli. Larrt du 8 avril 201491 qui a invalid la directive sur la rtention des donnes de
connexion (directive 2006/24/CE), communment dite data retention92, et larrt du 13
mai 2014, arrt dit Google Spain. Avec ce dernier arrt, la Cour reconnat toute personne
un droit ce quune information relative sa personne ne soit plus lie son nom par une
liste de rsultats affichs lors dune recherche effectue partir de son identit. Il convient
de souligner que, contrairement ce qui a t rgulirement dit de manire errone, le
drfrencement ne constitue pas une suppression de linformation source, mais la seule
dcorrlation entre le nom de la personne et la liste de rsultats correspondant ce nom
dans les rsultats des moteurs de recherche. Bien que ce droit au drfrencement ou
leffacement (et non droit loubli, contrairement ce qui est souvent indiqu) consacre
le principe nouveau selon lequel le droit individuel la suppression de liens prvaut, en rgle
gnrale, non seulement sur lintrt conomique de lexploitant du moteur de recherche,
en revanche, ce principe nest pas absolu. Il convient en effet de veiller ce que le droit
la protection des donnes ne prime pas de manire systmatique sur dautres liberts
fondamentales, au premier chef la libert dexpression.
Or si la dcision de la Cour affirme juste titre la ncessit dune garantie tendue du
droit la protection des donnes personnelles, elle napprofondit gure le point crucial
de la mise en balance de la protection des donnes personnelles avec celle de la libert
dexpression et dinformation en confiant aux moteurs de recherche la gestion de lquilibre
88
89
90
91
92

Il sagit du droit, reconnu toute personne, de demander au dtenteur dun fichier de lui communiquer
toutes les informations la concernant. Ce droit permet de vrifier lexactitude de ces informations et, le cas
chant, de faire rectifier celles qui sont errones.
Source: www.cnil.fr
Op.cit
Arrt Digital Rights Ireland Ltd (C-293/12) et Krntner Landesregierung (C-594/12)
Directive 2006/24/CE du Parlement europen et du Conseil du 15 mars 2006, sur la conservation de donnes
gnres ou traites dans le cadre de la fourniture de services de communications lectroniques accessibles
au public ou de rseaux publics de communications, et modifiant la directive 2002/58/CE

62 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

des droits en cause, alors mmes quils nont ni la comptence, ni la lgitimit de se substituer
un juge, ce qui remet en cause les principes les plus fondamentaux de ltat de droit.

Les diffrents textes et accords-cadres:


de la Convention 108 la Directive 1995
De nombreux textes existent au plan international et tout particulirement au plan
europen. Des textes qui placent le droit la protection des donnes personnelles comme
un droit fondamental et inalinable de chaque individu; le modle europen de protections
des donnes issu de la directive de 1995 et de la convention 108 du Conseil de lEurope
en sont un exemple. Dautres textes contribuent galement dfinir un cadre protecteur
en la matire. Dans lune de ses publications sur lenjeu de la protection des donnes
personnelles prsent lors de lorganisation de leur colloque au sein de notre assemble, le
Forum dAvignon a ralis une prsentation et une analyse objective de ces diffrents textes
que nous reprenons ici:
La Convention europenne des droits de lHomme et des liberts fondamentales
(CEDH) du 4 novembre 1950, en particulier, larticle 8.1 de la CEDH qui prvoit que
toute personne a droit au respect de sa vie prive et familiale, de son domicile et de
sa correspondance.
le Pacte international de lOrganisation des Nations unies (ONU) relatif aux droits
civils et politiques du 16 dcembre 1966, en particulier son article 17.1 prvoyant
notamment que nul ne sera lobjet dimmixtions arbitraires ou illgales dans sa vie
prive, sa famille, son domicile ou sa correspondance, ni datteintes illgales son
honneur et sa rputation.
les lignes directrices rgissant la protection de la vie prive et les flux
transfrontires de donnes caractre personnel de lOrganisation de
coopration et de dveloppement conomiques (OCDE) du 23 septembre 1980.
LOCDE, cre en 1961, a notamment pour objectif dapporter son aide en favorisant
lchange de comptences et le partage dexpertises entre ses membres ou entre
les pays membres et les autres pays. En adoptant ces lignes directrices, lobjectif de
lOCDE tait de disposer de principes communs permettant ainsi de contribuer
lharmonisation des lgislations nationales en matire de protection des donnes.
Ces principes sont principalement les suivants : principes de la limitation de la
collecte et de lutilisation des donnes, principe de la qualit des donnes (pertinence
des donnes, etc.), principe de la spcification des finalits de la collecte, principe
des garanties de scurit des donnes, principe de transparence (information des
personnes concernes), principe de la participation individuelle (possibilit pour
un individu dobtenir la confirmation dune utilisation de donnes le concernant) et
principe de responsabilit du responsable de traitement (cf. infra, les principes prvus
par la rglementation franaise applicable en la matire). Les principes de lOCDE
nont toutefois aucun caractre contraignant.
la Convention pour la protection des personnes lgard du traitement
automatis des donnes caractre personnel (Convention 108) du Conseil de
lEurope ouverte la signature le 28 janvier 1981. Cette Convention constitue
le premier instrument international juridique contraignant en matire de
protection des donnes caractre personnel. Les tats signataires ont lobligation
de prendre les mesures ncessaires et appropries, dans leur lgislation nationale,

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 63

afin den appliquer les principes ( savoir notamment le principe de collecte licite et
loyale, le principe de conservation limite des donnes, le principe de qualit et de
proportionnalit des donnes, le principe dinformation des personnes concernes, le
respect des droits daccs et de rectification, etc.).
les accords de lAPEC (Asia Pacific Economic Cooperation): la zone APEC cre en
1989 regroupe les pays suivants: Australie, Brunei, Canada, Core du Sud, Chili, tatsUnis, Indonsie, Japon, Malaisie, Mexique, Nouvelle-Zlande, Philippines, Singapour,
Thalande, Chine, Hong Kong, Taipei, Papouasie-Nouvelle-Guine, Prou, Russie et Vit
Nam). LAPEC a notamment pour objectif de renforcer la coopration conomique de
la zone Asie-Pacifique. Fin 2004, lAPEC a adopt des principes directeurs en matire
de protection de la vie prive et des donnes caractre personnel (APEC Privacy
Framework) qui sont en accord avec les lignes directrices de lOCDE du 23 septembre
1980. Ces principes nont aucun caractre contraignant. Ils apprhendent la question
des transferts de donnes hors des frontires et encouragent notamment les pays
membres de lAPEC adopter une approche commune. Un dispositif visant encadrer
ces flux transfrontaliers entre les membres de lAPEC a t finalis fin 2011 ( savoir
les Cross Border Privacy Rules - CBRP). Les organismes souhaitant mettre en place
ces CBRP pourront raliser, sur la base dun questionnaire revu par un organisme
certificateur (APEC-recognized Accountability Agent), une auto-valuation en matire
de protection des donnes caractre personnel et pourront ainsi obtenir une
certification. Pour plus de dtails voir notamment le document intitul CRPB Policies,
Rules and Guidelines disponible sur le site de lAPEC www.apec.org.
les principes directeurs des Nations unies pour la rglementation des fichiers
informatiss contenant des donnes caractre personnel adopts le 14 dcembre
1990 par lAssemble gnrale des Nations Unies dans sa rsolution 45/95. Ces principes
nont pas non plus de valeur contraignante et les lignes introductives prcisent que
leurs modalits dapplications sont laisses la libre initiative de chaque tat.
la directive n 95/46/CE du 24 octobre 1995, relative la protection des
personnes physiques lgard du traitement des donnes caractre personnel
et la libre circulation de ces donnes constitue le texte de rfrence, pour le droit
communautaire, en matire de protection des donnes caractre personnel.
la Charte des droits fondamentaux de lUnion europenne en date du 7 dcembre
2000 (cf., en particulier, larticle 8 de son titre II) a galement consacr expressment
le droit la protection des donnes. En effet, larticle 8 de la charte prcite prvoit
que toute personne a droit la protection des donnes caractre personnel la
concernant. La charte ajoute notamment que le traitement de ces donnes doit tre
ralis loyalement et sur la base du consentement de la personne concerne ou en
vertu dun autre fondement lgitime prvu par la loi. La charte prvoit galement la
ncessit de mettre en place des autorits de contrle indpendantes afin dassurer le
respect des rgles dictes en la matire. Cette charte, qui navait initialement quune
valeur daccord interinstitutionnel liant le Parlement, le Conseil et la Commission
europenne, sest vue reconnatre la valeur de trait par son intgration au trait de
Lisbonne (trait modifiant le trait sur lUnion europenne et le trait instituant la
Communaut europenne) sign le 13 dcembre 2007.
le Conseil de lEurope a adopt le 16 avril 2014 une recommandation sur un guide
des droits de lHomme pour les utilisateurs dInternet.
64 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Le projet de rglement europen


Lvolution des techniques numriques et les opportunits immenses quoffre le Big
Data conduisent radapter les cadres rglementaires en matire de protections des
donnes personnelles et des liberts dans le monde numrique. Il sagit de revenir des
fondamentaux et repenser compltement ce qui se reconstruit sur ces fondamentaux. Un
certain nombre de faits conus dans le domaine matriel volent en clats dans le domaine
dInternet (on rentre dans les maisons par Internet mme si la porte est physiquement
ferme). Do lexigence dun nouveau cadre juridique au moins europen en rponse
lintensification de la collecte des donnes et de la prise de conscience par lopinion publique
des usages qui peuvent tre abusifs de ces donnes collectes.
Le projet de rglement des donnes personnelles est une premire rponse
dhomognisation du cadre rglementaire entre tous les tats membres et tous les acteurs
de la chane numrique et pas seulement les oprateurs tlphoniques. La proposition vise
rformer la lgislation europenne datant de 1995 en harmonisant les rgles europennes
et en renforant le rle des autorits nationales de protection des donnes.
Lengagement franais face la rforme venir de la lgislation europenne sur la
protection des donnes personnelles (CEPD) est indispensable. Le CESE souhaite que les
pouvoirs publics franais dans leur ensemble se mobilisent fortement par rapport cette
question. Ce texte prsente des avances considrables Son avantage majeur est de
soumettre au droit europen tout traitement de donnes concernant un rsident europen
par une entreprise non tablie en Europe.
Mais il pose en revanche le problme de la notion dtablissement principal, selon
lequel lautorit de rgulation comptente en cas de diffrend avec un citoyen europen
est celle du lieu o se trouve lentreprise et non celle du plaignant. Concrtement, si une
entreprise est localise au Luxembourg ou Malte, en cas de plainte dun citoyen franais,
cette plainte sera exclusivement instruite par la CNIL luxembourgeoise ou maltaise.
Or, ce dispositif ne peut marcher, car dans une part trs importante des cas, les autorits
nationales ne seraient plus comptentes par rapport leurs propres ressortissants.

La protection des donnes personnelles:


entre rgulation et autorgulation
Un certain nombre dactions en faveur dune protection et dune matrise des donnes
numriques est possible en partant du principe selon lequel linnovation senrichit du respect
des principes thiques de transparence et de confiance. Opposer lun lautre comme le
font certains est un non-sens ou plutt lexpression dun cynisme dangereux. Autrement
dit, la privacy et linnovation ne sont pas antagonistes. Lopen innovation nest pas seulement
dordre technologique mais est galement une ouverture aux attentes, aux aspirations de la
socit. Le principe dinnovation responsable doit inclure cette dimension thique comme
un moteur de nouveaux usages et de nouveaux outils.
Par rapport cette proccupation thique, le dialogue peut tre fructueux entre les
entreprises et les rgulateurs pris au sens large. Toutefois il nappartient pas aux entreprises
de se substituer la dcision du politique. Cest la raison pour laquelle lautorgulation ne
doit pas se substituer la rgulation. Lautorgulation doit tre un tage supplmentaire,

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 65

qui sajoute et peut apporter une diffrenciation, le cas chant un usage, qui protge les
valeurs encore mieux que ce que le lgislateur a fix comme principe. Autrement dit, elle
peut faire vivre concrtement les principes qui ne peuvent pas aller dans les dtails ni tre
amend la vitesse de linnovation dans le numrique. Il faut trouver la juste articulation
entre les principes durables et la corgulation les faisant vivre au fil du temps et des
volutions et nouveaux usages. En voici trois illustrations.
Lautorisation de la Cnil est lexemple dune rgulation par le respect des prescriptions
rglementaires. Lintroduction de clauses contractuelles types encourage par la Commission
europenne est du ressort de la co-rgulation. Enfin lexemple du Do Not Track By Default
des navigateurs de recherche introduisant par dfaut des fonctionnalits destines mieux
protger les utilisateurs dinternet contre le suivi abusif de leur navigation sur le web illustre
lexemple type de lautorgulation.

Complmentarits de la loi et de la technologie


Lexemple du privacy by design
La protection des donnes et le Big Data sont intrinsquement incompatibles. Pour
fonctionner, un dispositif sappuyant sur le Big Data requiert dabsorber rapidement,
continument, des donnes varies, et en grande quantit. linverse, la loi protge, que
ce soit pralablement, ou en post-rgulant quand un problme apparat, les donnes
personnelles. Le paradoxe demeure : pour amliorer leur vie personnelle, les individus
ont recours des services qui, tout en leur offrant des bnfices souvent rels, peuvent se
retourner contre eux, soit par leurs effets propres (par exemple, quand Facebook, changeant
ses rgles de privacy, rend publiques des informations que les individus auraient voulu
rserver un cercle restreint) soit par leurs effets cumuls (par exemple, quand un croisement
de vos comptes Facebook, Four Square et Trip Advisor rvle que vous tes en cong et non
en arrt maladie). Cela tant, le lgislateur structure les conditions de fonctionnement des
outils technologiques, et la collecte et le traitement des donnes sont encadrs. En ce sens,
loi et technologie sont doublement complmentaires: la technologie sinsre dans le cadre
dcrit par la loi et la loi se modifie selon les problmes que la technologie suscite. Toutefois,
la difficult propre au Big Data, une fois carts les cas dirrespect, par les acteurs, du cadre
lgal et rglementaire, est que les usagers peuvent eux-mmes provoquer des infractions
leur vie prive.
Il sagit l dun passage oblig de protection de la vie prive. La loi doit interdire
certaines pratiques et affirmer la primaut de lindividu en matire de gestion des donnes
personnelles. Cest ce qutablit la loi Informatique et liberts de 1978 mais aussi la Charte
europenne des droits fondamentaux.
En revanche, la loi ne peut pas grer la protection et ldition de donnes par la
personne elle-mme. Cette possibilit de divulgation mais aussi de protection passe par
des applications techniques au sein des logiciels dits privacy by design permettant de grer
lutilisation de donnes personnelles, mais aussi la possibilit de ne pas tre traqu par des
enseignes commerciales avec, par exemple, lajout par Microsoft son Internet Explorer du
do not track by default, ce que lon appelle le privacy by default. On peut galement citer la
limitation de conservation six mois des donnes de connexion dune adresse IP comme
une bonne pratique.

66 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

Cette complmentarit entre la loi et la technologie permet de retrouver la confiance


mise mal par certains oprateurs du Net, mais elle est encore peu pratique et exige une
prise de conscience des GAFA sur ce sujet.
Lenjeu de lanonymisation: lexemple de lOpen Data
LOpen Data permet le dveloppement dun aspect collaboratif qui est source de
dmocratie. Lidal est le contrle en amont de la mise en ligne, cest le rle notamment du
Comit du secret statistique qui dfinit des rgles strictes. Le Comit du secret statistique a
t cr en 1984 la suite de la loi du 7 juin 1951 qui interdisait toute atteinte la vie prive
pour les mnages et pour les entreprises et imposait la non-utilisation de leurs rponses
des enqutes pouvant permettre une atteinte au secret commercial, une utilisation des fins
fiscales ou de rpression conomique. Peu peu, lINSEE a mis disposition des chercheurs
des fichiers anonymiss pour les mnages, mais pour les entreprises il a fallu ouvrir certaines
possibilits de traitement.
Cest en 1984 que lon cre le Comit du secret statistique concernant les entreprises. Il
est plac auprs du Conseil national de linformation statistique (CNIS). Il est prsid par un
membre du Conseil dtat et compos de membres de ladministration, des entreprises, un
reprsentant des organisations syndicales des salaris et un des utilisateurs rgionaux des
statistiques.
En 2004, laction du Comit est tendue aux mnages, aux personnes morales de droit
public. Le Comit donne donc des avis sur la transmission des donnes publiques sensibles,
sous certaines conditions, notamment en matire dutilisation et dobjectif poursuivi. En
2008, la loi sur les archives a permis douvrir des donnes personnelles prives aprs 75 ans
au lieu de 100 ans et aprs 25 ans pour les documents dordre conomique et financier. Cela
a oblig le Comit se scinder en deux sections: lune sur les donnes personnelles avec une
composition revue avec larrive de membres du Parlement et du CESE, de reprsentants
des Archives de France, de la CNIL, de lUNAF et de lINED; en parallle la section entreprise
sest ouverte au MEDEF, la CGPME, la FNSEA, lUPA, les CCI et les chambre de mtiers, ainsi
que les collectivits territoriales.
Lenjeu dmocratique de lOpen Data pour rendre compte des actions publiques est
extrmement important vis--vis des collectivits territoriales, laction des parlementaires
et du gouvernement. Un Open Data scuris, gratuit, anonymis mais ouvert et permettant
des comparaisons, est source dune dmocratie renouvele. Il convient toutefois que tous
les citoyens puissent se saisir de tels outils.

La matrise des donnes personnelles:


entre confiance et rciprocit
Les donnes personnelles sont dfendues par principe. La loi les dfend, les bonnes
pratiques sont encourages et diffuses pour que les entreprises les dfendent, et les usagers
sont encourags dfendre eux-mmes, dans leurs pratiques, leurs donnes. Toutefois, ce
que change le Big Data, cest quil accompagne et amplifie la collecte et le traitement des
donnes personnelles, avec deux consquences. Tout dabord, les erreurs, manquements,
infractions, tout en demeurant la marge, deviennent de plus en plus nombreux. Ensuite,
et cest l la vraie nouveaut, un usager peut avoir, auprs des solutions en ligne quil
emploie, une bonne matrise de ses donnes, mais la dispersion de ses donnes sur un
trs grand nombre de plateformes rend possible sa r-identification et donc, en cela, une

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 67

perte de contrle sur ce que de nombreux internautes peroivent comme une ncessit: la
dissociation entre lidentit relle et lidentit virtuelle, qui demeure toujours incomplte. En
ce sens, il y a donc bien un problme nouveau pos par le Big Data et une ncessit de voir
comment le rsoudre, que ce soit par la rgulation, lautorgulation, ou lducation.
Restaurer la confiance et le partage
Le Big Data est comme nous venons de voir constitu de donnes qui sont de plus en
plus coproduites par les personnes et les acteurs du numrique. La multiplication des objets
connects participera dune inflation de cette masse de donnes; mme si ces dernires ne
seront pas ncessairement des donnes caractre personnel, les risques de surveillance et
dauthentification seront levs. Face cela, les mesures rglementaires que nous venons
dentrevoir sont une rponse indispensable. Il ny a pas de libert sans tat de droit. Or,
force est de constater que le temps long associ la loi rend souvent caduque ses effets
de protection face des technologies dont les caractristiques et les finalits voluent
rapidement.
Pour autant, labandon de la dmarche de rgulation au profit de mesures de laisser
faire est inenvisageable. Elle conforterait la logique de prdation des donnes par des
plateformes avides de les commercialiser aux dtours de mthodes pas toujours conformes
avec les principes lmentaires de la loi Informatique et liberts.
Complmentaires aux dispositions rglementaires, les approches dite relationnistes
sont en mesure de restaurer la confiance ncessaire lusage thique du numrique sans
abandonner la dimension coercitive quand celle-ci simpose. Lducation au numrique
comme enjeu de citoyennet doit participer cette restauration ncessaire de la confiance,
qui passe certes par une meilleure protection des donnes personnelles, mais pas seulement.
Lenjeu, cest de redonner aux personnes du pouvoir sur leurs donnes, en leur permettant
de les rcuprer, den produire de nouvelles, de les partager et ce dans un cadre qui soit
protecteur et qui ait du sens.
La proprit des donnes, une fausse bonne ide
Lducation au numrique appelle une dmarche de rappropriation des enjeux et
des mcanismes de fonctionnement de ces plateformes. Mais la rappropriation de leviers
propres une matrise de la gestion des donnes et notamment des donnes personnelles
ne doit pas sentendre comme le glissement vers un rgime de proprit o les donnes
personnelles seraient dune certaine faon considres comme une uvre de lesprit
bnficiant dun droit de proprit intellectuelle ou comme une marchandise ngociable
et cessible. Une telle approche couple dans tous les cas la montisation des donnes
personnelles prendrait le contrepied de la conception franaise et europenne de la vie
priv qui place sa protection sur le terrain des droits et liberts fondamentaux.
Aller sur ce terrain, cest invitablement [renvoyer] sur lindividu la responsabilit de
grer et de protger ses donnes, au lieu de trouver des rponses collectives un problme
de socit [et] participe dune vision qui renforce lindividualisme et nie les rapports de force
entre les consommateurs et les entreprises93. Cest sinscrire trs en rupture avec la culture
humaniste franaise o la donne nest pas un lment patrimonial mais un lment de
droit fondamental. Plus encore, le risque est dapporter moins de garanties que le systme
actuel : aujourdhui, mme si les donnes sont traites par des tiers (Google, Facebook,
tats), les droits sur les donnes des personnes, droit loubli, droit de rectification et
93

Valrie Peugeot - Donnes personnelles : sortir des injonctions contradictoires, Vecam. 13/04/2014.

68 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL

de suppression, demeurent. Dans le cas o ces dernires deviennent propritaires de leurs


donnes et quune cession de celles-ci est conclue, la personne nest alors plus dtentrice
daucun droit sur les donnes et par extension sur une partie delle-mme.
Le pari de linnovation et de la protection est un pari gagnant. Les deux termes de cette
quation ne sont pas incompatibles. Mais cela suppose en plus du cadre rglementaire
de sorienter plus gnralement vers une rgulation du march des donnes en passant
notamment par une exigence de transparence sur lutilisation qui est faite des donnes dun
utilisateur dune plateforme ou dun service. Lide est alors de rompre le dsquilibre qui
devient intenable entre, dun ct des organisations surinformes notamment propos de
leurs clients, surquipes en outils dcisionnels, surprotges et, de lautre, des individus
dots de leur seul navigateur web94.
Les CGU
La gratuit apparente des services en ligne qui sont autant de collecteurs de donnes
personnelles susceptibles de nourrir le Big Data est une source majeure des problmes que
les individus peuvent rencontrer. Toutefois, sous lapparence de la gratuit, cette relation
reste une relation marchande et laffirmation de ce fait explique une des volutions sur
lencadrement des pratiques de collecte et de traitement, qui sinspire de plus en plus du droit
de la consommation, et notamment de lide de la ncessit du consentement libre et clair
du consommateur, qui se manifeste dsormais par un double opt-in (accord explicitement
demand et explicitement donn), ou par laffichage que le site que linternaute consulte
collecte des informations sur sa navigation.
Devant ltendue du problme que le Big Data peut contribuer amplifier, une solution
envisageable, paralllement la rgulation, lautorgulation ou lducation, est dadopter
des outils, ou applications, ou dispositifs qui auraient pour mission explicite de redonner
aux internautes la matrise de leurs donnes personnelles ou, dfaut, nauraient pas besoin
de nos donnes personnelles pour fonctionner. Le dispositif le plus connu est ce contrat
dchange de consentements explicites et clairs quincarnent les conditions gnrales
dutilisation (CGU). Mais ces CGU prsentent trois types de difficults. Tout dabord, si un
outil simpose, alors il peut y avoir une forte pression lusage, mme si linternaute rprouve
les CGU dudit outil. Ensuite, ces CGU sont notoirement longues et rarement lues : ce qui
explique des tentatives pour imposer un simple code visuel qui signale clairement ce que
fait lentreprise des donnes personnelles, si elles sont revendues ou non. Enfin, les CGU
changent parfois: ainsi, Twitter a chang en 2009 ses rgles de confidentialit pour revendre
en 2013 deux ans de tweets des socits de data-mining. Ainsi, mme si des bonnes
pratiques peuvent tre encourages du ct des CGU, ce ne peut tre une solution.
Tiers de confiance
Les enjeux thiques du numrique se posent travers le respect de la vie prive et la
libert individuelle qui semblent mis constamment en question. Ces enjeux qui concernent
la protection des donnes personnelles, le droit loubli, le droit la dconnexion, la fracture
numrique ou encore la surveillance lectronique, peuvent au fond se rsumer en un enjeu
gnrique, majeur, celui de la confiance dans la socit.
Lintrt de respecter des rgles thiques, et de faire preuve de transparence vis--vis
des politiques dexploitation des donnes personnelles, est de conserver du mieux possible
la confiance de ses clients/consommateurs. titre dexemple, Orange a publi en fvrier
94

Marine Albarde, Ren Francou, Daniel Kaplan. Mes Infos : cahier dexploration. FING. Mars 2013.

LES DONNES NUMRIQUES : UN ENJEU DDUCATION ET DE CITOYENNET 69

les rsultats dune nouvelle tude, Future of Digital Trust , sur les proccupations des
consommateurs lgard du traitement de leurs donnes personnelles par les entreprises.
Cette tude met en vidence le manque de confiance des consommateurs: 78 % dentre
eux estiment quil est difficile de faire confiance aux entreprises en ce qui concerne
lexploitation de leurs donnes personnelles. La mme proportion de consommateurs
estime que les fournisseurs de services dtiennent trop dinformations sur leurs habitudes
et leurs prfrences. 70 % pensent quil y a peu ou pas de possibilits de savoir comment ces
donnes personnelles sont utilises.
Paralllement, 82 % considrent quils ont peu de moyens de contrler la faon dont
leurs donnes personnelles sont utilises par les entreprises et les institutions. Daprs
cette tude, le traitement des donnes personnelles constitue un lment essentiel la
prservation de la confiance que va accorder un consommateur une entreprise ou une
institution, pratiquement au mme titre que la qualit des services.
En raison du constat dune incomprhension du droit et des exigences rglementaires
en matire de protection des liberts numriques, beaucoup de projets sont en marge de
la loi et mriteraient une tude de conformit plus approfondie. Dans ce domaine, la CNIL
adopte une doctrine qui tient compt galement des changes quelle opre avec les acteurs
de lconomie numrique et de la socit civile. Dautres approches doivent ncessairement
tre discutes, pour accompagner le dveloppement de modles conomique et sociaux
associant des dispositifs de traabilit et de prestations de services. Parmi ces pistes de
rflexion concernant les volutions normatives possibles susceptibles de permettre de
redonner confiance dans la collecte et la gestion des donnes dans un contexte lgislatif
volutif, le concept dautorgulation (accountability) comme celui de la prise de pouvoir
par lusager (empowerment) ou sa participation spontane la production de donnes
(crowdsourcing) apportent des rponses susceptibles de confirmer le couple protection/
innovation. Ce qui suppose plus largement lexistence dun projet politique mme de
replacer la confiance au cur des dbats et des changes dmocratiques.
Afin de rpondre la problmatique de linterconnexion des nombreuses donnes que
nous avons grer au quotidien, ou que des quipes de recherche peuvent avoir besoin
de traiter, il pourrait tre envisag que les acteurs dun mme projet, publics et privs,
dsignent, parmi eux ou par lintermdiaire dun tiers de confiance, dans le cadre dune
dmarche dautorgulation, une entit charge de centraliser lensemble des informations
nominatives issues des divers fichiers destins tre intgrs lapplication, cette
personne tant ainsi la seule matriser et grer les fichiers interconnects. On rduirait
ainsi le risque de dissmination de telles informations connectes et lon faciliterait alors le
rapprochement entre acteurs publics et privs. Ce tiers de confiance serait alors soumis
des obligations de scurit et de conformit renforces, quil pourrait dfinir lui-mme sous
le contrle de la CNIL. Agissant comme un coffre-fort de donnes, cest galement ce tiers
de confiance qui dciderait, au cas par cas, de librer certaines informations nominatives
au bnfice des partenaires pour des besoins spcifiques, en prenant le soin de cloisonner
certains fichiers, anonymiser certaines donnes, exiger certaines conditions dutilisation
spcifiques en fonction des besoins rencontrs. Ces transferts de donnes, raliss sous la
forme contractuelle, pourraient tre soumis des binding corporate rules (BCR, rgles
internes dentreprise), dj connues par ailleurs pour les changes intragroupes ou en dehors de lUnion europenne, sorte de contrats types dont la formulation a t soumise
pralablement lapprobation de la CNIL.

70 AVIS DU CONSEIL CONOMIQUE, SOCIAL ET ENVIRONNEMENTAL