Académique Documents
Professionnel Documents
Culture Documents
dans ce secteur. g
www.strategie.gouv.fr
11/2013
No 08
Les eNjeux
Big data et 5 V
Lavnement doutils comme le cloud computing (encadr 1) permet par ailleurs de stocker des donnes
moindre cot. Globalement, le prix dun gigaoctet pour
un disque dur est pass denviron 16 USD (12,30 euros)
en fvrier 2000 0,10 USD (0,07 euros) en aot 20108.
1. World Economic Forum (2012), Big Data, Big Impact: New Possibilities for International Development.
2. Brasseur C. (2013), Enjeux et usages du big data. Technologies, mthodes et mises en uvre, Paris, Lavoisier, p. 30.
3. 1 traoctet reprsente par exemple 6 millions de livres, 1 ptaoctet reprsente 2 milliards de photos numriques de rsolution moyenne, et 1,8 zettaoctets reprsentent
toutes les informations enregistres en 2011.
4. Banque mondiale (2013), World Development Indicators.
5. Ibid.
6. IDC Press Release (2012), Smartphones Drive Third Quarter Growth in the Worldwide Mobile Phone Market, According to IDC, 25 octobre.
7. Ericsson White Paper (2011), More than 50 Billion Connected Devices.
8. http://ns1758.ca/winch/winchest.html.
LA Note DANALyse
11/2013
No 08
Tout lintrt des masses de donnes ne rside pas uniquement dans leur quantit. Le volume partir duquel il
est possible de parler de big data ne fait dailleurs pas
lunanimit. Lanalyse des big data comprend quatre
autres critres que lon retrouve de faon plus ou moins
simultane : vitesse, varit, vracit, valeur.
Outils et mthodes
Pour rpondre aux besoins provenant dentreprises
comme Google ou Facebook, des logiciels capables de
traiter de gigantesques volumes de donnes structures
et non structures ont vu le jour, pour la plupart il y a
moins de cinq ans. Ces logiciels, souvent open source
comme Hadoop, peuvent distribuer des donnes simultanment sur plusieurs serveurs. Dautres logiciels,
www.strategie.gouv.fr
La technologie big data est galement associe au dveloppement de logiciels capables de rendre intelligibles les
rsultats rendu possible par l'mergence de nouveaux
outils de visualisation (images, diagrammes, animations).
COMPRENDRE LE POTENTIEL
DES ANALYSES DES BIG DATA
Simplifier et adapter les services
Lanalyse des big data permet tout dabord de mieux
couter les usagers, de mieux comprendre leurs modes
dutilisation des services et daffiner loffre. Google
Analytics propose par exemple aux entreprises damliorer la conception de leur site internet par lanalyse des
visites des internautes. Ces applications ont aussi leur
utilit dans le secteur public.
eNcADr 2. WAtsoN-iBM
Watson est un programme informatique dintelligence
artificielle conu par IBM dans le but de rpondre des
questions formules en langage naturel. Pour dvelopper
ce programme, IBM sest donn un objectif ludique.
Il sagissait de remporter le jeu tlvis amricain Jeopardy!
contre des champions. Ce jeu consiste en lnonc de
rponses pour lesquelles les candidats ont trouver les
questions correspondantes. Le programme informatique
doit pouvoir comprendre lnonc (en langage naturel) et
trouver la question dans un temps de rflexion comparable
celui des humains.
Ce programme dintelligence artificielle utilise le logiciel
Hadoop (voir supra) afin de parcourir une grande quantit
de contenus (200 millions de pages lors de sa victoire
Jeopardy!) trs rapidement (en moins de trois secondes
pour Jeopardy!). Watson value la probabilit que la
rponse quil trouve soit la bonne, rpondant seulement si
celle-ci est juge assez leve.
IBM cherche maintenant commercialiser lutilisation de
Watson. Watson est par exemple utile dans le domaine du
diagnostic mdical. En analysant les symptmes et les
donnes mdicales fournis par un mdecin (en langage
naturel), et les connaissances emmagasines (dictionnaires
mdicaux, littrature scientifique, tudes de cas, etc.),
selon un modle de machine learning qui lui permet
LA Note DANALyse
11/2013
No 08
De mme, en analysant les donnes provenant de capteurs sur les avions et en les associant des donnes
mto, on modifie les couloirs ariens pour raliser des
conomies de carburant, on amliore la conception, la
maintenance des avions ou leur scurit24.
Prdire et prvenir
Lanalyse des masses de donnes permet plus spcifiquement danticiper, avec un certain degr de certitude,
des comportements ou des besoins25. La socit Crito
vend, par exemple, des services de publicits cibles
sous forme de bannires affiches sur les sites consults.
Il sagit danalyser une importante quantit dinformations sur les habitudes de consommation des internautes
pour tablir des corrlations, et ainsi prvoir leurs achats.
De la mme faon, lenseigne amricaine Target parvient
identifier les femmes qui attendent un enfant pour leur
proposer des produits pour nourrisson. cette fin, les
analystes ont corrl des millions de donnes laide de
cartes de fidlit de femmes ouvrant une liste de cadeaux
20. TechAmerica Foundation (2012), Demystifying Big Data: A Practical Guide To Transforming The Business of Government, p. 15.
21. Hamel M.-P. (2012), Fraude, indus, non-recours : comment faciliter le juste paiement des prestations sociales ?, La Note d'analyse, Centre danalyse stratgique,
n 306, novembre ; Hamel M.-P. (2013), Comment utiliser les technologies numriques pour poursuivre l'amlioration des relations entre l'administration et ses usagers ?,
La Note d'analyse, Centre danalyse stratgique, n 317, janvier.
22. Yiu C. (2012), The Big Data Opportunity: Making Government Faster, Smarter and More Personal, Policy Exchange, p. 13.
23. TechAmerica Foundation (2012), Demystifying Big Data: A Practical Guide To Transforming The Business of Government, p. 12 ; McKinsey Global Institute (2011), Big Data.
The Next Frontier for Innovation, Competition, and Productivity, 156 p.
24. Jouniaux P. (2013), Big data au service de la scurit du transport arien : lanalyse des donnes de vol, Tlcom, n 169, juillet.
25. ce sujet, voir Siegel E. (2013), Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die, John Wiley & Sons.
www.strategie.gouv.fr
La prvention des crimes est lune des applications possibles de lanalyse des masses de donnes. La police et
luniversit de Memphis ont dvelopp un programme
(Blue Crush), maintenant utilis par de nombreuses villes,
qui permet didentifier les zones et les heures o des
dlits sont le plus mme davoir lieu, afin doptimiser
laffectation des services35.
LA Note DANALyse
11/2013
No 08
37. http://www.washingtonpost.com/wp-srv/special/politics/prism-collection-documents/.
38. Loi 78-17 du 6 janvier 1978 modifie.
39. Directive 95/46/CE du Parlement europen et du Conseil, du 24 octobre 1995, relative la protection des personnes physiques lgard du traitement des donnes
caractre personnel et la libre circulation de ces donnes, JOCE n L 281 du 23/11/1995, p. 31. Proposition de rglement du Parlement europen et du Conseil relatif la
protection des personnes physiques lgard du traitement des donnes caractre personnel et la libre circulation de ces donnes (rglement gnral sur la
protection des donnes), Bruxelles, le 25 janvier 2012, COM(2012) 11 final, 2012/0011 (COD).
40. Levallois-Barth C. (2013), Big data et protection des donnes personnelles : un dfi (quasi) impossible ?, Tlcom, n 169, juillet.
41. ce sujet, voir le premier cahier Innovation et prospective de la CNIL, Vie prive lhorizon 2020, p. 32-33.
42. Levallois-Barth C. (2013), op. cit.
43. Ibid.
44. Pas de motif lgitime invoquer dans le cadre de la prospection commerciale.
45. Levallois-Barth C. (2013), op. cit.
46. CNIL, Dcision n 2013-025 du 10 juin 2013 de la prsidente de la CNIL mettant en demeure la socit GOOGLE INC.
www.strategie.gouv.fr
LA Note DANALyse
11/2013
No 08
public-priv56. Il est essentiel de poursuivre ces initiatives, tout en sensibilisant les acteurs privs aux risques
sur les liberts et la vie prive57.
Concernant les changes dinformations entre administrations, des outils de scurisation sont mis disposition
par le Secrtariat gnral pour la modernisation de laction publique (SGMAP). Le Rfrentiel gnral de scurit
(RGS) veut scuriser, en fixant des rgles, les changes
lectroniques entre les usagers et les autorits administratives et entre les autorits administratives59. La Plateforme dchange de confiance (PEC) met, pour sa part, en
place un systme dintermdiation entre les administrations et les partenaires/usagers pour leur permettre de
communiquer en confiance.
LIrlande aspire pour sa part devenir le pays de rfrence des technologies big data. Le Plan daction pour
lemploi de 2013 prvoit le dveloppement dune filire
big data depuis la formation de la main-duvre jusqu
la cration ou linstallation dentreprises. Sy ajoute un
investissement de 1 million deuros pour dvelopper un
centre de recherche dont les grandes orientations seront
dfinies par un consortium dentreprises prives.
56. Le projet de cloud public Andromde sest concrtis en 2012 au travers de la cration de Numergy et de Cloudwatt, deux socits nes de partenariats public-priv avec
SFR et Bull dun ct, et Orange et Thales de lautre.
57. Achiary A., Hamelin J. et Auverlot D. (2013), Cyberscurit, lurgence dagir, La note danalyse, Centre danalyse stratgique, n 324, mars.
58. Voir les guides de scurit sur la mthode de gestion des risques IL et sur le catalogue de mesures de scurit mettre en place, dits rcemment par la CNIL.
59. Premier ministre, ANSSI, ministre du Budget, des Comptes publics et de la Rforme de ltat (DGME), Rfrentiel gnral de scurit. Version 1.0 du 6 mai 2010.
60. Mayer-Schnberger V. et Cukier K(2013), op. cit., p. 157-163.
61. Reynaudi M. et Sauneron S. (2012), Mdecine prdictive : les balbutiements dun concept aux enjeux considrables, La note danalyse, Centre danalyse stratgique,
n 289, octobre.
62. Voir par exemple au sujet de la cration de sries tlvises : http://www.salon.com/2013/02/01/how_netflix_is_turning_viewers_into_puppets/.
63. Tata Consultancy Service (2013), The Emerging Big Returns on Big Data. A TCS 2013 Global Trend Study.
http://www.lesechos-conferences.fr/data/classes/produit_partenaire/fichier_5183_540.pdf.
www.strategie.gouv.fr
matire danalyse des big data au sein de lUnion europenne. Ce projet veut fournir une plateforme de discussion sur lmergence dune conomie de la donne pour
lindustrie, la recherche et les dcideurs politiques.
64. http://www.afdel.fr/actualites/categorie/actualite-afdel/article/big-data-filiere-d-avenir-pour-la-france-les-propositions-de-l-afdel.
65. Commission innovation 2025 (2013), Un principe et sept ambitions pour linnovation, commission prside par Anne Lauvergeon, Paris, La Documentation franaise,
octobre.
66. Ministre du Redressement productif, La nouvelle France industrielle, Paris, 2013.
67. lorigine un projet franco-allemand, puis seulement franais.
68. http://www.atinternet.fr/documents/barometre-des-moteurs-avril-2013/.
69. McKinsey Global Institute (2011), Big Data. The Next Frontier for Innovation, Competition, and Productivity, 156 p.
70. Tlcom ParisTech.
10
LA Note DANALyse
11/2013
No 08
de la sant. Les pouvoirs publics doivent financer, hauteur de 90 millions de livres sterling (106 millions deuros), linstitut big data de luniversit dOxford. Cet institut
ralisera des analyses pour amliorer la dtection, la surveillance, le traitement et la prvention dun large ventail
de maladies.
coNcLusioN
Le nombre de donnes continue crotre et
les outils danalyse vont se perfectionner.
Sans prsager des futurs usages, lanalyse des
big data est sans aucun doute voue gagner en
importance, certains parlant mme de rvolution72.
LA Note DANALyse
11/2013 - No 08
11
www.strategie.gouv.fr
DerNires
PuBLicAtioNs
coNsuLter
www.strategie.gouv.fr, rubrique publications
Notes danalyse :
N 01 g Un fonds europen pour lemploi des jeunes - Proposition
pour une initiative (juin 2013)
www.strategie.gouv.fr
CommissariatStrategieProspective
www.strategie.gouv.fr
Commissariat gnral la stratgie et la prospective - 18, rue de Martignac - 75700 Paris SP 07 - Tl. 01 42 75 60 00