Vous êtes sur la page 1sur 24

Introduction Big Data

SOMMAIRE

Rdacteurs :

SH. Lazare / F. Barthlemy

Rf.:

AXIO_BD_V1

QU'EST-CE QUE LE BIG


DATA?
ENJEUX TECHNOLOGIQUES

ENJEUX STRATGIQUES
BIG DATA ET RH
ANNEXE

Ce document constitue le support dune prsentation orale.


Priv des commentaires laccompagnant, il peut donner lieu
des interprtations errones.
Data & Information System

Avertissement
Prsentation AXIODIS

Historique & contexte

Qu'est-ce que le Big


Data?

Lvolution du SI amne les entreprises traiter de plus en plus de donnes issues


de sources toujours plus varies .
Les prvisions de taux de croissance des volumes de donnes traites dpassent les
limites des technologies traditionnelles. On parle de ptaoctet (billiard doctets) voir
de zettaoctet (trilliard doctets) Quelle solution pour exploiter ces donnes ?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

March du Big Data

Qu'est-ce que le Big


Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

Dfinition
Big Data : exploration de trs vastes ensembles de donnes pour obtenir des
renseignements utilisables
Qu'est-ce que le Big
Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

Le terme Big Data se rfre aux technologies qui permettent aux entreprises
d'analyser rapidement un volume de donnes trs important et d'obtenir une vue
synoptique. En mixant intgration de stockage, analyse prdictive et applications, le
Big Data permet de gagner en temps, en efficacit et en qualit dans linterprtation
de donnes.
Les objectifs de ces solutions dintgration et de traitements des donnes sont de
traiter un volume trs important de donnes aussi bien structures que non
structures, se trouvant sur des terminaux varis (PC, smartphones, tablettes, objets
communicants...), produites ou non en temps rel depuis n'importe quelle zone
gographique dans le monde.
le Big Data sera un outil majeur la fois pour la prise de dcisions et
l'optimisation de la comptitivit au sein des entreprises.

Problmatique
Le Big Data se caractrise par la problmatique des 3V :
Vlocit : la vitesse laquelle les donnes sont traites simultanment
Qu'est-ce que le Big
Data?

Varit : l'origine varie des sources de donnes qui arrivent non


structures (formats, codes, langages diffrents...)
Volume : le poids total des donnes collectes

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

Vous tes confront une problmatique de gestion de donnes


correspondant ces trois critres ou plus simplement vous ne savez plus grer
ces donnes avec les architectures traditionnelles, alors vous avez une
problmatique de type Big Data.

Il faut en effet penser collecter, stocker puis analyser les donnes dune
faon qui ne peut plus tre traite par une approche traditionnelle pour
permettre de satisfaire au 4me V la Valorisation des donnes.
7

Est-ce une innovation?

Lexplosion des volumes des


donnes ncessite une
innovation en terme de :

Qu'est-ce que le Big


Data?

Enjeux stratgiques

Enjeux
technologiques

.
Big Data et RH

Annexe

Acclration
matrielle
Abandon des disques durs au
profit
des
mmoires
dynamiques DRAM ou flash
meilleur bnfice des
processeurs multicoeurs.

Bases de donnes d'analyse massivement parallle (MPP). Ces bases de


donnes conformes SQL sont conues pour rpartir le traitement des donnes sur
plusieurs machines
Modle Map-Reduce, Hadoop, et autres approches NoSQL. Ces approches,
appeles collectivement "NoSQL" ou "Not Only SQL" permettent d'accder aux
donnes via des langages de programmation sans utiliser les interfaces bases
sur SQL et permettent de rpartir les donnes sur plusieurs machines distinctes.
8

Vocabulaire

Qu'est-ce que le Big


Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

Datavizualisation : capacit reprsenter des donnes de faon visuelle


(graphiques, diagrammes, cartographies, infographies). Plus largement
cest la capacit naviguer rapidement et simplement dans les donnes.
Not Only SQL / Bases sans schma : catgorie de systmes de gestion de
base de donnes (SGBD) qui n'est plus fonde sur l'architecture classique
des bases relationnelles. L'unit logique n'y est plus la table, et les donnes
ne sont en gnral pas manipules avec SQL.
Map Reduce : modle de programmation permettant de manipuler de
grandes quantits de donnes non obligatoirement structures.
Hadoop / Cassandra / MongoDB : framework
dapplication utilisant le modle Map Reduce.

de dveloppement

Data Flow / Pig / Hive ..: logiciel et langage danalyse de donnes


permettant dutiliser Hadoop.

Pourquoi faire du Big Data?


La comprhension de votre environnement passe la par la valorisation des
toutes les donnes accessibles pour les raisons suivantes :
Qu'est-ce que le
Big Data?

Enjeux stratgiques

Stratgiques (Crer un avantage concurrentiel, Contrler son image)


Organisationnelles (Piloter en temps rel, Impliquer les collaborateurs)

lenvironnement actuel toujours plus dinformations exploitables ncessite


une nouvelle approche de lanalyse des donnes .

Enjeux
technologiques

Big Data et RH

Annexe

10

Big Data : Secteurs & activits


De nombreux secteurs sont concerns :

(e-) (m-) Commerce & CRM


Qu'est-ce que le
Big Data?

Sant
Dfense, renseignement (e.g. cyberscurit, biomtrie)
Banque/Finance

Enjeux stratgiques

Enjeux
technologiques

Transports intelligents
Et concerne diffrentes activits :
Moteurs de recherche, moteurs de recommandation
Maintenance prdictive

Big Data et RH

Marketing viral travers les rseaux sociaux


Dtection des fraudes

Annexe

Mdecine individualise
Publicit en ligne (retargeting)

11

Impacts du Big Data dans


lentreprise
Lmergence de nouveaux mtiers capables de grer vos donnes dintrt et
den extraire les bonnes informations :
Qu'est-ce que le
Big Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

Architecte Big Data:


Connaissance infrastructures et logiciels Big Data
Connaissances en modlisations

Data Analyst:
Connaissance des logiciels & langages Big Data
Connaissance en modlisations

Data Scientist:
Connaissance des logiciels & langages Big Data
Connaissance en modlisations
Connaissances mtiers

Chief-Data-Officer (Directeur des donnes)


Responsable des donnes et de leur gouvernance (collecte, traitement,
sauvegarde, accs)
Responsable de lanalyse des donnes et aide la dcision

Mettre en uvre des quipes agiles & transverses


12

Architecture Big Data


Faire voluer votre SI traditionnel vers un SI BigData
Source de donnes htrognes

Consommation /
valorisation des donnes

Qu'est-ce que le
Big Data?
Sources htrognes

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Stockage et
traitement de
donnes

Intgration
des
donnes

Annexe

Analyse des donnes

13

Stockage des donnes


Les approches NoSQL (data in memory) sont particulirement importantes
pour les tches d'analyse qui ne peuvent pas tre codes efficacement dans
SQL (itrations multiples sur les donnes, analyse de textes)
Qu'est-ce que le
Big Data?

Map-Reduce et Hadoop sont


les outils NoSQL les plus
rpandus pour mettre
disposition les donnes non
structure au niveau des
applications

Enjeux stratgiques

Enjeux
technologiques
HDFS

Big Data et RH

Annexe

14

Data visualisation
Les utilisateurs / dcideurs doivent pouvoir visualiser et comprendre les rsultats.
Le Reporting version Big Data doit tre conu pour pouvoir trouver "une
aiguille dans une botte de foin " on parle de datavizualisation.
Qu'est-ce que le
Big Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Les prsentations peuvent tre simples,


dynamiques
il faut choisir ce quon veut montrer.
Un graphique nest quune prsentation
de la ralit

Annexe

15

Scurit et supervision
Il est ncessaire dinclure dans votre architecture des solutions de supervision
mme dauditer en permanence votre environnement.
Qu'est-ce que le
Big Data?

Accs & scurit

Enjeux stratgiques

Enjeux
technologiques

Provenance et
fiabilit des
donnes

Archivage,
entrepts de
donnes

Programmes de
traitements,
contrles daccs

Big Data et RH

Annexe

Garantir lanonymisation des donnes la scurit des traitements


Se prmunir des risques datteintes la vie prive
Respecter les contraintes lgales et rglementaires volutifs.

16

Repenser les fonctions RH


Le Big Data apporte une nouvelle dimension aux RH

Qu'est-ce que le Big


Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

GPEC

Exploiter et croiser plus de


sources de donnes

H@rp

Fidlisation des employs


Ciblage des candidats / impact
formation

Explication de labsentisme / sant


Rsolutions de conflits
Satisfaction au travail
Corrlation de la performance et la
17
structure dune unit

De nouvelles ambitions
CEB indique dans son tude de 2012 que 77 % des professionnels RH ne
savent pas valuer limpact du potentiel des salaris de leur entreprise sur ses
rsultats financiers.
Qu'est-ce que le Big
Data?

Enjeux stratgiques

Le gain de productivit d au Big Data pour les services RH slverait


environ 70% et permettrait ainsi de traiter plus de sujets pour une meilleure
connaissance des collaborateurs.

Enjeux
technologiques

Anticiper
Big Data et RH

Scuriser
Annexe

Valoriser
18

Lexemple du recrutement
Les premiers acteurs RH avoir utilis le Big Data sont les sous-traitants RH
souhaitant amliorer le recrutement:
Dmultiplication les sources dinformations :
Qu'est-ce que le Big
Data?

Paye par action/motif sur une historique complet par collaborateur


Analyse des demandes de recrutement trop rcurrente sur certains postes

Enjeux stratgiques

Enjeux
technologiques

Analyse des CV et banques externes (yc monster)

Modlisation du parcours de recrutement permettant dviter les erreurs


de recrutement.
En complement le Big Data leur a permis de dvelopper :

Big Data et RH

Annexe

une expertise sur les donnes collectes pour rpondre leurs clients
Une offre de services et de conseil forte valeur ajoute complmentaire la
sous-traitance

19

Lexemple de la gestion des


comptences
Prvoir lvolution des mtiers de lentreprise et des effectifs en
croisant des donnes concernant tout type dinformation :
Qu'est-ce que le Big
Data?

La stratgie de lentreprise => secteurs, marchs, technologies


Les comptences prsentes aujourdhui

Enjeux stratgiques

Les formations internes et externes => dures, cots,


Les cots RH => recrutements, salaires,

Enjeux
technologiques

Big Data et RH

Le Big Data leur a permis de concevoir un plan de maintient des


effectifs et de prvision des comptences ncessaire dans le futurs
Prvoir les campagnes de recrutement, de formation
Accompagner les salaris vers de nouveaux challenges

Annexe

Chiffrer ces volutions

20

Dfinition
autres notions
Autour du Big Data, on trouve galement les termes :
Qu'est-ce que le Big
Data?

Open Data : solution visant rendre accessibles tous des bases


de donnes, s'appuyant sur le participatif et la transparence.

Enjeux stratgiques

Little Data: parfois utilis pour permettre aux entreprises qui


nauraient pas les 3V pour utiliser les technologies Big Data

Enjeux
technologiques

Smart Data: Extraire parmi lensemble des donnes du Big Data


les donnes intelligentes permettant de piloter vos activits
nouvelle expression synonyme de Business Intelligence.

Big Data et RH

Annexe

Attention ne pas tre confront au final au Bad Data!


21

Thmatiques RH

Qu'est-ce que le Big


Data?

Enjeux stratgiques

Enjeux
technologiques

Big Data et RH

Annexe

Quelles variables expliquent la performance dune unit daffaire


ou dune quipe ?
Quelles variables expliquent les statistiques obtenues en sant,
en scurit, en absentisme, les plaintes clients, la fidlisation
des clients, les ventes ?

Quels profils et quelles comptences prdisent le mieux la


fidlisation demploys et la performance des employs et des
candidats?
Quels managers gnrent les meilleurs rsultats en terme de
civilit organisationnelle, de rsolutions de conflits, de rglement
de plaintes, de satisfaction au travail, de promotion ou de
dpart?
Quelle initiative de formation a eu le meilleur impact ?

Quelles statistiques influencent le plus la profitabilit et la


croissance de lentreprise ?
22

Rfrences bibliographiques

Qu'est-ce que le Big


Data?

Enjeux stratgiques

http://www.forbes.com/sites/gilpress/2013/05/09/a-veryshort-history-of-big-data/
http://www.martinhilbert.net/WorldInfoCapacityPPT.ht
ml

Cabinets conseils Big Data:


Enjeux
technologiques

Big Data et RH

IDATE
DATA&DATA Consulting

Enqute IBM Big Data 2012


Annexe

23

MERCI

www.axiodis.com

Vous aimerez peut-être aussi