Académique Documents
Professionnel Documents
Culture Documents
Mahdia
Département: Technologies de
l’informatique
Chapitre 01 Chapitre 02
01 Introduction au
Big Data
03 Hadoop et Map-
Reduce
Chapitre 03 Chapitre 04
Domines
02 Les bases de
données NoSQL
04 d’application du
big data
0
PLAN
Approche
Historique Big Data: traditionnelle
& Définition Caractéristiques vs Approche
Contexte Big data
L’évolution du SI amène les entreprises à traiter de plus en plus de données issues de sources
toujours plus variées .
Les prévisions de taux de croissance des volumes de données traitées dépassent les limites des
technologies traditionnelles.
Croissance de la quantité des données exponentielle
La quantité de données digitales produites double tous les 2 ans.
Historique On parle de pétaoctet (billiard d’octets) voir de zettaoctet (trilliard d’octets).
et
Contexte
03
02 04
05
3
1/3 des Chefs d’entreprise prennent fréquemment
des décisions basées sur des informations en
lesquelles ils n’ont pas confiance, ou qu’ils n’ont pas
Historique
et
• 1/2 Chefs d’entreprise disent qu’ils n’ont pas accès
Contexte aux informations dont ils ont besoin pour faire leur
travail
Historique Les données massives sont le résultat de la rencontre de trois éléments essentiels qui
et sont:
Contexte
• Internet
• Les réseaux sociaux
• Les appareils intelligents: les ordinateurs, les tablettes,
03 les smartphones, les
objets connectés
L’internet permet la transmission de l’information quelle que soit sa forme sur les
appareils intelligents:
02création de données 04
Appareils intelligents:
Utilisateurs des réseaux sociaux: consommateur
Internet: vecteur de transmission
05
5
Challenges
Historique
et
Contexte
? Réunir un grand volume de données variées pour trouver de nouvelles idées
? Difficulté pour sauvegarder toutes ces données03
05
6
Quelle solution pour exploiter ces données
1To
2000: Présentation des 1ers modèles de données dynamiques lors d’une
conférence
02 « économétrie » 04
1Go
1998: 1ères estimations de croissance et volumétrie des données internet
1997: 1ère utilisation du terme ‘Big Data’ lors d’une conférence informatique
05
1996: sauvegarder sur support électronique coûte moins cher que l’archivage papier
7
Le big data a pris naissance dans un contexte particulier;
Avec l’explosion des usages digitaux, des objets connectés, les internautes-
consommateurs partagent de plus en plus d’informations et laissent sur la toile de plus
en plus de traces;
Les outils traditionnels de gestion de données ont vite été débordés par cet afflux de
données différentes
Big Data:
Definitions
Initialement, le phénomène Big Data a été exploité et développé par des sociétés comme
Yahoo, Google, Amazon, Facebook, qui offrent à leurs internautes la possibilité de
bénéficier de services gratuits en échange d’informations personnelles
03
8
Big data is high volume, high velocity, and/or high variety information
assets that require new forms of processing to enable enhanced decision
making, insight discovery and process optimization.
Big Data:
Definitions
Le big data ou mégadonnées parfois appelées données massives, désignent des
ensembles de données devenus si volumineux qu'ils dépassent l'intuition et les
capacités humaines pour les analyser et même celles des03outils informatiques
classiques de gestion de base de données ou de l'information.
05
9
Autour du Big Data, on trouve également les termes :
Open Data : solution visant à rendre accessibles à tous des bases de données,
s'appuyant sur le participatif et la transparence.
Big Data: Little Data: parfois utilisé pour permettre aux entreprises qui n’auraient pas les 3V
Definitions
pour utiliser les technologies Big Data
Smart Data: Extraire parmi l’ensemble des données du Big Data les données
03
“intelligentes” permettant de piloter vos activités… nouvelle expression synonyme
de Business Intelligence.
02 04
Attention à ne pas être confronté au final au Bad Data!
05
10
Les 3Vs (Gartner 2001)
02 04
La vitesse à laquelle les données sont
traitées simultanément
05
11
Les 3Vs (Gartner 2001)
Volume
(Volume)
Big Data:
Caractéristiques
05
12
Les 3Vs (Gartner 2001)
Variété
(Variety)
Big Data:
Caractéristiques
Traitement des données sous forme structurée (bases de données structurée, feuilles de
calcul venant de tableur, …) et non structurée (textes, sons, images, vidéos, données de
capteurs, fichiers journaux, medias sociaux, signaux,…) qui doivent faire l’objet d’une analyse
collective.
Données sous plusieurs formats et types 03
On veut tout stocker:
Exemple: pour une discussion dans un centre d’appel, on peut la stocker sous forme textuelle
pour son contenu, comme on peut stocker l’enregistrement en entier, pour interpréter le ton de
voix du client
Certaines données peuvent 02paraître obsolètes, mais sont04utiles pour certaines décisions:
Exemple: Pour le transport de marchandise, on a tendance à choisir le camion le plus proche.
Mais parfois, ce n’est pas la meilleure solution. D’autres problèmes peuvent intervenir. Besoin de
: Données GPS, Plan de livraison du camion, Circulation, Chargement du camion, Niveau
d’essence… 05
13
Les 3Vs (Gartner 2001)
Vitesse
(Velocity)
Big Data:
Caractéristiques
02 04
05
14
Les 4Vs (IBM 2012)
Big Data:
Caractéristiques
Volume Variété
(Volume) (Variety)
Véracité
03 (Veracity)
Vitesse
(Velocity)
02 04
05
15
Les 4Vs (IBM 2012)
Véracité
(Veracity)
Big Data:
Caractéristiques
Le V le plus important
Il faut transformer toutes les données en valeurs exploitables:
les données sans valeur sont inutiles Volume Variety
Atteindre des objectifs stratégiques de création de valeur pour Velocity
les clients et pour l’entreprise dans tous les domaines 03
d’activité
La démarche Big Data n’a de sens que pour atteindre des Veraci
objectifs stratégiques de création de valeur pour les clients et ty
pour l’entreprise; dans tous les domaines d’activité :
commerce, industrie, services
02 … 04
Le succès d’un projet Big Data n'a d'intérêt aux utilisateurs que
s'il apporte de la valeur ajoutée et de nouvelles connaissances.
05 Value
17
Pour Conclure Avec les 5Vs
05
18
Approche traditionnelle Les besoins métier guident la conception de la
solution
Analyse structurée et répétée
Le responsable métier
définit les besoins :
Quelles questions doit-on
poser?
Approche
traditionnelle Appropriée pour:
vs Approche
Big data
Des données structurées
IT conçoit une solution avec Opérations et processus
un ensemble de structures
et fonctionnalités répétitifs
03 Sources relativement
De nouvelles stables
exigences
nécessitent une Besoins bien compris et
nouvelle bien cadrés
conception et
construction
02
Le responsable métier exécute
les requêtes pour répondre aux
questions – encore et encore
05
19
Approche Big Data Les sources d’information guident la découverte créative
03
De nouvelles idées
conduisent à 02 IT fournit une plateforme
l’intégration de qui permet une exploration
technologies créative de toutes les
traditionnelles données disponibles
Le responsable métier
05 détermine les
questions à poser en explorant
les données et relations entre
elles
20
La Fusion de l’approche traditionnelle avec l’approche
Big Data
La question n’est pas :
Approche
traditionnelle
vs Approche
Big data Dois-je choisir entre l’approche classique et
l’approche Big Data?
03
Mais plutôt:
05
21
La Fusion de l’approche traditionnelle avec l’approche
Big Data
Entrepôt de Plateforme
Approche
données Big Data
traditionnelle
vs Approche
Big data
03
Intégration
02
Sources Plateforme
traditionnelles 05 Big Data
22
La Fusion de l’approche traditionnelle avec l’approche
Big Data
Approche Traditionnelle Approche Big Data
Analyse Structurée et Répétée Analyse Itérative et
Approche
traditionnelle
Exploratoire
vs Approche Responsables IT
Responsables
Big data Fournissent une
Métier
plateforme pour
Déterminent
permettre la
quelles découverte
questions poser
VS
03 créative
Responsables
Responsables IT
Métier
Structurent les 02 Explorent la
données pour
plateforme pour
répondre à ces
questions déterminer quelles
questions poser
05
23