Vous êtes sur la page 1sur 35

Oddo BI solution

Big Data Mining

Hazem Ben Sassi


Alaeddine Ghrab
Arwa Chettaoui
Ramzi Fennira
MedAmine Jebari

Plan

Introduction
Big Data
Big Data Mining
Besoins dODDO
Outils
Solutions et analyses
Conclusion
2

Introduction
Big Data
ou
volumes
massifs de
donnes.

90%
cres les
deux
dernires
annes.

Des
donnes
qui
provienne
nt de
partout

2,5
trillions
doctets
de
donnes
par jour

Big Data
Volum
e

Vraci
t

Varit

Vlocit

Big Data
Volume
Les entreprises sont submerges de volumes de
donnes croissants de tous types, qui se comptent en
traoctets, voire en ptaoctets.
Transformer les 12 traoctets de Tweets crs
quotidiennement en analyse pousse des opinions sur
un produit
Convertir les 350 milliards de relevs annuels de
compteurs afin de mieux prdire la consommation
d'nergie

Big Data
Varit
le Big Data se prsente sous la forme de donnes
structures ou non structures.
Utiliser les centaines de flux vido des camras de
surveillance pour contrler les points d'intrt
Tirer parti de la croissance de 80 % du volume de
donnes image, vido et documentaires pour amliorer
la satisfaction client

Big Data
Vlocit
Parfois, 2 minutes c'est trop. Pour les processus
chronosensibles tels que la dtection de fraudes, le Big
Data doit tre utilis au fil de l'eau, mesure que les
donnes sont collectes par votre entreprise afin d'en
tirer le maximum de valeur.
Exploiter 5 millions d'vnements commerciaux par jour
afin d'identifier les fraudes potentielles
Analyser en temps rel 500 millions denregistrements
dtaills dappels quotidiens

Big Data
Vracit
1 dcideur sur 3 ne fait pas confiance aux donnes sur
lesquelles il se base pour prendre ses dcisions.
Comment pouvons-nous nous appuyer sur l'information
si vous n'avez pas confiance en elle?
Etablir la confiance dans les Big Data reprsente un dfi
d'autant plus important que la varit et le nombre de
sources augmentent.

Big Data Mining

Data mining

Big Data Mining


Prsentatio
n PPT

Docume
nt word

Documen
t PDF

Emails

10

Big Data Mining


Le Text mining sert:
classifier automatiquement des documents
avoir un aperu du contenu dun document sans le lire
alimenter automatiquement des bases de donnes
faire de la veille sur des corpus documentaires importants
enrichir lindex dun moteur de recherche pour amliorer
la consultation des documents

11

Besoins dODDO

Le comportement
du client
Lefficacit
des
campagne

Performance
Email
Collecte
des
fonds

Variation
des
produits

Application
mobile

12

Outils

Hadoop est un framework libre et open source crit en Java


destin faciliter la cration d'applications distribues au niveau
du stockage des donnes et de leurs traitement.
Le noyau d'Hadoop est constitu d'une partie de stockage: HDFS
(Hadoop Distributed File System), et une partie de traitement
appel MapReduce.
Le terme Hadoop se rfre aussi son cosystme et
l'ensemble des logiciels qui viennent s'y connecter comme
Cloudera

13

Outils

La firme Cloudera se consacre au dveloppement de logiciels


fonds sur Apache Hadoop, permettant l'exploitation de Big Data,
savoir des bases de donnes accumulant plusieurs ptaoctets.

14

Outils

R est un langage de programmation dont le but est de pouvoir traiter et


organiser des jeux de donnes afin de pouvoir y appliquer des tests
statistiques plus ou moins complexes et se reprsenter ces donnes
graphiquement l'aide d'une grande varits de graphiques disponibles.

15

Outils

RStudio est un environnement de dveloppement multiplateforme


gratuit, libre et open source pour R, un langage de programmation utilis
pour le traitement de donnes et lanalyse statistique.

16

Outils

QDA Miner est un logiciel danalyse qualitative conu pour la recherche


avec mthodes mixtes. la fois convivial et facile utiliser, il permet le
codage, lannotation, lexploration et lanalyse de petites et de grandes
quantits de documents et dimages.

17

Outils

18

Outils

19

Outils

20

Outils

21

Solutions et analyses

22

Solutions et analyses

23

Solutions et analyses

24

Solutions et analyses

25

Solutions et analyses

26

Solutions et analyses

27

Solutions et analyses

28

Solutions et analyses

29

Solutions et analyses

30

Solutions et analyses

31

Solutions et analyses

32

Solutions et analyses

33

Solutions et analyses

34

Conclusion
Elargir la vision avec le BIG DATA et le Data Mining:

35