Vous êtes sur la page 1sur 17

Big Data As A Service

(BDaas)

Réalisé par :
Marwa Mhamdi
Sassi ines
Plan
Introduction
Introduction

Big Data
Big Data

Big Data as a service


Big Data as a service

Haas
Haas

Avantages et Inconvénients
Avantages et Inconvénients

Conclusion
Conclusion
Introduction

Le Big Data est devenu aujourd’hui une réalité pour de nombreuses
organisations. En effet, de plus en plus d’entreprises disposent de masses
de données provenant de multiples sources internes ou externes
(capteurs, réseaux sociaux, transactions en ligne, interactions et traces
laissées sur le Web…).

 Ces données sont hétérogènes, évolutives et engendrent des volumétries


importantes.

3
Big Data

BIG DATA:
 Signifie mégadonnées, grosses données ou encore données massives.
Permet aux entreprises d'analyser rapidement un volume de données très
important et d'obtenir une vue synoptique.
En mixant intégration de stockage, analyse prédictive et applications, le Big
Data permet de gagner en temps, en efficacité et en qualité dans
l’interprétation de données.
le Big Data sera un outil majeur à la fois pour la prise de décisions et
l'optimisation de la compétitivité au sein des entreprises.

4
Big Data

Les caractéristiques du Big Data :


Le Big Data se caractérise par la problématique des 3V :
Vélocité : la vitesse à laquelle les données sont traitées simultanément
 Variété : l'origine variée des sources de données qui arrivent non structurées
(formats, codes, langages différents...)
 Volume : le poids total des données collectées

5
Big data as a service

BIG DATA AS A SERVICE:

(BDaaS) sont la fourniture d' outils d' analyse statistique ou


d'informations par un fournisseur externe qui aide les entreprises à
comprendre et à utiliser les connaissances obtenues à partir de grands
ensembles d'informations afin d'obtenir un avantage concurrentiel .

6
Types de Bdaas

Core
 Performances
 Fonctionnalités
BDaaS BDaaS
intégrée. Le
combine
BDaaS
BDaaS
BDaaS utilise
fourni une
intégré des
n'a
l’infrastructure
infrastructure
possibilités
pas encore été dede base
offert,
hdoop
mais
définition
mais inclut
de base avec
il comprendrait
des
l'utilisation
d'application
applications
théoriquement enà de
la
stockage
provisoire
fonction
fois des des telles
d'autres
besoins
que
les
logiciels
de tâches
moteurs
performances et matériels
deet des
traitement
(par
particulières.  Par
exemple,
fonctions BDaaS afin
NoSQL,d'Amazon
Altiscale)
exemple,
de permettre les
afinoffres
des
tels
d'optimiser
d'écosystèmes
que YARN. Une
performances les de
technologie
performances
Hadoop
maximales sonttout
complète
à des
en
de
fins
raffinées
base
spécifiques:
soutenant BDaaS
avec
les leest
Amazon
augmenter
logiciel IaaS
propriétairesElastic
MapReduce
l'évolutivité
d'Amazon
d'entreprise. ouet
(EMR).
le
potentiel
Google.
.
informatique à des Four Big Data as a Service Business model
coûts prévisibles.

7
Big Data as a service
Pourquoi BDaaS est-il utile?
 L'externalisation ou la virtualisation de vos activités d'analyse
impliquant de grands ensembles de données présente plusieurs avantages.

 La popularité de Hadoop a dans une certaine mesure démocratisé le


Big Data - tout le monde peut utiliser du matériel standard et des logiciels
open source bon marché pour analyser des données.

8
Map Reduce
MapReduce est une technique de traitement et un modèle de programme
pour l'informatique distribuée basée sur Java. 
L'algorithme MapReduce contient deux tâches importantes, à savoir Map et
Reduce. 
Map prend un ensemble de données et le convertit en un autre ensemble de
données, où les éléments individuels sont décomposés en tuples (paires clé /
valeur). 
Deuxièmement, réduire la tâche, qui prend la sortie d'une carte comme une
entrée et combine ces tuples de données dans un ensemble plus petit de
tuples. Comme l'indique la séquence du nom MapReduce, la tâche de
réduction est toujours effectuée après le travail de carte.
9
Map Reduce
L'algorithme de Map Reduce
Le programme MapReduce s'exécute en trois étapes, à savoir l'étape de la carte,
l'étape de lecture aléatoire et l'étape de réduction.

Étape de la carte :
Le travail de la mappe ou du mappeur consiste à traiter les données
d'entrée. 
Généralement, les données d'entrée sont sous la forme d'un fichier ou d'un
répertoire et sont stockées dans le système de fichiers Hadoop (HDFS). 
Le fichier d'entrée est transmis à la fonction de mappage ligne par ligne. 
Le mappeur traite les données et crée plusieurs petits blocs de données.

10
Map Reduce
L'algorithme de Map Reduce

Etape Réduire  :
Cette étape est la combinaison de l' étape de lecture aléatoire et de l' étape
de réduction . 
Le travail du réducteur consiste à traiter les données provenant du mappeur. Aprè
le traitement, il produit un nouveau jeu de sortie, qui sera stocké dans le HDFS.

Au cours d'un travail MapReduce, Hadoop envoie les tâches Map et Reduce aux
serveurs appropriés du cluster.
Le framework gère tous les détails de la
transmission des données tels que l'émission de
tâches, la vérification de l'achèvement des
tâches et la copie des données autour du cluster
11
entre les nœuds
Map Reduce
L'algorithme de Map Reduce

Le framework gère tous les détails de la transmission des données tels que
l'émission de tâches, la vérification de l'achèvement des tâches et la copie des
données autour du cluster entre les nœuds

La majeure partie de l'informatique a lieu sur des noeuds avec des données sur
des disques locaux qui réduisent le trafic réseau

Une fois les tâches données terminées, le cluster collecte et réduit les données
pour former un résultat approprié et les renvoie au serveur Hadoop.

12
Haas
Hadoop en tant que service (HaaS)

 Hadoop en tant que service (HaaS), également connu sous le nom de Hadoop
dans le cloud, est un framework d' analyse de données volumineuses qui stocke
et analyse les données dans le cloud à l' aide de Hadoop.
Facilite l'approche des applications et des projets Big Data.

13
HaaS
Les options du (HaaS)
connecteur
Amazon
connecteur Google
EMR
Google Cloud Storage pour Hadoop 
Amazon EMRCloud Storage pour Hadoop  CenturyLink
 fournit un Rackspace 
Rackspace 
environnement Hadoop CenturyLink
Sahara
Sahara
 fournit
vous
vous un
pouvez
pouvez environnement
exécuter
exécuter des
des Hadoop
travaux
travaux MapReduce
MapReduce directement
directement
offre
offreplusieurs options pour     fournit une
unecapacité de
detraitement
géréplusieurs
géré pour optionsetet
pourdistribuer
distribuer pour
traiter
traiterde
de lelefournisseur
 fournit
fournisseur de
deservices
capacité de
decloud,
traitement
services cloud,
exécuter
sur les
exécuter
grandes Apache
données
Apache deHadoop.
Google
deHadoop.
quantités de Cloud Storage, sans de données
copier sur élastique
le (EDP)
sur les données
grandes quantités dedonnées
Google Cloud
données sur
surStorage, sans
aasix
de données
copier leélastique (EDP)
surHadoop.
plans
des instances Amazon EC2. six plans Hadoop.
disquedes instances
local et Amazon
exécuter EC2.
disque local et exécuter Hadoop Distributed FileSystem
Hadoop Distributed File System
(HDFS).
(HDFS).
 Skytap CSC 
CSC 
Aleron 
Aleron   Skytap
 offre     lele grand
grand intégrateur
intégrateur , , propose
propose lala
 offredes
desenvironnements
environnementsvirtuels
virtuels
fait
faitlalapromotion
promotion d'une
d'une
dans gamme
gamme
lesquels de
de pouvez
vous plateforme
plateforme Big Big Data
Data en en tant
tant que
dans Gold
lesquels
Gold Coast 
vous
Coast  pouvezcréer,
créer, que
déployer et supprimer des service
instances (BDPaaS).
combine
services
combine
servicesdes services
Big
desBigData,
services de
y développement
compris
déployer et
Data, ydecompris des
supprimer
développement
des d'applications et(BDPaaS).
des service
d'applications
instances et de
de
conseil --aidant les Hadoop
clients si
clientsààsinécessaire
optimiser Cloudera
Cloudera.sur
conseil
offres aidantsur
axées
Hadoop
lesHadoop. nécessaire
optimiser .surAmazon
Amazon
Web offres
WebServices axées
Services sur Hadoop.

14
Avantages et inconvénients
Avantage Inconvénient
Cloud Infrastructure permet l'instanciation de exigences en matière de
l'infrastructure informatique connaissances en
et détermine les capacités infrastructure - défi
de l'infrastructures concernant l'expertise.
Gestion des données accès direct aux données et en programmation de
d'analyse et de gérer connaissances - un défi
complexes des données nd'expertise
Analyse des données accéder aux services aucun accès direct aux
d'analyse sans avoir à traiter services de données et
les sphères de données ou d'analyse n'est limité aux
de programmation des données qui se trouvent
infrastructures BDaaS dans la couche d'analyse de
données
Sécurité la responsabilité des une manipulation potentielle
problèmes de sécurité est négative des données par
transmise au fournisseur des des parties externes - peut
services influencer la croissance de
l'entreprise 15
Conclusion

L'idée de Big Data as a Service est solide avec beaucoup plus de potentiel de

croissance que les entreprises exploitent l'importance des Big Data pour leurs

objectifs d'affaires. Les services BDaaS seront inestimables, en particulier pour les

entreprises qui ne peuvent pas se permettre de mettre en place leur propre

infrastructure de Big Data et d'analyse, leur offrant une chance de récolter les

bénéfices avec leurs homologues.

16
17

Vous aimerez peut-être aussi