Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Supervision de l’activité
Optimisation de l’activité
Gestion des ressources humaines
Améliorer la qualité des produits ou services
Attirer plus de clients
Améliorer la fidélisation des clients
Des campagnes marketing plus efficaces
Identification des perspectives
6
Impacts économique dans l’organisation
Ventes et marketing :
Acquérir plus de clients
Retenir les clients existants
Augmenter le panier d’achat et le trafic en magasin
Optimiser la tarification et le rendement
Améliorer l’efficacité et la publicité
7
Impacts économique dans l’organisation
Opérations :
Optimiser la performance du réseau
Prévoir les problèmes de maintenance
Prévoir l’utilisation/capacité
Augmenter les taux de service
Réduire les ruptures de stock
Consolider les fournisseurs
8
Exercices
Donner des exemples concret d’utilisation et/ou exploitation des technologies Big Data
chez les entreprises et organisation moderne ?
9
Enjeux de Big data
Quelles sont les approches à suivre pour assurer les enjeux du big data dans l’entreprise
?
Quelles sont les solutions à faire pour assurer la qualités de données massives ?
Quelles sont les solution à faire pour assurer une bonne gestion de données massives ?
Quelles sont les solution à faire pour choisir la bonne architecture de traitement Big Data ?
12
Gouvernance des données
Data Lineage est un processus qui vise a fournir une cartographie du système
d'information. Il permet une visualisation du cycle de vie de la donnée en vue de
répondre aux questions suivantes :
De quelle source provient cette donnée? Quelles transformations a-t-elle subies?
16
Sécurité des données - Apache Ranger
Apache Sentry est un système permettant d'appliquer une autorisation basée sur des
rôles avec une fine granularité aux données et métadonnées stockées sur un cluster
Hadoop
Permet de définir des règles d'autorisation pour valider les demandes d'accès d'un
utilisateur ou d'une application aux ressources Hadoop
18
Sécurité des données - Kerberos
L’un des enjeux Big Data est l’optimisation de traitement des données à travers la mise en
place de l’architecture Big Data adéquat qui répond aux besoins de l’entreprise
Le Big Data oblige les entreprises à adapter leurs systèmes existants (BI classique) pour
pouvoir effectuer l’ingestion, le traitement et l’analyse des données volumineuses
Mettre en place la bonne architecture qui permet de manager, traiter et stocker de Big Data
Adapter la structure de l’écosystème informatique traditionnel et mettre en place une
architecture Big Data
21
Pourquoi une architecture Big Data ?
La plupart des architectures Big Data incluent tout ou partie des éléments suivants :
Source de données (base de données relationnel, fichiers, data mart, data warehouse, cloud, web)
Stockage (magasin de données, data lake)
Batch processing (traitement par lots)
Stream processing (traitement de flux de data)
Préparation de données
Data catalog
Modélisation de données
Technologie d’orchestration
En fonction du type d’architecture choisi et adopté, certaines de ces composantes seront
absentes, mutualisées ou combinées dans la structure
23
Architectures Big Data
Pour effectuer des traitements Big Data, beaucoup d’architectures sont mis en place
Architecture Lambda
Architecture Kappa
Architecture Zeta
Architecture SMACK
24
Architecture Lambda
Hadoop n'est pas capable de traiter un grand volume de données qui doit satisfaire une
faible latence, même en ajoutant d'autres serveurs de calcul
l'architecture Lambda crée par Nathan Marz réponds aux limite de Hadoop en
fournissant un modèle de traitement Big Data presque temps réel
25
Architecture Lambda
L’architecture lambda garantit l'équilibre entre la tolérance aux pannes, les contraintes
de latence (lecture/écriture) et le débit des disques durs
Basé à la fois sur les traitements batch qui fournissent des vues batch et les traitements
temps réel qui fournissent des vues streaming, puis les joint avant leur présentation
26
Architecture lambda
Créée par Jay Kreps en se basant sur ses expériences chez LinkedIn et son retour
d'expérience de l'architecture Lambda, dans un article : « Questioning the Lambda
Architecture »
l'architecture Kappa, permet de simplifier l'architecture Lambda, en fusionnant la couche
batch et la couche streaming
L'architecture Kappa n'est pas destinée au stockage des données, mais uniquement à
leur traitement
28
Exercices
Qui est le responsable de la mise en place d’architecture Big Data dans un projet big data
?