Académique Documents
Professionnel Documents
Culture Documents
LSI– 2023/2024
Faculté des Sciences et Techniques de Tanger
Département Génie Informatique
Plan du cours
• Introduction: Fondements de BIG DATA
L’Ingénierie ontologique et les techniques d’Intelligence Artificielle pour la modélisation d’un système e-
• Cours1: Ecosystème Hadoop
Learning adaptatif orienté compétences
• Cours2: HDFS (Hadoop Distributed File System)
• Cours3: Map Reduce
• Cours4: YARN (Yet Another Resource Negociator)
• Cours5: Spark
• Cours6: SGBD No SQL (Hbase, Hive, Impala ...)
LSI– 2023/2024
Faculté des Sciences et Techniques de Tanger
Département Génie Informatique
LSI– 2023/2024
Faculté des Sciences et Techniques de Tanger
Département Génie Informatique
LSI– 2023/2024
Introduction
VOLUMES
Chaque jour, 2,5 trillions d’octets de données sont générés.
Prévision d’une croissance de 800% des quantités de données à traiter d’ici
à 5 ans.
DIVERSITE DES SOURCES
capteurs, medias sociaux, images, vidéos, achats en lignes, signaux GPS …
6
CH1 Introduction et fondamentales de Big Data
1 in 2 83%
les chefs d'entreprise n'ont 83% des PDG ont cité BI et
pas accès aux données analytics dans le cadre de leur
dont ils ont besoin plan visionnaire
7
CH1 Introduction et fondamentales de Big Data
1 in 5
L'information
médicale double un diagnostic estimé inexact ou
tous les 5 ans, dont incomplet
une grande partie
est non structurée 1.5 million
des erreurs dans la façon dont les
81% des médecins médicaments sont prescrits, délivrés et
déclarent passer 5 pris aux États-Unis chaque année
heures ou moins Entre 44,000 et 98,000
par mois à lire des
revues médicales Nombre d'Américains qui meurent
chaque année d'erreurs médicales
évitables dans les hôpitaux seulement
=> Adapter sa technologie ainsi que sa stratégie est aujourd’hui
indispensable
8
CH1 Introduction et fondamentales de Big Data
Migration et Changement
Data warehouse vers les Big Data
9
CH1 Introduction et fondamentales de Big Data
BI traditionnelle
10
CH1 Introduction et fondamentales de Big Data
11
CH1 Introduction et fondamentales de Big Data
Migration et Changement
12
CH1 Introduction et fondamentales de Big Data
13
CH1 Introduction et fondamentales de Big Data
14
CH1 Introduction et fondamentales de Big Data
Besoin en BIG DATA
15
CH1 Introduction et fondamentales de Big Data
16
CH1 Introduction et fondamentales de Big Data
ADAPTABILITE
18
CH1 Introduction et fondamentales de Big Data
19
CH1 Introduction et fondamentales de Big Data
20
CH1 Introduction et fondamentales de Big Data
• Les ETL peuvent générer du code qui sera traité par la plateforme “Big
Data”, afin d’exploiter la puissance de cette dernière.
21
CH1 Introduction et fondamentales de Big Data
• Ils existent également d’autres outils qui sont spécialisés pour certains
types d’analyse comme le text mining ou l’analyse des réseaux
sociaux.
22
CH1 Introduction et fondamentales de Big Data
Visualisation de DATA
23
CH1 Introduction et fondamentales de Big Data
24
CH1 Introduction et fondamentales de Big Data
BIG DATA?
BIG DATA?
BIG DATA?
27
CH1 Introduction et fondamentales de Big Data
28
CH1 Introduction et fondamentales de Big Data
29
CH1 Introduction et fondamentales de Big Data
BIG DATA?
30
CH1 Introduction et fondamentales de Big Data
BIG DATA: 3V
31
CH1 Introduction et fondamentales de Big Data
BIG DATA: 5V
32
CH1 Introduction et fondamentales de Big Data
BIG DATA?
33
CH1 Introduction et fondamentales de Big Data
BIG DATA?
The 42 V’s of Big Data and Data Science (2017)
34
CH1 Introduction et fondamentales de Big Data
Nous désirons traiter en temps réel les données relatives à un vol d’avion
entre 8h et 12h => traitement en temps (Streaming Kafka) => Tableau de
bord en temps réel
35
CH1 Introduction et fondamentales de Big Data
36
CH1 Introduction et fondamentales de Big Data
37
CH1 Introduction et fondamentales de Big Data
38
CH1 Introduction et fondamentales de Big Data
39
CH2 Architectures Big Data usuelles
40
CH2 Architectures Big Data usuelles
2 classes de traitement:
1. Batch: Les traitements vont analyser l’ensemble des données
disponibles à un instant T.
Tant que des données seront présentes les traitements vont se
poursuivre et l’on aura un résultat cohérent et accessible
uniquement à la fin des traitements.
41
CH2 Architectures Big Data usuelles
43
CH2 Architectures Big Data usuelles
2 : Temps Réel
2.1Micro-Batch:
Un résultat est produit toutes les n secondes.
EXEMPLE:
2.2 Streaming :
Chaque entrée est traitée immédiatement
et produit un résultat.
EXEMPLE :.
44
CH1 Introduction et fondamentales de Big Data
45
CH1 Introduction et fondamentales de Big Data
46
CH1 Introduction et fondamentales de Big Data
47
CH1 Introduction et fondamentales de Big Data
48
CH1 Introduction et fondamentales de Big Data
49