Vous êtes sur la page 1sur 20

Plan de cours

Chapitre01: Introduction à Big Data


Chapitre02: MapReduce
2.1. Pourquoi MapReduce?
2.2. Définition de modèle MapReduce
2.3. L’architecture de modèle MapReduce
Chapitre 03: Les plateformes de traitement des Big
Data
3.1. La plateforme Hadoop
3.2. La plateforme Spark
3.2.1. Motivation de Spark
3.2.2. Définition
3.2.3. Avantages de Spark/Hadoop2
Plan de cours
Chapitre04: Le stockage
4.1. Le stockage classique
4.2. Le stockage centralisé.
4.3. Le stockage centralisé et distribué.
4.4. Définition de Tachyon
Chapitre 05: L’infrastructure distribuée
5.1. Les grappes cluster
5.2. Les grilles
5.3. Les nuages

3
Université Benyoucef Benkhadda – Alger 1
Faculté des Sciences / Département MI

BIG DATA ANALYTICS

• Master 1 en Informatique
Présenté par: DR MEZZOUDJ Saliha
• Année Universitaire: 2021 – 2022
Pourquoi MapReduce?

• Les systèmes d’entreprise traditionnels disposent normalement


d’un serveur centralisé .pour stocker et traiter les données.
• Le modèle traditionnel et les serveurs de base de données
standard ne sont pas adapté au traitement de gros volumes de
données évolutives.
• Le système centralisé crée trop de goulot d’étranglement lors du
traitement simultané de plusieurs fichiers.

• Google a résolu ce problème du goulot d’étranglement à l’aide


de modèle MapReduce.

Vous aimerez peut-être aussi