Cours 5 Map Reduce

Transféré par

jiji31zeboudji

0% ont trouvé ce document utile (0 vote)

3 vues10 pages

map reduce

Titre original

Cours_5_Map_Reduce

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

map reduce

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

3 vues10 pages

Cours 5 Map Reduce

Transféré par

jiji31zeboudji

map reduce

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 10

Rechercher à l'intérieur du document

Big Data

Big Data& &

BI BI

L’Algorithme MapReduce
et framework Hadoop
2020/2021

Manel.laib113@gmail.com Mme ,
1/ Définition de MapReduce :
• MapReduce est un modèle de programmation créé
par Google pour manipuler et créer de grands
ensembles de données sur des groupes
d'ordinateurs. Il s'agit d'un composant essentiel du
cadre logiciel Apache Hadoop, qui permet la
gestion flexible et distribuée d'énormes ensembles
de données non structurés sur des clusters
d'ordinateurs, où chaque nœud dispose de son
propre espace de stockage. Concrètement, le cadre
fournit deux fonctions principales. Il répartit le
travail entre les différents nœuds du cluster (la
carte), puis les organise et réduit les résultats que
chaque nœud fournit en une réponse cohérente à
une requête. Ceci est rendu possible avec HDFS
MapReduce
2 /Les avantages de MapReduce :
• MapReduce fonctionne sur une large gamme d'appareils et est hautement évolutif. Il
peut être implémenté sous de nombreuses formes en utilisant différents langages de
programmation tels que Java, C # et C ++. Pour les développeurs novices, le cadre est
utile car les routines de la bibliothèque peuvent être utilisées pour créer des
programmes parallèles sans se soucier des connexions sous-blocs, de la surveillance
des tâches ou de la gestion des erreurs. Les programmeurs qui n'ont aucune
expérience des systèmes parallèles et distribués peuvent facilement utiliser les
ressources de grands systèmes distribués.
• Comme ils fonctionnent en parallèle sur d'énormes clusters, la taille des blocs n'a
aucun effet sur le traitement des données, car les tâches peuvent être réparties sur
n'importe quel nombre de serveurs. Il est également disponible en plusieurs
langages, notamment C, C ++, Java, Ruby, Pearl et Python.
• Les programmeurs peuvent également utiliser les bibliothèques MapReduce qui
reposent exclusivement sur Java 8 pour créer des tâches sans se soucier de la
communication ou de la coordination entre les nœuds.
Exemple :

• Par exemple, s’il est possible de compter manuellement le nombre de fois

qu’un mot apparaît dans un roman, cela prend beaucoup de temps. Si l’on
répartit cette tâche entre une vingtaine de personnes, les choses peuvent
aller beaucoup plus vite. Chaque personne prend une page du roman et écrit
le nombre de fois que le mot apparaît sur la page. Il s’agit de la partie Map de
MapReduce. Si une personne s’en va, une autre prend sa place. Cet exemple
illustre la tolérance aux erreurs de MapReduce. Lorsque toutes les pages sont
traitées, les utilisateurs répartissent tous les mots dans 26 boîtes en fonction
de la première lettre de chaque mot. Chaque utilisateur prend une boîte, et
classe les mots par ordre alphabétique. Le nombre de pages avec le même
mot est un exemple de la partie Reduce de MapReduce.

Vous aimerez peut-être aussi

SLA Marche A Suivre PDF
Document10 pages
SLA Marche A Suivre PDF
Ibrahim Bekkali
Pas encore d'évaluation
Big Data: Marie NDIAYE
Document11 pages
Big Data: Marie NDIAYE
Serigne Ndour
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
BIG DATA Et R
Document6 pages
BIG DATA Et R
Šməì Ĺĕ
Pas encore d'évaluation
Présentation D'HADOOP
Document38 pages
Présentation D'HADOOP
Ferdinand Owona
Pas encore d'évaluation
Hadoop Ecosystem
Document37 pages
Hadoop Ecosystem
hajar.filali4
Pas encore d'évaluation
CH 1
Document53 pages
CH 1
ya.latreche
Pas encore d'évaluation
(Big Data) CHAP3 - MapReduce
Document29 pages
(Big Data) CHAP3 - MapReduce
Mbarki Med Oussema
Pas encore d'évaluation
Chapitre 2 - Système Pig de Hadoop_Oct 2023
Document22 pages
Chapitre 2 - Système Pig de Hadoop_Oct 2023
Khalid Harrati
Pas encore d'évaluation
Chapitre 5 Big Data
Document6 pages
Chapitre 5 Big Data
SYRINE SDIRI
Pas encore d'évaluation
Juno SlidesCarnival
Document43 pages
Juno SlidesCarnival
Maria Boulefaa
Pas encore d'évaluation
Cours Intro Hadoop v27022014 Erraki Haddad
Document62 pages
Cours Intro Hadoop v27022014 Erraki Haddad
Zohra CHANNOUF
Pas encore d'évaluation
Leçon2 - Hadoop, MapReduce Et Le Big
Document52 pages
Leçon2 - Hadoop, MapReduce Et Le Big
Mido pro
Pas encore d'évaluation
Cour 9
Document7 pages
Cour 9
Ran Ia
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
CH 2 Hadoop
Document56 pages
CH 2 Hadoop
Rihane Farah
Pas encore d'évaluation
Résumé Big Data
Document6 pages
Résumé Big Data
El Moumne Nihal
Pas encore d'évaluation
Spark
Document28 pages
Spark
hajar.filali4
Pas encore d'évaluation
Big Data: Marie NDIAYE
Document28 pages
Big Data: Marie NDIAYE
Serigne Ndour
Pas encore d'évaluation
Big Data
Document10 pages
Big Data
Smaïl Ben
Pas encore d'évaluation
0162 Formation Dba Oracle 10g
Document98 pages
0162 Formation Dba Oracle 10g
Jeancy Grys Kalunga
Pas encore d'évaluation
Data Architect: Relevez Le Défi Du Big Data ! Concevez Des Infrastructures Pour Exploiter Des Données Massives
Document18 pages
Data Architect: Relevez Le Défi Du Big Data ! Concevez Des Infrastructures Pour Exploiter Des Données Massives
Wood Cherenfant
Pas encore d'évaluation
Partie Hadoop Et Ecosystème
Document93 pages
Partie Hadoop Et Ecosystème
Safa '
Pas encore d'évaluation
Haddop VF
Document126 pages
Haddop VF
Nour
Pas encore d'évaluation
Technologies Big Data: Zouhair Elamrani Abou Elassad
Document75 pages
Technologies Big Data: Zouhair Elamrani Abou Elassad
jon cina
Pas encore d'évaluation
Apache Spark
Document16 pages
Apache Spark
MOHAMED ELRHAOUAT
Pas encore d'évaluation
ch4 Mapreduce
Document16 pages
ch4 Mapreduce
Bedoui Mehdi
Pas encore d'évaluation
Chapitre 2 Hadoop-Part1
Document26 pages
Chapitre 2 Hadoop-Part1
souhail nahed
100% (1)
agEGext 2019 OPTD Sujet 02
Document17 pages
agEGext 2019 OPTD Sujet 02
amine samir
Pas encore d'évaluation
Application2 - Initiation Spark PDF
Document7 pages
Application2 - Initiation Spark PDF
Administration IHET
Pas encore d'évaluation
Leilclic 688
Document98 pages
Leilclic 688
Julius Socrate El-Gafir
Pas encore d'évaluation
Chapitre 2 - Programmation MapReduce
Document14 pages
Chapitre 2 - Programmation MapReduce
souhail nahed
Pas encore d'évaluation
Big Data
Document11 pages
Big Data
Salah
Pas encore d'évaluation
Poly Hadoop
Document19 pages
Poly Hadoop
Daignon Max Nicolas ATINDOKPO
Pas encore d'évaluation
Mbds Big Data Hadoop Cours 1
Document113 pages
Mbds Big Data Hadoop Cours 1
gridech
Pas encore d'évaluation
Exploitation Des Data Centers Et Cloud Computing
Document26 pages
Exploitation Des Data Centers Et Cloud Computing
christian raharinirina
Pas encore d'évaluation
Chap1-Big Data pour Entreprise et Ecosystème Hadoop_Oct 2023
Document37 pages
Chap1-Big Data pour Entreprise et Ecosystème Hadoop_Oct 2023
Khalid Harrati
Pas encore d'évaluation
4 - Chapitre 3.1
Document14 pages
4 - Chapitre 3.1
maryem.benali
Pas encore d'évaluation
Programmation Hadoop WordCount
Document18 pages
Programmation Hadoop WordCount
Hammami Mélek
Pas encore d'évaluation
64 Data Architect FR FR Standard
Document18 pages
64 Data Architect FR FR Standard
ali.hellouing
Pas encore d'évaluation
ST Tutor5 R Mapreduce
Document6 pages
ST Tutor5 R Mapreduce
Daignon Max Nicolas ATINDOKPO
Pas encore d'évaluation
Couche DB
Document19 pages
Couche DB
Améth Ndiaye
Pas encore d'évaluation
Resume Big Data
Document9 pages
Resume Big Data
Khaoula RAZZAKI
Pas encore d'évaluation
Hadoop (Rihab Chaouch Et Alaa El Ghoul
Document17 pages
Hadoop (Rihab Chaouch Et Alaa El Ghoul
Chaouch Mohamed Abd Salem
Pas encore d'évaluation
Chap4 MapReduce
Document17 pages
Chap4 MapReduce
mootaz haddad
Pas encore d'évaluation
BD2 - Cours 8 Et 9 v2
Document71 pages
BD2 - Cours 8 Et 9 v2
stephanie ngouladjo
Pas encore d'évaluation
Mémo Hadoop
Document1 page
Mémo Hadoop
adjemi_brahim
Pas encore d'évaluation
Formation Python Pour Le Big Data - Data Value
Document3 pages
Formation Python Pour Le Big Data - Data Value
Gael ODJO
Pas encore d'évaluation
NoSQLziad (1) - 1
Document34 pages
NoSQLziad (1) - 1
Dimokrati Houssam
Pas encore d'évaluation
Chapitre 2 Final FR
Document94 pages
Chapitre 2 Final FR
Äya Ķh
Pas encore d'évaluation
résBigData-2
Document11 pages
résBigData-2
Elleuch Mariem
Pas encore d'évaluation
Gschwend Matthieu 3 Presentation 012023
Document18 pages
Gschwend Matthieu 3 Presentation 012023
Sayoba Gansane
Pas encore d'évaluation
Cours SPARK REDUIT V Impression (3450) - 1
Document138 pages
Cours SPARK REDUIT V Impression (3450) - 1
Mohamed Elamri
Pas encore d'évaluation
OCTO Livre Blanc Hadoop 2015
Document86 pages
OCTO Livre Blanc Hadoop 2015
mypollux
Pas encore d'évaluation
Cours 02 Intro Hadoop
Document30 pages
Cours 02 Intro Hadoop
Michael Sniper Wu
Pas encore d'évaluation
Big Data: Marie NDIAYE
Document16 pages
Big Data: Marie NDIAYE
Serigne Ndour
Pas encore d'évaluation
Cluster Signifie Groupe Ou Grappe en Français Il Désigne
Document4 pages
Cluster Signifie Groupe Ou Grappe en Français Il Désigne
Dieumerci Makenga DM
Pas encore d'évaluation
Lec1,2,3 ch1,2
Document14 pages
Lec1,2,3 ch1,2
Mariam Kilany
Pas encore d'évaluation
Initiation à l'écosytème Hadoop
D'Everand
Initiation à l'écosytème Hadoop
Juvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5 (1)
Le Guide Rapide Du Cloud Computing Et De La Cybersécurité
D'Everand
Le Guide Rapide Du Cloud Computing Et De La Cybersécurité
Marcia R.t. Pistorious
Pas encore d'évaluation
La programmation en GDS
D'Everand
La programmation en GDS
Talek
Pas encore d'évaluation
Support de Cours N° 5 Du Module Management de La Qualité
Document5 pages
Support de Cours N° 5 Du Module Management de La Qualité
jiji31zeboudji
Pas encore d'évaluation
Chapitre III Ebanking
Document3 pages
Chapitre III Ebanking
Ėlena Såī
Pas encore d'évaluation
Le Processus de Recrutement
Document7 pages
Le Processus de Recrutement
jiji31zeboudji
Pas encore d'évaluation
NAA 210 Accord Surlestermesdelamissionf
Document13 pages
NAA 210 Accord Surlestermesdelamissionf
Ghezali Maroua
Pas encore d'évaluation
3 Mise en Forme Du Diagramme de Gantt Et Du Réseau Pert
Document9 pages
3 Mise en Forme Du Diagramme de Gantt Et Du Réseau Pert
jiji31zeboudji
Pas encore d'évaluation
Dossier de Sponsoring
Document1 page
Dossier de Sponsoring
jiji31zeboudji
Pas encore d'évaluation
Le Management Des Ressources Humaines À L'ère de La Transformation Digitale
Document5 pages
Le Management Des Ressources Humaines À L'ère de La Transformation Digitale
jiji31zeboudji
Pas encore d'évaluation
Chapitre 1 Comptabilité Publique
Document74 pages
Chapitre 1 Comptabilité Publique
jiji31zeboudji
Pas encore d'évaluation
Chapitre 4
Document14 pages
Chapitre 4
jiji31zeboudji
Pas encore d'évaluation
Cours dAFCM S2
Document3 pages
Cours dAFCM S2
jiji31zeboudji
Pas encore d'évaluation
Les Opérations Sur Les Titres
Document6 pages
Les Opérations Sur Les Titres
jiji31zeboudji
Pas encore d'évaluation
Série AFC
Document4 pages
Série AFC
jiji31zeboudji
Pas encore d'évaluation
Résumé
Document5 pages
Résumé
jiji31zeboudji
Pas encore d'évaluation
NOSQL
Document23 pages
NOSQL
jiji31zeboudji
Pas encore d'évaluation
Cours Afc 2022
Document12 pages
Cours Afc 2022
jiji31zeboudji
Pas encore d'évaluation
Duolingo - Recherche Google
Document1 page
Duolingo - Recherche Google
Ismail Tchich
Pas encore d'évaluation
E-Commerce Et Developpement de La Ville de Bandundu. CT Bima Leminde Glody
Document22 pages
E-Commerce Et Developpement de La Ville de Bandundu. CT Bima Leminde Glody
Glody Bima
Pas encore d'évaluation
Squid Et GuardSquid
Document14 pages
Squid Et GuardSquid
SamiLouisse
Pas encore d'évaluation
Aller Plus Loin - Apprenez À Créer Votre Site Web Avec HTML5 Et CSS3 - OpenClassrooms
Document8 pages
Aller Plus Loin - Apprenez À Créer Votre Site Web Avec HTML5 Et CSS3 - OpenClassrooms
android itel
Pas encore d'évaluation
EBP Devis Facturation Guide
Document36 pages
EBP Devis Facturation Guide
rome220181
Pas encore d'évaluation
Fiche VoIP-IoT
Document8 pages
Fiche VoIP-IoT
Sebastien Bernard
Pas encore d'évaluation
POO C++ - 2 - OpenClassrooms
Document9 pages
POO C++ - 2 - OpenClassrooms
Josias Ndjiki
Pas encore d'évaluation
TP de Prise en Main Du STEP 7 Usthb
Document6 pages
TP de Prise en Main Du STEP 7 Usthb
Mį Ņā Řěť
Pas encore d'évaluation
T.P. Systèmes Distrubués - Master I Informatique
Document2 pages
T.P. Systèmes Distrubués - Master I Informatique
Ahlem Bennat
Pas encore d'évaluation
5 Projet HTML-css
Document2 pages
5 Projet HTML-css
flo bil
100% (1)
Comptage Temporaire Du Trafic Routier
Document76 pages
Comptage Temporaire Du Trafic Routier
SouFiane MansouRi
Pas encore d'évaluation
Caméra Autonome Solaire Connexion 4G Ou WiFi Enregistrement HD 1080P Détection PIR Serveur Cloud Ou MicroSDHC 64 Go
Document7 pages
Caméra Autonome Solaire Connexion 4G Ou WiFi Enregistrement HD 1080P Détection PIR Serveur Cloud Ou MicroSDHC 64 Go
marcus
Pas encore d'évaluation
Projection Orthogonale Dessin Technique PDF
Document2 pages
Projection Orthogonale Dessin Technique PDF
Brahim Tires
67% (3)
Ordonnancement Et Gestion Des Flux - Esith - 2019
Document115 pages
Ordonnancement Et Gestion Des Flux - Esith - 2019
Fatima Ezzahraa Nahid
Pas encore d'évaluation
Yozi Food Casablanca - Recherche Google
Document1 page
Yozi Food Casablanca - Recherche Google
wjr47snztg
Pas encore d'évaluation
Cet Article Vous Permettra de Bien Configurer Le Firewall Zone Alarm Pro
Document13 pages
Cet Article Vous Permettra de Bien Configurer Le Firewall Zone Alarm Pro
Sef SandMan
Pas encore d'évaluation
6 - Programmation - AS3, Partie 3
Document24 pages
6 - Programmation - AS3, Partie 3
Sher'ls Sheriff
Pas encore d'évaluation
Eds7-2 Qualite Energie
Document7 pages
Eds7-2 Qualite Energie
Messaoud Belazzoug
Pas encore d'évaluation
Exercices
Document9 pages
Exercices
Asmaa Marzak El Hanni
Pas encore d'évaluation
Commandes Windows
Document3 pages
Commandes Windows
FOOVI Komlan Mawuli
Pas encore d'évaluation
Automates Regul Temperature
Document10 pages
Automates Regul Temperature
Rabah Amidi
Pas encore d'évaluation
Instructions Mein Goethe Fr22
Document1 page
Instructions Mein Goethe Fr22
Fatma Gmati
Pas encore d'évaluation
Pygtk
Document109 pages
Pygtk
Salman Al Farisi
Pas encore d'évaluation
Recommandations Pédagogiques Pour La Mise en Œuvre Des Nouveaux Programmes As 2021
Document2 pages
Recommandations Pédagogiques Pour La Mise en Œuvre Des Nouveaux Programmes As 2021
Hm Walid
Pas encore d'évaluation
CV - HBA - Français - 3-12-19-Tech
Document2 pages
CV - HBA - Français - 3-12-19-Tech
amin
Pas encore d'évaluation
Stratégie Et Contrôle - Séance IV-Chapitre Introductif
Document29 pages
Stratégie Et Contrôle - Séance IV-Chapitre Introductif
Abdelaziz Moufakkir
Pas encore d'évaluation
Pense Bête DBA - Fiche 1
Document26 pages
Pense Bête DBA - Fiche 1
Moïse Kouadio
Pas encore d'évaluation
1.6. Pré-Requis. Installation de Maarch Sous Linux Et Windows. Sommaire. Environnement de La Machine D'installation
Document10 pages
1.6. Pré-Requis. Installation de Maarch Sous Linux Et Windows. Sommaire. Environnement de La Machine D'installation
Sabah El ghrissi
100% (1)
Ganttproject
Document8 pages
Ganttproject
Steph De
100% (1)