TD3 Big Data

Transféré par

Mohamed Sidi Brahim

0% ont trouvé ce document utile (0 vote)

89 vues2 pages

TD3 BIG DATA

Titre original

TD3 BIG DATA

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

TD3 BIG DATA

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

89 vues2 pages

TD3 Big Data

Transféré par

Mohamed Sidi Brahim

TD3 BIG DATA

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

TD n°3

Matière : Introduction au Big Data

Classe : 1ère année MPSD

Enseignant : Mohamed Anouar DAHDEH

Objectif : Maitriser l’algorithme MapReduce à travers une étude de cas

Etude de cas – Calcul d’une jointure entre deux tables:

Le calcul d’une jointure entre deux tables d’un modèle relationnel est opération
particulièrement gourmande en ressources. A tel point que certains modèles de données en
agrégats utilisés par certains systèmes NoSQL ont été conçus pour les éviter complètement dans
un Big data. On préfère dans ces situations colocaliser les données qui sont reliées dans un
seul et même enregistrement. Dans certains cas cependant l’algorithme MapReduce vient alors
à la rescousse à point nommé.
Rappelons qu’une jointure entre deux tables A et B, envisagé comme des listes
d’enregistrement, est définie par deux clés, une par table. Le résultat sera une nouvelle relation
dont les enregistrements sont obtenus en concaténant tous les couples formés d’un
enregistrement de A avec un enregistrement de B dont les deux clés coïncident (figure 2.1).

Figure 2.1- Jointure entre deux tables (employés et département), définie par un couple de clés

L’idée de base pour réaliser cette jointure avec MapReduce consiste à réaliser une opération
en apparence triviale avant même la phase de map, à savoir regrouper les enregistrements des
deux tables dans une seule longue liste d’enregistrement. De plus, pour chaque enregistrement,

1
on retiendra non seulement son contenu, mais également le nom de la table dont il est issu
(figure 2.2). Bien que logiquement séparée du reste du traitement, cette tâche pourra en fait être
prise en charge par les fonctions map elles-mêmes.

Figure 2.2- Regroupement des enregistrements dans une liste pour la fonction Map

La tâche d’une opération map est dès lors d’une simplicité enfantine : pour chaque
enregistrement en entrée, elle renverra un couple clé-valeur dont la clé est la clé de jointure et
la valeur est le contenu de l’enregistrement auquel on a adjoint le nom de la table originale.
Le framework regroupera ensuite en listes d’enregistrements intermédiaires les enregistrements
qui partagent une même clé de jointure. Chacune de ces listes est affectée ensuite à un reducer.
Une invocation d’opération reduce a pour tâche de produire la jointure proprement dite, c’est-
à-dire d’effectuer toutes les concaténations possibles d’un enregistrement de la table A avec un
enregistrement de la table B associées à une même valeur de clé de jointure
Travail demandé :

En se basant sur l’exemple de jointure de la table employés et département :

1- Donner le résultat de la fonction map qui retourne le contenu d’un enregistrement et le

nom de la table originale dans la valeur de retour. La clé est la clé de la jointure.
2- Donner les listes d’enregistrement intermédiaires résultat du shuffle
3- Donner le résultat de la fonction reduce qui produit toutes les concaténations voulues à
partir d’une liste d’enregistrement intermédiaires résultat du shuffle. Pour chaque
valeur de clé de jointure, elle produit la liste des concaténations des couples
d’enregistrements associés à cette clé

Vous aimerez peut-être aussi

Administration Et Hebergement Web
Document5 pages
Administration Et Hebergement Web
Tagne Guylain Florian
Pas encore d'évaluation
TD 1 Java
Document3 pages
TD 1 Java
Curriculum Vitae
100% (1)
Chapitre3-Modele Relationnel
Document17 pages
Chapitre3-Modele Relationnel
mikao31
Pas encore d'évaluation
TD XML DTD Corrige PDF
Document3 pages
TD XML DTD Corrige PDF
Mackus Da Silva
Pas encore d'évaluation
2014 05 Examen Compilation Correction
Document4 pages
2014 05 Examen Compilation Correction
Chouichi Ghada
100% (1)
TD2 Indexation
Document3 pages
TD2 Indexation
Amine Amiri
Pas encore d'évaluation
Chiffrement de Hill
Document2 pages
Chiffrement de Hill
shylamo
Pas encore d'évaluation
Algo
Document30 pages
Algo
Bessem Bessem
Pas encore d'évaluation
TP Creation Tablespace
Document2 pages
TP Creation Tablespace
Maryem Baihat
100% (2)
3 1 TD3 Ethernet - CSMA - CD - Correction
Document4 pages
3 1 TD3 Ethernet - CSMA - CD - Correction
amani sayari
Pas encore d'évaluation
Chapitre 1.
Document16 pages
Chapitre 1.
Ele Akacha
Pas encore d'évaluation
TD Transactions 2013
Document2 pages
TD Transactions 2013
Zaza Dh
100% (1)
Chapitre 1 - Introduction Au Base de Données NoSQL
Document33 pages
Chapitre 1 - Introduction Au Base de Données NoSQL
mohydinemed
Pas encore d'évaluation
TD EC Big Data
Document3 pages
TD EC Big Data
Mme et Mr Lafon
Pas encore d'évaluation
Ue 23: Conception D'Un Systeme D'Information
Document20 pages
Ue 23: Conception D'Un Systeme D'Information
Dilane Fonkou
Pas encore d'évaluation
SOA Révision
Document114 pages
SOA Révision
Amira Ghazouani
Pas encore d'évaluation
Question de Cours Reseaux 2
Document4 pages
Question de Cours Reseaux 2
Eslemhoum Medl
Pas encore d'évaluation
QCM Oracle - DBA1
Document4 pages
QCM Oracle - DBA1
maf.save02
Pas encore d'évaluation
CORRIGE EXAMENJanvier2017
Document4 pages
CORRIGE EXAMENJanvier2017
Sel Ma
100% (1)
Examen BDA
Document3 pages
Examen BDA
Med Nour Elhak Jouini
Pas encore d'évaluation
Examen BD 2013 corrig├й
Document2 pages
Examen BD 2013 corrig├й
Nano Chka
100% (1)
Gsi 2 Asy TD & TP 2019-2020
Document7 pages
Gsi 2 Asy TD & TP 2019-2020
Harrison Dzietham
Pas encore d'évaluation
Chapitre2 IA 2019
Document53 pages
Chapitre2 IA 2019
Khalil Kraiem
Pas encore d'évaluation
Système D'exploitation - 2 - Cours
Document38 pages
Système D'exploitation - 2 - Cours
Mira Allali
Pas encore d'évaluation
Questionnaires À Choix Multiples-Test5-Niveau Moyen-Cor
Document4 pages
Questionnaires À Choix Multiples-Test5-Niveau Moyen-Cor
Samir Benchakroun
Pas encore d'évaluation
Travail Pratique Objectif: Gestion Des Tablespaces Exercice 1
Document4 pages
Travail Pratique Objectif: Gestion Des Tablespaces Exercice 1
ouameur abderrahim
100% (1)
EXAMEN Tech Principal 2018
Document4 pages
EXAMEN Tech Principal 2018
PFE
0% (1)
Atelier 2
Document3 pages
Atelier 2
dddr ee
Pas encore d'évaluation
Examen Corriges MI2EL3 20072008
Document21 pages
Examen Corriges MI2EL3 20072008
cultinium
Pas encore d'évaluation
Exercice Admin
Document25 pages
Exercice Admin
FORMATION ORADIST
Pas encore d'évaluation
Administration Et Sécurité Des Bd-Partie 2
Document24 pages
Administration Et Sécurité Des Bd-Partie 2
Ismail Ameskour
Pas encore d'évaluation
Cours de C PDF
Document220 pages
Cours de C PDF
Hamouda Azzouz
Pas encore d'évaluation
Corrige GL 2021
Document2 pages
Corrige GL 2021
Papi
Pas encore d'évaluation
Rappel - Le Routage Statique
Document17 pages
Rappel - Le Routage Statique
Simo Sirage Ddine
Pas encore d'évaluation
XML: Bien Formé, Valide: Exercice 1: Soit La DTD Suivante Qui Permet D'écrire Des Documents Répertoires D'adresses
Document4 pages
XML: Bien Formé, Valide: Exercice 1: Soit La DTD Suivante Qui Permet D'écrire Des Documents Répertoires D'adresses
Khalil recup
Pas encore d'évaluation
TD 6 - Séc Réseaux
Document3 pages
TD 6 - Séc Réseaux
uijzj
Pas encore d'évaluation
Chap2 SE Processus
Document34 pages
Chap2 SE Processus
مسيطر Ara
Pas encore d'évaluation
TP3 Routage
Document2 pages
TP3 Routage
ahmado35641
Pas encore d'évaluation
Serie N 4 BDR PDF
Document2 pages
Serie N 4 BDR PDF
Rihab Na
100% (1)
Nat Pat
Document19 pages
Nat Pat
Souilem CHAHER
100% (1)
Exercices ch3
Document5 pages
Exercices ch3
Eya Hmida
Pas encore d'évaluation
PHP Résumé
Document26 pages
PHP Résumé
Emnaa Hasnewi
Pas encore d'évaluation
TD 1 Techniques de Protection
Document5 pages
TD 1 Techniques de Protection
Sarah Jandoubi
Pas encore d'évaluation
BDD NoSQL Et Big Data - Chapitre II Partie 2 New
Document6 pages
BDD NoSQL Et Big Data - Chapitre II Partie 2 New
son.600
Pas encore d'évaluation
tp1 Dss - 2021
Document1 page
tp1 Dss - 2021
Akk Ramm
Pas encore d'évaluation
TP5JAVA
Document2 pages
TP5JAVA
plural 5amsa
Pas encore d'évaluation
0 BEN RABAA Mars 2018
Document10 pages
0 BEN RABAA Mars 2018
Rayen Fekih
Pas encore d'évaluation
TP 2 Sparql
Document4 pages
TP 2 Sparql
Yao jean luc
Pas encore d'évaluation
Exam-Arch 2010
Document6 pages
Exam-Arch 2010
abir cherif
Pas encore d'évaluation
Contrôle Continu 1 Base de Données 2019 2020
Document1 page
Contrôle Continu 1 Base de Données 2019 2020
Saad Alilou
Pas encore d'évaluation
Présentation Du Module
Document8 pages
Présentation Du Module
Chiheb Mezrigui
Pas encore d'évaluation
QCM2
Document42 pages
QCM2
Ghofrane Bennasr
Pas encore d'évaluation
Maitrisez La Configuration Apache Tomcat Sous Linux
D'Everand
Maitrisez La Configuration Apache Tomcat Sous Linux
Koru Lenag
Pas encore d'évaluation
Langage Formel ET Théorie des Automates
D'Everand
Langage Formel ET Théorie des Automates
Ajit Singh
Pas encore d'évaluation
Électre
D'Everand
Électre
Jean Giraudoux
Pas encore d'évaluation
Certificat De Sécurité TLS/SSL Sous Linux
D'Everand
Certificat De Sécurité TLS/SSL Sous Linux
Roku Nelga
Pas encore d'évaluation
Formation 3D par la pratique avec C#5 et WPF: Modeliser des molecules
D'Everand
Formation 3D par la pratique avec C#5 et WPF: Modeliser des molecules
Patrice Rey
Pas encore d'évaluation
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
D'Everand
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
YVES SITBON
Pas encore d'évaluation
Mif18 2015 Mapreduce
Document4 pages
Mif18 2015 Mapreduce
Anonymous 1P2S4tbM
Pas encore d'évaluation
2 - Les Base de Données Lier Deux Tables (Suite BD)
Document2 pages
2 - Les Base de Données Lier Deux Tables (Suite BD)
souissi souissi
Pas encore d'évaluation
Big Data Environnement Cloud
Document70 pages
Big Data Environnement Cloud
ab.dou
Pas encore d'évaluation
1 Limites Des Systèmes Classiques de Gestion de Gestion Des BDD
Document19 pages
1 Limites Des Systèmes Classiques de Gestion de Gestion Des BDD
أبو أحمد الساحلي
Pas encore d'évaluation
Visco Route
Document2 pages
Visco Route
Hans Jonathan Agoua
Pas encore d'évaluation
Les Bases de Donnees-Essono Zue Arnauld5
Document155 pages
Les Bases de Donnees-Essono Zue Arnauld5
Arnauld ESSONO ZUE
Pas encore d'évaluation
Chapitre 00 Introduction PDF
Document4 pages
Chapitre 00 Introduction PDF
ntaringuene
Pas encore d'évaluation
Examen NOSQL Decembre-2021
Document6 pages
Examen NOSQL Decembre-2021
amina.mami
Pas encore d'évaluation
@@less01 DB Architecture
Document20 pages
@@less01 DB Architecture
Ab
Pas encore d'évaluation
tp1 Mongodb
Document11 pages
tp1 Mongodb
Nourhene Dahmeni
Pas encore d'évaluation
Introduction A Access
Document27 pages
Introduction A Access
Salim Habak
Pas encore d'évaluation
SI BD MIP4 Cours1
Document96 pages
SI BD MIP4 Cours1
St-Cima Sobert
Pas encore d'évaluation
TP1: Oracle: Base de Données Relationnelles Et Langage SQL
Document5 pages
TP1: Oracle: Base de Données Relationnelles Et Langage SQL
Zakaria Touyeb
Pas encore d'évaluation
Chapitre 2 Base de Données
Document20 pages
Chapitre 2 Base de Données
Clive Madzaka
Pas encore d'évaluation
TDI FF Principal Corrigé
Document10 pages
TDI FF Principal Corrigé
said
Pas encore d'évaluation
NSIJ2PO
Document10 pages
NSIJ2PO
LETUDIANT
Pas encore d'évaluation
Analyse OLAP Et Algèbre Multidimensionnelle
Document26 pages
Analyse OLAP Et Algèbre Multidimensionnelle
Mayssa Trabelsi
Pas encore d'évaluation
BD Cours 01 Presentation - v06
Document5 pages
BD Cours 01 Presentation - v06
kouki samar
Pas encore d'évaluation
NoSQL - MongoDb (Partie 2)
Document27 pages
NoSQL - MongoDb (Partie 2)
Leila Meriem
Pas encore d'évaluation
Séance 1 Généralités Sur Le Classement
Document7 pages
Séance 1 Généralités Sur Le Classement
PROVIDENTIAL CONSULTING
Pas encore d'évaluation
TH4877
Document142 pages
TH4877
Islam Haffied
Pas encore d'évaluation
Chapitre 13 Sauvegarde Et Récupération
Document97 pages
Chapitre 13 Sauvegarde Et Récupération
ntaringuene
100% (1)
3-Modele Relationnel
Document5 pages
3-Modele Relationnel
El Hadji Mamadou Diagne Badiane
Pas encore d'évaluation
Li385 C2 Nosql
Document80 pages
Li385 C2 Nosql
ecarlate
Pas encore d'évaluation
TP sql3 n1
Document4 pages
TP sql3 n1
jouhaina nasri
Pas encore d'évaluation
Entrepôts de Données 2CS-Cours03 (Partie 3)
Document40 pages
Entrepôts de Données 2CS-Cours03 (Partie 3)
ahmedtoujani2000
Pas encore d'évaluation
Installation Oracle 18c XE PDF
Document29 pages
Installation Oracle 18c XE PDF
Meriem EL Hiba
Pas encore d'évaluation
Chapitre1 Introduction
Document23 pages
Chapitre1 Introduction
HanaSelmi
Pas encore d'évaluation
SESSION 2 - BASE DE DONNEE NoSQL
Document20 pages
SESSION 2 - BASE DE DONNEE NoSQL
kouame.kobena
Pas encore d'évaluation
Barka Ahlem
Document77 pages
Barka Ahlem
Islam Haffied
Pas encore d'évaluation
M205 8. ORM Eloquent - Partie 2
Document33 pages
M205 8. ORM Eloquent - Partie 2
Asmae YOUALA
Pas encore d'évaluation
Bases de Données Relationnelles Et SQL
Document18 pages
Bases de Données Relationnelles Et SQL
ayodeleprecieux02
Pas encore d'évaluation