Hadoop Map Reduce Exo

Transféré par

RAMZI Azeddine

100% ont trouvé ce document utile (2 votes)

2K vues2 pages

documentation Hadoop

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

documentation Hadoop

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

100% ont trouvé ce document utile (2 votes)

2K vues2 pages

Hadoop Map Reduce Exo

Transféré par

RAMZI Azeddine

documentation Hadoop

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Hadoop: MapReduce

Exercice 1 : Graphe Social

On suppose qu'on administre un réseau social comportant des millions d'utilisateurs. Pour
chaque utilisateur, on a dans notre base de données la liste des utilisateurs qui sont ses amis
sur le réseau (via une requête SQL). On souhaite afficher quand un utilisateur va sur la page
d'un autre utilisateur une indication « Vous avez N amis en commun ». On ne peut pas se
permettre d'effectuer une série de requêtes SQL à chaque fois que la page est accédé (trop
lourd en traitement). On va donc développer des programmes MAP et REDUCE pour cette
opération et exécuter le traitement toutes les nuits sur notre base de données, en stockant le
résultat dans une nouvelle table.

Pour simplifier et pour se focaliser sur les opérations Hadoop, nous supposons que nos
données sont sous la forme d'un graphe d'adjacence stocké dans un fichier où chaque ligne
renseigne les amis d'une personne. Une ligne commence ainsi par le l’utilisateur suivi par ses
amis.
A => B, C, D
B => A, C, D, E
C => A, B, D, E
D => A, B, C, E
E => B, C, D

1. Donner un schéma illustratif (avec les différentes phases) du traitement

MapReduce
2. Proposer un pseudo code pour le Mapper
3. Proposer un pseudo code pour le Reducer

Exercice 2 : Sentiment client/twitter

Une entreprise dispose d'un compte twitter pour son service après vente, recevant plusieurs
dizaines de milliers de tweets par jour. Elle cherche à déterminer le taux de satisfaction de ses
clients à partir du compte twitter.
Chaque heure, les tweets reçus sont exportés au sein d'un fichier texte. Données d'entrée :

4. Expliquer brièvement le traitement du Mapper et du Reducer

5. Proposer un pseudo code pour le Mapper
6. Proposer un pseudo code pour le Reducer

Exercice 3 : Bank data

Proposer un schéma MapReduce (avec un pseudo-code des Mappers et Reducers)
qui à partir du fichier bank-data.csv calcule des statistiques de base par rapport aux
âges des personnes incluses (e.g., pour chaque âge le salaire minimum, maximum,
moyen, l'écart type, le nombre de personnes de cet âge).

1/2
Ci-après la structure du fichier bank-data.csv :

id,age,sex,region,income,married,children,car,save_act,current_act,mortgage,pep
ID12101,48,FEMALE,INNER_CITY,17546.0,NO,1,NO,NO,NO,NO,YES
ID12102,40,MALE,TOWN,30085.1,YES,3,YES,NO,YES,YES,NO
ID12103,51,FEMALE,INNER_CITY,16575.4,YES,0,YES,YES,YES,NO,NO
ID12104,23,FEMALE,TOWN,20375.4,YES,3,NO,NO,YES,NO,NO
ID12105,57,FEMALE,RURAL,50576.3,YES,0,NO,YES,NO,NO,NO
ID12106,57,FEMALE,TOWN,37869.6,YES,2,NO,YES,YES,NO,YES
ID12107,22,MALE,RURAL,8877.07,NO,0,NO,NO,YES,NO,YES
ID12108,58,MALE,TOWN,24946.6,YES,0,YES,YES,YES,NO,NO

1. Donner un schéma illustratif (avec les différentes phases) du traitement

MapReduce.
2. Donner le Pseudo code Mapper.
3. Donner le Pseudo code Reducer.

2/2

Vous aimerez peut-être aussi

Spring Boot par la pratique: Développer les services Rest avec Spring-Boot et Spring-RestTemplate
D'Everand
Spring Boot par la pratique: Développer les services Rest avec Spring-Boot et Spring-RestTemplate
Bertrand Nguimgo
Pas encore d'évaluation
Td1: Hadoop: Exercice 1
Document3 pages
Td1: Hadoop: Exercice 1
ala fezai
0% (1)
TP 3 - Exercices Map Reduce
Document3 pages
TP 3 - Exercices Map Reduce
ines
75% (4)
SujetEvaluation2017 Correction
Document5 pages
SujetEvaluation2017 Correction
Abdo Elmamoun
100% (4)
Correction Examen Big Data 2020 2021 Session Normale
Document4 pages
Correction Examen Big Data 2020 2021 Session Normale
Nora Habrich
88% (8)
Exam Final-Big Data
Document3 pages
Exam Final-Big Data
Ferdaous Hdioud
100% (3)
Ds Big Data Hachani
Document7 pages
Ds Big Data Hachani
Mohamed Amine Hachani
Pas encore d'évaluation
TD 04
Document3 pages
TD 04
Houssem Bousri
67% (9)
TD1 MapReduce PDF
Document5 pages
TD1 MapReduce PDF
Mr : Anas
100% (1)
QCM Corrigé
Document7 pages
QCM Corrigé
charfeddine fredj
Pas encore d'évaluation
QCM Big Data
Document7 pages
QCM Big Data
zid
100% (1)
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Document11 pages
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Rim Hancha
Pas encore d'évaluation
Examen BigData SR 1617
Document5 pages
Examen BigData SR 1617
Med Nour Elhak Jouini
Pas encore d'évaluation
Resume Big Data
Document9 pages
Resume Big Data
Khaoula RAZZAKI
Pas encore d'évaluation
TP MongoDB Supplémentaire
Document2 pages
TP MongoDB Supplémentaire
사라Sara
75% (4)
TP Pig and Hive
Document3 pages
TP Pig and Hive
oueslati ahlem
100% (1)
Fiche de TD INF 356
Document21 pages
Fiche de TD INF 356
Sali Yaya Farani
Pas encore d'évaluation
Chapitre 2 Hadoop-Part2
Document47 pages
Chapitre 2 Hadoop-Part2
souhail nahed
Pas encore d'évaluation
Chapitre 4 - HBase
Document35 pages
Chapitre 4 - HBase
souhail nahed
Pas encore d'évaluation
Correction TD1
Document3 pages
Correction TD1
Samir Aouni
71% (7)
Control Big Data N°4-AU22-23
Document3 pages
Control Big Data N°4-AU22-23
Ferdaous Hdioud
Pas encore d'évaluation
Résumé Big Data
Document6 pages
Résumé Big Data
El Moumne Nihal
Pas encore d'évaluation
DS Cloud Virt 2015
Document2 pages
DS Cloud Virt 2015
Abdelkrim Lamraoui
100% (1)
ExamBDIA NOV 07corrige
Document5 pages
ExamBDIA NOV 07corrige
Alix Rouchdi Lakerdos
100% (2)
TD 05
Document3 pages
TD 05
Houssem Bousri
100% (2)
BI SerieTDn02
Document2 pages
BI SerieTDn02
Emna Boussoffara
100% (1)
TD Datawarehouse 2011-2012
Document5 pages
TD Datawarehouse 2011-2012
Yassin Rh
100% (1)
Exo Corrrigé PDF
Document8 pages
Exo Corrrigé PDF
olympe QUENUM
100% (2)
Intégration de Données Quiz QCM Intégration de Données
Document5 pages
Intégration de Données Quiz QCM Intégration de Données
Sayah Mohammed Mouaad
Pas encore d'évaluation
EXamEnBI 3LFIG
Document4 pages
EXamEnBI 3LFIG
Warda Flora
100% (1)
QCM Nosql
Document5 pages
QCM Nosql
MARYAM
Pas encore d'évaluation
Q C M CLOUD - Corrigés
Document9 pages
Q C M CLOUD - Corrigés
Ahmed
0% (1)
Correction TP MongoDB
Document5 pages
Correction TP MongoDB
Yassine Ksibi
100% (2)
Chapitre 3 Mongo Mapreduce
Document20 pages
Chapitre 3 Mongo Mapreduce
souhail nahed
Pas encore d'évaluation
TD1 2
Document4 pages
TD1 2
Ķőőķie Šâm
100% (4)
Examen de Revision SOA - Questions
Document5 pages
Examen de Revision SOA - Questions
Sofien Haddad
Pas encore d'évaluation
Big Data
Document10 pages
Big Data
Smaïl Ben
Pas encore d'évaluation
TP 6 Algorithme KNN
Document7 pages
TP 6 Algorithme KNN
Baha Bechikh
Pas encore d'évaluation
TD Clustering Algorithme K-Means
Document2 pages
TD Clustering Algorithme K-Means
Rami Hlioui
100% (1)
TD Blockchain 2017 2018 Corrige
Document2 pages
TD Blockchain 2017 2018 Corrige
zied
Pas encore d'évaluation
BigDATA M1 GSI Corrigé - Type
Document3 pages
BigDATA M1 GSI Corrigé - Type
LAHDHEB Rim
100% (2)
Examen DBA
Document3 pages
Examen DBA
nour hene
50% (2)
DS Béja Virt Et Cloud 18-19
Document1 page
DS Béja Virt Et Cloud 18-19
Yosra JABRI
100% (2)
Correction QCM Cloud
Document2 pages
Correction QCM Cloud
EMNA KANZARI
100% (2)
TP N°2 - Exemple Word Count Avec Hadoop
Document12 pages
TP N°2 - Exemple Word Count Avec Hadoop
ines
Pas encore d'évaluation
EXAMEN
Document3 pages
EXAMEN
Ayachi Emna
Pas encore d'évaluation
Presentation Hadoop
Document27 pages
Presentation Hadoop
khadidja khadidja
Pas encore d'évaluation
Evaluation Connaissance
Document2 pages
Evaluation Connaissance
LY
Pas encore d'évaluation
Correction Examen SMI S6 2017
Document4 pages
Correction Examen SMI S6 2017
IMA
Pas encore d'évaluation
Exercice Sur La BI
Document9 pages
Exercice Sur La BI
samvip
Pas encore d'évaluation
TP XML + DTD
Document2 pages
TP XML + DTD
Sadik Youssouf
Pas encore d'évaluation
TD3 - Transactions Et Accès Concurrents + Correction
Document10 pages
TD3 - Transactions Et Accès Concurrents + Correction
Tunisia touristic
Pas encore d'évaluation
QCM Ia n1 Eleve
Document2 pages
QCM Ia n1 Eleve
Sami Hadhri
75% (4)
Mbds Big Data Hadoop Cours 1
Document113 pages
Mbds Big Data Hadoop Cours 1
gridech
Pas encore d'évaluation
Examen1ereSessionNFP214 2007-2008
Document9 pages
Examen1ereSessionNFP214 2007-2008
imane
Pas encore d'évaluation
EXAMEN - Virtualisation Et Cloud (EXAMEN - CLOUD)
Document13 pages
EXAMEN - Virtualisation Et Cloud (EXAMEN - CLOUD)
Salah Eddine Hebabaze
100% (2)
Piloter Vos Jobs Sas Data Management Depuis Sas Base
Document8 pages
Piloter Vos Jobs Sas Data Management Depuis Sas Base
Nicolas Housset
Pas encore d'évaluation
TD-MapReduce 02 2024
Document3 pages
TD-MapReduce 02 2024
Rihane Farah
Pas encore d'évaluation
Delphi 2010 WP DataSnap FR
Document65 pages
Delphi 2010 WP DataSnap FR
Habib Bedouin Bensafi
Pas encore d'évaluation
Examen Android GBM3 Inf Med Décembre 2017
Document3 pages
Examen Android GBM3 Inf Med Décembre 2017
ben salah sarra
Pas encore d'évaluation
Oberlin 2001
Document10 pages
Oberlin 2001
RAMZI Azeddine
Pas encore d'évaluation
08 - Benzinou PDF
Document14 pages
08 - Benzinou PDF
RAMZI Azeddine
Pas encore d'évaluation
Livres Philo PDF
Document1 page
Livres Philo PDF
RAMZI Azeddine
Pas encore d'évaluation
La Philosophie A L Ecole Primaire-1
Document2 pages
La Philosophie A L Ecole Primaire-1
RAMZI Azeddine
Pas encore d'évaluation
Linux 8 Ème Édition
Document191 pages
Linux 8 Ème Édition
Mouez Chebbi
Pas encore d'évaluation
Linux Administration Best F o PDF
Document48 pages
Linux Administration Best F o PDF
SoufianeAmrani
Pas encore d'évaluation
2021 Oracle 12c TP5 +CORRIGE VVVVFFF
Document38 pages
2021 Oracle 12c TP5 +CORRIGE VVVVFFF
ABDESSADEQ EL MAKKIOUI
Pas encore d'évaluation
Tutoriel Business Intelligence
Document193 pages
Tutoriel Business Intelligence
mechanical79
Pas encore d'évaluation
Informatique de Gestion II Mail1
Document70 pages
Informatique de Gestion II Mail1
Saadia Dia
100% (2)
TP TD 1 Inf132
Document5 pages
TP TD 1 Inf132
PLOHTTOS GAMING
Pas encore d'évaluation
Administration Des Bases de Données
Document4 pages
Administration Des Bases de Données
Styve Nourka
Pas encore d'évaluation
Dynamo DB
Document10 pages
Dynamo DB
daniellle
Pas encore d'évaluation
Chapitre 3 MLD
Document20 pages
Chapitre 3 MLD
coach fatma baccour
Pas encore d'évaluation
Thesis
Document215 pages
Thesis
fethi
Pas encore d'évaluation
Recherche C++
Document16 pages
Recherche C++
Yassine Moaataz
Pas encore d'évaluation
Représentation Des Connaissances
Document98 pages
Représentation Des Connaissances
NIKIEMA Francklin Powell
Pas encore d'évaluation
Validation Nchaallah
Document64 pages
Validation Nchaallah
Chaymaa Bjm
100% (2)
RequetesSQL Introexercices
Document3 pages
RequetesSQL Introexercices
frethices
Pas encore d'évaluation
TD 2
Document1 page
TD 2
thiziroarour0
Pas encore d'évaluation
TP 03 Data Warehouse Shema Etoile GIL3
Document5 pages
TP 03 Data Warehouse Shema Etoile GIL3
zouhir es salmani
Pas encore d'évaluation
I. Le Langage SQL: Film (Titre, Réalisateur, Acteur) Programme (Nomciné, Titre, Horaire)
Document11 pages
I. Le Langage SQL: Film (Titre, Réalisateur, Acteur) Programme (Nomciné, Titre, Horaire)
Adamou MFAMBOU
Pas encore d'évaluation
SLAM Lascaux SujetZero Corrige
Document11 pages
SLAM Lascaux SujetZero Corrige
fury6z
100% (4)
Data Warehouse Et Data Mining
Document5 pages
Data Warehouse Et Data Mining
hinddekkak13
Pas encore d'évaluation
Guide Des Cours M201 - 1 - Bases de Données - SQL Server 2017
Document58 pages
Guide Des Cours M201 - 1 - Bases de Données - SQL Server 2017
Benny Bav
Pas encore d'évaluation
Chapitre 4: Normalisation D'une Base de Données Relationnelle
Document24 pages
Chapitre 4: Normalisation D'une Base de Données Relationnelle
yadoho
Pas encore d'évaluation
Resume Big Data
Document9 pages
Resume Big Data
Khaoula RAZZAKI
Pas encore d'évaluation
La Communication VB .NET - BDD - Apprenez À Programmer en VB .NET - OpenClassrooms
Document9 pages
La Communication VB .NET - BDD - Apprenez À Programmer en VB .NET - OpenClassrooms
Cindy Spacy
100% (1)
Planning SITN Apprentissage 2021 - 2022
Document48 pages
Planning SITN Apprentissage 2021 - 2022
Y2121
Pas encore d'évaluation
Projet 1
Document2 pages
Projet 1
Jesuyon
Pas encore d'évaluation
TD Sur Les Requêtes SQL
Document6 pages
TD Sur Les Requêtes SQL
Harouna Coulibaly
100% (1)
Doctrine
Document42 pages
Doctrine
PFE
Pas encore d'évaluation
m1104 tp3 tp4
Document6 pages
m1104 tp3 tp4
Gordien Bigirimana
Pas encore d'évaluation
Chapitre 2-BDetSI-suite (01-11-2021)
Document42 pages
Chapitre 2-BDetSI-suite (01-11-2021)
boubker imane
Pas encore d'évaluation
Cours T-SQL
Document25 pages
Cours T-SQL
assiacharafi2003
Pas encore d'évaluation