TP 4

Transféré par

nafissa bridah

0% ont trouvé ce document utile (0 vote)

12 vues14 pages

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

12 vues14 pages

TP 4

Transféré par

nafissa bridah

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 14

Rechercher à l'intérieur du document

Traitement

du Big Data
TP 4
Analyse du dataset Olympix

Nassim Bahri M1 DSSD

Objectifs du
TP
implémentation d'un job MapReduce
permettant d'analyser le contenu du
dataset olympix_data.csv
Présentation
L'objectif de ce TP sera l'implémentation d'un job MapReduce permettant
d'analyser le contenu du dataset olympix_data.csv.

Le fichier olympix_data.csv à est disponible sur ce lien :

https://github.com/BigDataESEN/datasets/blob/main/olympix_data.csv
Présentation
Les colonnes de ce fichier sont décrites comme suit :

0 Nom de l'athlète 5 Nom de la discipline (sport)

1 Age de l'athlète 6 Nombre de médailles d'or

2 Nom du pays 7 Nombre de médailles en argent

3 Année de participation 8 Nombre de médailles en bronze

4 Date de la cérémonie de clôture 9 Nombre total de médailles

Implémentation
Commençons par créer un projet Maven dans IntelliJ IDEA. Nous utiliserons dans
notre cas JDK 1.8.

Ouvrir le fichier pom.xml, et ajouter les dépendances suivantes pour Hadoop,

HDFS et Map Reduce :

1. hadoop-common
2. hadoop-mapreduce-client-common
3. hadoop-mapreduce-client-core
4. hadoop-hdfs
Implémentation
<dependencies>
Pour ajouter une bibliothèque java, il faut juste
<dependency>
<groupId>org.apache.hadoop</groupId> chercher son nom de le repository de maven.
<artifactId>hadoop-common</artifactId>
<version>3.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-common</artifactId>
<version>3.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-mapreduce-client-core</artifactId>
<version>3.3.2</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId> Choisissez la version.
<version>3.3.2</version>
<scope>test</scope>
</dependency>
</dependencies>
Implémentation
1- Créer la classe OlympixMapper, contenant ce code :
Implémentation
2- Créer la classe OlympixReducer, contenant ce code :
Implémentation
3- Créer la classe Olympix, contenant ce code :
Implémentation
3- Créer la classe Main, contenant ce code : (suite)
Tester Map Reduce sur
votre cluster

Il faut suivre les étapes décrite dans le TP 3

Correction

Le code source du job est disponible

sur l'adresse suivante :

https://github.com/BigDataESEN
/OlympixMapReduce
Références

https://hadoop.apache.org/docs/current/hadoop-mapreduce-client/hadoop-
mapreduce-client-core/MapReduceTutorial.html

https://kontext.tech/column/hadoop/265/default-ports-used-by-hadoop-
services-hdfs-mapreduce-yarn
Merci pour votre
attention

Vous aimerez peut-être aussi

TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
Master 2 Miage-Mbds Projet Big Data Analytics: Analyse de La Clientèle D'un Concessionnaire Automobile Pour La Recommandation de Modèles de Véhicules
Document20 pages
Master 2 Miage-Mbds Projet Big Data Analytics: Analyse de La Clientèle D'un Concessionnaire Automobile Pour La Recommandation de Modèles de Véhicules
Asil
Pas encore d'évaluation
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
Document6 pages
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
chebinega
Pas encore d'évaluation
tp2 Map Reduce
Document5 pages
tp2 Map Reduce
Raja Bs
Pas encore d'évaluation
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Document7 pages
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Siham DL
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
Examen Big DATA
Document4 pages
Examen Big DATA
zaki worker
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
tp4 - Framework - Struts 2
Document5 pages
tp4 - Framework - Struts 2
halabimeryem89
Pas encore d'évaluation
ExpressTuto - DEV205-P1
Document6 pages
ExpressTuto - DEV205-P1
Hamza Chalout
Pas encore d'évaluation
CBD TP
Document6 pages
CBD TP
zemer
Pas encore d'évaluation
Cours Spring Fondamentaux
Document59 pages
Cours Spring Fondamentaux
Baghdadi Abs
Pas encore d'évaluation
React Redux Tutoriel 1
Document9 pages
React Redux Tutoriel 1
hachemfst
Pas encore d'évaluation
Openldap Server
Document52 pages
Openldap Server
ichbin1199
Pas encore d'évaluation
Active Directory
Document5 pages
Active Directory
Amunox
Pas encore d'évaluation
Chapitre3 NoSQL Avec Redis
Document44 pages
Chapitre3 NoSQL Avec Redis
Godni Rodney
Pas encore d'évaluation
coursNodeJs PDF
Document66 pages
coursNodeJs PDF
rodrigue ntchounkeu
Pas encore d'évaluation
Introduction À Laravel - Cours
Document21 pages
Introduction À Laravel - Cours
Jean marc Konan
Pas encore d'évaluation
SujetEvaluation2017 Correction
Document5 pages
SujetEvaluation2017 Correction
Abdo Elmamoun
100% (4)
TP1 Hadoop3.1.2
Document20 pages
TP1 Hadoop3.1.2
fatima ezzahrae el ghatous
Pas encore d'évaluation
tp1 IRS
Document7 pages
tp1 IRS
Zohra CHANNOUF
100% (1)
Projet PHP
Document13 pages
Projet PHP
Houdadine Abdou
Pas encore d'évaluation
Cours Big Data Avancee Chp2 Data-Ingestion
Document46 pages
Cours Big Data Avancee Chp2 Data-Ingestion
MarwenCherif
Pas encore d'évaluation
Formation Node Expressjs 617c0eb091742
Document41 pages
Formation Node Expressjs 617c0eb091742
Adil Khalki
Pas encore d'évaluation
Supervision Avec Nagios
Document28 pages
Supervision Avec Nagios
Ali Amaniss
67% (3)
Mongo DB
Document13 pages
Mongo DB
Zied Zinelabidine
Pas encore d'évaluation
Cours Android
Document111 pages
Cours Android
Abdelhamid El Guarti
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
Document12 pages
TP N°2 - Exemple Word Count Avec Hadoop
ines
Pas encore d'évaluation
Nodejs
Document20 pages
Nodejs
Mohamed El Haddad
Pas encore d'évaluation
Tutorial Spring MVC Crud Jpa Hibernate Postgresql
Document39 pages
Tutorial Spring MVC Crud Jpa Hibernate Postgresql
neji jlassi
100% (1)
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
Bootstrap Abdali
Document49 pages
Bootstrap Abdali
Youssef
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
Atelier 1 - Projet Spring Boot
Document10 pages
Atelier 1 - Projet Spring Boot
Jouhaina Nasri
Pas encore d'évaluation
Compte Rendu TP 1 Big Data
Document6 pages
Compte Rendu TP 1 Big Data
Gaith Belkacem
Pas encore d'évaluation
AM2020 1-Copier
Document4 pages
AM2020 1-Copier
Sia Boualem
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
Spring Boot-2
Document31 pages
Spring Boot-2
Jouhaina Nasri
Pas encore d'évaluation
Récupérer Des Données Hadoop Avec Python - Makina Corpus
Document3 pages
Récupérer Des Données Hadoop Avec Python - Makina Corpus
Ahmed Mohamed
Pas encore d'évaluation
Scala
Document33 pages
Scala
Zouhair Ng
Pas encore d'évaluation
TP1 Producing SOAP Web Service
Document10 pages
TP1 Producing SOAP Web Service
zineb elfadili
Pas encore d'évaluation
Tuto Spring Jpa
Document17 pages
Tuto Spring Jpa
langageccc
Pas encore d'évaluation
TP4-5 Spark
Document21 pages
TP4-5 Spark
Mazozi safae
Pas encore d'évaluation
TP ASP Net Core MVC
Document8 pages
TP ASP Net Core MVC
BOUZAZI
Pas encore d'évaluation
BigData2A TD3 4 Enonce - 2
Document9 pages
BigData2A TD3 4 Enonce - 2
Souhail Ben Afia
Pas encore d'évaluation
Tutorial Spring MVC Crud Spring Data Postgresql
Document31 pages
Tutorial Spring MVC Crud Spring Data Postgresql
neji jlassi
Pas encore d'évaluation
PHP Ex Codeigniter4
Document11 pages
PHP Ex Codeigniter4
RaliteraToky
Pas encore d'évaluation
TP1-SOAP Service
Document8 pages
TP1-SOAP Service
Arbi Bouhaddi
Pas encore d'évaluation
Extensions Plugins Qgis
Document12 pages
Extensions Plugins Qgis
Hebray Sébastien
Pas encore d'évaluation
Spring MVC (PDFDrive)
Document64 pages
Spring MVC (PDFDrive)
world internet
Pas encore d'évaluation
Hadoop Ecosystem
Document37 pages
Hadoop Ecosystem
hajar.filali4
Pas encore d'évaluation
Fiche de TD INF 356
Document21 pages
Fiche de TD INF 356
Sali Yaya Farani
Pas encore d'évaluation
1.1 Prise en Main de L'émulateur: Chapitre
Document8 pages
1.1 Prise en Main de L'émulateur: Chapitre
Mamadou Mouctar Diallo
Pas encore d'évaluation
Administration Et Hebergement Web
Document5 pages
Administration Et Hebergement Web
Tagne Guylain Florian
Pas encore d'évaluation
Programmer en JavaScript
D'Everand
Programmer en JavaScript
Preston Prescott
Évaluation : 4.5 sur 5 étoiles
4.5/5 (2)
Programmer en Java
D'Everand
Programmer en Java
Troy Dimes
Évaluation : 5 sur 5 étoiles
5/5 (4)
Spring Boot par la pratique: Développer les services Rest avec Spring-Boot et Spring-RestTemplate
D'Everand
Spring Boot par la pratique: Développer les services Rest avec Spring-Boot et Spring-RestTemplate
Bertrand Nguimgo
Pas encore d'évaluation
Initiation à l'écosytème Hadoop
D'Everand
Initiation à l'écosytème Hadoop
Juvénal CHOKOGOUE
Évaluation : 5 sur 5 étoiles
5/5 (1)
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
D'Everand
MAITRISER Python : De l'Apprentissage aux Projets Professionnels
YVES SITBON
Pas encore d'évaluation
Cours Tableau de Bord
Document55 pages
Cours Tableau de Bord
nafissa bridah
100% (1)
Chapitre 2 - Les Collections de Données en Python
Document61 pages
Chapitre 2 - Les Collections de Données en Python
nafissa bridah
Pas encore d'évaluation
TD 1 Imp
Document4 pages
TD 1 Imp
nafissa bridah
Pas encore d'évaluation
Les Graphiques Dans Power BI
Document3 pages
Les Graphiques Dans Power BI
nafissa bridah
Pas encore d'évaluation
Exemples
Document3 pages
Exemples
nafissa bridah
Pas encore d'évaluation
Révision
Document7 pages
Révision
nafissa bridah
Pas encore d'évaluation
AZUUURE
Document30 pages
AZUUURE
nafissa bridah
Pas encore d'évaluation
GDP 22 23 - L3 - CHAP2 - VF
Document70 pages
GDP 22 23 - L3 - CHAP2 - VF
nafissa bridah
Pas encore d'évaluation
Definition Couplage For Et Couplage Leger
Document2 pages
Definition Couplage For Et Couplage Leger
nafissa bridah
Pas encore d'évaluation
PFE Book 2023-2024: 12 Novembre 2023
Document83 pages
PFE Book 2023-2024: 12 Novembre 2023
nafissa bridah
Pas encore d'évaluation
TD 2 Imp
Document4 pages
TD 2 Imp
nafissa bridah
Pas encore d'évaluation
TD 1 Imp
Document4 pages
TD 1 Imp
nafissa bridah
Pas encore d'évaluation
TD 6 Imp
Document5 pages
TD 6 Imp
nafissa bridah
Pas encore d'évaluation
Les Processus Autorégressifs 12-12-2021 (Partie Finie)
Document20 pages
Les Processus Autorégressifs 12-12-2021 (Partie Finie)
nafissa bridah
100% (1)
TP 5
Document25 pages
TP 5
nafissa bridah
Pas encore d'évaluation
Cours 02 Intro Hadoop
Document30 pages
Cours 02 Intro Hadoop
Michael Sniper Wu
Pas encore d'évaluation
TP3 Hadoop Exercices
Document2 pages
TP3 Hadoop Exercices
koyine9472
Pas encore d'évaluation
Hadoop TP MSBG
Document7 pages
Hadoop TP MSBG
zemer
Pas encore d'évaluation
Big Data Résume
Document1 page
Big Data Résume
Oumaima Ezafa
Pas encore d'évaluation
Chap 1
Document18 pages
Chap 1
Hakim Farhani
Pas encore d'évaluation
C01
Document16 pages
C01
Serigne Ndour
Pas encore d'évaluation
TP Map Reduce
Document3 pages
TP Map Reduce
fidaletaief58
Pas encore d'évaluation
Chapitre 2 Hadoop-Part2
Document47 pages
Chapitre 2 Hadoop-Part2
souhail nahed
Pas encore d'évaluation
Ch0 Big Data
Document21 pages
Ch0 Big Data
Younes Oulad Sayad
Pas encore d'évaluation
Ex Amen Big Data 1617
Document6 pages
Ex Amen Big Data 1617
Med Nour Elhak Jouini
Pas encore d'évaluation
BDA mongoDB PDF
Document80 pages
BDA mongoDB PDF
Hamdouch Bachr
Pas encore d'évaluation
Mbds Big Data Hadoop 2019 2020 TP 2
Document11 pages
Mbds Big Data Hadoop 2019 2020 TP 2
Pevo Jo
Pas encore d'évaluation
Les Bases de Données Nosql: Pr. Soussi Nassima
Document112 pages
Les Bases de Données Nosql: Pr. Soussi Nassima
Sokaina Elharouri
Pas encore d'évaluation
Hadoop
Document25 pages
Hadoop
adjemi_brahim
100% (2)
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
Big Data Analytics Three Use Cases With R Python A
Document39 pages
Big Data Analytics Three Use Cases With R Python A
Melek Maalej
Pas encore d'évaluation
TP Map Reduce2
Document4 pages
TP Map Reduce2
mariemltifi61
Pas encore d'évaluation
Tpe Yarn-1
Document11 pages
Tpe Yarn-1
Taka fidèle
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
Tpe-Inf-356 Modifié OK
Document17 pages
Tpe-Inf-356 Modifié OK
Seini Mtk
Pas encore d'évaluation
Chapitre 2 Final FR
Document94 pages
Chapitre 2 Final FR
Äya Ķh
Pas encore d'évaluation
BigData Technologies Avancées
Document81 pages
BigData Technologies Avancées
nihed attia
Pas encore d'évaluation
Chapitre 3 Mongo Mapreduce
Document20 pages
Chapitre 3 Mongo Mapreduce
souhail nahed
Pas encore d'évaluation
Big Data
Document11 pages
Big Data
Salah
Pas encore d'évaluation
Miniprojet BigData
Document9 pages
Miniprojet BigData
ghassen lassoued
Pas encore d'évaluation
PFE Cloud Computing - Open Stack
Document69 pages
PFE Cloud Computing - Open Stack
Youssef ameur
Pas encore d'évaluation
3 PDF
Document81 pages
3 PDF
Kouakou N'coré
Pas encore d'évaluation
CY3903 Formation Cloudera Essentials For Apache Hadoop PDF
Document1 page
CY3903 Formation Cloudera Essentials For Apache Hadoop PDF
CertyouFormation
Pas encore d'évaluation
Big Data
Document15 pages
Big Data
Nezha Soufi
Pas encore d'évaluation