Bienvenue sur Scribd !

Ignorer le carrousel

Compte Rendu TP 1 Big Data

Transféré par

Gaith Belkacem

0% ont trouvé ce document utile (0 vote)

1K vues6 pages

Titre original

Compte rendu TP 1 Big Data

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

1K vues6 pages

Compte Rendu TP 1 Big Data

Transféré par

Gaith Belkacem

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 6

Rechercher à l'intérieur du document

Ministère de l’éducation supérieure

Université de Carthage
*****
Institut National des sciences
appliquées et de technologie

Compte rendu du TP 1 en Big

Data
Filière: Réseaux et Télécommunications
Niveau: 4éme année

Réalisé par:
Belkacem Mohamed Ghaith

Année universitaire: 2020/2021

Objectifs du TP:
Se familiariser avec le framework hadoop et patron d'architecture MapReduce, et
puis d’utiliser docker afin de lancer un cluster hadoop composé 3 nœuds et tester la
wordcount application en utilisant un fichier input.

Etapes pour préparer l’environnement:

1. Télécharger l'image docker uploadée sur dockerhub
docker pull liliasfaxi/spark-hadoop:hv-2.7.2

2. Créer les trois contenaires à partir de l'image téléchargée.

2.1. Créer un réseau qui permettra de relier les trois contenaires
docker network create --driver=bridge hadoop

2.2. Créer et lancer les trois contenaires

docker run -itd --net=hadoop -p 50070:50070 -p 8088:8088 -p 7077:7077 -p
16010:16010 \
--name hadoop-master --hostname hadoop-master \
liliasfaxi/spark-hadoop:hv-2.7.2

docker run -itd -p 8040:8042 --net=hadoop \

--name hadoop-slave1 --hostname hadoop-slave1 \
liliasfaxi/spark-hadoop:hv-2.7.2

docker run -itd -p 8041:8042 --net=hadoop \

--name hadoop-slave2 --hostname hadoop-slave2 \
liliasfaxi/spark-hadoop:hv-2.7.2

3. Entrer dans le contenaire master pour commencer à l'utiliser.

docker exec -it hadoop-master bash
La première chose à faire, une fois dans le contenaire, est de lancer hadoop
./start-hadoop.sh

4. Créer un répertoire dans HDFS, appelé input.

hadoop fs –mkdir -p input

5. Charger le fichier purchases dans le répertoire input créé:

hadoop fs –put purchases.txt input

6. Pour afficher les dernières lignes du fichier purchases:

hadoop fs -tail input/purchases.txt
Map Reduce
Etapes:
1. Créer un projet Maven dans IntelliJ IDEA
2. Ouvrir le fichier pom.xml, et ajouter les dépendances pour Hadoop, HDFS et
Map Reduce
3. Créer un package tn.insat.tp1 sous le répertoire src/main/java
4. Créer la classe TokenizerMapper
5. Créer la classe IntSumReducer
6. Créer la classe WordCount
7. Tester Map Reduce en local
7.1. Créer un répertoire input sous le répertoire resources du projet.
7.2. Créer un fichier de test: file.txt dans lequel on insère les deux lignes:
Hello Wordcount!
Hello Hadoop!
8. Créer une configuration de type Application
9. Définir comme Main Class: tn.insat.tp1.WordCount, et comme Program
Arguments: src/main/resources/input/file.txt src/main/resources/output
Après avoir suivi l’énoncé du TP 1, voici le resultat d’execution du programme qui est trouvé
dans le fichier part-r-00000 sous le dossier output:

Lancer Map Reduce sur le cluster

Steps:

1. Créer une configuration Maven avec la ligne de commande: package install

2. Lancer la configuration. Un fichier wordcount-1.jar sera créé dans le répertoire
target du projet.
3. Copier le fichier jar créé dans le contenaire master avec la commande:
docker cp target/wordcount-1.jar hadoop-master:/root/wordcount-1.jar
4. Revenir au shell du contenaire master, et lancer le job map reduce avec cette
commande:
hadoop jar wordcount-1.jar tn.insat.tp1.WordCount input output7
En affichant les dernières lignes du fichier généré output7/part-r-00000, avec
hadoop fs -tail output7/part-r-00000, on obtient l'affichage suivant:

Vous aimerez peut-être aussi

tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
ABL Cloud
Document9 pages
ABL Cloud
DeBoub Moez
100% (1)
TP PIG Hadoop
Document3 pages
TP PIG Hadoop
Chouchen Nizar
Pas encore d'évaluation
Procedure D'installation de Hadoop
Document13 pages
Procedure D'installation de Hadoop
Aymen Bouazizi
100% (1)
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Document11 pages
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Rim Hancha
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
Document12 pages
TP N°2 - Exemple Word Count Avec Hadoop
ines
Pas encore d'évaluation
TP Pig and Hive
Document3 pages
TP Pig and Hive
oueslati ahlem
100% (1)
Presentation Hadoop
Document27 pages
Presentation Hadoop
khadidja khadidja
Pas encore d'évaluation
Mbds Big Data Hadoop Cours 1
Document113 pages
Mbds Big Data Hadoop Cours 1
gridech
Pas encore d'évaluation
Resume Big Data
Document9 pages
Resume Big Data
Khaoula RAZZAKI
Pas encore d'évaluation
Ds Big Data Hachani
Document7 pages
Ds Big Data Hachani
Mohamed Amine Hachani
Pas encore d'évaluation
Cours 1 - Introduction Au Big Data
Document45 pages
Cours 1 - Introduction Au Big Data
Youness Saouab
Pas encore d'évaluation
TP 3 - Exercices Map Reduce
Document3 pages
TP 3 - Exercices Map Reduce
ines
75% (4)
Fiche de TD INF 356
Document21 pages
Fiche de TD INF 356
Sali Yaya Farani
Pas encore d'évaluation
Big Data
Document10 pages
Big Data
Smaïl Ben
Pas encore d'évaluation
TP MongoDB Supplémentaire
Document2 pages
TP MongoDB Supplémentaire
사라Sara
75% (4)
QCM Corrigé
Document7 pages
QCM Corrigé
charfeddine fredj
Pas encore d'évaluation
Control Big Data N°4-AU22-23
Document3 pages
Control Big Data N°4-AU22-23
Ferdaous Hdioud
Pas encore d'évaluation
Résumé Big Data
Document6 pages
Résumé Big Data
El Moumne Nihal
Pas encore d'évaluation
Examen BigData SP 1617
Document6 pages
Examen BigData SP 1617
Sofien Haddad
Pas encore d'évaluation
Chapitre 2 Hadoop-Part2
Document47 pages
Chapitre 2 Hadoop-Part2
souhail nahed
Pas encore d'évaluation
Controle Final 2020 Corrige
Document3 pages
Controle Final 2020 Corrige
Omar Mossadek
100% (2)
TP MapReduce Python
Document5 pages
TP MapReduce Python
nour elislem
Pas encore d'évaluation
QCM Docker
Document33 pages
QCM Docker
LAHDHEB Rim
67% (3)
Examen SP UE
Document4 pages
Examen SP UE
Med Nour Elhak Jouini
Pas encore d'évaluation
Credit 5bi Big Data
Document4 pages
Credit 5bi Big Data
Aouinti Ahmed
Pas encore d'évaluation
TD1 MapReduce PDF
Document5 pages
TD1 MapReduce PDF
Mr : Anas
100% (1)
td01 Hadoop
Document6 pages
td01 Hadoop
aissamemi
Pas encore d'évaluation
Hadoop
Document13 pages
Hadoop
hamid ouhnni
Pas encore d'évaluation
Td1: Hadoop: Exercice 1
Document3 pages
Td1: Hadoop: Exercice 1
ala fezai
0% (1)
Examen BigData SR 1617
Document5 pages
Examen BigData SR 1617
Med Nour Elhak Jouini
Pas encore d'évaluation
Hadoop Map Reduce Exo
Document2 pages
Hadoop Map Reduce Exo
RAMZI Azeddine
100% (2)
SujetEvaluation2017 Correction
Document5 pages
SujetEvaluation2017 Correction
Abdo Elmamoun
100% (4)
Ex Amen Big Data 1617
Document6 pages
Ex Amen Big Data 1617
Med Nour Elhak Jouini
100% (1)
BigDATA M1 GSI Corrigé - Type
Document3 pages
BigDATA M1 GSI Corrigé - Type
LAHDHEB Rim
100% (2)
Atelier 3 - Hive
Document6 pages
Atelier 3 - Hive
Chorale Voix D'Anges Tunis
Pas encore d'évaluation
TD 05
Document3 pages
TD 05
Houssem Bousri
100% (2)
TP3 Hive Correction
Document9 pages
TP3 Hive Correction
Bechir Mathlouthi
Pas encore d'évaluation
TP XML + DTD
Document2 pages
TP XML + DTD
Sadik Youssouf
Pas encore d'évaluation
Exam Final-Big Data
Document3 pages
Exam Final-Big Data
Ferdaous Hdioud
100% (3)
QCM
Document3 pages
QCM
KYRIA Help
100% (1)
Chapitre 2 - HDFS
Document23 pages
Chapitre 2 - HDFS
hiba
Pas encore d'évaluation
Exam Bd1718 SR
Document5 pages
Exam Bd1718 SR
Ayachi Emna
Pas encore d'évaluation
Test Docker MCQ & Quiz en Ligne 2020 2020 - en Ligne ..
Document14 pages
Test Docker MCQ & Quiz en Ligne 2020 2020 - en Ligne ..
Faten Abd
Pas encore d'évaluation
QCM Inf 356
Document13 pages
QCM Inf 356
Sali Yaya Farani
100% (3)
QCM Big Data
Document7 pages
QCM Big Data
zid
100% (1)
Correction Exam 2011 2012
Document5 pages
Correction Exam 2011 2012
MeHdi La
0% (1)
Initiation À La Gestion de Projet
Document21 pages
Initiation À La Gestion de Projet
Oumaima Al
Pas encore d'évaluation
Chapitre 3 Mongo Mapreduce
Document20 pages
Chapitre 3 Mongo Mapreduce
souhail nahed
Pas encore d'évaluation
TP3 TP4
Document8 pages
TP3 TP4
Nikash Gomes
Pas encore d'évaluation
La Méthode Developpement Rapid D'application: Réalisé Par
Document11 pages
La Méthode Developpement Rapid D'application: Réalisé Par
ahmed arbi
Pas encore d'évaluation
Etude de Cas QCM 1 Correction
Document4 pages
Etude de Cas QCM 1 Correction
radouane
Pas encore d'évaluation
Exercices D'application SOA
Document19 pages
Exercices D'application SOA
Shaïma Shīmöú Bõülīfi
100% (1)
Resumé Android
Document23 pages
Resumé Android
Wael Habboubi
Pas encore d'évaluation
td3 Entrepot de Donnees Et Analyse en Ligne Corrige
Document2 pages
td3 Entrepot de Donnees Et Analyse en Ligne Corrige
Akk Ramm
Pas encore d'évaluation
Video
Document16 pages
Video
Souley
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
TP5 Docker
Document9 pages
TP5 Docker
koyine9472
Pas encore d'évaluation
tp1 IRS
Document7 pages
tp1 IRS
Zohra CHANNOUF
100% (1)
TD1 STR 2021
Document2 pages
TD1 STR 2021
Gaith Belkacem
Pas encore d'évaluation
Compte Rendu TP CNA RT4
Document19 pages
Compte Rendu TP CNA RT4
Gaith Belkacem
0% (1)
Compte Rendu TP1 Communcations Optiques
Document10 pages
Compte Rendu TP1 Communcations Optiques
Gaith Belkacem
Pas encore d'évaluation
Compte Rendu TP 2 Communication Optiques
Document12 pages
Compte Rendu TP 2 Communication Optiques
Gaith Belkacem
Pas encore d'évaluation
Cours C++
Document190 pages
Cours C++
Mouna Chan
Pas encore d'évaluation
Examen N 1-Converti
Document20 pages
Examen N 1-Converti
chebbi inès
Pas encore d'évaluation
Corrigé Épreuve Théorique D'Informatique: References Et Solutions Bareme Commentaire
Document11 pages
Corrigé Épreuve Théorique D'Informatique: References Et Solutions Bareme Commentaire
Ngouen Anouar
Pas encore d'évaluation
Django TDD
Document41 pages
Django TDD
lagrange27 lagrange
Pas encore d'évaluation
Vba S1
Document28 pages
Vba S1
oumar cisse
Pas encore d'évaluation
La Programmation Reseau en Net
Document99 pages
La Programmation Reseau en Net
paasswwoorrdd
Pas encore d'évaluation
6-TD Les Exceptions Python
Document1 page
6-TD Les Exceptions Python
Younes Oulad Sayad
Pas encore d'évaluation
Rapport Final Gestion Des Paiements Emines PDF
Document33 pages
Rapport Final Gestion Des Paiements Emines PDF
Ayoub Talibi
Pas encore d'évaluation
TD8 Corrige Web
Document60 pages
TD8 Corrige Web
Centre DeltaSkills
Pas encore d'évaluation
02 Merise
Document5 pages
02 Merise
Marouane Boussellami
Pas encore d'évaluation
Norme 61508
Document37 pages
Norme 61508
gueridi
100% (1)
TP N°3 HTML 5 CSS3 4eme STI
Document7 pages
TP N°3 HTML 5 CSS3 4eme STI
Anonymous rQyZjgRM
Pas encore d'évaluation
TP1 Hadoop - HDFS
Document3 pages
TP1 Hadoop - HDFS
Zakariyae register
Pas encore d'évaluation
CV Akram Kanber
Document3 pages
CV Akram Kanber
Youssef Chaiti
Pas encore d'évaluation
FormationSpringBoot 3 SpringMVC
Document94 pages
FormationSpringBoot 3 SpringMVC
hounaine
Pas encore d'évaluation
Hibernate Reference
Document346 pages
Hibernate Reference
lareinesisi
Pas encore d'évaluation
La Plate Forme VMware Vsphere 4 Utilise La Puissance de La Virtualisation Pour Transformer Les Infrastructures de Datacenters en Cloud Computing.
Document7 pages
La Plate Forme VMware Vsphere 4 Utilise La Puissance de La Virtualisation Pour Transformer Les Infrastructures de Datacenters en Cloud Computing.
Hanen Chaib
Pas encore d'évaluation
Raport de Stage D'initiation DUT
Document30 pages
Raport de Stage D'initiation DUT
Mohamed Noury
Pas encore d'évaluation
Cours-4-Modèles D'architecture
Document46 pages
Cours-4-Modèles D'architecture
zaki nygma
Pas encore d'évaluation
Awt
Document100 pages
Awt
elaakri
Pas encore d'évaluation
Rowzvami: Alexandre
Document1 page
Rowzvami: Alexandre
Privat Serbain N'Gala
Pas encore d'évaluation
Guide Des Scripts Photoshop CS5
Document87 pages
Guide Des Scripts Photoshop CS5
Random Random
Pas encore d'évaluation
Inititiation À Python
Document36 pages
Inititiation À Python
Cyril REDIER
Pas encore d'évaluation
Comment Savoir Quel Programme Utilise Le Port TCP 80, 8080 Ou Autres - Faq
Document1 page
Comment Savoir Quel Programme Utilise Le Port TCP 80, 8080 Ou Autres - Faq
Arold Stone
Pas encore d'évaluation
Dorra Ferah: Diplomes Et Formations
Document1 page
Dorra Ferah: Diplomes Et Formations
Cherif Mohamed Yassine
Pas encore d'évaluation
Investigation Numerique: Mme El Hilaly
Document51 pages
Investigation Numerique: Mme El Hilaly
Soufain Rmiki
Pas encore d'évaluation
Robot Framework Guide de FR PDF
Document296 pages
Robot Framework Guide de FR PDF
Gabriel Grandet
100% (1)
Serie TD1
Document5 pages
Serie TD1
Sarah Nour
Pas encore d'évaluation
Django Introduction
Document39 pages
Django Introduction
Daniel Marcial Sosa Rios
Pas encore d'évaluation
Curriculum Vitae Pascal Jonckers
Document2 pages
Curriculum Vitae Pascal Jonckers
Lam Novox
Pas encore d'évaluation