Bienvenue sur Scribd !

Ignorer le carrousel

Bigdata

Transféré par

mohamedaligharbi20

0% ont trouvé ce document utile (0 vote)

6 vues3 pages

Titre original

bigdata

Copyright

Formats disponibles

DOCX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

6 vues3 pages

Bigdata

Transféré par

mohamedaligharbi20

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 3

Rechercher à l'intérieur du document

Sujet : Problème d'installation de JDK sous Ubuntu et Étapes des TP3

Chère maysam chaari

J'espère que vous allez bien. Je vous écris pour vous informer d'un problème technique que j'ai
rencontré en essayant de terminer le tp3. J'ai rencontré des difficultés pour installer le JDK (Kit de
développement Java) sur mon système Ubuntu malgré plusieurs tentatives et diverses solutions.

J'ai suivi plusieurs guides et étapes de dépannage disponibles en ligne, mais malheureusement, je n'ai
pas réussi à résoudre ce problème. En conséquence, je ne suis pas en mesure d'exécuter les tâches
requises pour le tp 3 qui impliquent des activités liées à Java.

Cependant, je suis déterminé(e) à terminer l'assignation et j'ai énuméré ci-dessous les étapes des tp3 :

Objectif du TP :

Le TP vise à acquérir une compréhension approfondie du fonctionnement du système de fichiers

distribués Hadoop (HDFS) et à maîtriser l'exécution des programmes avec le modèle MapReduce. Plus
précisément, les objectifs incluent la mise en place de HDFS, l'installation de Python, l'exécution d'un
programme MapReduce pour effectuer le décompte des occurrences de mots dans un fichier texte, ainsi
que l'exécution de programmes MapReduce supplémentaires pour d'autres tâches spécifiques.

Procédures d'exécution des programmes Map et Reduce avec Python :

Mise en place de HDFS :

Démarrage des démons Hadoop avec start-dfs.sh et start-yarn.sh.

Création des répertoires monTravail et data dans HDFS.

Déplacement des fichiers vers ces répertoires avec des commandes telles que hdfs dfs -mkdir et hdfs dfs
-mv.

Installation de Python :

Installation de Python via la commande sudo apt-get install python.

Vérification de l'installation avec python --version.

Exécution d'un programme MapReduce :

Écriture de scripts Python pour le mappage (mapper.py) et la réduction (reducer.py).

Test local des scripts pour le comptage des occurrences de mots dans un fichier texte (Book.txt).

Exécution des scripts sur Hadoop via Hadoop Streaming avec les fichiers mappés et réduits.

Testez votre code localement, puis avec Hadoop :

Tests Locaux :

Pour chaque script, les tests locaux sont effectués en utilisant des commandes telles que cat
<Emplacementfichier_Book> | python <emplacement_de_code_mapper>.

Les résultats sont vérifiés pour s'assurer que les scripts fonctionnent correctement avant l'exécution sur
Hadoop.

Tests avec Hadoop :

Les mêmes scripts sont exécutés avec Hadoop en utilisant Hadoop Streaming pour le mappage et la
réduction.

Les résultats sont comparés avec les tests locaux pour assurer la cohérence et la précision des calculs
effectués par Hadoop.

Description et justification de votre solution :

La solution utilise le modèle MapReduce pour traiter des tâches de traitement de données sur un
système distribué.

L'utilisation de HDFS permet la gestion distribuée des données, offrant évolutivité et tolérance aux
pannes.

Python a été choisi pour la simplicité et la facilité de mise en œuvre des scripts MapReduce.

La comparaison entre les tests locaux et les tests avec Hadoop révèle souvent des différences dans les
performances, la gestion des données volumineuses, et la répartition de charge de travail.

Je vous demande votre aide ou toute autre solution que vous pourriez suggérer pour m'aider à
surmonter cet obstacle. Je suis désireux(se) d'apprendre et de remplir les exigences de l'assignation dès
que possible.
Je vous remercie pour votre compréhension et votre soutien.

Cordialement,

[Mohamed Ali Gharbi]

Vous aimerez peut-être aussi

Spring Boot Codingame
Document10 pages
Spring Boot Codingame
rahmoucha125
100% (3)
TP 3 - Exercices Map Reduce
Document3 pages
TP 3 - Exercices Map Reduce
ines
75% (4)
td01 Hadoop
Document6 pages
td01 Hadoop
aissamemi
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
Document6 pages
tp2 Designpatternsdanshadoop 140428050218 Phpapp02
chebinega
Pas encore d'évaluation
Hadoop Ecosystem
Document37 pages
Hadoop Ecosystem
hajar.filali4
Pas encore d'évaluation
Mbds Big Data Hadoop 2019 2020 TP 1
Document17 pages
Mbds Big Data Hadoop 2019 2020 TP 1
Pevo Jo
Pas encore d'évaluation
Hadoop TP MSBG
Document7 pages
Hadoop TP MSBG
zemer
Pas encore d'évaluation
MAPREDUCE
Document9 pages
MAPREDUCE
patrice mvogo
Pas encore d'évaluation
Technologies Big Data: Zouhair Elamrani Abou Elassad
Document75 pages
Technologies Big Data: Zouhair Elamrani Abou Elassad
jon cina
Pas encore d'évaluation
Prati Que
Document17 pages
Prati Que
Ch Rïs
Pas encore d'évaluation
Njava TP
Document9 pages
Njava TP
Alfred degny
Pas encore d'évaluation
Cluster Hadoop - Docker Portainee
Document33 pages
Cluster Hadoop - Docker Portainee
Oumayma Naffeti
Pas encore d'évaluation
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Document11 pages
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Rim Hancha
Pas encore d'évaluation
Chapitre 2 - Programmation MapReduce
Document14 pages
Chapitre 2 - Programmation MapReduce
souhail nahed
Pas encore d'évaluation
tp2 Map Reduce
Document5 pages
tp2 Map Reduce
Raja Bs
Pas encore d'évaluation
0303 Apprendre Langage Programmation Ruby
Document79 pages
0303 Apprendre Langage Programmation Ruby
Oumar KOITA
Pas encore d'évaluation
Chap 7
Document25 pages
Chap 7
syslinux2000
Pas encore d'évaluation
TP2 MapReduce 02 2024
Document8 pages
TP2 MapReduce 02 2024
Rihane Farah
Pas encore d'évaluation
Programmation Hadoop
Document11 pages
Programmation Hadoop
شيبي محمد
100% (1)
Création de Logiciel Scolaire Avec DJANGO
Document12 pages
Création de Logiciel Scolaire Avec DJANGO
Lamine Sarr
100% (1)
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
Laravel
Document30 pages
Laravel
guellalmohand.anesrif
Pas encore d'évaluation
tp1 IRS
Document7 pages
tp1 IRS
Zohra CHANNOUF
100% (1)
Guide Optimiser Images Docker
Document16 pages
Guide Optimiser Images Docker
rabeh.abassi
Pas encore d'évaluation
Leçon - Hadoop MapReduce c3
Document16 pages
Leçon - Hadoop MapReduce c3
Hajri
Pas encore d'évaluation
Hands-On Lab - Hands-On Lab - AC1 Courseware - WeThink Edx
Document1 page
Hands-On Lab - Hands-On Lab - AC1 Courseware - WeThink Edx
MaRoua Abdelhafidh
Pas encore d'évaluation
Introduction À Laravel - Cours
Document21 pages
Introduction À Laravel - Cours
Jean marc Konan
Pas encore d'évaluation
Conpte Rendus Ss
Document8 pages
Conpte Rendus Ss
hyont dev
Pas encore d'évaluation
Programmation Hadoop WordCount
Document18 pages
Programmation Hadoop WordCount
Hammami Mélek
Pas encore d'évaluation
Couche DB
Document19 pages
Couche DB
Améth Ndiaye
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
Cours C#
Document118 pages
Cours C#
Mouhamed Rassoul Gueye
Pas encore d'évaluation
CH 3
Document6 pages
CH 3
Hakim Farhani
Pas encore d'évaluation
TP1 Hadoop3.1.2
Document20 pages
TP1 Hadoop3.1.2
fatima ezzahrae el ghatous
Pas encore d'évaluation
Corr Tri FF TH 2014
Document15 pages
Corr Tri FF TH 2014
Issam Ouakid
Pas encore d'évaluation
Travaux Pratiques OS Linux
Document34 pages
Travaux Pratiques OS Linux
Deiss Gonnon
Pas encore d'évaluation
Projet Du Cours Ecosysteme Du Big Data
Document1 page
Projet Du Cours Ecosysteme Du Big Data
Wilfride
Pas encore d'évaluation
02 Prépare Le Serveur À La Mise en Réseau
Document13 pages
02 Prépare Le Serveur À La Mise en Réseau
pladardmpundu10
Pas encore d'évaluation
Fiche 1
Document3 pages
Fiche 1
brahim ousman
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
Document12 pages
TP N°2 - Exemple Word Count Avec Hadoop
ines
Pas encore d'évaluation
Administration Systeme Sous Linux Red Hat 4
Document44 pages
Administration Systeme Sous Linux Red Hat 4
KOUASSI
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
CH 2 Hadoop
Document56 pages
CH 2 Hadoop
Rihane Farah
Pas encore d'évaluation
Tp1 Bigdata Mapreduce 171031163107
Document8 pages
Tp1 Bigdata Mapreduce 171031163107
Koffi Kanga
Pas encore d'évaluation
01 - Configurer-Environnement-Golang
Document4 pages
01 - Configurer-Environnement-Golang
Christian Biboue
Pas encore d'évaluation
CBD TP
Document6 pages
CBD TP
zemer
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
Présentation D'HADOOP
Document38 pages
Présentation D'HADOOP
Ferdinand Owona
Pas encore d'évaluation
TP4-5 Spark
Document21 pages
TP4-5 Spark
Mazozi safae
Pas encore d'évaluation
Éléments Essentiels de La Programmation en Python: Module 4: Dans Ce Module, Vous Découvrirez
Document71 pages
Éléments Essentiels de La Programmation en Python: Module 4: Dans Ce Module, Vous Découvrirez
Abderrahim Boulakhbar
Pas encore d'évaluation
Pig Hive Mahout Benali Mounir
Document30 pages
Pig Hive Mahout Benali Mounir
chaimaeelhmami20
Pas encore d'évaluation
Gschwend Matthieu 3 Presentation 012023
Document18 pages
Gschwend Matthieu 3 Presentation 012023
Sayoba Gansane
Pas encore d'évaluation
Tuto Python & Pandas - Installation Et Manipulations de Base
Document18 pages
Tuto Python & Pandas - Installation Et Manipulations de Base
deogratias davo
Pas encore d'évaluation
Cours Cs 1
Document7 pages
Cours Cs 1
Syrine Bouhachem
Pas encore d'évaluation
Exam Bd1718 SR
Document5 pages
Exam Bd1718 SR
Ayachi Emna
Pas encore d'évaluation
PCEP - Python Module 4
Document72 pages
PCEP - Python Module 4
Salwa Ben
Pas encore d'évaluation
Initiation À La Programmation en C#
Document420 pages
Initiation À La Programmation en C#
Gasy Cool
Pas encore d'évaluation
Big Data: Marie NDIAYE
Document11 pages
Big Data: Marie NDIAYE
Serigne Ndour
Pas encore d'évaluation
Le Cluster Hadoop
Document8 pages
Le Cluster Hadoop
Amidou Bagayogo
Pas encore d'évaluation
Programmer en JavaScript
D'Everand
Programmer en JavaScript
Preston Prescott
Évaluation : 4.5 sur 5 étoiles
4.5/5 (2)
TD 1 Se
Document2 pages
TD 1 Se
talamahcen warda
Pas encore d'évaluation
UE Cybersecurite-TP DVWA v0.6
Document58 pages
UE Cybersecurite-TP DVWA v0.6
Pape Mignane Faye
Pas encore d'évaluation
L'initiation HTML CSS PDF
Document371 pages
L'initiation HTML CSS PDF
Mosinfo TIC
Pas encore d'évaluation
Es Exceptions: Exercice 1
Document4 pages
Es Exceptions: Exercice 1
Louay Sejine
100% (2)
TS PcVue Architecturesdeployment FR
Document53 pages
TS PcVue Architecturesdeployment FR
Hosni Ben Khimissa
Pas encore d'évaluation
Fiche - Apprenez A Programmer en Javascript
Document1 page
Fiche - Apprenez A Programmer en Javascript
Oumarou yacouba Abdourazak
Pas encore d'évaluation
Cecfod Busness School
Document3 pages
Cecfod Busness School
madjirebaye evian peguy
Pas encore d'évaluation
BPOO Heritage Polymorphisme x4
Document9 pages
BPOO Heritage Polymorphisme x4
Donia Fioklou
Pas encore d'évaluation
Market Projet Web en 15 Étapes
Document17 pages
Market Projet Web en 15 Étapes
Mystère Desy
Pas encore d'évaluation
Tp2 Corrige
Document6 pages
Tp2 Corrige
Mina Mint Chighali
Pas encore d'évaluation
Info
Document2 pages
Info
Abdul Koudouss Kone
Pas encore d'évaluation
14-15 brochureWD14
Document2 pages
14-15 brochureWD14
Rony Germon
Pas encore d'évaluation
Guide Pratique Pour Démarrer Avec Prolog: Anonyme (Désigne Une Variable Dont La Valeur Ne Nous Intéresse Pas)
Document4 pages
Guide Pratique Pour Démarrer Avec Prolog: Anonyme (Désigne Une Variable Dont La Valeur Ne Nous Intéresse Pas)
Ikram Merour
Pas encore d'évaluation
Les Types Avancees Windev
Document66 pages
Les Types Avancees Windev
Nguessan Kouadio
100% (2)
Cours MS Access VBA
Document26 pages
Cours MS Access VBA
abdoulaye
Pas encore d'évaluation
Les 50 Raccourcis Clavier Indispensables À Ta Productivité
Document13 pages
Les 50 Raccourcis Clavier Indispensables À Ta Productivité
adama sall
Pas encore d'évaluation
TD 1
Document3 pages
TD 1
jaik Duhamel
Pas encore d'évaluation
05 - Windows 10 - Optimisation Et Maintenance
Document30 pages
05 - Windows 10 - Optimisation Et Maintenance
momo9278
Pas encore d'évaluation
CHANDOUL SupCom
Document23 pages
CHANDOUL SupCom
chammem
Pas encore d'évaluation
Rapport Admin Linux Avancee Grp1
Document25 pages
Rapport Admin Linux Avancee Grp1
Sugesh ANANDAN
Pas encore d'évaluation
ZHPCleaner (R)
Document2 pages
ZHPCleaner (R)
khayisam
Pas encore d'évaluation
Copier Une Base de Données Vers Une Autre Avec Talend - BI Experience
Document5 pages
Copier Une Base de Données Vers Une Autre Avec Talend - BI Experience
Anonymous 1P2S4tbM
Pas encore d'évaluation
TP Service NFS Sur Ubuntu 20
Document12 pages
TP Service NFS Sur Ubuntu 20
asmaa kassid
Pas encore d'évaluation
Presentation GLPI
Document15 pages
Presentation GLPI
abdoulaye24.ndiaye
Pas encore d'évaluation
Own Cloud
Document26 pages
Own Cloud
Akhd Diop
Pas encore d'évaluation
AndriantahinaMinohasina ESPA MAST 18
Document101 pages
AndriantahinaMinohasina ESPA MAST 18
boris esser
Pas encore d'évaluation
Conception Et Developpement D'un Logiciel de Gestion Commerciale
Document12 pages
Conception Et Developpement D'un Logiciel de Gestion Commerciale
Shek Matte
Pas encore d'évaluation
Chapitre I Sous-Programmes PDF
Document12 pages
Chapitre I Sous-Programmes PDF
Adem Allab
Pas encore d'évaluation
Installation Et Configuration Du Serveur Web Apache
Document6 pages
Installation Et Configuration Du Serveur Web Apache
fatimamoussaid792
Pas encore d'évaluation