Bienvenue sur Scribd !

Ignorer le carrousel

Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main

Transféré par

Hmad SADAQ

0% ont trouvé ce document utile (0 vote)

1 vues24 pages

Titre original

TP1

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

1 vues24 pages

Traitement Du Big Data: TP1 Apache Hadoop: Installation Et Prise en Main

Transféré par

Hmad SADAQ

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 24

Rechercher à l'intérieur du document

Traitement

du Big Data
TP 1
Apache Hadoop : Installation et prise en main

Nassim Bahri M1 DSSD

Objectifs du Installation du framework hadoop

TP en se basant sur les conteneurs

Docker.

Apprendre les concepts et les

commandes afin de bien gérer les
fichiers sur HDFS.
Présentation de Hadoop
Apache Hadoop est un framework open-source
pour stocker et traiter les données
volumineuses sur un cluster.
HDFS (Hadoop Distributed File System)

Système de fichiers distribués permettant de stocker des fichiers de très

grandres tailles.
MapReduce

(Framework développé par Google) Système de traitement parallèle de grands

ensembles de données.
Présentation de Hadoop
(Job Tracker)

(Task Tracker)
Ecosystème de Hadoop
Les
distributions
de Hadoop
Installation
J'ai besoin d'une
distribution Linux.
comment dois-je
procéder ?
Présentation de docker
Docker est un logiciel libre permettant facilement de
lancer des applications dans des conteneurs logiciels.

L'utilisation des contenaires nous permettra de réduire considérablement la

complexité de configuration des machines ainsi que la lourdeur d'exécution (si
on opte pour l'utilisation d'une machine virtuelle).

Avantages

Portabilité - Meilleurs performances - Déploiement

Présentation de docker

Conteneurs Docker vs machines virtuelles

Présentation de docker
Etape 1 : Installation de Docker

https://docs.docker.com/get-docker/
Etape 2 : Installation de l'image
Hadoop
1- Télécharger l'image depuis le
Docker hub

2- Vérifier que l’image a bien été

téléchargée
Etape 3 : Lancer l'image Hadoop

3- Lancer l'image
Hadoop (l'une des
commandes)

--name : Pour spécifier le nom du conteneur

Etape 3 : Lancer l'image Hadoop

4- Afficher les conteneurs en cours

d'exécution

-a : Pour afficher tous les conteneurs disponibles (même ceux qui sont morts)
Etape 3 : Lancer l'image Hadoop

5- Accéder au conteneur en
mode shell

Option 2
Lancer le conteneur en mode
interactif (replace les étapes 4+5)
Etape 3 : Lancer l'image Hadoop

5- Lancer les services Hadoop

7- Vérifier que tous les services sont en

cours d'exécution
Premiers pas avec Hadoop
Toutes les commandes interagissant avec le système Hadoop commencent par
hadoop fs (aussi hdfs dfs). Ensuite, les options rajoutées sont très largement
inspirées des commandes Unix standard.

1- Créer un répertoire dans HDFS, appelé input (Tapez l'une de ces commandes)
Premiers pas avec Hadoop
2- Vérifier si le répertoire a bien été créé)

3- Télécharger un fichier distant

https://www.nassimbahri.ovh/docs/bigdata/words.txt
Premiers pas avec Hadoop
4- Vérifier si le fichier est bien placé dans
votre répertoire locale

5- Placer le fichier words.txt

dans le répertoire input que
vous avez créé

6- Afficher le contenu du
répertoire input
Les commandes Hadoop
Commande Fonctionnalité

hdfs dfs -help Afficher l'aide

hdfs dfs -ls [répertoire] Afficher le contenu du répertoire

Upload un fichier dans hadoop (à partir du répertoire

hdfs dfs –put file.txt
courant linux)

Download un fichier à partir de hadoop sur votre

hdfs dfs –get file.txt
disque local

hdfs dfs –tail file.txt Lire les dernières lignes du fichier

Les commandes Hadoop
Commande Fonctionnalité

hdfs dfs –cat file.txt Affiche tout le contenu du fichier

hdfs dfs –mv file.txt newfile.txt Renommer le fichier

hdfs dfs –rm newfile.txt Supprimer le fichier

hdfs dfs –cat file.txt \| less Lire le fichier page par page
Commandes Docker
Sauvegarder les modifications

Arrêter le conteneur
Références
https://www.youtube.com/watch?v=caXHwYC3tq8

https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-
common/SingleCluster.html

https://www.edureka.co/blog/install-hadoop-single-node-hadoop-cluster
Merci pour votre
attention

Vous aimerez peut-être aussi

Presentation Hadoop
Document27 pages
Presentation Hadoop
khadidja khadidja
Pas encore d'évaluation
Blockchain La Rã©volution de La Confiance by Laurent Leloup
Document280 pages
Blockchain La Rã©volution de La Confiance by Laurent Leloup
Christian Emmanuel Nkengne
Pas encore d'évaluation
TP1 Hadoop
Document2 pages
TP1 Hadoop
Manel Hkimi
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Document11 pages
TP #1: Le Traitement Batch Avec Hadoop, Hdfs Et Mapreduce
Rim Hancha
Pas encore d'évaluation
tp1 Enrichie 2018
Document5 pages
tp1 Enrichie 2018
Rania Benamara
Pas encore d'évaluation
Atelier HDFS
Document5 pages
Atelier HDFS
Fredj Kriaa
Pas encore d'évaluation
Cluster Hadoop - Docker Portainee
Document33 pages
Cluster Hadoop - Docker Portainee
Oumayma Naffeti
Pas encore d'évaluation
Hadoop Distributed File System - Utilisation Pratique D'un Cluster PDF
Document1 page
Hadoop Distributed File System - Utilisation Pratique D'un Cluster PDF
rim
Pas encore d'évaluation
Projet Majeur
Document1 page
Projet Majeur
nouharakrouki822
Pas encore d'évaluation
TP1 - HDFS VF
Document9 pages
TP1 - HDFS VF
Chaymae
Pas encore d'évaluation
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Document11 pages
Apache Hadoop Installation On Ubuntu (Multi-Node Cluster) .
Hanane Nadi
Pas encore d'évaluation
Gestion de Données Avec HDFS
Document7 pages
Gestion de Données Avec HDFS
z.essiddiqi
Pas encore d'évaluation
Chapitre II - Hadoop
Document37 pages
Chapitre II - Hadoop
Mariem SELMI
Pas encore d'évaluation
Atelier Big Data
Document16 pages
Atelier Big Data
Abdelhakim Traouli
Pas encore d'évaluation
Lab2 Hdfs
Document9 pages
Lab2 Hdfs
Maryâm Bôuch
Pas encore d'évaluation
TP1 Hadoop
Document7 pages
TP1 Hadoop
Anass Hamzaoui
Pas encore d'évaluation
Video
Document16 pages
Video
Souley
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
TP1 Hadoop - HDFS
Document3 pages
TP1 Hadoop - HDFS
Zakariyae register
Pas encore d'évaluation
TP1 Hadoop
Document10 pages
TP1 Hadoop
Absence Manager
Pas encore d'évaluation
Tp1 Bigdata Mapreduce 171031163107
Document8 pages
Tp1 Bigdata Mapreduce 171031163107
Koffi Kanga
Pas encore d'évaluation
tp1 Hdfs
Document7 pages
tp1 Hdfs
Raja Bs
Pas encore d'évaluation
Semaine 3
Document63 pages
Semaine 3
benben08
Pas encore d'évaluation
Ch3 Big Data Hdfs Map Reduce
Document52 pages
Ch3 Big Data Hdfs Map Reduce
Younes Oulad Sayad
Pas encore d'évaluation
Installation Cloudera HDFS
Document5 pages
Installation Cloudera HDFS
noussa79
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
Manipulations Sur HDFS
Document2 pages
Manipulations Sur HDFS
hiba
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
Atelier Framework Big Data PDF
Document21 pages
Atelier Framework Big Data PDF
Zohra CHANNOUF
Pas encore d'évaluation
Chap2 Hadoop
Document74 pages
Chap2 Hadoop
Abdelhakim Traouli
Pas encore d'évaluation
Lab 2
Document3 pages
Lab 2
Hammami Mélek
Pas encore d'évaluation
Fonctionnement Du Système de Fichiers Distribués Hadoop (HDFS)
Document5 pages
Fonctionnement Du Système de Fichiers Distribués Hadoop (HDFS)
Hanane Nadi
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part8
Document2 pages
Mickaelbaron-Hadoopinstallation Part8
satmania
Pas encore d'évaluation
Le Cluster Hadoop
Document8 pages
Le Cluster Hadoop
Amidou Bagayogo
Pas encore d'évaluation
Installation-Hadoop Mastere
Document17 pages
Installation-Hadoop Mastere
thouraya hsan
Pas encore d'évaluation
TP N°1 - Installation Via Paquets
Document6 pages
TP N°1 - Installation Via Paquets
Ferdaous Hd
Pas encore d'évaluation
Procedure D'installation de Hadoop
Document13 pages
Procedure D'installation de Hadoop
Aymen Bouazizi
100% (1)
TP Hadoop
Document50 pages
TP Hadoop
Mohamed
Pas encore d'évaluation
Word Count
Document5 pages
Word Count
nouharakrouki822
Pas encore d'évaluation
Mooc Fun Big Data Semaine 9 Hadoop
Document84 pages
Mooc Fun Big Data Semaine 9 Hadoop
MONTCHO Wesley
Pas encore d'évaluation
TP2 Big Data Env Docker
Document3 pages
TP2 Big Data Env Docker
inesabdelali11
Pas encore d'évaluation
Cours Pig
Document93 pages
Cours Pig
Oussama Panorama
Pas encore d'évaluation
Hadoop
Document89 pages
Hadoop
CHAIMA SAKKA
Pas encore d'évaluation
Big Data
Document16 pages
Big Data
Rima CHEMENGUI
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
Document9 pages
TP1 BigDataAnalytics Initiation Hadoop
Souley
Pas encore d'évaluation
Hive Installation
Document37 pages
Hive Installation
Sana Bakrim
100% (1)
TP1 Installation
Document7 pages
TP1 Installation
bouazizchahine7
Pas encore d'évaluation
1atelier 1 - Installation Hadoop - V23-24
Document11 pages
1atelier 1 - Installation Hadoop - V23-24
Fredj Kriaa
Pas encore d'évaluation
CBD TP
Document6 pages
CBD TP
zemer
Pas encore d'évaluation
Cours 02 Intro Hadoop
Document30 pages
Cours 02 Intro Hadoop
Michael Sniper Wu
Pas encore d'évaluation
Hadoop
Document25 pages
Hadoop
adjemi_brahim
100% (2)
Technologies Big Data: Zouhair Elamrani Abou Elassad
Document75 pages
Technologies Big Data: Zouhair Elamrani Abou Elassad
jon cina
Pas encore d'évaluation
Commandes Hadoop
Document10 pages
Commandes Hadoop
Yasser Radouani
Pas encore d'évaluation
Hadoop Distributed File System - Dans Quel But Utiliser HDFS - PDF
Document1 page
Hadoop Distributed File System - Dans Quel But Utiliser HDFS - PDF
rim
Pas encore d'évaluation
Cours Intro Hadoop v27022014 Erraki Haddad
Document62 pages
Cours Intro Hadoop v27022014 Erraki Haddad
Zohra CHANNOUF
Pas encore d'évaluation
TP1 - HadoopReseauPont - TP1 - HadoopReseauPont
Document4 pages
TP1 - HadoopReseauPont - TP1 - HadoopReseauPont
Roland Kagbo
Pas encore d'évaluation
Lecture 3-1 (FR)
Document1 page
Lecture 3-1 (FR)
Ismail Mourid
Pas encore d'évaluation
Ubuntu Server 10.04
D'Everand
Ubuntu Server 10.04
MARTIN Pierre-Jean
Pas encore d'évaluation
Python Et Le Module Pandas Pour Gérer Et Analyser Des Données
Document1 page
Python Et Le Module Pandas Pour Gérer Et Analyser Des Données
Hmad SADAQ
Pas encore d'évaluation
Ex - Symétrie Centrale
Document4 pages
Ex - Symétrie Centrale
Hmad SADAQ
Pas encore d'évaluation
Correction TD Résolution Systèmes Linéaires
Document3 pages
Correction TD Résolution Systèmes Linéaires
Hmad SADAQ
Pas encore d'évaluation
Durée: 2 Heures (Documents Autorisés) : Abderrahim - Chariete@
Document6 pages
Durée: 2 Heures (Documents Autorisés) : Abderrahim - Chariete@
Hmad SADAQ
Pas encore d'évaluation
Ch6 Introduction À La Science de Données
Document15 pages
Ch6 Introduction À La Science de Données
Hmad SADAQ
Pas encore d'évaluation
Bases de Donnee Reparties
Document10 pages
Bases de Donnee Reparties
Hmad SADAQ
Pas encore d'évaluation
Poly TP MongoDB
Document8 pages
Poly TP MongoDB
Hmad SADAQ
Pas encore d'évaluation
Calcule Les Opérations Suivantes:: Les Nombres Relatifs: (Addition Et Soustraction)
Document4 pages
Calcule Les Opérations Suivantes:: Les Nombres Relatifs: (Addition Et Soustraction)
Hmad SADAQ
Pas encore d'évaluation
NoSQL AZOUGAGH
Document172 pages
NoSQL AZOUGAGH
Hmad SADAQ
Pas encore d'évaluation
Apercu
Document13 pages
Apercu
Hmad SADAQ
Pas encore d'évaluation
Chapitre2 Fondements Big Data Hdfs
Document23 pages
Chapitre2 Fondements Big Data Hdfs
Hmad SADAQ
Pas encore d'évaluation
Comment Télécharger La Vidéo Bloquée Depuis YouTube Grace Au Serveur Proxy
Document4 pages
Comment Télécharger La Vidéo Bloquée Depuis YouTube Grace Au Serveur Proxy
RBJ
Pas encore d'évaluation
Liste Des Codes de Triche GTA 5 Sur PS5, PS4, PS3, Xbox Series X - S, Xbox One Et PC
Document7 pages
Liste Des Codes de Triche GTA 5 Sur PS5, PS4, PS3, Xbox Series X - S, Xbox One Et PC
leiisikanisdorgeless
Pas encore d'évaluation
4 Fonctions
Document30 pages
4 Fonctions
malick avery
Pas encore d'évaluation
Module2-Collect de Données Prise en Main ODK-Kobo PDF
Document51 pages
Module2-Collect de Données Prise en Main ODK-Kobo PDF
Moh Moha
Pas encore d'évaluation
Rapport Miage
Document14 pages
Rapport Miage
Thami Addou
Pas encore d'évaluation
Synthese Python NSI
Document2 pages
Synthese Python NSI
Manal Elhijazi
Pas encore d'évaluation
Technologies Réseaux Longue Distance
Document8 pages
Technologies Réseaux Longue Distance
Lucie Marchand
Pas encore d'évaluation
SRM Datasheet
Document4 pages
SRM Datasheet
Rochdi Bouzaien
Pas encore d'évaluation
Ospf
Document46 pages
Ospf
top2box
Pas encore d'évaluation
Guide Utilisation GED
Document15 pages
Guide Utilisation GED
chãymãę el fechtali
Pas encore d'évaluation
Preparation Du Concours Master 2018 (BD)
Document4 pages
Preparation Du Concours Master 2018 (BD)
Ahoussou Martin Yao
Pas encore d'évaluation
Chapitre1-Introduction POO
Document35 pages
Chapitre1-Introduction POO
Nadjah Namane
100% (1)
Programmes en Python Sur Les Suites Numériques - CORRIGE
Document4 pages
Programmes en Python Sur Les Suites Numériques - CORRIGE
WAHID Sofia
Pas encore d'évaluation
Fiche Pédagogique - Traitement de Texte
Document2 pages
Fiche Pédagogique - Traitement de Texte
Abdessamad Gabbadi
100% (1)
calendrier-SMI - Contrôle - Automne 2023-2024-Session-Normale-Janvier-2023
Document1 page
calendrier-SMI - Contrôle - Automne 2023-2024-Session-Normale-Janvier-2023
vejedey334
Pas encore d'évaluation
Concours de Recrutement Des Techniciens de 3è
Document5 pages
Concours de Recrutement Des Techniciens de 3è
titousse
Pas encore d'évaluation
Cours1 Asd
Document48 pages
Cours1 Asd
Amira Byoussef
Pas encore d'évaluation
Les Bus de Terrain
Document28 pages
Les Bus de Terrain
a
Pas encore d'évaluation
Guide Utilisation Etendue
Document83 pages
Guide Utilisation Etendue
Staifa Simo
Pas encore d'évaluation
Histsys
Document307 pages
Histsys
Gabriel Patrascu
Pas encore d'évaluation
Programme Bachelor AIS 2023-2024
Document34 pages
Programme Bachelor AIS 2023-2024
Amad Diallo
Pas encore d'évaluation
Cours IB Chapitre I (Partie2)
Document63 pages
Cours IB Chapitre I (Partie2)
Oussama Essaouli
Pas encore d'évaluation
3eme GE PDF
Document223 pages
3eme GE PDF
Oumayma Shili
100% (2)
Ocp Oracle Plsqlv3.1
Document114 pages
Ocp Oracle Plsqlv3.1
Adda Issa Abdoul Razak
Pas encore d'évaluation
L'algorithme D'echange Des Cles Diffie-Hellman
Document7 pages
L'algorithme D'echange Des Cles Diffie-Hellman
tchonang2001
0% (1)
Sécurité Chapitre 1
Document30 pages
Sécurité Chapitre 1
RKAM Mellecem
Pas encore d'évaluation
Queue Prog
Document10 pages
Queue Prog
ichawayumayanda
Pas encore d'évaluation
Etude de Cas 3
Document6 pages
Etude de Cas 3
radouane
Pas encore d'évaluation
ONDCA CCTP Vconsult
Document76 pages
ONDCA CCTP Vconsult
Alfred Doucet
100% (1)