Bienvenue sur Scribd !

Ignorer le carrousel

Fondements Du Big Data TP1

Transféré par

Hanane Nadi

0% ont trouvé ce document utile (0 vote)

7 vues3 pages

Titre original

Fondements du Big Data TP1

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

7 vues3 pages

Fondements Du Big Data TP1

Transféré par

Hanane Nadi

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 3

Rechercher à l'intérieur du document

Université Abdelmalek Essaadi Enseignants :

MOHAMED CHERRADI
Ecole Nationale des Sciences Appliquées &&
Al Hoceima Anass EL HADDADI

Filière : Ingénierie de données Niveau : 2ème Année

Module : Big Data
A.U : 2022/2023

TP 01 :
« Installation du Hadoop sous Windows. »
1. Objectif

Cette séance de TP constitue un premier pas vers l’utilisation d’outils Big Data. Nous avons fait le choix de
l’environnement Apache Hadoop, car c’est un Framework open-source de stockage distribué et de traitement
parallèle de données volumineuses sur un cluster HDFS.

Au terme de ce TP, vous serez capables d’installer et lancer toutes les composantes de Hadoop correctement.
Pour la configuration Hadoop, nous devons modifier les composantes répertoriés ci-dessous.

 Définir le chemin dans les variables d'environnement: Java, et Hadoop

 Core-site.xml
 Mapred-site.xml
 Hdfs-site.xml
 Yarn-site.xml
 Hadoop-env.cmd (Définir l'environnement Java Home dans Hadoop)
 Créez deux dossiers datanode et namenode

2. Installation

2.1. Configuration du NameNode (NN)

 Core-site.xml : Configurer l’essentiel de Hadoop, tel que hostname et le port du NameNode (fs.default.name)

 Hdfs-site.xml : Configurer HDFS, en particulier, les nœuds NameNode (NN), Secondary NameNode (SNN), et
les DataNode (DN)

o dfs.namenode.name.dir : La liste des répertoires ou le NameNode stocke ces métadonnées persistantes.

Le NN stocke une copie de métadonnées dans chaque répertoire de la liste.

o dfs.datanode.name.dir : Liste des répertoires dans lequel le DataNode stocke des blocs. Chaque block
est stocké dans un seul de ces répertoires.

o dfs.namenode.checkpoint.dir : Liste de répertoires dans lequel le NameNode Secondaire stocke les

checkpoints. Il stocke des checkpoints dans chaque répertoire de la liste.

o dfs.replication : Par défaut, HDFS réplique les blocks de données avec un facteur de 3. Lorsqu’il est
exécuté avec un seul DataNode, HDFS ne peut pas réplique les blocs de données en trois DataNodes. Ce
problème est résolu par la valeur 1.
Université Abdelmalek Essaadi Enseignants :
MOHAMED CHERRADI
Ecole Nationale des Sciences Appliquées &&
Al Hoceima Anass EL HADDADI

Filière : Ingénierie de données Niveau : 2ème Année

Module : Big Data
A.U : 2022/2023

Fig. 1 : Configuration du NameNode.

2.2. Démarrage du HDFS (NN && DN)

a. Formatage des fichiers systèmes :

hdfs namenode -format

- Créer les métadonnées initiales dans le disque (fsimage), dans le répertoire spécifie.

- NB : Le formatage du HDFS est obligatoire, pour que le cluster démarre

b. Démarrage du NN et DN :

start-dfs

- Une fois le cluster est démarré, après 3S :

 Les DN(s) envoient un signal de pulsation au NN, et s’inscrivent auprès du NN
 Le NN envoi à son tour ses identifiants aux DN(s)
 Interface Web pour le NN, par défaut : http://localhost:50070
 Vérification des nœuds (JVM Process Status Tool)
jps
 Arrêt des nœuds
Stop-dfs

2.3. Démarrage du HDFS (NN && DN)

 Le fichier mapred-site.xml : Configuration des paramètres du MapReduce

o mapreduce.framework.name : Runtime framework pour l’éxecution des jobs MapReduce. Elle peut
etre local, classic, ou yarn.
Université Abdelmalek Essaadi Enseignants :
MOHAMED CHERRADI
Ecole Nationale des Sciences Appliquées &&
Al Hoceima Anass EL HADDADI

Filière : Ingénierie de données Niveau : 2ème Année

Module : Big Data
A.U : 2022/2023

 Le fichier yarn.xml : Configuration des paramètres de YARN (Ressource Manager, Node Manager, …)

o yarn.nodemanager.aux-services : Indique à Node Manager qu’un service auxiliaire appelé

« mapreduce.shuffle » doit étre implementé.

o yarn.nodemanager.aux-services.mapreduce.shuffle.class : Définit la classe à utiliser pour l’opération

shuffle

Fig. 2 : Configuration du service YARN.

2.4. Démarrage du YARN

Start-yarn

 Pour afficher YARN Ressource Manager dans le navigateur : https://localhost:8080

 Pour arrêter YARN :

Stop-yarn

Vous aimerez peut-être aussi

Cours 02 Intro Hadoop
Document30 pages
Cours 02 Intro Hadoop
Michael Sniper Wu
Pas encore d'évaluation
Chapitre 2 Hadoop-Part1
Document26 pages
Chapitre 2 Hadoop-Part1
souhail nahed
100% (1)
TP1 Hadoop3.1.2
Document20 pages
TP1 Hadoop3.1.2
fatima ezzahrae el ghatous
Pas encore d'évaluation
chp2 Hadoopmapreduce
Document58 pages
chp2 Hadoopmapreduce
Arnauld
Pas encore d'évaluation
Cours1 2 Bigdata 1
Document93 pages
Cours1 2 Bigdata 1
mohamed aziz madhoun
Pas encore d'évaluation
tp1 Hdfs
Document7 pages
tp1 Hdfs
Raja Bs
Pas encore d'évaluation
tp1 BigData
Document9 pages
tp1 BigData
Haitam Laaouini
Pas encore d'évaluation
Exam Bd1718 SR
Document5 pages
Exam Bd1718 SR
Ayachi Emna
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
CH 1
Document53 pages
CH 1
ya.latreche
Pas encore d'évaluation
Bigdata
Document2 pages
Bigdata
asma.chaabouni345
Pas encore d'évaluation
Installation-Hadoop Mastere
Document17 pages
Installation-Hadoop Mastere
thouraya hsan
Pas encore d'évaluation
Control Big Data N°4-AU22-23
Document3 pages
Control Big Data N°4-AU22-23
Ferdaous Hdioud
Pas encore d'évaluation
Memoire Corg67777
Document67 pages
Memoire Corg67777
Adem Phyh
Pas encore d'évaluation
TP 2
Document4 pages
TP 2
moad
Pas encore d'évaluation
Examen Big DATA
Document4 pages
Examen Big DATA
zaki worker
Pas encore d'évaluation
TD 0 Eclipse Et HDFS
Document4 pages
TD 0 Eclipse Et HDFS
test user
Pas encore d'évaluation
Big Data
Document3 pages
Big Data
Lamiae Elgueloui
Pas encore d'évaluation
TP01 Installation de Hadoop Sous Linux
Document10 pages
TP01 Installation de Hadoop Sous Linux
Manal Ess
Pas encore d'évaluation
TP Hadoop
Document11 pages
TP Hadoop
Jas Min
Pas encore d'évaluation
BigChapitre 03 Partie02
Document11 pages
BigChapitre 03 Partie02
khliaissa46
Pas encore d'évaluation
Cours 4 Architecture - Big Data Hadoop2 HDFS YARN
Document40 pages
Cours 4 Architecture - Big Data Hadoop2 HDFS YARN
alaska8fouad
Pas encore d'évaluation
Hadoop Ecosystem
Document37 pages
Hadoop Ecosystem
hajar.filali4
Pas encore d'évaluation
TP N°1 - Installation Via Paquets
Document6 pages
TP N°1 - Installation Via Paquets
Ferdaous Hd
Pas encore d'évaluation
TP DHCP, DNS, Apache Et Mail
Document4 pages
TP DHCP, DNS, Apache Et Mail
Ivan Megaptché
Pas encore d'évaluation
TP 4 Reseaux
Document2 pages
TP 4 Reseaux
rihab
Pas encore d'évaluation
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Document7 pages
EFM Création D'une Application Cloud Native Bahae Eddine Halim
Siham DL
Pas encore d'évaluation
Chapitre 3 LEcosystème Hadoop VF
Document42 pages
Chapitre 3 LEcosystème Hadoop VF
Brahim Ben Saada
100% (1)
tp2 Map Reduce
Document5 pages
tp2 Map Reduce
Raja Bs
Pas encore d'évaluation
1 ELFADDOULI BigData HDFS 2022
Document22 pages
1 ELFADDOULI BigData HDFS 2022
abdou boulif
Pas encore d'évaluation
Chapitre2 Fondements Big Data Hdfs
Document23 pages
Chapitre2 Fondements Big Data Hdfs
Hmad SADAQ
Pas encore d'évaluation
M1101 TD 03 Correction
Document3 pages
M1101 TD 03 Correction
FH
67% (6)
Big Data
Document16 pages
Big Data
Rima CHEMENGUI
Pas encore d'évaluation
DS 2021 2022
Document2 pages
DS 2021 2022
bro
Pas encore d'évaluation
Big Data
Document6 pages
Big Data
zaki worker
Pas encore d'évaluation
2 Elfaddouli Bigdata Mapred 2022
Document25 pages
2 Elfaddouli Bigdata Mapred 2022
abdou boulif
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
Document2 pages
Mickaelbaron-Hadoopinstallation Part4
satmania
Pas encore d'évaluation
Chapter 2 HDFS and ZooKeeper - v2
Document70 pages
Chapter 2 HDFS and ZooKeeper - v2
Sweety Princess
Pas encore d'évaluation
4 Elfaddouli Bigdata Hive 2022
Document32 pages
4 Elfaddouli Bigdata Hive 2022
abdou boulif
Pas encore d'évaluation
Chapitre3 NoSQL Avec Redis
Document44 pages
Chapitre3 NoSQL Avec Redis
Godni Rodney
Pas encore d'évaluation
Fiche de TD INF 356
Document21 pages
Fiche de TD INF 356
Sali Yaya Farani
Pas encore d'évaluation
Cours Intro Hadoop v27022014 Erraki Haddad
Document62 pages
Cours Intro Hadoop v27022014 Erraki Haddad
Zohra CHANNOUF
Pas encore d'évaluation
Fiche TP N°4: Configuration Du Réseau: Objectifs
Document2 pages
Fiche TP N°4: Configuration Du Réseau: Objectifs
Mahamat Saleh
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
Sujet Linux - SRI 2020 Principal Corrigé
Document9 pages
Sujet Linux - SRI 2020 Principal Corrigé
Anass Hamzaoui
Pas encore d'évaluation
tp1 Mapreduce
Document15 pages
tp1 Mapreduce
Ivan003
Pas encore d'évaluation
TP1 Polytech
Document11 pages
TP1 Polytech
haha
Pas encore d'évaluation
Résumé Big Data
Document6 pages
Résumé Big Data
El Moumne Nihal
Pas encore d'évaluation
TP1 Hadoop
Document10 pages
TP1 Hadoop
Absence Manager
Pas encore d'évaluation
Kien Thuc&Thanh Phan
Document7 pages
Kien Thuc&Thanh Phan
Tú Trần
Pas encore d'évaluation
TP1 Spark
Document2 pages
TP1 Spark
Zakariyae register
Pas encore d'évaluation
PHP-PDO 27mars2019 (Abdelwahed)
Document16 pages
PHP-PDO 27mars2019 (Abdelwahed)
Morad EL MASLOUHY
Pas encore d'évaluation
Application Repartie
Document29 pages
Application Repartie
cedilo10
Pas encore d'évaluation
Réseau TP6
Document31 pages
Réseau TP6
jc watelet
Pas encore d'évaluation
Chapitre 2 - Programmation MapReduce
Document14 pages
Chapitre 2 - Programmation MapReduce
souhail nahed
Pas encore d'évaluation
Big DataHadoop Map Reduce
Document55 pages
Big DataHadoop Map Reduce
meriam chaouch
Pas encore d'évaluation
Atelier 1
Document13 pages
Atelier 1
Jam Muslim
Pas encore d'évaluation
Credit 5bi Big Data
Document4 pages
Credit 5bi Big Data
Aouinti Ahmed
Pas encore d'évaluation
Guide Des Commandes SED Sous Linux
D'Everand
Guide Des Commandes SED Sous Linux
Anna Sederman
Pas encore d'évaluation
Démarrer avec OpenBSD
D'Everand
Démarrer avec OpenBSD
Wesley Mouedine Assaby
Évaluation : 3 sur 5 étoiles
3/5 (1)
XFB Monitor CFT Guide Exploitation 2 4 1 UNIX FRA
Document65 pages
XFB Monitor CFT Guide Exploitation 2 4 1 UNIX FRA
grdb
100% (1)
Mise en Place Des Systèmes de Mise À Jour Et de Déploiement Automatique D - Applications Et Des Systèmes D - Éxploitation
Document103 pages
Mise en Place Des Systèmes de Mise À Jour Et de Déploiement Automatique D - Applications Et Des Systèmes D - Éxploitation
vevo tv
Pas encore d'évaluation
Serveur LDAP
Document23 pages
Serveur LDAP
test
Pas encore d'évaluation
DHCP VMware
Document12 pages
DHCP VMware
SOULEYMAN DEMBA
Pas encore d'évaluation
PNE Environnement Du Poste de Travail CP2I - DONC. Octobre Windows 10. Présentation Généralités. Version Pro (Redstone)
Document440 pages
PNE Environnement Du Poste de Travail CP2I - DONC. Octobre Windows 10. Présentation Généralités. Version Pro (Redstone)
balamurali_a
Pas encore d'évaluation
HP Intelligent Provisioning v2.30 - Configuration Du Serveur Et Installation PDF
Document14 pages
HP Intelligent Provisioning v2.30 - Configuration Du Serveur Et Installation PDF
Danielle Kamdem
Pas encore d'évaluation
Mettre en Oeuvre Le vSAN
Document13 pages
Mettre en Oeuvre Le vSAN
staojr
Pas encore d'évaluation
TP Clustering
Document15 pages
TP Clustering
starland yaounde
Pas encore d'évaluation
Commandes Reseau Windows
Document3 pages
Commandes Reseau Windows
Marouene Mabrouk
Pas encore d'évaluation
Cours Chapitre 3 SNT
Document3 pages
Cours Chapitre 3 SNT
chloclolittle
Pas encore d'évaluation
Leçon 1.la Structure D'un SE
Document4 pages
Leçon 1.la Structure D'un SE
radia gana
Pas encore d'évaluation
Stion Des Accès À Distance
Document7 pages
Stion Des Accès À Distance
org 2021
Pas encore d'évaluation
Exercices Archit
Document2 pages
Exercices Archit
lok lok
0% (1)
Feuilletage 2
Document10 pages
Feuilletage 2
Magagi Alassan
Pas encore d'évaluation
NDG Linux Essential1 Lab-Chap7 PDF
Document12 pages
NDG Linux Essential1 Lab-Chap7 PDF
Histoire pleines D'émotions
Pas encore d'évaluation
Chapitre 1 - Fiche de Cour
Document4 pages
Chapitre 1 - Fiche de Cour
H E
Pas encore d'évaluation
Exercice Compte Utilisateurs Ouverture Session
Document3 pages
Exercice Compte Utilisateurs Ouverture Session
bouki15
100% (1)
Configuration Du Serveur
Document6 pages
Configuration Du Serveur
Maryam Maryam
Pas encore d'évaluation
Active Directory 2012
Document4 pages
Active Directory 2012
Fernando Jorge
Pas encore d'évaluation
MAnuel EBP Paye V14
Document662 pages
MAnuel EBP Paye V14
Faniry
Pas encore d'évaluation
Rapport de Stage Leroux-Gc3a9rc3a9 S1sio
Document9 pages
Rapport de Stage Leroux-Gc3a9rc3a9 S1sio
gnuslim slim
Pas encore d'évaluation
Enonce TP1
Document6 pages
Enonce TP1
Assil Bouaziz
Pas encore d'évaluation
La Programmation Système en C Sous Unix
Document58 pages
La Programmation Système en C Sous Unix
Fadhul Djirame
Pas encore d'évaluation
TP2 PDF
Document2 pages
TP2 PDF
Étoile Jolie
100% (1)
GnuLinux Installation LM
Document36 pages
GnuLinux Installation LM
idass
Pas encore d'évaluation
4 SSH
Document16 pages
4 SSH
JEAN MEBENGA MBALLA
Pas encore d'évaluation
Cours 2024 SYSTÈMES D'EXPLOITATIONS
Document175 pages
Cours 2024 SYSTÈMES D'EXPLOITATIONS
djakou magdiel
Pas encore d'évaluation
Architecture Windows NT
Document112 pages
Architecture Windows NT
Abdelmalek
Pas encore d'évaluation
TD TP Systeme Deust1
Document2 pages
TD TP Systeme Deust1
May May
Pas encore d'évaluation
Tp3 Config Réseau Telnet SshV2
Document4 pages
Tp3 Config Réseau Telnet SshV2
Ay Sar
Pas encore d'évaluation