Académique Documents
Professionnel Documents
Culture Documents
TP1 Polytech
TP1 Polytech
• Installation openJDK
❖ Utilisez la commande suivante pour mettre à jour votre système avant de
lancer une nouvelle installation :
1
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
2
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
ssh localhost
3
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
Wget https://dlcdn.apache.org/hadoop/common/hadoop-3.2.2/hadoop-
3.2.2.tar.gz
4
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
Rappel
❖ :d
Définissez les variables d'environnement Hadoop en ajoutant le contenu
suivant à la fin du fichier :
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export JAVA_INSTALL=$JAVA_HOME
export HADOOP_HOME=/home/mayssa/hadoop-3.2.2
export HADOOP_INSTALL=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native"
5
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
source ~/.bashrc
6
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
7
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
Ajoutez la configuration suivante pour remplacer les valeurs par défaut du répertoire
temporaire et ajoutez votre URL HDFS pour remplacer le paramètre du système de
fichiers local par défaut :
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/mayssa/tmpdata</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://127.0.0.1:9000</value>
</property>
</configuration>
Ajoutez la configuration suivante au fichier et, si nécessaire, ajustez les répertoires NameNode et
DataNode à vos emplacements personnalisés :
<configuration>
<property>
<name>dfs.data.dir</name>
<value>/home/mayssa/dfsdata/namenode</value>
</property>
<property>
8
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
<name>dfs.data.dir</name>
<value>/home/mayssa/dfsdata/datanode</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
Utilisez la commande suivante pour accéder au fichier mapred-site.xml et définir les valeurs
MapReduce :
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
9
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
Le fichier fil-site.xml est utilisé pour définir les paramètres relatifs à YARN . Il
contient des configurations pour Node Manager, Resource Manager,
Containers et Application Master .
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>127.0.0.1</value>
</property>
<property>
<name>yarn.acl.enable</name>
<value>0</value>
</property>
<property>
<name>yarn.nodemanager.env-whitelist</name>
<value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADO
OP_CONF_DIR,CLASSPATH_PERPEND_DISTCACHE,HADOOP_YARN_HOME,H
ADOOP_MAPRED_HOME</value>
</property>
</configuration>
10
Discipline : 5-info Matière : Big Data
Enseignantes : Dr. Dalel kanzari & Mme. Mayssa Ben Kahla
cd /home/mayssa/hadoop-3.2.2/sbin/
./start-dfs.sh
./start-yarn.sh
Tapez cette commande simple pour vérifier si tous les démons sont actifs et
s'exécutent en tant que processus Java :
jps
11