TP 1

TP 1
Installation et configuration d’Apache Hadoop
Objectif :
Afin de réaliser ce TP on doit suivre les étapes suivantes :
Etape 1 (téléchargement et installation)
 Télécharger et installer java

 Télécharger et installer hadoop
Etape 2 (paramétrage des variables d’environnement)
 Java_Home
 Hadoop_Home
Etape 3 (configuration d’Hadoop)
 Modifier 5 fichiers
 Copier le fichier winutils
Etape 4 (Tester Hadoop)
 Tester les commandes de démarrage

 Tester les commandes d’arrêt
I. Etape 1 (téléchargement et installation)
Hadoop
Pour télécharger Hadoop visitez le site web mentionné sur la figure et cliquer sur download
Vous pouvez remarquer un dossier compresser est encours de téléchargement
Extraire le dossier dans C et nommé le Hadoop comme suit
1
Télécharger sur google un dossier nommée winutils Hadoop 2.6
Cliquer sur le deuxième lien
Le téléchargement sera lancé
Java
Pour télécharger java il faut vérifier tout d’abord qu’il n’existe plus dans votre machine pour ce faire
démarrer l’invite de commande (cmd) comme suit :
En tapant sur la barre de recherche cmd et en cliquant avec le bouton droit sur Exécuter en tant
qu’Administrateur
Une nouvelle fenêtre qui s’affiche devant vous :
2
Tapez la commande java -version
Vous pouvez remarquer que java n’est pas reconnu
Maintenant on doit télécharger java
Visitez le site web suivant :
Lancer le téléchargement en cliquant sur ce bouton
Après cliquer donwload
Il vous demande de créer un compte
Remplir les champs nécessaires
3
Valider le compte et lancer le téléchargement
Lancer l’installation de java
Cliquer sur change pour changer l’emplacement d’enregistrement
Modifier le comme suit
La même chose ici vous devez changer l’emplacement de l’installation de dossier jre comme suit
4
Créer un nouveau dossier et nommée le jre1.8.0_202
Suivant –suivant--- et close
Vérifier maintenant que l’installation de java est bien réussie
II. Etape 2 (paramétrage des variables d’environnement)
On passera à la configuration d'une variable d'environnement
Pour Java
Tapez variables dans la barre de recherche
5
Cliquer sur variables d’environnement puis sur nouvelle
Ajouter le nom de la variable et le chemin comme la figure
Cliquer sur path puis modifier
6
Ajouter deux le chemin vers les bin de jdk
Pour Hadoop
Refaire la même chose pour Hadoop
Dans les variables d’environnement ajouter un chemin pour Hadoop
Modifier le path et ajouter un chemin vers le bin et sbin
7
Etape 3 (configuration d’Hadoop)
copier le contenu du dossier winutils Hadoop 2.6
Coller le dans Hadoop\bin comme suit
Entrer dans le chemin suivant
C:\hadoop\etc\hadoop
On doit éditer et modifier 5 fichiers :
Core site.xml
Apporter les modifications suivantes
Le deuxième fichier est hdfs site.xml
8
Le 3ème fichier est yarn site.xml
Le 4ème fichier est yarn site.xml
Le 5ème fichier est hadoop-env
9
Etape 4 (Tester Hadoop)
Avant de commencer vérifier que Hadoop a été bien installer pour ce faire taper la commende
Hadoop –version
On va lancer la commande de formatage hdfs namenode -format
On peut remarquer la création du dossier namenode
Dans le namenode on peut trouver les deux fichier fsimage et edits
On peut démarrer le namenode et le datanode avec la commande start-dfs
10
On peut remarquer le démarrage de deux fenêtres namenode et datanode
On peut remarquer la création du dossier datanode
Dans le dataenode on trouve un fichier version qui vient du namenode
Démarrer maintenant yarn
Avec la commande start-yarn
et on peut remarquer l’exécution du nodemanager et resourcemanager
11
Vérifier le démarrage des ressources de notre cluster avec la commande jps
Exécuter maintenant la commande stop-dfs
On remarque que deux fenêtres qui sont fermé le namenode et le datanode
Exécuter la commande stop-yarn
On remarque que deux fenêtres qui sont fermé le resourcemanager et le datamanager
Avec la commande start-all vous pouvez démarrer tous les composants
On peut voir maintenant le web en tapant http://localhost:8088/cluster
C’est lien vers resourcemanager dans lequel on trouve toute les tache programmé
Avec le deuxième lien on peut voir des informations sur le cluster et datanode
12
Dans les utilities – browse the file system on va créer des fichier et des base de données
Finalement
Avec la commande stop-all vous pouvez fermer tous les composants
13

TP 1

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

TP 1

Transféré par

Droits d'auteur :

Formats disponibles

TP 1

Installation et configuration d’Apache Hadoop

Afin de réaliser ce TP on doit suivre les étapes suivantes :

Etape 1 (téléchargement et installation)

 Télécharger et installer java

Etape 2 (paramétrage des variables d’environnement)

Etape 3 (configuration d’Hadoop)

Etape 4 (Tester Hadoop)

 Tester les commandes de démarrage

I. Etape 1 (téléchargement et installation)

Vous pouvez remarquer un dossier compresser est encours de téléchargement

Extraire le dossier dans C et nommé le Hadoop comme suit

Cliquer sur le deuxième lien

Le téléchargement sera lancé

Une nouvelle fenêtre qui s’affiche devant vous :

Vous pouvez remarquer que java n’est pas reconnu

Maintenant on doit télécharger java

Visitez le site web suivant :

Lancer le téléchargement en cliquant sur ce bouton

Après cliquer donwload

Il vous demande de créer un compte

Remplir les champs nécessaires

Lancer l’installation de java

Cliquer sur change pour changer l’emplacement d’enregistrement

Modifier le comme suit

Suivant –suivant--- et close

Vérifier maintenant que l’installation de java est bien réussie

II. Etape 2 (paramétrage des variables d’environnement)

On passera à la configuration d'une variable d'environnement

Tapez variables dans la barre de recherche

Ajouter le nom de la variable et le chemin comme la figure

Cliquer sur path puis modifier

Refaire la même chose pour Hadoop

Dans les variables d’environnement ajouter un chemin pour Hadoop

Modifier le path et ajouter un chemin vers le bin et sbin

copier le contenu du dossier winutils Hadoop 2.6

Coller le dans Hadoop\bin comme suit

Entrer dans le chemin suivant

On doit éditer et modifier 5 fichiers :

Apporter les modifications suivantes

Le deuxième fichier est hdfs site.xml

Apporter les modifications suivantes

Apporter les modifications suivantes

Le 4ème fichier est yarn site.xml

Apporter les modifications suivantes

Le 5ème fichier est hadoop-env

Apporter les modifications suivantes

On va lancer la commande de formatage hdfs namenode -format

On peut remarquer la création du dossier namenode

Dans le namenode on peut trouver les deux fichier fsimage et edits

On peut démarrer le namenode et le datanode avec la commande start-dfs

On peut remarquer la création du dossier datanode

Dans le dataenode on trouve un fichier version qui vient du namenode

Démarrer maintenant yarn

Avec la commande start-yarn

et on peut remarquer l’exécution du nodemanager et resourcemanager

Exécuter maintenant la commande stop-dfs

On remarque que deux fenêtres qui sont fermé le namenode et le datanode

Exécuter la commande stop-yarn

On remarque que deux fenêtres qui sont fermé le resourcemanager et le datamanager

Avec la commande start-all vous pouvez démarrer tous les composants

On peut voir maintenant le web en tapant http://localhost:8088/cluster

Avec la commande stop-all vous pouvez fermer tous les composants

Vous aimerez peut-être aussi