Académique Documents
Professionnel Documents
Culture Documents
Thème : YARN
Matricule : 21D0470EP
IC3
INTRODUCTION ...................................................................................................... 1
1. Définition ............................................................................................................ 2
2. Utilité .................................................................................................................. 2
CONCLUSION .......................................................................................................... 6
Partie QCM................................................................................................................. 8
INTRODUCTION
1
I. YARN : qu’est-ce que c’est ?
1. Définition
La version 1 de Hadoop possède 2 couches (MapReduce et HDFS). Cependant,
depuis la version 2 Hadoop a adopté une troisième couche : YARN « Yet Another
Resource Negotiator », En français « Encore un autre négociateur de ressource », un outil
de gestion de ressources distribuée. Cette technologie provient d’un découpage de la
première version de Hadoop MapReduce en 2 sous-couches :
2. Utilité
2
II. LES FONCTIONNALITES DE YARN
3
Sur chaque nœud, on retrouve un Gestionnaire de nœuds (Node Manager) dont
le rôle est de surveiller et de rapporter au Resource Manager ;
On retrouve par ailleurs un gestionnaire d’applications (Application Master),
créé pour chaque application, chargé de négocier les ressources et de travailler
conjointement avec le Node Manager pour exécuter et surveiller les tâches ;
Enfin, les conteneurs de ressources (container) : il s’agit d’un ensemble de
ressources physiques telles que la RAM, les cœurs de processeur et le disque sur
un seul nœud. Les conteneurs sont appelés par Container Launch Context (CLC)
qui est un enregistrement qui contient des informations telles que les variables
d’environnement, les jetons de sécurité, les dépendances, etc. ils sont contrôlés
par les Node Managers et assigne les ressources allouées aux applications
individuelles. Ce concept permet d’optimiser l’usage des ressources.
4
4. Le gestionnaire d’applications négocie les conteneurs à partir du gestionnaire de ressources 5. Le
gestionnaire d’applications indique au gestionnaire de nœuds de lancer des conteneurs
6. Le code de l’application est exécuté dans le conteneur
7. Le client contacte le gestionnaire de ressources/le gestionnaire d’applications pour surveiller
l’état de l’application
8. Une fois le traitement terminé, le gestionnaire d’applications se désenregistre auprès du
gestionnaire de ressources.
5
CONCLUSION
Parvenu au terme de notre étude portant sur l’architecture YARN, nous avons pu voir
ce que c’est, son utilité, ses fonctionnalités et ses différents composants. Dès lors,
L’architecture YARN sépare essentiellement la couche de gestion des ressources de la
couche de traitement. Dans la version Hadoop 1.0, la responsabilité du Job tracker est
partagée entre le gestionnaire de ressources et le gestionnaire d’applications. Il a donc été
introduit dans Hadoop 2.0 pour supprimer le goulot d’étranglement sur Job Tracker qui était
présent dans Hadoop 1.0.
6
7
Partie QCM
1- Les initiales YARN désignent :
2- YARN permet de :
a. MapReduce et YARN
b. YARN et HDFS
c. MapReduce et HDFS
a. Hadoop
b. MapReduce
6- Les applications de réduction de carte existantes sans interruption sont prises en charge
par :
8
a. YARN
b. MapReduce
c. HDFS
a. Statique
a. 03 sous couches
b. 02 sous couches
c. 02 couches indépendantes
9- L’un de ces éléments est une méthode de planification utilisée par YARN :
a. Fair Scheduler
b. Fast Scheduler
c. Beet Scheduler