Vous êtes sur la page 1sur 2

Cloudera Administrator Training for Apache Hadoop

Formation Informatique / Virtualisation et Cloud / Cloudera

Cette formation permet aux participants d'acqurir les comptences et connaissances pour dployer, configurer et grer la
mise en uvre de Cloudera Apache Hadoop et HDFS.
Les participants aborderont l'installation et la configuration via la rpartition de charges et les rglages.
Cette formation prpare en partie l'examen de certification CCAH (Cloudera Certified Administrator for Apache Hadoop).
Notez que la formation CY3907 tait prcdemment planifie sous la rf. CY3901

OBJECTIFS

A retenir

Se familiariser avec HDFS et MapReduce et la cration de l'architecture Hadoop


Configuration des clusters et dploiement afin de faciliter l'intgration avec d'autres systmes et le matriel dans un
data center
Charger les donnes dans un Cluster partir des fichiers grs dynamiquement l'aide de Flume et partir de RDBMS
l'aide de Sqoop
Configurer FairScheduler pour fournir les agrments niveau service pour de multiples utilisateurs d'un cluster
Installer et mettre en uvre la scurit base sur Kerberos
Meilleures pratiques pour prparer et maintenir Apache Hadoop en production
Dpanner, diagnostiquer, rglages et rsolution des problmes Hadoop

PUBLIC
Cette formation s'adresse aux administrateurs et aux gestionnaires IT souhaitant acqurir la comprhension des tapes
ncessaires pour faire fonctionner et grer les clusters Apache Hadoop.

PRE-REQUIS
Avoir de bonnes connaissances de base sur le systme Linux.

PROGRAMME
Le cas d'Hadoop
Pourquoi Hadoop ?
Bref historique de Hadoop
Composants Hadoop
Concepts fondamentaux

Dure : 4 jours soit 28h.


Rf. CY3907

Dates des sessions


Paris
16/06/2015
25/08/2015
24/11/2015

Cette
formation est
galement
propose en
formule
INTRA-ENTREPRISE.
Inclus dans cette formation

HDFS
Fonctionnalits HDFS
Ecrire et lire des fichiers
NameNode
Vue d'ensemble de la scurit HDFS
Utiliser l'interface Web NameNode
Utiliser le Shell fichiers Hadoop
Intgration de donnes dans HDFS
Ingrer des donnes partir de sources externes avec Flume
Ingrer des donnes partir de bases de donnes relationnelles avec Sqoop
Bases de donnes avec Sqoop
Interfaces REST
Meilleures pratiques pour l'importation des donnes
MapReduce
Qu'est-ce que MapReduce?
Fonctionnalits de MapReduce
Concepts de base
Vue d'ensemble de l'architecture
MapReduce version 2
Rcupration des checs
Utiliser l'interface utilisateur JobTracker

Coaching Aprs-COURS
Pendant 30 jours, votre formateur
sera disponible pour vous aider.
CERTyou s'engage dans la ralisation
de vos objectifs.

Votre garantie 100%


SATISFACTION

Planification du cluster Hadoop

Notre engagement 100% satisfaction


vous garantit la plus grande qualit
de formation.

Besoins en planification gnrale


Choisir le matriel adapt
Besoins rseau
Configurer les nud

CERTYOU, 37 rue des Mathurins, 75008 PARIS - SAS au capital de 10 000 Euros
Tl : 01 42 93 52 72 - Fax : 01 70 72 02 72 - contact@certyou.com - www.certyou.com
RCS de Paris n 804 509 461- TVA intracommunautaire FR03 804509461 - APE 8559A
Dclaration dactivit enregistre sous le N 11 75 52524 75 auprs du prfet de rgion dIle-de-France

Cloudera Administrator Training for Apache Hadoop


Formation Informatique / Virtualisation et Cloud / Cloudera

Planning de la gestion des clusters


Installation Hadoop et configuration initiale
Types de dploiement
Installer Hadoop
Spcifier la configuration Hadoop
Amliorer la configuration initiale HDFS
Amliorer la configuration MapReduce initiale
Localisation des fichiers journaux
Installation et configuration de Hive, de Impala et de Pig
Hive
Impala
Pig
Clients Hadoop
Qu'est-ce que le client Hadoop?
Installer et configurer les clients Hadoop
Installer et configurer Hue
Authentification Hue et configuration
Cloudera Manager
Fonctionnalits Cloudera Manager
Versions standards et d'entreprise
Topologie Cloudera manager
Installer Cloudera Manager
Installer Hadoop avec Cloudera Manager
Amliorer les tches d'administration de base
Utiliser Cloudera Manager
Configuration avance du cluster
Paramtres de configuration avance
Configurer les ports Hadoop
Inclusion et exclusion des htes
Configurer HDFS pour "Rack awareness"
Configurer la haute disponibilit HDFS
Scurit Hadoop
Pourquoi la scurit Hadoop est-elle importante?
Les concepts de systmes de scurit
Qu'est-ce que Kerberos et comment il fonctionne?
Scuriser un cluster Hadoop avec Kerberos
Gestion et planification des jobs
Grer le fonctionnement des jobs
Planifier les jobs Hadoop
Configurer FairScheduler
Maintenance du Cluster
Vrifier le statut HDFS
Copier les donnes entre les clusters
Ajouter et supprimer les nuds des clusters
Rquilibrer le cluster
Sauvegarde des mtadonnes NameNode
Mise jour du Cluster
Surveillance et dpannage du cluster
Surveillance du systme gnral
Grer les fichiers journaux Hadoop
Surveiller les clusters Hadoop
Problmes de dpannage courants

CERTYOU, 37 rue des Mathurins, 75008 PARIS - SAS au capital de 10 000 Euros
Tl : 01 42 93 52 72 - Fax : 01 70 72 02 72 - contact@certyou.com - www.certyou.com
RCS de Paris n 804 509 461- TVA intracommunautaire FR03 804509461 - APE 8559A
Dclaration dactivit enregistre sous le N 11 75 52524 75 auprs du prfet de rgion dIle-de-France