Bienvenue sur Scribd !

Ignorer le carrousel

Hadoop DeployerduBigData

Transféré par

noussa79

0% ont trouvé ce document utile (0 vote)

6 vues2 pages

big data hadoop

Titre original

Hadoop_DeployerduBigData

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

big data hadoop

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

6 vues2 pages

Hadoop DeployerduBigData

Transféré par

noussa79

big data hadoop

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

DAWAN

Plan de la formation
www.dawan.fr

Formation Hadoop : Déployer du Big Data

Durée : 4 jours
Public : Administrateurs systèmes
Pré-requis : Connaissances en administration système, préférablement Java
Objectifs : Comprendre le Big Data et ses enjeux - Savoir déployer Hadoop et son
écosystème - Comprendre HDFS, MapReduce - Structurer les données avec
HBase - Écrire des requêtes avec HiveQL - Lancer une analyse avec Pig
Référence : BUS869-F
Demandeurs Contactez-nous pour connaître les remises Pôle Emploi
d'emploi :

Introduction au Big Data

Qu'est-ce que le Big Data ?

Source des données : l'homme, la machine
La problématique de taille
Position de Hadoop dans le paysage

Introduction à Hadoop

L'origine du projet
Le système de fichiers HDFS
Comprendre l'algorithme MapReduce
L'environnement d'Hadoop : HBase, ZooKeeper, Hive, Pig…
L'API YARN

Mettre Hadoop en place : HDFS

Du mode autonome au mode complètement distribué en cluster

Pré-requis, distributions Hadoop
Cluster Hadoop : NameNode, ResourceManager, DataNode, NodeManager
Les fichiers de configuration
Opérations de base sur le cluster HDFS : formatage, démarrage, arrêt
Atelier pratique : installer Hadoop sur 2 nœuds, formater et manipuler HDFS

Travailler avec MapReduce

L'intérêt de MapReduce
Mappers, reducers, parallélisme et indépendance des traitements
Entrées, sorties
Soumission d'un job à Hadoop
Atelier pratique : exécuter une tâche via MapReduce, avec sortie dans HDFS

Une base de données distribuée : HBase

L'accès aléatoire, temps réel, lecture-écriture au Big Data

Fonctionnalités de HBase, NoSQL
Pré-requis, configuration
Manipulation via le shell HBase
Atelier pratique : mettre en place HBase sur Hadoop, créer et manipuler une table

Et pourquoi pas un peu de SQL avec Hive ?

Présentation de Hive
Gérer le schéma : bases, tables, vues, partitions
Manipulation des données, requêtes et map-reduce avec HiveQL
Audits et journal d'erreurs
Atelier pratique : chargement de données massives dans Hive, requêtes

Analyser les données avec Pig

Présentation, installation du projet Apache Pig

Exécutions de Pig en local, en mode map-reduce
Scripter pour Pig
Le langage Pig Latin
Manipulations de données et stockage avec Pig
Atelier pratique : écrire un script contenant du Pig Latin pour une tâche simple, et l'exécuter en local,
puis en mode map reduce.

Aller plus loin avec Hadoop

Gérer les logs et l'audit de tâches Hadoop

Découvrir MRUnit pour les test unitaires dans Hadoop
Débogage en local
Surveillance des perfomances
Atelier pratique : mise en place d'un job MapReduce plus complexe avec traces et tests unitaires

Vous aimerez peut-être aussi

Uml 2 Analyse Et Conception (Dunod)
Document242 pages
Uml 2 Analyse Et Conception (Dunod)
Hatim Afilal
50% (6)
TP NoSQL Révision
Document24 pages
TP NoSQL Révision
noussa79
Pas encore d'évaluation
TP 2 Restaurant Mongodb
Document4 pages
TP 2 Restaurant Mongodb
noussa79
Pas encore d'évaluation
Scala Tuto
Document12 pages
Scala Tuto
noussa79
Pas encore d'évaluation
Mongodb FR
Document89 pages
Mongodb FR
noussa79
Pas encore d'évaluation
TP Oriente Objet Avec Python
Document2 pages
TP Oriente Objet Avec Python
noussa79
100% (1)
TP Oriente Objet Avec Python - Ti15
Document2 pages
TP Oriente Objet Avec Python - Ti15
noussa79
Pas encore d'évaluation
852 Correc TPfichiers 2017
Document10 pages
852 Correc TPfichiers 2017
noussa79
Pas encore d'évaluation
1.1.1.5 Lab - Cybersecurity Case Studies
Document2 pages
1.1.1.5 Lab - Cybersecurity Case Studies
noussa79
Pas encore d'évaluation
Installation Cloudera HDFS
Document5 pages
Installation Cloudera HDFS
noussa79
Pas encore d'évaluation
MongoDB - Réplication Et Sharding
Document6 pages
MongoDB - Réplication Et Sharding
noussa79
Pas encore d'évaluation
3.1.3.4 Lab - Linux Servers
Document7 pages
3.1.3.4 Lab - Linux Servers
noussa79
Pas encore d'évaluation
TD Mongoshell
Document4 pages
TD Mongoshell
noussa79
Pas encore d'évaluation
7.3.2.4 Lab - Attacking A mySQL Database
Document17 pages
7.3.2.4 Lab - Attacking A mySQL Database
noussa79
Pas encore d'évaluation
Examen TP
Document5 pages
Examen TP
noussa79
Pas encore d'évaluation
Tri Par Insertion
Document1 page
Tri Par Insertion
noussa79
Pas encore d'évaluation
Cours3 Android
Document43 pages
Cours3 Android
noussa79
Pas encore d'évaluation
Chapter6 EIGRP
Document65 pages
Chapter6 EIGRP
noussa79
Pas encore d'évaluation
Ccna 3
Document312 pages
Ccna 3
amisan
100% (3)
Semaine2 PDF
Document49 pages
Semaine2 PDF
Hicham Ameur
Pas encore d'évaluation
Centrale Supelec 2020 Informatique Commun Sujet
Document8 pages
Centrale Supelec 2020 Informatique Commun Sujet
Mokhtar El khrichi
Pas encore d'évaluation
Note Cours Informatique Scientifique 2004
Document60 pages
Note Cours Informatique Scientifique 2004
Tahirindrainy Fanoela Jean
Pas encore d'évaluation
PNT
Document10 pages
PNT
houcem8
Pas encore d'évaluation
Examen de Fin de Formation 2015 Pratique Variante 8 Tri
Document8 pages
Examen de Fin de Formation 2015 Pratique Variante 8 Tri
Innocent Ndri
Pas encore d'évaluation
Cours Virtualisation Et Cloud Computing 2024
Document66 pages
Cours Virtualisation Et Cloud Computing 2024
Issa hardaga abdelhack
Pas encore d'évaluation
Maindocument
Document14 pages
Maindocument
BENYAHIA NESRINE
Pas encore d'évaluation
Charte Du Forum
Document4 pages
Charte Du Forum
api-285534894
0% (1)
Recensement de La Faune Avec PDA (.AXF D'arcpad
Document73 pages
Recensement de La Faune Avec PDA (.AXF D'arcpad
Rachid Skoubasson
Pas encore d'évaluation
Arithmétique Et Décomposition en Facteurs Premiers: 1.la Division Euclidienne
Document6 pages
Arithmétique Et Décomposition en Facteurs Premiers: 1.la Division Euclidienne
Hømmę Class
Pas encore d'évaluation
Poly TP
Document14 pages
Poly TP
Ima Aut
Pas encore d'évaluation
Windows 7 - Le Mode D'emploi Complet
Document160 pages
Windows 7 - Le Mode D'emploi Complet
oswaldjosy619
Pas encore d'évaluation
TP Toip L1
Document29 pages
TP Toip L1
sarrfallou267
Pas encore d'évaluation
(Free Scores - Com) - Bogosh Noah Hope 29847 PDF
Document3 pages
(Free Scores - Com) - Bogosh Noah Hope 29847 PDF
Enrique Rosas
Pas encore d'évaluation
Transformations Coordonnees Geodesiques
Document16 pages
Transformations Coordonnees Geodesiques
Ahmed Ennehri
Pas encore d'évaluation
Socks 4 Proxy List
Document75 pages
Socks 4 Proxy List
Vibe
Pas encore d'évaluation
Texte EC
Document1 page
Texte EC
rauzier
Pas encore d'évaluation
Exam-MEF - ENSMM-2015 PDF
Document10 pages
Exam-MEF - ENSMM-2015 PDF
اشراقةامل
Pas encore d'évaluation
Cahors - Distribution Elec BT 2017 PDF
Document184 pages
Cahors - Distribution Elec BT 2017 PDF
Moulay m'hammed LOUKILI
Pas encore d'évaluation
Logiciel Ccleaner Professional Plus 6.02 Win Multi Activator Portable
Document4 pages
Logiciel Ccleaner Professional Plus 6.02 Win Multi Activator Portable
stephen rueda
Pas encore d'évaluation
Chi 5232
Document156 pages
Chi 5232
MENANI Zineddine
Pas encore d'évaluation
Ev2xx HL
Document13 pages
Ev2xx HL
Vo Phong Phu
Pas encore d'évaluation
9.3.2.13 Lab Configuration Et Vérification Des Listes de Contrôle Daccès Étendues
Document9 pages
9.3.2.13 Lab Configuration Et Vérification Des Listes de Contrôle Daccès Étendues
HamzaBahhou
Pas encore d'évaluation
PFE 2012 Sagemcom Catalogue
Document21 pages
PFE 2012 Sagemcom Catalogue
Khalil Ahmadi
Pas encore d'évaluation
Procédure Récupération EBP
Document6 pages
Procédure Récupération EBP
caroline
Pas encore d'évaluation
Windows 7 QCM
Document5 pages
Windows 7 QCM
Walid Mouatamid
Pas encore d'évaluation
Exposé Méthode Agile
Document10 pages
Exposé Méthode Agile
Alfred Ebrottie
Pas encore d'évaluation
DVR Nextvision
Document131 pages
DVR Nextvision
Philippe Blangenois
Pas encore d'évaluation
Senace 02
Document13 pages
Senace 02
med
Pas encore d'évaluation
td02 PDF
Document2 pages
td02 PDF
Amina Boujeglat
Pas encore d'évaluation