Cette formation :
est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.
PROGRAMME
Architecture et Infrastructure
A lissue de ce stage les participants seront en mesure de : Exploiter les architectures Big DATA et mettre en place des socles techniques
complets pour des projets BIG DATA.
Prrequis : Avoir une connaissance pratique du Shell linux, des bases rseau, des bases de donnes relationnelles et des
architectures rparties.
Public concern : Administrateurs systmes, dveloppeurs, architectes et chefs de projets techniques, consultant Business Intelligence.
Cette formation :
est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.
PROGRAMME
Prrequis : Avoir des comptences Java 8 streaming, python et scala ; Avoir des connaissances sur Talend et/ou en BI est un plus.
Public concern : Dveloppeurs, chefs de projets, responsables qualit.
Cette formation :
est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.
PROGRAMME
Cas dusage
BIG DATA OVERVIEW Quest-ce que la qualit de donnes
Introduction au Big Data : de quoi sagit-il ? Traitements de la qualit dans le MDM
Exemples pratiques Mesure de la qualit dun entrept de donnes:
Les technologies concernes, les outils, les langages Fiabilisation ou restauration de la qualit
-Hortonworks Aspects mthodologiques de la qualit (Workflow) : Data
-MapR curation/gouvernance
-Cloudera Aspects juridiques lis la qualit :
-Ibm Watson Best practices pour la qualit
-
LANALYSE DES DONNEES : SPARK ET SPARK
Dmystification du Big Data
STREAMING
Les acteurs principaux
Les diffrents mtiers du Big Data Introduction Apache Spark
Apache Spark MLlib
ARCHITECTURE BIG DATA Apache Spark Streaming
La capture des donnes Apache Spark SQL
- MapReduce, PIG, Hive, Apache Spark GraphX
La mise en qualit Stockage bas sur les Graphes
Le stockage des donnes
VISUALISATION DES DONNEES
La diffusion des donnes
Traitements Temps-Rel ou Diffr Couleurs
- Kafka Itrations sur la perception
Les architectures rparties Techniques dinteractions
- Hadoop Exemples danalyses : Efficacit des Antibiotiques
Visualisation Big Data
LINGESTION ET LE STOCKAGE DES DONNEES R,Graphx.
Importance de la Qualit des Donnes
Cot de la mauvaise qualit
1.4 Plan de cours Lot 4
Prrequis : Maitriser Java ou Python. Avoir des connaissances mathmatiques avances pour pouvoir interprter les algorithmes
mettre en uvre.
Public concern : DataScientist, experts en recherche oprationnelle, dveloppeurs expriments avec une forte exprience en
mathmatiques algbriques.
Cette formation :
est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des diplmes
et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.
PROGRAMME
Rseaux de Neurones
BIG DATA OVERVIEW Arbres de Dcisions et de Rgression
Introduction au Big Data : de quoi sagit-il ? Support Vector Machines
Exemples pratiques Mthodes Ensemblistes
Les technologies concernes, les outils, les langages
-Hortonworks MACHINE LEARNING AVEC: SPARK ET SPARK STREAMING
-MapR Introduction Apache Spark
-Cloudera Faire du Machine learning avec Apache Spark MLlib
-Ibm Watson Traiter les donnes en temps rel avec Apache Spark Streaming
-.. Faire des requtes en format SQL avec Apache Spark SQL
Dmystification du Big Data Crer des graphes avec Apache Spark GraphX
Les acteurs principaux Stockage bas sur les graphes
Les diffrents mtiers du Big Data VISUALISATION
RAPPEL La valeur de la visualisation
Le langage Python (Application de la mapReduce) Modles de Donnes et Images
Les mathmatiques de base (Algbre, statistiques, probabilits) Donnes Multidimensionnelles
Le langage SQL Principes de Design
Perception Graphique
LES ALGORITHMES ET ANALYSE DE DONNEES
Les concepts du Machine Learning
RESTITUTION ET PILOTAGE
Les donnes supervises ou non Supervises ? Quelles diffrences ? Couleurs
Rgression Itrations sur la Perception
Modles linaires Techniques dInteractions
Classification Exemples dAnalyses : Efficacit des Antibiotiques
Naive Bayes Visualisation Big Data
K-NN
K-Means Clustering
1.5 Plan de cours Lot 5
Prrequis : Une exprience projet est fortement souhaitable idalement dans un contexte multi disciplinaire.
Public concern : Chefs de projets, directeurs de projets, directeurs en systme dinformation, Scrum Master, Architectes fonctionnels ou
techniques.
Cette formation :
est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.
PROGRAMME
CARACTERISTIQUES DES PROJETS BIG DATA COMPETENCES ET ORGANISATION DES PROJETS BIG
Comparaison entre un projet classique et un projet Big DATA DATA
Analyse des caractristiques et retours expriences sur des projets mis en Les comptences de l'quipe projet
chec en BIG DATA Collaboration entre experts mtiers, statisticiens et informaticiens
Processus d'exploration de donnes et lapport de la recherche Outils du manager de projets Big Data
oprationnelle et / ou Data science Dploiement et mise en production des rsultats de test & learn
Dmarche d'organisation projets Big Data
MISE EN SITUATION
CADRAGE DES PROJETS BIG DATA Atelier agile avec mise en place dune stratgie de pilotage et de gestion
Cadrage mtiers de plusieurs quipes sur un projet BIG DATA
Identification de nouvelles sources de donnes
Cartographie des diffrentes entits impliques dans la collecte de la
donne et leurs types
Dfinition des besoins technologiques
Estimation budgtaire et planification pour le big data