Vous êtes sur la page 1sur 6

1 ANNEXE 2 : Plan de cours

1.1 Plan de cours Lot 1

Enjeux et perspectives du BIG DATA


A lissue de ce stage les participants seront en mesure de : Pouvoir apprhender lensemble des enjeux et facteurs prendre en compte pour
russir lintgration du BIG DATA dans la vision large du SI.

Rfrence : BIGF-ENJ Modalits et moyens pdagogiques :


Exposs
Dure : 2 jours (14h) cas pratiques
Rythme : Journes conscutives synthse

Apprciation : Evaluation qualitative de fin de stage

Prrequis : Avoir une bonne connaissance de lenvironnement projet SI.


Public concern : Architectes fonctionnels, chefs de projets, directeurs de projets, consultant SI.

Cette formation :

est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.

PROGRAMME

INTRODUCTION -Les nouvelles techniques de Datamining


Introduction au Big Data : de quoi sagit-il ? Lenjeux conomique
Exemples pratiques. Limpact organisationnel
Les technologies concernes, les outils, les langages : -La conduite du changement
-Hortonworks -Lapparition de nouveaux mtiers
-MapR Etude de cas
-Cloudera
LES TECHNOLOGIES UTILISEES DANS DES PROJETS BIG
-Ibm Watson
DATA
-
Les outils de stockage
Dmystification du Big Data.
Lcosystme Hadoop (Apache, HortonWorks, Cloudera, MapR,
Les acteurs principaux.
IBM, Oracle)
Les diffrents mtiers du Big Data.
Les solutions de visualisations (Microstrategy, Tableau, QlickView)
ENJEUX, ET EVOLUTIONS DU BIG DATA
SECURITE, ETHIQUE ET ENJEUX JURIDIQUES
La qualit des donnes
Assurer la protection des donnes
Le traitement des donnes
-Lanonymisation dune donne
La protection des donnes
-Le contrle dintgrit
Limage de la donne
-Le chiffrement dune donne
Lhumanit des donnes
Quest-ce que la Blockchain ?
ENJEUX STRATEGIQUES ET ORGANISATIONNELS Cas dusage : Bitcoin
Le challenge technique
ETUDE DE CAS
-Investissement dans la capacit de stockage
Migration russie dun SI htrogne vers une urbanisation
-Investissement dans lanalyse oriente BIG DATA
-La web smantique
1.2 Plan de cours Lot 2

Architecture et Infrastructure
A lissue de ce stage les participants seront en mesure de : Exploiter les architectures Big DATA et mettre en place des socles techniques
complets pour des projets BIG DATA.

Rfrence : BIGF-ARC Modalits et moyens pdagogiques :


Exposs
Dure : 5 jours (35h) Cas pratiques
Rythme : Journes conscutives Synthse
Pourcentage Thorie/Pratique : 30/70
Apprciation : Exercices de validation - Attestation de stages

Prrequis : Avoir une connaissance pratique du Shell linux, des bases rseau, des bases de donnes relationnelles et des
architectures rparties.
Public concern : Administrateurs systmes, dveloppeurs, architectes et chefs de projets techniques, consultant Business Intelligence.

Cette formation :

est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.

PROGRAMME

BIG DATA OVERVIEW


Introduction au Big Data : de quoi sagit-il ? ARCHITECTURE TECHNIQUE
Exemples pratiques La capture des donnes
Les technologies concernes, les outils, les langages La mise en qualit des donnes (Data Quality)
-Hortonworks - utilisation dune exploitation dun flux openDATA avec Talend
Data quality
-MapR
-Cloudera Le stockage des donnes
-Ibm Watson - Hadoop, HDFS, NOSQL (Casandra, MongoDB)
- La diffusion des donnes
Dmystification du Big Data - Streaming avec Apache Kafka, Amazone AWS
Les acteurs principaux Traitements Temps-Rel ou Diffr
Les diffrents mtiers du Big Data - Apache Spark
Les architectures rparties
SOLUTIONS BIG DATA - Clustering Hadoop
Projets, Applications, Plateformes Supervision des plateformes
Solutions de stockage de Donnes -App Dynamix, Ambari
Considrations Hardware
APPLICATIONS METIERS
- Stockage
- CPU Text Analytics
- Mmoire Dtection de Fraude
- Rseau Ciblage clientle
- Systmes distribus
La Science et lArt de lAnalyse Prdictive

ARCHITECTURE APPLICATIVE (ETUDE DE CAS)


Les diffrentes tapes de gestion des donnes
Les outils du march
LIngestion
La transformation
La restitution / visualisation
1.3 Plan de cours Lot 3

Les techniques danalyse et de visualisation


A lissue de ce stage les participants seront en mesure de : charger et exploiter des donnes de toute source et la restituer aprs un ensemble
de traitement, de nettoyage et denrichissement des donnes.

Rfrence : BIGF-ANV Modalits et moyens pdagogiques :


Exposs
Dure : 5 jours (35h) Cas pratiques
Rythme : Journes conscutives Synthse
Pourcentage Thorie/Pratique : 30/70
Apprciation : Exercices de validation - Attestation de stages

Prrequis : Avoir des comptences Java 8 streaming, python et scala ; Avoir des connaissances sur Talend et/ou en BI est un plus.
Public concern : Dveloppeurs, chefs de projets, responsables qualit.

Cette formation :

est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.

PROGRAMME
Cas dusage
BIG DATA OVERVIEW Quest-ce que la qualit de donnes
Introduction au Big Data : de quoi sagit-il ? Traitements de la qualit dans le MDM
Exemples pratiques Mesure de la qualit dun entrept de donnes:
Les technologies concernes, les outils, les langages Fiabilisation ou restauration de la qualit
-Hortonworks Aspects mthodologiques de la qualit (Workflow) : Data
-MapR curation/gouvernance
-Cloudera Aspects juridiques lis la qualit :
-Ibm Watson Best practices pour la qualit
-
LANALYSE DES DONNEES : SPARK ET SPARK
Dmystification du Big Data
STREAMING
Les acteurs principaux
Les diffrents mtiers du Big Data Introduction Apache Spark
Apache Spark MLlib
ARCHITECTURE BIG DATA Apache Spark Streaming
La capture des donnes Apache Spark SQL
- MapReduce, PIG, Hive, Apache Spark GraphX
La mise en qualit Stockage bas sur les Graphes
Le stockage des donnes
VISUALISATION DES DONNEES
La diffusion des donnes
Traitements Temps-Rel ou Diffr Couleurs
- Kafka Itrations sur la perception
Les architectures rparties Techniques dinteractions
- Hadoop Exemples danalyses : Efficacit des Antibiotiques
Visualisation Big Data
LINGESTION ET LE STOCKAGE DES DONNEES R,Graphx.
Importance de la Qualit des Donnes
Cot de la mauvaise qualit
1.4 Plan de cours Lot 4

Le dveloppement dapplications Big Data et la Data visualistion


A lissue de ce stage les participants seront en mesure de : Dvelopper des applications avec Spark Streaming- Faire de la programmation
parallle sur un cluster - Exploiter des donnes avec Spark SQL - Comprendre et exploiter les algorithmes standard de Machine Learning et
permettre une visualisation avec Graphx.

Rfrence : BIGF-DEVV Modalits et moyens pdagogiques :


Exposs
Dure : 5 jours (35h) Cas pratiques
Rythme : Journes conscutives Synthse
Pourcentage Thorie/Pratique : 60/40
Apprciation : Exercices de validation - Attestation de stages

Prrequis : Maitriser Java ou Python. Avoir des connaissances mathmatiques avances pour pouvoir interprter les algorithmes
mettre en uvre.
Public concern : DataScientist, experts en recherche oprationnelle, dveloppeurs expriments avec une forte exprience en
mathmatiques algbriques.

Cette formation :

est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des diplmes
et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.

PROGRAMME
Rseaux de Neurones
BIG DATA OVERVIEW Arbres de Dcisions et de Rgression
Introduction au Big Data : de quoi sagit-il ? Support Vector Machines
Exemples pratiques Mthodes Ensemblistes
Les technologies concernes, les outils, les langages
-Hortonworks MACHINE LEARNING AVEC: SPARK ET SPARK STREAMING
-MapR Introduction Apache Spark
-Cloudera Faire du Machine learning avec Apache Spark MLlib
-Ibm Watson Traiter les donnes en temps rel avec Apache Spark Streaming
-.. Faire des requtes en format SQL avec Apache Spark SQL
Dmystification du Big Data Crer des graphes avec Apache Spark GraphX
Les acteurs principaux Stockage bas sur les graphes
Les diffrents mtiers du Big Data VISUALISATION
RAPPEL La valeur de la visualisation
Le langage Python (Application de la mapReduce) Modles de Donnes et Images
Les mathmatiques de base (Algbre, statistiques, probabilits) Donnes Multidimensionnelles
Le langage SQL Principes de Design
Perception Graphique
LES ALGORITHMES ET ANALYSE DE DONNEES
Les concepts du Machine Learning
RESTITUTION ET PILOTAGE
Les donnes supervises ou non Supervises ? Quelles diffrences ? Couleurs
Rgression Itrations sur la Perception
Modles linaires Techniques dInteractions
Classification Exemples dAnalyses : Efficacit des Antibiotiques
Naive Bayes Visualisation Big Data
K-NN
K-Means Clustering
1.5 Plan de cours Lot 5

Concevoir et piloter un projet Big Data


A lissue de ce stage les participants seront en mesure de : bien comprendre les challenges dans la mise en place dun projet Big DATA -
Mesurer limpact politique et stratgique sur lentreprise et la pertinence dun reporting rgulier - Avoir une bonne gestion des conflits et de la
conduite du changement.

Rfrence : BIGF-PROJ Modalits et moyens pdagogiques :


Dmonstrations Cas pratiques Synthse et valuation des acquis
Dure : 2 jours (14h) Pourcentage Thorie/Pratique : 30/70
Rythme : Journes conscutives

Apprciation : Evaluation qualitative de fin de stage

Prrequis : Une exprience projet est fortement souhaitable idalement dans un contexte multi disciplinaire.
Public concern : Chefs de projets, directeurs de projets, directeurs en systme dinformation, Scrum Master, Architectes fonctionnels ou
techniques.

Cette formation :

est anime par un consultant-formateur dont les comptences techniques, professionnelles et pdagogiques ont t valides par des
diplmes et/ou testes et approuves par lditeur et/ou par M2i Formation
bnficie dun suivi de son excution par une feuille de prsence marge par demi-journe par les stagiaires et le formateur.

PROGRAMME

CARACTERISTIQUES DES PROJETS BIG DATA COMPETENCES ET ORGANISATION DES PROJETS BIG
Comparaison entre un projet classique et un projet Big DATA DATA
Analyse des caractristiques et retours expriences sur des projets mis en Les comptences de l'quipe projet
chec en BIG DATA Collaboration entre experts mtiers, statisticiens et informaticiens
Processus d'exploration de donnes et lapport de la recherche Outils du manager de projets Big Data
oprationnelle et / ou Data science Dploiement et mise en production des rsultats de test & learn
Dmarche d'organisation projets Big Data
MISE EN SITUATION
CADRAGE DES PROJETS BIG DATA Atelier agile avec mise en place dune stratgie de pilotage et de gestion
Cadrage mtiers de plusieurs quipes sur un projet BIG DATA
Identification de nouvelles sources de donnes
Cartographie des diffrentes entits impliques dans la collecte de la
donne et leurs types
Dfinition des besoins technologiques
Estimation budgtaire et planification pour le big data

MANAGEMENT DE PROJET BIG DATA


Phase des projets Big Data
Approche agile pour le Big Data: Agile Data Management
Livrables des projets Big Data
Mesure de la performance: benchmark, surperformance
Traitement des obligations juridiques: CNIL, proprits intellectuelles

PROCESSUS ET COMPOSANTES DU PROJET


Identification des composantes de la solution finale du projet
Qualification du poids de chacune des composantes du projet
Risques dincohrences du choix technique

RISQUES DU PROJET BIG DATA


Risques mtiers lis au cadrage du scope
Risques stratgiques et manque de sponsoring
Les KPI : Time to Market VS Time To Live VS Return On Investment
La maturit des solutions du march
La jungle des produits et limmaturit des solutions
Jeunes talents VS maturit projets.