Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Master 2
Déroulement des 3 sessions
Jour 1 : Projet Big Data
Jour 2 : La méthode agile
Jour 3 : Evaluation (Questions + Etude de cas)
Gestion de projet - Vérification des acquis
1/ Qu’est ce qu’un projet ?
2/ Les grandes étapes d’un projet ?
3/ Qu’est ce qu’un cycle en V ?
4/ La méthode agile ?
5/ Les qualités d’un chef de projet ?
6/ Un projet Big Data, c’est quoi ?
Qu’est-ce qu’un projet ?
PMI® (Project Management Institute – USA) – PMBOK® Guide 5e édition, 2013 (Project Management
Body of Knowledge – Guide).
Un projet est une entreprise temporaire initiée dans le but de fournir un produit, un service ou un
résultat unique.
Temporaire signifie que tout projet a un début et une fin déterminés.
PRINCE2™ (PRINCE2™ est une marque déposée de Axelos, 2013)
Un projet est une organisation temporaire, créée en vue de livrer un ou plusieurs produits du projet
conformément à un Cas d’Affaire convenu.
L’ensemble des actions est appelé « œuvre », d’où la notion de « maître d’œuvre » qui désigne celui
qui réalise le projet.
Le résultat de cet ensemble d’actions est appelé « ouvrage », d’où la notion de « maître d’ouvrage »
qui désigne celui qui est propriétaire du résultat du projet.
Les grandes étapes d’un projet ?
Cycle en V
Les qualités d’un chef de projet
Part 1
QU’EST-CE QU’UN PROJET BIG DATA ?
Principe d’un projet Big Data
Source : https://www.cyres.fr/
Exemples de cas d’usage
Les cas d’usages sont multiples :
◦ ASSURANCE : Objets connectés – Collecter en temps réel des données des voitures pour analyser la
conduite des clients pour les facturer en fonction
◦ BANQUE : Analyse de fraude – Collecter les données clientes pour alimenter un datalab pour analyser
les comportements frauduleux de certains clients
• Equipe multidisciplinaire
Ressources
• Formation et veille dans un contexte d’innovation permanente
humaines
• Risque de turn-over important
Projet Big Data : Méthodologie
◦ Technologies et architectures spécifiques pour traiter des données massives non structurées
(architecture Hadoop / architecture Lambda)
◦ Théorème CAP (Consitency / Availability / Partition Tolerance)
◦ Difficulté à avoir des transactions ACID (atomicité, cohérence, isolation et durabilité)
◦ Différentes catégories de bases de données NoSQL (BDOA et BDOG)
◦ Automatisation du traitement parallèle (algorithme Map Reduce et framework Hadoop, écosystème
autour d’Hadoop, autres solutions notamment pour les traitements interactifs)
◦ Solutions Big Data proposées en mode Cloud (PaaS et DaaS)
Rôles clés : CHIEF DATA OFFICER (CDO)
Il est le Directeur de la data, le gardien de l’éthique.
Il est à la tête d’une équipe spécialisée dans l’acquisition, l’analyse et l’exploitation des données.
Ses missions :
◦ Sa fonction consiste à la gouvernance de son équipe pour l’approvisionnement des données les plus
pertinentes et cohérentes pour l’intérêt de l’entreprise.
◦ Il organise le partage de leur analyse avec les directions métiers, et fait respecter l’éthique en matière
d’usage de ces informations.
◦ Il s’appuie, avec son équipe, sur des connaissances pointues en statistiques, informatique et numérique
pour donner des repères à chaque département : marketing, ressources humaines, ingénierie, service
qualité, comptabilité et gestion.
Rôles clés : ARCHITECTE BIG DATA
Les architectes de données élaborent des schémas pour des systèmes de gestion de données. Le
rôle de l’architecte Big Data est d’agréger les données internes et externes, pour ensuite
concevoir un moyen de les regrouper et de les organiser.
Ses missions :
◦ Définir une stratégie de données correspondants aux besoins du métier
◦ Cartographier les données nécessaires pour implémenter l’architecture
◦ Identifier et évaluer les technologies de gestion des données
◦ Préconiser des solutions
La fonction d’administrateur/Intégrateur est clé dans le Big Data. C’est un profil qui doit bien connaitre
tant l’administration système que les différentes technologies du Big Data
L’équipe en charge du projet BIG DATA
L’implication nécessaire et
Métiers indispensable de la DSI et des
Directions Métiers
Il est important de bien clarifier
l’équipe au début du projet pour
pouvoir la sécuriser
IT (Infrastructure
Data science
& Dev team)
Cas d’un projet de datascience
Imaginer : compréhension et définition de la problématique métier, identification des besoins, la définition des
objectifs, la formulation rigoureuse du besoin ou de l’opportunité métier, le seuil de signification envisageable,
études de cas
Collecter : la disponibilité et la qualité des données, les sources traditionnelles de données (dont enjeux politiques
internes), les nouvelles sources de données (dont open data et réseaux sociaux), les formats de données,
l’acquisition des données (Crawling, Scraping…), la législation, le stockage des données massives (lac de données,
entrepôt, cache d’analyse), la stratégie de gouvernance des données
Cas d’un projet de datascience
Préparer : les techniques de nettoyage, d’homogénéisation des formats et de mise à l’échelle, l’enrichissement
des données massives, les technologies sémantiques, l’organisation de l’information pour optimiser l’analyse des
données, exemples (dont Pig et Hive)
Modéliser : l’approche itérative, les données prédictives, le machine learning, le « feature engineering »,
l’exploration et l’analyse (par lot ou en temps réel), la création de nouvelles informations (par identification,
corrélation, agrégation ou projection de l’ensemble des données précédemment transformées), la réduction
dimensionnelle (quand nécessaire), les techniques prédictives (régressions, règles d’association, classification), les
techniques exploratoires (acp, afc, clustering), l’interprétabilité de l’algorithme, 8 exemples d’algorithmes, études
de cas (segmenter une population, analyser l’opinion sur la base de verbatims)
Visualiser : l’importance de la visualisation des données, les rudiments à connaître (html5, javascript, librairies), le
recours à des applications de data visualisation (tableau software, microsoft power BI), les échanges avec les
utilisateurs métiers, exemples de représentations graphiques (les plus couramment utilisées)
Optimiser : la démarche agile et le cycle itératif, les principaux tests et optimisations réalisables, le déploiement,
exemples (dont valorisation des données et intégration de modèles prédictifs)
Déployer : l’industrialisation de la chaîne de traitement, le changement d’échelle, la possible réécriture du code,
la gestion de l’après-projet, la maintenance des applications et des données
Principaux risques
Conduite de projet Partage des données Juridiques Financiers
• Exigences et • Difficulté à mobiliser les • RGPD • Estimations budgétaires
spécifications opérationnels, • DCP (Données à mal cadrées
incomplètes obstruction Caractère Personnel), • Absence de mesure du
• Exigences irréalistes ou • Peu d’utilisateurs finaux agrégation de données ROI
trop innovantes • Difficulté à casser les • CNIL
• Ne pas douter des silos entre métiers ou • Propriété intellectuelle,
données équipes exemples
• Difficulté à « montrer »
le travail qui a été
réalisé
• Généraliser trop vite les
premiers résultats
obtenus
A vos idées…
Objectif :
Objectif :
https://app.klaxoon.com/animate/
board/AHSWRGQ
Projet en mode Agile : Les concepts (1/2)
Projet en mode Agile : Les concepts (2/2)
Ø Vision produit
Ø Approche itérative et empirique
Ø Eviter l’effet tunnel
Ø Accélérer le « Time To Market »
Ø Différentes méthodes agile : Scrum, eXtreme Programming, RAD, Chrystal Clear,...
L’adaptation
L’Inspection
importants du Scrum doivent un ou plusieurs
processus doivent régulièrement passer aspects d'un
être visibles. en revue les artefacts processus sortent des
• La transparence et l’état d’avancement limites acceptables
implique que soit par rapport aux et/ou que le produit
définis un standard objectifs afin de résultant risque d’être
commun que les détecter les écarts inacceptable, le
observateurs indésirables. processus ou le
partagent. développement en
cours doit être ajuste.
Les Valeurs du Scrum
Si des changements sont souhaités par l’organisation, ils doivent être portés par le Product
Owner
L’équipe de développement ne travaille que sur les éléments qui lui sont confiés par le Product
Owner
Rôle : L’équipe de développement
L’équipe de développement est composée de professionnels qui livrent à chaque sprint un
incrément ≪ termine ≫ et potentiellement livrable du produit.
Seuls les membres de l’équipe de développement réalisent l’incrément;
L’équipe de développement est structurée et habilitée par l’organisation à organiser et gérer son
propre travail
Elle est pluridisciplinaire, ayant toutes les compétences nécessaires pour mettre en œuvre un
incrément du produit.
Même si individuellement, ses membres peuvent être spécialises (compétences ou domaines
fonctionnels), la responsabilité appartient a l’équipe de développement dans son ensemble
L’équipe de développement doit être assez petite pour demeurer agile et assez grande pour
effectuer du travail significatif : 6 personnes* +/- 3(* hors Product Owner et Scrum Master)
Rôle : Le Scrum Master
Le Scrum Master est responsable de la compréhension et de l’application de Scrum. Pour cela il
ou elle s’assure que l’équipe Scrum adhère aux valeurs, pratiques et règles de Scrum;
Le rôle de Scrum Master est celui de meneur au service de l’équipe (ServantLeader);
Le Scrum Master aide les personnes extérieures a l’équipe Scrum à comprendre lesquelles de
leurs interactions sont utiles et lesquelles ne le sont pas;
Le Scrum Master apporte son aide pour changer ces interactions afin de maximiser la valeur
créée par l’équipe Scrum;
Pourquoi spécifier les besoins ?
Comment spécifier les besoins ? (1/2)
Comment spécifier les besoins ? (2/2)
Une bonne user story
C’est une fonction métier compréhensible et utilisable par un utilisateur
Ceci est nécessaire pour que l’avancement du projet soit basé sur des fonctionnalités livrées (avec le
niveau de finition attendu)
C’est un Use Case, une fonction ou un fragment, ou une partie de Use Case /fonction/fragment dont :
◦ La ≪ bonne ≫ durée de conception ainsi que la durée de réalisation tourne autour d’1/2 itération
◦ Pour limiter l’effet tunnel
◦ Faciliter l’ordonnancement des travaux
◦ Pour maximiser le nombre de stories terminées en fin d’itération
En synthèse :
◦ Un Cas d’utilisation, une fonction, .. est strictement une vue fonctionnelle ou utilisateur
◦ Une story est une vue fonctionnelle qui prend en compte les nécessités d’ingénierie (découpage du Use Case
en de multiples stories qui peut être implémentée en 1 itération)
A vos stylos…
Objectif :
Plus nous avançons dans le projet et plus nous sommes juste sur l’estimation de notre vélocité
L’agile c’est …