Académique Documents
Professionnel Documents
Culture Documents
1
Question
• Quelle est la meilleure approche pour developper une
solution de BI ?
Approche top-down vs bottom-up
Caractéristique Top-down (B. Inmon) Bottom-up (R. Kimball)
Objectifs
Livrer une solution Livrer une solution permettant aux
technologiquement saine basée sur usager d'obtenir facilement et
des methodes et technologies rapidement des reponses a leurs
eprouvées des bases de données requites d'analyse
Complexity de la methode Plutot complexe Plutot simple
Importante Peu importante
Importance de la conception
physique
Orientation du modele Oriente données Orienté processus d'affaires
Accessibility des Faible Forte
utilisateurs
finaux
Outils de conception
Traditionnels (diagrammes entite- Modelisation dimensionnelle
relation et flot de donnees) (schema en etoile)
Auditoire principal Professionnels en Tl Utilisateurs finaux
9
Le cycle de vie d'une solution Bl
Diagramme de flux de travail (DW Lifecycle, Kimball)
12
Question
Comment determine-t-on la portee d'un projet de BI?
13
La portee preliminaire du projet
• Depend de:
— Le nombre de sujets d'analyse vises (ex: fonctions d'affaires,
regions, etc.)
— Le nombre et le type de sources de donnees brutes;
— L'approche employee pour charger les donnees des sources
dans l'entrepot de donnees;
— Les regles d'affaires appliquees aux donnees sources lors de la
validation;
— Le contenu, le niveau de detail, et l'historique des donnees
sources;
— Les outils frontaux (front-end) d'intelligence d'affaires
employees pour l'analyse;
— La complexite architecturelle de l'environnement.
La portee preliminaire du projet
• Directives pour determiner la portee:
- Definie en fonction de besoins specifiques;
- Doit apporter une valeur d'affaires suffisante a I'entreprise,
tout en restant faisable;
- Doit etre fait conjointement avec les representants
d'affaires et ceux des TI.
15
Exemple de document de portee
Nom du projet
Information de base
BigCo desire maximiser les revenus provenant de ses activites de promotion. Presentement, elle depense
environ $40 million annuellement en publicite. L'objectif est de reduire les depenses reliees aux activites
promotionnelle de 25% d'ici trois ans.
La prochaine phase du projet de Bl portera sur ^information promotionnelle, complementant le projet
precedent consacre aux donnees de vente. Les equipes de vente et de marketing auront acces a la fois aux
donnees de vente et de promotion, permettant ainsi le developpement de strategic promotionnelles plus
efficaces.
Portee du projet:
• Trois annees de donnees historiques sur les activites internes de promotion;
• Maximum de 25 utilisateurs initialement, avec le plan d'augmenter la capacite a 150 utilisateurs;
• architecture technique sera basee sur...
Exclusions:
• Donnees externes, telles que les information sur les ventes et promotions des principaux competiteurs;
• Support pour des programmes promotionnels non-domestiques;
Criteres de succes:
• Une seule source d'information employee pour les analyses reliees aux activites de promotion;
• Reduction du temps requis pour effectuer une analyse reliees aux activites de promotion;
• Investissements et coUts:
- Achat/mise a niveau de composantes materielles:
• Ex: serveurs, reseau, HD, etc.
- Embauches internes:
• Ex: analyste de donnees, DBA, directeur de projet, etc.
- Ressources externes:
• Ex: consultants, support technique de produits achetes, etc.
- Couts de maintenance:
• Ex: frais de maintenance, support et croissance.
18
Justification du projet
• Benefices ($):
- Augmentation des revenus de vente;
- Meilleur taux de reponse aux envois publicitaires;
- Elimination des produits a faible marge de profit;
- Reduction des depenses en marketing;
- Diminution du taux d'attrition;
- Reduction des cas de fraude;
- etc.
Indirect
100%
TOTAL: $12,931,800
• Benefices principaux:
- Reduction du temps de creation de rapports;
- Amelioration de la qualite et la visibilite des donnees;
- Embauche d'employe en TI evitee;
Proprietaire,
President Sponsors
Analyste d'affaires,
Gardien de but, Architecte de donnees,
Centres, Analyste en QA,
Ailiers, Administrateur de BD,
Defenseurs Architecte/developpeur ETL,
Architecte/developpeur d'applications Bl
Specialiste technique,
Specialiste en securite,
Unites speciales Specialiste en forage de donnees,
Charge des tests,
Educateur
Partisans Utilisateurs
22
Equipe d'un projet de BI
• Sponsor:
- Membre de la haute direction;
- Approuve les budgets;
- Defend le projet en cas de besoin.
• Directeur de projet:
- Sert de liaison entre les sponsors et les autres membres de
I'equipe;
- Responsable du leadership et de la direction du projet;
- Influence les decisions strategiques et architecturelles.
23
Equipe d'un projet de BI
• Chef de projet:
- Gere le projet au jour le jour:
• Coordination des ressources et des activites;
• Planification des taches et des budgets;
• Suivi de I'etat et de I'avancement du projet.
- Doit pouvoir reagir rapidement aux problemes rencontres,
avant que ceux-ci s'intensifient.
• Analyste d'affaires:
- Gere la collecte et la definition des besoins;
- Assure la juste representation des besoins dans les autres
etapes du projet;
- Doit tres bien connaitre les processus d'affaires de l'entreprise.
Equipe d'un projet de BI
• Analyste en QA / intendant des donnees:
- Responsable d'etablir une vue consolidee des definitions
et regies des donnees, a I'echelle de I'entreprise;
- S'assure que les donnees inserees dans l'entrepot sont
valides et completes;
- Peut egalement etre responsable de verifier l'integrite des
applications de BI.
• Architecte de donnees:
- En charge de definir une architecture facilitant la
reutilisabilite, l'integration et l'optimisation des donnees;
- Congoit et developpe le modele dimensionnel des
donnees;
- Participe parfois a la collecte des besoins.
25
Equipe d'un projet de BI
• Administrateur de BD (DBA):
- Responsable de convertir le modele des donnees en
structures physiques de l'entrepot (tables, colonnes, etc.);
- Choisit des parametres physiques maximisant la
performance de l'entrepot (ex: disposition des disques,
partitionnement, indexes, etc.)
- Gere l'integrite, la disponibilite et la performance de
l'entrepot au quotidien.
• Architecte/developpeur ETL:
- Responsable de la conception et developpement du
systeme ETL;
- Architecte est souvent implique dans la collecte des
besoins;
28
Definition des besoins
• Processus d'analyse (Kimball):
29
Moderation des donnees
• Se base sur le document de description des besoins;
• Comprend:
— Identification desfaits et leur granularite;
— Identification desdimensionset leur hierarchie;
— Strategies: denormalisation, gestion des changements, etc.
30
Moderation des donnees
Processus/ Date Clien Prod Plan Cana LigneRelai Repre Emp Appel
Dimension t uit d'utilis tel. loye servic
ation l de senta e Matrice en bus
vente nt
de de donnees
vente
Facturation client X X X X X X
X X X X X X X
Gestion du trafic
d'appels
Inventaire X X X
X X X X X X X
Service a la
clientele Dim : DateFacturation
idDateFacture (PK)
idDateFacture (FK)
mois
idClient (PK)
idLigne (FK)
annee
noClient
idClient (FK)
nomClient
idVendeur (FK)
ville
Dim : LigneTel
idPlan (FK)
province
idLigne (PK)
noFacture (DD)
codePostal
noLigne
nbAppels
datePremierService
codeRegional
total Minutes
dateActivation
minutesLongueDistance
idPlan (PK)
minutesSoir
Dim: RepresentantVente
codePlan
minutesWeekend
idVendeur (PK)
abbreviationPlan
fraisService
noVendeur
descriptionPlan
fraisLongueDistance
nomVendeur
Schema en etoile
minutesSemaine
taxes
idDepartement
minutesSoir
(magasin de donnees)
total
nomDepartement
minutesWeekend
directeurDepartement
31
Conception physique des donnees
32
Conception physique des donnees
Requete analytique
SELECT SUM(Inventaire.quantite)
FROM Inventaire, Produit, Fournisseur
WHERE Inventaire.idProduit = Produit.id AND
Inventare.idFournisseur = Fournisseur.id AND
Produit.categorie='moteur_mazda AND 1
Fournisseur.province= QC' 1
Strategie d'optimisation
Inventaire(Fournisseur.province, Produit.categorie)
Inventare.idFournisseur = Fournisseur.id
33
Conception de ('architecture technique
Comprend:
— Identification des besoins techniques;
— Creation du plan d'architecture.
34
Conception de ('architecture technique
Source Systems
Internal Data
ETL System Bl Applications
ERP
-GL
- Purchasing
Clean, Conform Presentation
Extract - Customer Deliver Application Types
- Distribution
- Directory - SCD2 tracking Server
-Inventory
demog
monitor - Product • Late arriving cust - Direct access queries
-HR - Standard reports
- Payroll
- Demog lookup integration info
- ERP adapter - Store attribute - Fact table pipeline RDBMS - Analytic applications
hist - Aggregate mgmt - Promotion mgmt
>
Club Card ETL Management Services - Atomic <0 - Forecasting
Tracker (CCT) - Job scheduler and monitor - Problem escalation business
2 - Dashboard/scorecard
- Registration - Backup, recovery, restart - Security and compliance process - Bl portal interface
a> - Data mining/models
- Maintenance - Data quality workbench - Dimension manager front dimensional
- Customer end
TO
O)
contacts front end models TO Bl Management Services
O)
- Aggregates _ O) - Usage monitor
<
Subsidiary
- Security mgmt/enforcement
ETL Data Stores
Metadata /
POS
- Compliance enforcement
- ETL process logs - Lookup/decode tables Process metadata:
- Retail sales
- Query management
- Staged data - Hierarchy masters - Database monitoring
- SKU master
- Bl tool administration
- Dimension masters - Audit dimension data system tables
- Enterprise reporting
- ETL tool repository - User managed attributes - Aggregate/OLAP
Subsidiary - Web/portal services Selection de
usage statistics
Archive Technical metadata:
• Store attribute ETL Metadata - Database system produits
history
Primary POS
Process metadata:
- ETL operations
statistics
Technical metadata: Business metadata:
- ETL job logic,
transforms
* Data quality screens
- Business rule logic
tables
- Partition settings
- Stored procs/scripts - Stored reports
Bl Data Stores
X
- Audit results - Retention, backup. - Aggregate definitions
J
• Application server caches
- Retail sales
- Store info
results \^~ Security and access data
Bl Metadata
Process metadata:
- Usage statistics
External Data
• Comprend:
— Identification et analyse des sources de donnees;
— Developpement des methodes d'extraction,de nettoyageet de
consolidation des donnees (code maison ou outils
commerciaux);
— Developpementdes methodes d'insertion de donnees (ex:
scripts, outils complexes);
- Validation de la qualite des donnees.
36
Conception et developpement du systeme ETL
Matrice de transformation
a
1
3Z
Sort Excel Sort DB
it
Merge Join
*
A Conditional Split
ExistingRow
NewRow
OLE DB Command
r OLE DB Destination
a
Conception et developpement des applications Bl
Requetes a acces
direct, reporting,
Besoins analytiques
data mining
et techniques
CO
Rapports standards
O)
T3
> +->
o
Applications
Q_ analytiques
Architecture
Tableaux de bords
et scorecards
Bl operationnel
• Comprend:
40
Plan de projet
• Definit pour chaque activite:
- Ressources responsables;
- Les dates de debut et de fin estimees (ne doivent pas etre
modifiees);
- L'etat courant (ex: future, en cours ou completee);
- Les dates de debut et de fin mises a jour;
- Le nombre de jours de retard;
- Le % complete;
- Les dependances (autres taches).
Plan de projet
last ttetrrt: Resources Original Original Original Status Updated Updatea Effort to Late % Depen¬
estimated estimated estimated start date com¬ finish days Com¬ dencies
effort start date completion pletion pleted
date date
b Project planning 15 days Tue 1/1/OS Tue 1.22*08 Future Task NA HA15 days 0 days 0%
1
2 Establish project identty PM/Proj Lead 0.5 days Tue 1/1/08 Tue 1/1A08 Future Task NA NA0 5 days! Odays 0%
i
3 0 Identify project resources 3 days Wed 1.2/08 Fri 1/4<08 Future Task NA NA 3 days 0 days 0%
4 Determine required roles PM 0.5 days Wfcd 1/2/08 Wed1/2J08 Future Task NA NA0.5 days Odays 0% 2
5 Determine resources PM/Proj Lead 2 days Wed 1/2/08 Fri 1 /4/08 Future Task NA NA 2 days Odays 0% 4
e Assign rotes to resources PM 0.5 days Fri 1/4/08 Fri 1/4/08 Future Task NA NA0.5 days- 0 days 0% 5
7 Develop project communication plan PM 1 day Mon 1/7/08 Mon 1/7/08 Future Task NA NA 1 day 0 days 0% 6
8 Prepare draft skeleton project plan PM 3 days Tue 1/8/08 Thu 1 *10.08 Future Task NA NA 3 days! 0 days 0% 7
9 El Establish project management procedures 1.5 days Fri 1/11/03 Mon 1.14/08 Future Task NA NA 1.5 days 0 days 0% 8
10 Establish change man^gernant proc^cc PM 0.5 day? Fri 1/11/OS Fr«1M1/08 Future T NA NA 0 5 d*ycji 0 days 09C
11 Create issue resolution process PM 0.5 days Fri 1/11/08 Fri1f11/08 Future Task NA NA 0 5 days Odays 0% 10
12 Establish enhancement treckhg process PM 0.5 days Mon 1/14/08 Mon 1 <14/08 Future Task NA NA 0 5 days 0 days 0% 11
13 Conduct project team kick-off PM 1 day Mon 1/14/08 Tue 1 <15/08 Future Task NA NA 1 day Odays 0% 9
14 Revise project plan PM/Team 5 days Tue 1/15/08 Tue 1 <22/08 Future Task NA NA 5 days! 0 days 0% 13
Deploiement
• Point de convergence des activites de developpement;
43
Maintenance et croissance
• Comprend:
• Philosophie Agile:
« Si un projet doit se solder par un echec, mieux vaut le
savoir apres 1 seul mois, qu'apres 15 mois »
- Jeffries, Anderson et Hendrickson (2000). Extreme Programming Installed.
Success Rates
Agile
w.it. •!. '
58%
i Successful
t 16%
• Avantages vs inconvenients:
Avantages Inconvenients
*: S. Brobst, M. Mclntire et E. Rado (2008). Agile Data Warehousing with Integrated Sandboxing,
Business Intelligence Journal, vol. 13, no. 1.