Académique Documents
Professionnel Documents
Culture Documents
Jean-Franois Desnos
Jean-Francois.Desnos@grenet.fr
ED JFD
ED JFD
ED JFD
ED JFD
Dcisionnel
Pilotage
In di
Administratif
Paye
Comptabilit
GRH
ca teurs
Produits
clients
procds
Mtier
ED JFD
Un projet complexe
ED JFD
Achats
Fournisseurs
200
Personnel
Clients
150
Bnfice
100
50
0
Anne 1
Anne2
Anne 3
Donnes
Bases sources
Couche n
Logiciel
Extraction
Transformation
Chargement
(ETL)
Logiciel
Recherche
Analyse
Mise en forme
des
donnes
Edition
Papier
Web
couche 1
ED JFD
10
Donnes dcisionnelles
Uniques(pas de redondance en
thorie)
ED JFD
11
ED JFD
12
ED JFD
13
14
Le modle dimensionnel
Une table contenant une cl multiple, la
table de faits,
un ensemble de tables secondaires, les
tables de dimension (chacune possde une
cl primaire unique correspondant lun
des composants de la cl multiple de la
table de faits).
jointures schma en toile
ED JFD
15
Table de faits
VENTE
code produit
code client
code vendeur
date
prix de vente
code vendeur
nom
code service
code client
type client
date
semaine
mois
anne
4 tables de dimensions
ED JFD
16
Table de faits
Contient des faits numriques
Les faits les plus utiles sont numriques et
additifs.
les agrgats, ou tables dagrgat, sont des
enregistrements rcapitulatifs.
ED JFD
17
Avantages du modle
dimensionnel
Conu pour un requteur : performances;
Peut tre modifi sans peine (faits
nouveaux, dimensions nouvelles ,attributs
dimensionnels nouveaux, granularit
variable);
Doit tre capable dintgrer de nouvelles
sources.
ED JFD
18
Rsultat possible
Tableau des ventes par produit et par client :
produit
client
ED JFD
19
Le cube de donnes
Chiffre daffaires
produit
ski de piste
raquette
surf
luge
ski de fond
Vendeur
jan
fev mars
Antoine
Brigitte
Laurence
mois
ED JFD
20
Volumtrie
Linformation de synthse peut tre plus
volumineuse que linformation de dtail
2D
3D
ED JFD
21
Exemple de volume
Tableau 3x3 9 lments de dtail
7 lments de totalisation
Tableau 3x3x3 27 lments de dtail
lments de totalisation :
3 tranches 3x3 = 3x7 = 21
+ la face avant 4x4 = 16
Total = 37
ED JFD
22
Cube de donnes
Dans un modle dimensionnel, on cherche reprsenter
les donnes dans un cube (ou hypercube).
analyse ascendante : synthtiser
analyse descendante : dtailler
rotation des dimensions et coupe : trancher le cube
ED JFD
23
Dimensions et indicateurs
dimension :
- produit
- client
- vendeur
- date
indicateur :
- chiffre daffaires
une dimension prend une liste de valeurs,
un indicateur est un nombre.
ED JFD
24
ED JFD
25
Exemple dadditivit
Table de faits VENTE
code produit
code client
code vendeur
prix de vente
ristourne client (type client)
commission vendeur (CA vendeur)
retour oui/non
ED JFD
26
27
Hirarchie de dimensions
Dimensions
mois
| semaine
| jour
ED JFD
28
Analyse multi-dimensionnelle
Rotation des dimensions
et tranchage,
Analyse descendante
ou ascendante.
ED JFD
29
Datamining :
Recherche et analyse dinformation dans une base de
donnes.
ED JFD
30
ED JFD
31
32
Bibliographie
Manuel du designer V5, Business Objects, 1999.
Piloter l'entreprise grce au data warehouse, J.-M. Franco et al.,
Eyrolles 2001.
La construction du datawarehouse, J.-F. Goglin, Herms 1998.
Building the Data Warehouse, W. H. Inmon, Wiley 1996.
Entrepts de donnes, guide pratique du concepteur, R. Kimball,
Wiley 1997.
Concevoir et dployer un data warehouse, R. Kimball et al.,
Eyrolles 2000.
http://www.tdwi.org
ED JFD
33
Entrepts de donnes
Modlisation
dimensionnelle
ED JFD
34
35
Modlisation entit-relation
liminer la redondance des donnes
Adapte aux transactions (ex : mise jour
dune adresse client), mais pas aux
interrogations
Modle complexe : des milliers de tables
Pas de comprhension pour lutilisateur
Ncessit de performances
ED JFD
36
Modlisation dimensionnelle
ED JFD
jointure en toile
37
Table de faits
Contient un ou plusieurs faits numriques
qui se produisent pour la combinaison de
cls d finissant chaque enregistrement
Ex.
Vente_euros, Vente_units, Cot_euros
ED JFD
38
ED JFD
39
Un schma entit-relation =
plusieurs tables de faits
Dtecter les processus mtier et les
modliser lun aprs lautre
Slectionner les relations n,n contenant des
faits numriques et additifs. En faire autant
de tables de faits
Les tables dimensionnelles relies
plusieurs schmas sont dites conformes
(partages)
ED JFD
40
Avantages de la modlisation
dimensionnelle
Structure prvisible
Structure standardise
Requteur simple et optimis
Toutes les dimensions sont quivalentes
Symtrie
ED JFD
41
Evolutions du modle
Ajout de faits nouveaux possible (si compatible
avec grain)
Ajout dune dimension nouvelle (si une seule
valeur par enregistrement de la table de faits)
Ajout dattributs dimensionnels
Outils dagrgat (enreg. rcapitulatifs)
ED JFD
42
Planification
Construction de lED datamart par
datamart, pour viter une trop grande
complexit
Eviter les tuyaux de pole
laborer un bus dcisionnel grce
aux dimensions conformes
ED JFD
43
Dimension conforme
Une table de dimension en relation avec
plusieurs tables de fait est dite conforme
Cohrence des interfaces utilisateurs et des
contenus
Cohrence de linterprtation des attributs
Grande importance dans la conception
ED JFD
44
Fait conforme
Fait ayant la mme dfinition dans tous les
datamarts, mme unit de mesure, mme
contexte dimensionnel.
Ex pour le fait recettes : priodes,
rgions de ventes cohrentes
Ex : conditionnement en units et botes
Fait non conforme : noms distincts
ED JFD
45
46
Schma dimensionnel
1 - voyages ariens
Dimension
client
Dimension
compagnie
arienne
ED JFD
Dimension
ville
Code client
Compagnie arienne
Ville darrive
Date du vol
Prix pay
Dimension
Date
47
48
Schma dimensionnel
2 location de voiture
Dimension
client
Dimension
loueur
ED JFD
Dimension
ville
Code client
Loueur
Ville de location
Date de location
Prix pay
Distance parcourue
Dimension
Date
49
ED JFD
50
Schma dimensionnel
3 - htel
Dimension
client
Dimension
Htelier
ED JFD
Dimension
ville
Code client
Htelier
Ville de sjour
Date de dbut
Nombre de nuites
Prix pay
Dimension
Date
51
52
Code client
Cie arienne
Ville darrive
Date du vol
Prix pay
Dimension
client
Code client
Loueur
Ville de location
Date de location
Prix pay
Distance parcourue
Code client
Htelier
Ville de sjour
Date de dbut
Nombre de nuites
Prix pay
ED JFD
Dimension
ville
Dimension
Date
53
Niveau de dtail
On privilgie le niveau le plus fin
Evolutivit
Puissance
Efficacit du Data mining
ED JFD
54
Multisources
Commencer par un datamart monosource
Rparer les tuyaux de pole : chercher
crer des dimensions conformes
Bus dcisionnel : dimensions et faits
conformes
ED JFD
55
56
ED JFD
57
Forage
Forage vers le bas = Drill down = donner
des dtails
Forage vers le haut = Drill up = sommer
Un vritable forage mlange les attributs
hirarchiss et non hirarchiss de toutes les
dimensions disponibles
ED JFD
58
Floconnage
Dfinition : dimension dont les champs
faible cardinalit sont dans des tables
spares, relies la table dorigine au
moyen de cls artificielles.
Non recommand : performances,
complexit
Gain en espace disque non dterminant
ED JFD
59
Exemple de floconnnage
Table de faits
contient
cl_produit
comme cl extrieure
Table de dimension
Cl_produit
Cl_conditionnement
Nombre_botes
Flocon
Cl_conditionnement
Type_conditionnement
ED JFD
60
Pas de codes
Littraux (mots complets)
Descriptifs
Soigns (orthographe, valeurs)
Indexs
Documents (mtadonnes)
ED JFD
61
Mtadonnes
Ensemble dinformations ncessaires laccs,
la comprhension et lexploitation des donnes
du data warehouse.
Le rfrentiel de lentrept de donnes =
mtadonnes + outils dadministration
Il collecte lensemble des modles de donnes
ncessaires la construction et lexploitation du
data warehouse.
ED JFD
62
Dimension temps
ED JFD
63
ED JFD
64
Dimensions changeantes
ED JFD
65
Dimensions dgnres
N bon de commande, n de facture ?
Souvent conserver dans la base de faits,
mais pas dattributs associs
pas de table de dimension associe
ED JFD
66
Cls
Toutes les cls : cls de substitution
dpourvues de signification, et sans rapport
avec les bases sources.
ED JFD
67
Faits
Additifs de prfrence
Faits textuels (exemple : conditions mtos
lors dun relev de sinistre d assurance) =
peu dintrt de comptage et regroupement
si texte libre
Prfrer les tmoins
ED JFD
68
Vente
Dclaration de sinistre
Inscription dtudiant
Ligne de facture
69
ED JFD
70
Agrgat
Table rcapitulative (sommations) destine
amliorer les performances du requtage.
Il sagit dune table de faits qui possde des
tables dimensionnelles.
ED JFD
71
ED JFD
72
73
ED JFD
74
75
ED JFD
76
ED JFD
77
Base cible
Couche n
Extraction
Transformation
Chargement
(ETL)
Recherche
Analyse
Mise en forme
des
donnes
Edition
couche 1
ED JFD
78
Loutil BO
Business Objects : extraire, mettre en forme et
analyser les donnes de la base cible.
intranet de ltablissement
univers = architecture des informations extraites.
utilisateurs : crent de nouvelles requtes,
paramtrent et en excutent des requtes
existantes.
ED JFD
79
Univers BO
Le designer dunivers :
Informaticien
Comptences
SQL
BD de lentreprise
ED JFD
80
Analyse
Analyser les besoins des utilisateurs
Conception
Faire le schma conceptuel; spcifier lunivers
Application
Crer lunivers
Maintenance
ED JFD
81
Prof
Univ
ED JFD
82
Classes et univers
Les objets peuvent tre regroups en classes
et sous-classes
L univers est un ensemble dobjets
crs sur une BD
ED JFD
83
Hirarchies
Une dimension appartient souvent une
hirarchie.
La hirarchie ordonne la dimension et
permet de changer le niveau danalyse.
ED JFD
84
Exemple de hirarchie
Exemple
Hirarchie dans lorganisation de la scolarit.
Composante (UFR)
Sciences
Cycle
1er cycle
Diplme
Deug
Etape
1re anne
ED JFD
85
Analyse dimensionnelle
Elle est possible si les dimensions de
lunivers sont hirarchises
Exemple : nombre dtudiants par
composante,.........., tape
changement du niveau danalyse
ED JFD
86
ED JFD
87
Objets de lunivers
Normaliser les noms des objets
ex. : Nationalit-code
Nationalit-libell
Utiliser la langue du mtier
Chaque dimension doit avoir une liste de
valeurs qui associe code et libell.
ED JFD
88
Structure de la base ED
Objectif : produire des indicateurs au
carrefour des dimensions
Une table de faits comporte des dimensions
et des indicateurs
A chaque dimension dune table de faits, on
associe une table de dimension (sauf
dimension dgnre)
ED JFD
89
La dimension historique
Elle est sous-jacente dans tous les faits : date,
trimestre, anne selon les faits mesurs : nb
dinscriptions, budget, appartenance un
groupe.
La date dextraction est galement importante.
2 dimensions historiques :
les faits, lextraction
ED JFD
90
ED JFD
91
92
93
ED JFD
94
Agrgats
Deux solutions :
ED JFD
95
ED JFD
96
ED cours 4
Elments darchitecture
Administration
Stratgie
Construction
ED JFD
97
ED JFD
98
Intgration au portail
A partir du client universel, accs toutes les
applications de lentreprise :
Applis dcisionnelles, bureau virtuel, workflow,
docflow, BD,
Point daccs unique,
Architecture simplifie,
Rduction des cots.
ED JFD
99
Administrer
Qualit de service (disponibilit, fiabilit,
scurit), gestion des anomalies
Configuration, paramtrage, maintenance du
systme dinformation :
gestion financire, administrative,
technique; maintenance et support.
ED JFD
100
Administration fonctionnelle
ED JFD
101
Administration technique
Volumtrie
Puissance des traitements
Evolutions
outils dadministration des systmes,
scurit, sauvegardes, mtrologie
Ces outils sappuient sur la politique des SI
de lentreprise
ED JFD
102
Choix stratgiques
Rfrentiel intgr
Solution centralise ou non
Espaces privs
Matriser les cots
Commencer par un datamart ?
ED JFD
103
Rfrentiel intgr
Multiplicit des dictionnaires : ETL, SGBD,
OLAP
Pour garantir la cohrence, 1 seul dictionnaire
si possible
ED JFD
104
ED JFD
105
Du datamart lED
Dveloppement RAD
Larchitecture retenue doit permettre le
passage lchelle
ED JFD
106
La dmarche RAD
Analyse des besoins
Phase 1
Mise en uvre 1re version
Retour dexpriences
.
Besoins complmentaires
Phase N
Mise en uvre Nime version
Retour dexpriences
ED JFD
107
ED JFD
108
50 %
20 %
15 %
109
Le chef de projet
110
ED JFD
111
Agrgats
Il faut slectionner les agrgats
retenir :
Compromis
volume
temps de rponse
ED JFD
112
Rfrentiel
Nomenclatures
nom. de rfrence,
org. rseau
Profils
utilisateurs
Paramtres
conception
exploitation
ED JFD
Rgles de gestion
Donnes et flux
mta-dictionnaire
Rfrentiel
Espaces privs
workflow
113