Académique Documents
Professionnel Documents
Culture Documents
et dployer un
data warehouse
Ralph Kimball
ditions Eyrolles
ISBN : 2-212-09165-6
2000
2
Le cycle de vie dimensionnel
Les auteurs de ce livre travaillaient ensemble chez Metaphor au tout dbut de limplmenta-
tion des solutions dcisionnelles. cette poque, il nexistait ni pratique industrielle optimale,
ni mthodologie officielle. Les auteurs, ainsi que dautres collaborateurs de Metaphor, ont
commenc dvelopper des techniques et des approches destines traiter les particularits
du dcisionnel. Nous avions t forms aux mthodologies de dveloppement traditionnelles ;
nous avons cependant modifi et amlior ces pratiques afin daborder les dfis particuliers
que reprsentaient le fait de mettre la disposition des utilisateurs un accs direct aux donnes
tout en prenant en compte la croissance et lextensibilit.
Au fil des ans, les auteurs se sont trouvs impliqus dans des centaines de projets de data
warehouse. Beaucoup ont t couronns de succs, dautres nont rpondu qu certaines
exigences, et quelques-uns se sont solds par des checs retentissants. Chaque projet a t
riche denseignements. De plus, nous avons tous eu la chance, au cours de ces annes, de nous
instruire au contact dorganisations et de personnes talentueuses. Nos approches et nos tech-
niques, formes et affines au fil du temps, sont aujourd'hui prsentes dans cet ouvrage.
La russite de limplmentation dun entrept de donnes dpend de lintgration adquate de
nombreux composants et tches. Il ne suffit pas de possder le modle de donnes parfait ou
la meilleure technologie ; il sagit de coordonner les multiples facettes du projet de data ware-
house, tout comme un chef dorchestre doit accorder les nombreux instruments qui compo-
sent son orchestre. Un soliste ne peut mener tout un orchestre lui seul. De la mme manire,
les efforts fournis pour limplmentation dun entrept de donnes doivent rvler leur effica-
cit travers tous les aspects du projet. Le cycle de vie dimensionnel sapparente la partition
dun chef dorchestre ; il fait en sorte que les lments du projet soient placs dans le bon
ordre au bon moment.
En dpit des avances technologiques spectaculaires survenues depuis les dbuts de Metaphor
dans les annes 80, les concepts de base du cycle de vie dimensionnel sont rests remarqua-
blement stables. Notre approche de la conception, du dveloppement et du dploiement des
entrepts de donnes est prouve et fiable. Elle a quasiment t teste dans tous les secteurs
dactivits et sur toutes les plates-formes technologiques. Le cycle de vie a fait ses preuves.
Planification du projet
Comme on peut sy attendre, le cycle de vie commence par la planification du projet. Celle-ci
aborde la dfinition et ltendue du projet de data warehouse, y compris lapprciation du
niveau de maturit de lorganisation face cet type dapproche et sa justification fonction-
nelle. Certaines tches initiales sont dcisives en raison du fort besoin de visibilit et des cots
associs la plupart des projets de data warehouse. partir de l, la planification du projet se
concentre sur les besoins en terme de ressources et de niveau de qualification, coupls aux
affectations des tches, leur dure et leur squencement. Le planning qui en dcoule iden-
tifie toutes les tches associes au cycle de vie dimensionnel et mentionne les ressources
Le cycle de vie dimensionnel
CHAPITRE 2
3
Dfinition de Installation
l'architecture et slection
technique des produits
Conception et
Dfinition Conception dveloppement Maintenance
Planification Modlisation du modle des lments
des Dploiement et
du projet dimensionnelle physique de la zone de
besoins de prparation croissance
l'entreprise des donnes
Spcification de Dveloppement
l'application de l'application
utilisateur utilisateur
Gestion du projet
Figure 2.1
Schma du cycle de vie dimensionnel.
les structures des tables et les cls principales et extrieures. Le plan dagrgation prliminaire
sera galement dvelopp. Cet ensemble dactivits sachvera sur le dveloppement dune
mise en correspondance des donnes source et cible.
Les concepts relatifs la modlisation dimensionnelle sont traits dans les chapitres 5 7. Le
chapitre 5 propose une introduction la modlisation dimensionnelle et sa justification, tandis que
le chapitre 6 couvre les sujets plus avancs relatifs la modlisation dimensionnelle. Le chapitre 7
dcrit lapproche recommande du processus de dveloppement dun modle dimensionnel.
dfini, en mme temps que les facteurs dvaluation spcifiques chaque composant de
larchitecture. Une fois les produits valus et slectionns, ceux-ci devront tre installs et
tests mticuleusement afin de garantir une intgration adquate de bout en bout dans lenvi-
ronnement du data warehouse. Le chapitre 13 traite principalement de larchitecture, de
lvaluation technologique, ainsi que des processus de slection et dinstallation qui en
dcoulent.
Dploiement
Le dploiement est le point de convergence de la technologie, des donnes et des applica-
tions utilisateur accessibles partir du poste de travail. Une planification de grande envergure
est indispensable afin que toutes les pices du puzzle se placent correctement. Il est gale-
ment ncessaire de prvoir une formation des utilisateurs qui intgre tous les aspects de cette
convergence. En outre, avant de permettre lutilisateur daccder lentrept de donnes,
il faut mettre en place les processus de communication, de support utilisateur, et de prise en
compte des demandes d volution ou de correction. Le chapitre 18 met laccent sur limpor-
tance de bien orchestrer le dploiement (celui-ci devra tre report si tous les lments ne
sont pas prts).
Maintenance et croissance
Aprs le dploiement initial de lentrept de donnes, il reste encore beaucoup de travail. Il
faut continuer vous occuper de vos utilisateurs en leur procurant un service de support et
une formation continue. Vous devez galement vous assurer que les processus et les proc-
dures mis en place pour la gestion de la zone de construction vont faire fonctionner
lentrept en continu et efficacement. Pour bien vendre votre entrept de donnes ses
utilisateurs, vous devez songer mesurer priodiquement son acceptation et ses perfor-
mances. Enfin, votre plan de maintenance devra inclure une stratgie de communication de
grande envergure.
Si, jusqu prsent, vous avez utilis le cycle de vie dimensionnel, votre entrept de donnes va
voluer et crotre. la diffrence de certaines initiatives traditionnelles de dveloppement, le
changement devra tre peru comme un facteur de succs et non dchec. Des processus de
hirarchisation des priorits doivent tre mis en place afin de grer la demande de lutilisateur en
termes dvolution et de croissance. Aprs avoir identifi les priorits du projet, nous revenons
au dbut du cycle de vie, en prenant appui sur ce qui a dj t mis en place dans lenvironne-
ment du data warehouse et en nous penchant sur les nouveaux besoins. Le chapitre 19 expose
nos recommandations concernant la sant et la croissance long terme de votre entrept de
donnes.
Gestion de projet et valuation des besoins
6 PREMIRE PARTIE
Gestion du projet
La gestion de projet garantit que les activits du cycle de vie dimensionnel restent sur la bonne
voie et sont bien synchronises. Comme le montre la figure 2.1, les activits de gestion de
projet sont tales tout au long du cycle de vie. Elles concernent le contrle de ltat davan-
cement du projet, la dtection et la rsolution des problmes et le contrle des changements,
afin de rester dans la limite des objectifs et du primtre. Enfin, la gestion de projet inclut le
dveloppement dun plan de communication dtaill, qui aborde la fois les services infor-
matiques et utilisateurs. Une communication suivie est absolument dcisive pour grer les
attentes, et une bonne gestion des attentes est elle-mme absolument dcisive pour que votre
entrept atteigne ses objectifs. Le chapitre 3 dtaille les activits de gestion de projet.
En rsum
Le cycle de vie dimensionnel propose un cadre permettant dorganiser les nombreuses tches
ncessaires limplmentation russie dun data warehouse. Grce des annes dexp-
riences pratiques, nous lavons fait voluer. Il est fortement ancr dans la ralit
daujourdhui. Maintenant que vous avez fait la connaissance du cycle de vie dimensionnel,
nous pouvons commencer !