Vous êtes sur la page 1sur 15

I.

INFORMATIQUE DECISIONNELLE
I.1. Prsentation
On qualifie d'informatique dcisionnelle (en anglais "Business intelligence", parfois appel
tout simplement "le dcisionnel") l'exploitation des donnes de l'entreprise dans le but de
faciliter la prise de dcision par les dcideurs, c'est--dire la comprhension du
fonctionnement actuel et l'anticipation des actions pour un pilotage clair de l'entreprise On
parle de s!st"me informatique dcisionnel, ou s!st"me O#$% (On #ine $nal!tical
%rocessing), par opposition au s!st"me informatique transactionnel (s!st"me O#&%)
I.1.1. Systmes OLTP ers!s systmes OLAP
#es s!st"mes transactionnels sont sou'ent qualifis par le terme O#&% pour indiquer qu(ils
ser'ent traiter des processus transactionnels en ligne )es s!st"mes sont caractriss par un
nombre d(utilisateurs important, des mises *our de donnes frquentes et des 'olumes de
donnes par transaction relati'ement faibles
#(exploitation des informations contenues dans ces s!st"mes transactionnels est ralise par
des processus d(anal!se en ligne de donnes, en d(autres termes par des s!st"mes O#$% )es
s!st"mes O#$% doi'ent permettre l(anal!se des donnes de mani"re interacti'e et rapide,
pour des donnes quelconques et des donnes historises +ls sont utiliss par un nombre
restreint d(utilisateurs, traitent des enregistrements 'olumineux dont la structure est complexe
et proc"dent par interrogation des donnes
,ne comparaison intressante des caractristiques des s!st"mes O#&% et O#$% porte sur les
donnes et les utilisateurs, comme le montre le tableau sui'ant :

-lment de comparaison .!st"mes transactionnels .!st"mes d(aide la dcision
/onnes
-xhausti'es
)ourantes
/!namiques
Orientes applications
0sumes
1istoriques
.tatistiques
Orientes su*ets
,tilisateurs
2ombreux
3aris
)oncurrents
4ises *our, interrogations
0equ5tes prdfinies
$cc"s peu d(information
%eu nombreux
,niquement les dcideurs
2on concurrents
+nterrogations
0equ5tes impr'isibles et
complexes
$cc"s de nombreuses
informations
I.". Le #on#e$t %e Data &ere'o!se
I.".1. Po!r(!oi !n Data &are'o!se
67
Ta)*ea! + )aractristiques compares des s!st"mes transactionnels et des s!st"mes dcisionnels
#(entreprise construit un s!st"me dcisionnel pour amliorer sa performance -lle doit
dcider et anticiper en fonction de l(information disponible et capitaliser sur ses expriences
/epuis plusieurs annes, une importante masse d(informations est stoc8e sous forme
informatique dans les entreprises #es s!st"mes d(information sont destins garder la trace
d('nements de mani"re fiable et int"gre +ls automatisent de plus en plus les processus
oprationnels

Les diffrentes donnes de l'entreprise
#(informatique a un r9le *ouer, en permettant l(entreprise de de'enir plus entreprenante et
d(a'oir une meilleure connaissance de ses partenaires, de sa comptiti'it ou de son
en'ironnement
$ ce titre, le /ata :arehouse doit 5tre rapproch de tous les concepts 'isant tablir une
association entre le s!st"me d(information et sa stratgie
I.".". D,inition %! Data &are'o!se
#a dfinition classique du /ata :arehouse donne par Bill +nmon
; ,n /ata :arehouse est une collection de donnes orientes su*et, intgres, non 'olatiles et
historises, organises pour le support de processus d(aide la dcision<
-n effet le /ata :arehouse est un entrep9t de donnes +l s'agit d'un stoc8age intermdiaire
des donnes issues des applications de production, dans lesquelles les utilisateurs finaux
puisent a'ec des outils de restitution et d'anal!se
6=
Orientes s!-et
#e /ata :arehouse est organis autour des su*ets ma*eurs et des mtiers de l'entreprise #es
donnes sont organises par th"me #'intr5t de cette organisation rside dans le fait qu'il
de'ient possible de raliser des anal!ses sur des su*ets trans'ersaux aux structures
fonctionnelles et organisationnelles de l'entreprise )ette orientation permet galement de
faire des anal!ses par itration, su*et apr"s su*et
Donnes int.res
,n /ata :arehouse est un pro*et d'entreprise +l concerne les diffrents ser'ices et mtiers de
l'entreprise $'ant d'5tre intgres dans le /ata :arehouse, les donnes doi'ent 5tres mises
en forme et unifies afin d'a'oir un tat cohrent #'intgration ncessite une forte
normalisation, une bonne gestion des rfrentiels et de la cohrence, une parfaite ma>trise de
la smantique et des r"gles de gestion s'appliquant aux donnes manipules )'est ainsi que
l'on pourra donner une bonne 'ision de l'entreprise 'ia l'utilisation d'indicateurs
Donnes 'istorises
#'historisation est ncessaire pour sui're dans le temps l''olution des diffrentes 'aleurs des
indicateurs anal!ser $insi, un rfrentiel temps doit 5tre associ aux donnes afin de
permettre l'identification dans la dure de 'aleurs prcises
Donnes non o*ati*es
$fin de conser'er la tra?abilit des informations et des dcisions prises, les informations
stoc8es au sein du /ata :arehouse ne peu'ent pas 5tre mises *our ,ne requ5te lance
diffrentes dates sur les m5mes donnes doit tou*ours retourner les m5mes rsultats ,ne
donne introduite dans le /ata :arehouse ne pourra donc plus 5tre supprime ni m5me
modifie
6@
I."./. La str!#t!re %! Data &are'o!se
#a structure du /ata :arehouse
,n /ata :arehouse peut se structurer en quatre classes de donnes, organises selon un axe
historique et un axe de s!nth"se
Les %onnes %tai**es
-lles refl"tent les 'nements les plus rcents #es intgrations rguli"res des donnes issues
des s!st"mes de production 'ont habituellement 5tre ralises ce ni'eau
Les %onnes a.r.es
-lles correspondent des lments d(anal!se reprsentatifs des besoins utilisateurs -lles
constituent d* un rsultat d(anal!se et une s!nth"se de l(information contenue dans le
s!st"me dcisionnel, et doi'ent 5tre facilement accessibles et comprhensibles
Les mta%onnes
&r"s sou'ent les donnes fdrer dans le /ata :arehouse pro'iennent de sources tr"s
htrog"nes )ela rend indispensable la prsence d'un dictionnaire unique qui sait grer
l'ensemble des fonctions du /ata :arehouse )ette cohrence du dictionnaire est dcrite au
sein des mtadonnes du dictionnaire du /ata :arehouse
#es mtadonnes constituent l'ensemble des donnes qui dcri'ent des r"gles attaches
d'autres donnes )es derni"res constituent la finalit du s!st"me d'information
6A





4

t
a
d
o
n
n

e
s
I.".0. Les ar#'ite#t!res
%our implmenter un /ata :arehouse, trois t!pes d(architectures sont possibles B
- #(architecture relle,
- #(architecture 'irtuelle,
- #(architecture remote
L1ar#'ite#t!re re**e
-lle est gnralement retenue pour les s!st"mes dcisionnels 2#e stoc8age des donnes est
ralis dans un .CB/ spar du s!st"me de production #e .CB/ est aliment par des
extractions priodiques $'ant le chargement, les donnes subissent d(importants processus
d(intgration, de netto!age et de transformation
#(a'antage de cette solution est de disposer de donnes prpares pour les besoins de la
dcision et rpondant aux ob*ectifs du /ata :arehouse2
#es incon'nients sont le coDt de stoc8age supplmentaire et le manque d(acc"s en temps
rel
L1ar#'ite#t!re irt!e**e
)ette architecture n(est pratiquement pas utilise pour le /ata :arehouse 2#es donnes
rsident dans le s!st"me de production -lles sont rendues 'isibles par des produits
middleEare
6
ou par des passerelles2
+l en rsulte deux a'antages B pas de coDt de stoc8age supplmentaire et l(acc"s se fait en
temps rel
#(incon'nient est que les donnes ne sont pas prpares ainsi que le probl"me d(acc"s pour
l(exploitation
L1ar#'ite#t!re remote
)(est une combinaison de l(architecture relle et de l(architecture 'irtuelle -lle est rarement
utilise
2#(ob*ectif est d(implmenter ph!siquement les ni'eaux agrgs afin d(en faciliter l(acc"s et
de garder le ni'eau de dtail dans le s!st"me de production en ! donnant l(acc"s par le biais
de middleEare ou de passerelle2
I./. Le #on#e$t %e Data Mart
#e terme de /ata 4art est rser' des bases plus petites )(est une petite structure tr"s
cible et pilote par les besoins utilisateurs +l a la m5me 'ocation que le /ata :arehouse
6F
(fournir une architecture dcisionnelle), mais 'ise une problmatique prcise a'ec un nombre
d(utilisateurs plus restreint
)onstruire un ou plusieurs /ata 4arts au lieu d(un /ata :arehouse permet de 'alider
rapidement le concept d(informatique dcisionnelle, puisque les /ata 4arts sont moins
complexes et plus facile dplo!er que les /ata :arehouse
/ata :arehouse /ata 4art
)ible utilisateur &oute l(entreprise /partement
+mplication du
ser'ice informatique
-le'e Gaible ou mo!en
Base de donnes
d(entreprise
.H# t!pe ser'eur .H# milieu de gamme, bases
multidimensionnelles
4od"les de donnes $ l(chelle de l(entreprise /partement
)hamp applicatif 4ulti su*ets, neutre Huelques su*ets, spcifique
.ources de donnes 4ultiples Huelques unes
.toc8age Base de donnes %lusieurs bases distribues
6 mi%%*e3are B outil logiciel de connecti'it B dans un contexte dcisionnel, il est situ entre les outils
d(aide la dcision et la base de donnes dcisionnelle ,n bon middleEare permet de conser'er
l(indpendance de ces deux t!pes de composants
I.0. Systme %4a*imentation %e Data 3are'o!se
#e s!st"me d'alimentation pour but de transformer les donnes primaires (par exemple
issues des s!st"mes de production) en informations stoc8es dans le /ata :arehouse %our
cela il est ncessaire de raliser les fonctions sui'antes B
- 0echerche et identification des donnes
- )ontr9le de qualit (puration et 'alidation)
5 E6tra#tion
5 Trans,ormation
5 C'ar.ement
6I
Ta)*ea! + Ginalits des / ata 4arts et /ata :arehouse

#e s!st"me d'alimentation /ata Earehouse
#a phase d'identification et d'puration des donnes consiste dfinir et identifier la donne la
plus pertinente en fonction de sa source
#a phase de transformation regroupe les oprations de mise au format ncessaires des
donnes, de calcul des donnes secondaires et de fusion ou d'clatement des informations
composites
-nfin la phase de chargement pour r9le de stoc8er les informations de mani"re correcte dans
les tables de faits du /ata :arehouse
I.7. Prsentation %! Mo%*e m!*ti%imensionne*
I.7.1. D,inition
#a modlisation multidimensionnelle t introduite par 0alph Jimball -lle consiste en deux
nou'eaux concepts tels que les faits et les dimensions )haque mod"le multidimensionnel est
compos d(une table contenant une cl, la table des faits qui permettent de mesurer l(acti'it
et d(un ensemble de tables dimensionnelles qui contiennent les informations contextuelles
faisant 'arier les mesures de l(acti'it en question )haque table de faits poss"de une cl qui
la relie a'ec la cl primaire de chaque table de dimension

.elon l'architecture de 0alph Jimball, les structures de donnes dimensionnelles sont la
destination ultime des processus -&# et ces tables se positionnent la fronti"re entre le Bac8
0oom et le Gront 0oom -n gnral les tables dimensionnelles sont l'tape finale de stoc8age
6K
ph!sique de donnes a'ant leur transfert 'ers l'en'ironnement des utilisateurs finaux
#e mod"le dimensionnel est la structure de donnes la plus utilise et la plus approprie aux
requ5tes et anal!ses des utilisateurs d'entrep9ts de donnes -lles sont simples crer, stables
et intuiti'ement comprhensibles par les utilisateurs finaux #e mod"le dimensionnel est la
fondation m5me pour la construction des cubes O#$%
i# consiste en une grande table de faits ( fact table) et un cercle d(autres tables qui contiennent
les lments descriptifs du fait, appeles ; dimensions < Huand illustr, le mod"le ressemble
une toile, c(est d(ailleurs l(origine du terme ; -n toile <
I.7.". Po!r(!oi *a Mo%*isation Dimensionne**e8
/u point de 'ue des performances, les mod"les dimensionnels peu'ent 5tre utiles de plusieurs
mani"res #a dnormalisation des tables de dimension au cours du processus de chargement
rduit le nombre de *ointures que le moteur de requ5tes doit effectuer au moment des
interrogations $u-del de cet aspect, l(optimiseur relationnel comprend que le mod"le
dimensionnel est une grande table de faits, a'ec des *ointures simples 'ers plusieurs tables de
dimension relati'ement petites dans lesquelles se trou'ent la ma*orit des contraintes L
l(optimiseur peut formuler une stratgie de requ5te qui tire parti de cette structure )ette
stratgie, appel *ointure en toile, peut amliorer considrablement la 'itesse d(excution de
la ma*orit des requ5tes d(anal!se dcisionnelle
I.7./ Les (!atre ta$es %e *a Mo%*isation Dimensionne**e
%our bien russir le mod"le dimensionnel il est ncessaire de raliser les quatre tapes
sui'antes B
I.7./.1 + C'oisir *e Pro#ess!s 9 Mo%*iser
+l s'agit de choisir le processus d'affaire tudier #e choix du processus est en gnral
effectu par les utilisateurs finaux /'ailleurs c'est ce stade que l'on essa!e de traduire les
ob*ectifs des tableaux de bord en indicateurs de performances (J%+) (sont des instantans qui
donnent une 'ision globale d(une acti'it ou d(une organisation, partir de mesures
spcifiques et prdfinies)/ans le cas des /.. d'indicateurs de gestion
I.7./." + D,inir *a .ran!*arit %! $ro#ess!s
+l s'agit de rpondre la question B Hue reprsente un enregistrement de la table de fait M
NO
#a granularit dfinit le ni'eau de dtail contenu dans la table de fait 3oici quelques
exemples B
,ne ligne de commande par produit, par client et par *our
,ne transaction bancaire par client par t!pe de retrait et par mois
+l s'agit de l'tape la plus critique lors de la cration du mod"le
I.7././ + C'oisir *es Dimensions
/ans cette tape on doit choisir les diffrentes dimensions qui reprsentent le contexte dans
lequel le fait a eu lieu
I.7./.0 + I%enti,ier *es Faits
%our identifier les faits, il faut rpondre la question B Hu'est ce qu'on mesure M
I.7.0. Mo%*e m!*ti%imensionne* #on#e$t!e*
+@= 1. Con#e$t %e #!)e
+l s'agit d'une modlisation multidimensionnelle des donnes facilitant l'anal!se d'une quantit
selon diffrentes dimensions )ette 'ision correspond une structuration des donnes selon
plusieurs axes d'anal!ses (ou dimensions) pou'ant reprsenter des notions 'aries telles que le
temps, les clients, les produits,P
schma de cube
+@= ".Les Ty$es De Mo%*isation M!*ti5%imensionne**e
N6
+@= ".1.Star Schma ou Schma en toile
+l consiste en une grande table de faits et un cercle d(autres tables qui contient les lments
descriptifs du fait, appeles ; dimensions < Huand illustr, le mod"le ressemble une toile,
c(est d(ailleurs l(origine du terme ; -n toile <
#a figure sui'ante illustre le schma en toile B
0eprsentation schema en etoile
I.5.4. 2.2.#e schma en flocons de neige
NN
#e schma en flocons de neige est une 'ariante du schma en toile /ans la thorie la
diffrence rside dans la simple normalisation des tables de dimensions +l est donc tout
simplement question de mettre les attributs de chaque ni'eau hirarchique dans une table de
dimension part
0eprsentation schma en flocons
#es deux nou'eaux concepts (par rapport au mod"le relationnel) sont B la ta)*e %es ,aits et la
ta)*e %e %imension.
La Ta)*e %es ,aits B
#a Ta)*e %es ,aits contient les donnes obser'ables (les faits) que l'on poss"de sur un su*et et
que l'on 'eut tudier, selon di'ers axes d'anal!se (les %imensions)
Cara#tristi(!es %1!ne ta)*e %e ,aits +
,ne table de faits contient les 'aleurs numriques de ce qu(on dsire mesurerL
,ne table de fait contient les cls associes aux dimensions +l s(agit des cls
trang"res dans la table de faitsL
N7
-n gnral une table de fait contient un petit nombre de colonnesL
,ne table de fait contient plus d(enregistrements qu(une table de dimensionL
#es informations dans une table de fait sont caractrises par B
-lles sont numriques et sont utilises pour faire des .,4, $3CP
#es donnes doi'ent 5tre additi'es ou semi-additi'esL
&outes les colonnes reprsentant les faits (mesure6, mesureN dans la figure 6) dans la
table de fait doi'ent rfrer et a'oir un lien direct aux cls de dimensions
exemple de table de fait
Str!#t!re %e )ase %1!ne ta)*e %e ,aits
,ne table de faits de'rait a'oir la structure sui'ante B
N=
Fi.!re 1: B 0eprsentation de la structure de table de fait
Dimension dgnre :
#a dimension dgnre est une cl de dimension dans la table de fait qui est en gnral sans
attribut %ar exemple 2o de bon de commande, 2o d(interruption de ser'ice, etc /ans le cas
de numro de l(interruption de ser'ice, les utilisateurs 'eulent sa'oir par exemple ; combien
de fois un client a t interrompu dans une priode de temps prcise<
3u qu(il s(agit d(une seule cl de dimension, nous 'itons alors de crer une table de
dimension, ce qui fait que cette table de dimension a dgnr dans la table de fait, c(est pour
cette raison que cette cl est appele ; dimension dgnre <
La Ta)*e %e %imension +
#a Ta)*e %e %imension contient les axes d'anal!se (les dimensions) selon lesquels on 'eut
tudier des donnes obser'ables (les faits) qui, soumises une anal!se multidimensionnelle,
donnent aux utilisateurs des renseignements ncessaires la prise de dcision On appelle ;
dimension < un axe d'anal!se +l peut s'agir des clients ou des produits d'une entrepriseP, etc
Cara#tristi(!es %1!ne %imension +
,ne table de dimension contient le dtail sur les faitsL
,ne table de dimension contient les informations descripti'es des 'aleurs numriques
de la table de faitsL
3u que les donnes dans la table de dimensions sont normalises, elle contient un plus
grand nombre de colonnesL
,ne table de dimension contient en gnral beaucoup moins d(enregistrement qu(une
table de faitsL
#es attributs d(une table de dimension sont sou'ent utiliss comme ; #ignes < et
; )olonne < dans un rapport ou rsultat de requ5te %ar exemple, les attributs textuels
d(un rapport pro'iennent sou'ent d(une dimension
N@
II. LA MODELISATION DES DATA MARTS DE LA D;
$pr"s a'oir tablir des dialogues a'ec des $dministrateurs nous a'ons dtermin les
diffrentes dimensions et axes d(anal!se de notre modlisation
#es dcideurs, qui sont les futurs utilisateurs de notre s!st"me, souhaitent estimer la
ma> trise des coDts, la mesure du rendement, #a segmentat ion des patients ainsi
ni'eau de fidlisation des patients sui'ant plusieurs axes d(anal!se
)es axes d(anal!se constituent les dimensions de nos mod"les des /ata 4arts
#e mod"le que nous a'ons adapt notre s!st"me dcisionnel c(est le mod"le en -toile
)e choix est *ustifi par B
la prsence des dimensions sans sous-dimensions
la prsence des tables de dimensions non 'olumineuses
-n se rfrant aux besoins exprims et prsents au ni'eau de l(tude des besoins (Ob*ectifs et
champ d(tude), nous a'ons con?u /ata 4arts sui'ant B
NA
Mo%*isation %! Data Mart %e *a D; Po*y#*ini(!e+
.chma conceptuel du /ata 4art de la /B %ol!clinique
NF