Memoire Mise en Place D'un Data Mart Concernant La Paie Du

MINISTERE DES ENSEIGNEMENTS SECONDAIRE,
SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE POLYTECHNIQUE
DE BOBO-DIOULASSO
ECOLE SUPERIEURE D'INFORMATIQUE
01 BP 1091, TL(226) 97 27 64
BOBO-DIOULASSO
BURKINA FASO
UNITE-PROGRES-mSTICE
.Afil:r
Centre National de Traitement
de l'Information
BP 1132 Ouagadougou al
e. mail: info@cenatrin.bf
Mise en place d'un data mart concernant la paie du
personnel de l'Etat
MEMOIRE DE FIN D'ETUDE
prsent et soutenu publiquement pour l'obtention du
Diplme d'ingnieur de conception en informatique
par
w. Stanislas KABRE
Maitre de stage
Joachim OUEDRAOGO
Anne universitaire 2004 - 2005
Directeur de memoire
Karim TRAORE
Table des matires
REMERCIEMENTS 3
INTRODUCTION 4
PARTIE 1. : ETAT DES LIEUX 5
1.1. La problmatique du thme 6
1.2. Le DPS 7000/250 7
1.3. Le GCOS7 10
1.4. Le systme oprationnel actuel Il
PARTIE II. : METHODES ET CONCEPTS 13
2.1. Le data warehouse ou entrept de donnes 14
2.1.1. Prsentation 14
2.1.2. Pourquoi un entrept de donnes 14
2.1.3. Dfinition 17
2.1.4. Concepts de base 19
2.1.5. Infocentre et Data Warehouse 21
2.1.6. Composants d'un entrept de donnes 23
2.1.7. Matrice de bus de l'entrept 26
2.1.8. Infrastructures 27
2.1.9. Conception d'un entrept de donnes 28
2.1.10. Administration des donnes 31
2.2. Le Data Mart 34
2.2.1. Dfinition 34
2.2.2. Mise en place 35
2.3. Le concept OLAP 37
2.3.1. Prsentation 37
2.3.2. Les 12 rgles LAP 37
2.3.3. Composants d'un systme OLAP 40
2.3.4. Offre du march 43
2.4. La modlisation dimensionnelle 44
2.4.1. Dfinitions 44
2.4.2. Processus de modlisation dimensionnelle 45
2.4.3. Dimensions 46
2.4.4. Tables des faits 49
2.4.5. Cls artificielles 51
2.4.6. Mythe de la modlisation dimensionnelle 51
2.4.7. Modlisation 52
2.4.8. Gestion du projet de modlisation dimensionnelle 53
PARTIE III. : APPLiCATION 56
3.1. Schma global des composants du data mart 57
3.2. La phase Extraction Traitement Chargement (ETC) 58
3.2.1. Extraction 58
3.2.2. La phase de traitement et de chargement 59
3.3. Le modle dimensionnel 60
3.3.1. Matrice de l'architecture en bus dcisionnel.. 60
3.3.2. Diagramme de la table des faits 61
3.3.3. Dtail de la table des faits 62
3.3.4. Dtail de la table dimensionnelle 63
Mise en place d'un data mart concernant la paie du personnel de l'Etat Page J
3.4. Le modle physique en toile 75
3.5. Le modle multidimensionnel 76
3.6. Les outils d'accs 77
3.7. Le scenario de mise en uvre 77
CONCLUSION 80
ANNEXE 1 : PRESENTATION DU CENATRIN 81
ANNEXE Il : ABREVIATIONS............................................................................................................ 85
ANNEXE ID : BmLIOGRAPHIE................................................................... 86
ANNEXE IV : RESSOURCES INTERNET.......................................................................... 87
ANNEXE V : GLOSSAIRE 88
ANNEXE VI: LISTE DES TABLEAUX ET SCHEMAS............................................ 90
Mise en place d'un data mart concernant la paie du personnel de l'Etat Page 2
Remerciements
Qu'il me soit permis ici de remercier trs sincrement les dirigeants du
Centre National de Traitement de l'Information (CENATRIN), notamment:
Toute la Direction Gnrale du CENATRIN, en particulier le Directeur
Gnral, pour l'opportunit qui m'a t donne de pouvoir m'inscrire ce
cycle et de pouvoir le terminer;
Le Chef de la Division Etudes et Dveloppement, pour la supervision de mes
travaux, les conditions de travail agrables, son soutien et ses conseils ;
Tous les chefs de Divisions et tout le personnel du CENATRIN ;
Je remercie galement tous ceux qui, de prs ou de loin, ont contribu ma
formation. Je citerai surtout:
Tout le corps professoral de l'Ecole Suprieure d'Informatique pour la
qualit des enseignements dispenss ;
Tous les enseignants rmssronnarres pour leur disponibilit et leur
contribution considrable notre formation;
Je n'oublierai pas les membres de ma famille, mes parents et mes amis pour leur
soutien multiforme.
Introduction
L'Ecole Suprieure d'Informatique (ESI) a vu le jour en 1990 avec
l'ouverture du Cycle des Ingnieurs de Travaux en Informatique (CITI) option:
analyste programmeur. Cela au vue de la ncessit de former des cadres comptents
en informatique au niveau national.
C'est dans cette mme optique que l'Ecole Suprieure d'Informatique a ouvert en
1998 le Cycle de formation des Ingnieurs de Conception en Informatique (CICI).
La formation thorique reue est complte par les tudes de cas, les travaux
pratiques et les stages en entreprises. En dernire anne du Cycle de formation des
Ingnieurs en Conception, les lves ingnieurs effectuent un stage de six (6) mois
en entreprise sanctionn par la prsentation d'un mmoire.
C'est dans ce cadre que nous avons effectu notre stage au Centre National de
Traitement de l'Information (CENATRIN), qui est mis en liquidation
administrative depuis juillet 2005. Le stage a t supervis par Monsieur Karim
TRAORE, enseignant l'ESI et Monsieur Joachim OUEDRAOGO, chef de projet,
Chef de la division Etudes et Dveloppement du CENATRIN. Ce mmoire a pour
thme Mise en place d'un data mart concernant la paie du personnel de l'Etat, et
vise apporter une solution aux problmes de manque d'tats dcisionnels
auxquels sont confrontes les structures en charge du traitement des salaires des
agents de l'Etat.
Ce document prsente en trois (3) parties les rsultats des travaux effectus
durant ce stage :
la premire partie pose la problmatique du sujet et fait un tat des lieux;
la deuxime partie prsente les mthodes et outils de conception et d'analyse
multidimensionnelle;
la troisime partie propose une application des concepts et mthodes pour la
mise en place d'un data mart dans le cadre de la paie du personnel de l'Etat.
Ces diffrentes parties sont compltes par une liste de rfrences bibliographies et
de ressources internet exploites au cours de ce stage.
QPfi(jf{t}{lfJE 10
0
fJEtat drre& (ire
Mise enplace d'un data mart concernant la paie dupersonnel de l'Etat Page 5
1.1. La problmatique du thme
Les services en charge de la gestion de la solde des agents de l'Etat burkinab
sont rgulirement confronts des problmes de non disponibilit de certains
types d'tats. La prsence de ces tats pourrait les aider dans les travaux quotidiens
ainsi que dans certaines prises de dcision. Le systme existant est trs pauvre en
tats de synthse. Les responsables sont obligs de recourir aux informaticiens
chaque fois pour demander des tats spcifiques non prvus l'origine de
l'application. La plupart du temps, ils sont obligs de ressaisir les donnes de
quelques tats qu'ils ont (par l'intermdiaire des informaticiens ou certains tats de
solde de fm du mois) sur Excel pour pouvoir les traiter et les analyser. Par exemple
les tats comme :
l'volution de la masse salariale sur les trois, cinq ou mme dix dernires
annes;
la rpartition annuelle de la masse salariale par province, dpartement,
localit sur une priode ;
la rpartition d'une indemnit quelconque par section ou par province;
l'volution d'un lment de salaire sur une priode donne;
la rpartition d'un lment de salaire par catgorie et sur une priode
donne;
ne peuvent pas tre faits avec les systmes actuels car ils n'ont pas t conus dans
une optique d'aide la dcision.
Suite l'arrt du gros systme le BULL DPS?OOO/250, il tait devenu
ncessaire de rcuprer les informations sur les bulletins des agents de l'Etat dont
la paye se faisait sur ce systme jusqu'en juillet 1999 pour la majorit. Ces
informations taient capitales car elles permettaient de mettre la disposition des
agents des duplicatas de bulletin. Ces bulletins venaient en complment des pices
constitutives de dossier administratif pour les corrections de salaire au niveau de la
solde, pour les dossiers de pension au niveau des caisses de retraite: la caisse
nationale de scurit sociale (CNSS) et la caisse autonome de retraite des
fonctionnaires (CARfO), et aussi des dossiers au niveau du Ministre de la
Fonction Publique.
Dans un premier temps, notre travail a consist rsoudre le problme de la
rcupration des informations sur les bulletins des agents de l'Etat. Ce travail
consistait raliser sur micro-ordinateur des programmes de transfert des donnes
se trouvant sur le DPS 7000/250 et l'application de consultation et d'dition des
bulletins de paie.
L'application devrait permettre d'avoir accs aux donnes sur une priode allant de
1994 2000.
Ces donnes en fichier texte plat reprsentent une taille de 2,16Go.
Par la suite, nous avons pens qu'il tait opportun de profiter des avances
technologiques pour mettre la disposition des responsables de la solde toute la
manne d'informations qu'ils avaient travers l'ancien systme de paie qui tait au
CENATRIN et le systme actuel. Ainsi les donnes du DPS 7000/250, couples
celles du mme genre produites par le systme oprationnel actuel SIGASPE
(Systme Intgr de Gestion Administrative et Salariale du Personnel de l'Etat),
pourraient tre orientes pour un sujet les lments de salaire pays , intgres,
historises et organises pour aider les responsables dans la prise de dcision: d'o
la mise en place d'un data mart. Le data mart devra permettre aux utilisateurs
d'avoir des tats de synthse, des statistiques et aussi de pouvoir partir
d'chantillons assez reprsentatifs faire des projections, des prvisions.
Pour le data mart, en plus des 2,16 Go de donnes du DPS 7000/250, il y a environ
3Go de donnes sous format dmp (fichier export d'une base oracle) provenant du
systme oprationnel actuel SIGASPE.
1.2. Le DPS 7000/250
Le DPS 7000/250 se classe dans la famille des gros systmes. Il a t install au
CENATRIN en Mai 1990 en remplacement du BULL 64 DPS 2.
Le BULL 64 DPS 2 tait un systme jumeau coupl: systme qUI partageait
dynamiquement et statiquement des ressources. Ce systme en exploitation depuis
plus de dix (10) ans ne prsentait aucune garantie, aussi il a fallu procder son
remplacement.
Le DPS 7000/250 tait un systme:
Compact: haute intgration grce VLSIICMOS (Very Large Scale
Integration / Complementary Metal Oxyde Semiconductor). Ceci
l'oppos du BULL 64 DPS 2 ;
Puissant: 5,5 21 transactions de type dbit/crdit par seconde
(transaction dbit/crdit dfinie par DATAMATION avril 1985). Il tait
cinq (5) fois plus puissant que le BULL64 ;
Fonctionnant en environnement de bureau: pas de climatisation
spcifique, pas de faux plancher, tension de 220 volts, consommation
lectrique faible;
Ayant des cots d'exploitation rduits: espace au sol trs rduit,
fonctionnement sans oprateur, tlmaintenance et tlcontrle ;
Avec intgration des rseaux locaux: support des rseaux locaux
Ethemet et Starlan.
Le DPS 7000/250 a un processeur principal ou central et des processeurs
spcialiss. Le processeur central gre l'initialisation du systme, les tests de
diagnostics (On line/Off line), l'accs la maintenance prventive et corrective, la
tlmaintenance, la gestion de la console de service, les changes de GCOS7 avec
le systme et les diffrents processeurs spcialiss. A leur tour, les processeurs
spcialiss avaient chacun un certain nombre de tches spcifiques: exemple un
processeur de disques pour les disques, un processeur de bandes pour les bandes,
un processeur de rseau.
Le DPS 7000/250 possde :
sept (7) disques de 1Go chacun avec un dbit de 2,45Mo/s et un temps
d'accs de 20 ms. Les disques taient organiss comme suit: un (1)
disque systme, cinq (5) disques de donnes et un (1) disque de secours.
Contrairement au BULL64, les disques du DPS 7000/250 n'taient pas
amovibles;
deux (2) imprimantes impact dont une de 750 lignes par minute et
l'autre de 1200 lignes par minute;
Quatre (4) drouleurs de bandes ;
Un (1) micro-ordinateur BULL Micral 200 de 20 Mo de disque dur, 4 Mo
de mmoire, un processeur 80-286. Ce micro ordinateur tournait sous
DOS 3.1. Il tait connect au DPS 7000 et permettait de lire et/ou d'crire
sur les disquettes 8' et 3' 5. Il assurait le transfert des fichiers dans les
deux sens;
Des terminaux locaux au CENATRIN et des terminaux distants au
Trsor, la solde, la direction du matriel... Les terminaux distants
taient connects au DPS7000/250 par une liaison X25 (FASOPAC) de
l'ONATEL (Office National des Tlcommunications) avec un dbit de
64 Ko/s. Le DPS7000/250 pouvait grer 130 terminaux actifs.
Une mmoire de 256 Mo tendue grce aux techniques de mmoire
virtuelle BKST (backing store). Cette mmoire tait repartie entre les
diffrentes classes de passage des travaux configures la
personnalisation du systme.
Le DPS 7000/250 effectuait essentiellement les traitements des applications de
l'Etat: solde, impts, dpense de matriel. .. , et celles des structures prives.
Tout cela pour dire que le DPS 7000 regorge d'une mine d'informations qu'il serait
dommage de laisser disparatre.
Le DPS 7000/250 tournait sous GCOS7 (systme d'exploitation pour les
ordinateurs centraux BULL HONEYWELL DPS 7000) version 3.
En comparaison, le DPS 7000/250 est de la gamme de l'AS/400 B60 d'IBM.
1.3. Le GCOS7
Le GCOS7 (General Comprehensive Operating System) se compose
de l'Operating system et des utilitaires auxquels se greffent les applications.
L'Operating system se compose:
du noyau;
des jobs de service ( reader, telecom, writers);
Ces deux (noyau et jobs de service) ralisent la gestion globale, gestion des
jobs, gestion des fichiers et volumes, gestion des messages. Ceci en
ragissant aux vnements extrieurs, aux ordres GCL (GCOS Command
Language) la main, aux ordres JCL (Job Control Language) en batch/lOF,
aux commandes et directives en lOF interactif
des fonctions systme partageables (qui sont soit en type 0, soit en
sharables modules) sont appelables par tous et ralisent des fonctions
d'intrt public.
Les utilitaires se composent :
des utilitaires entrant dans le dveloppement de programme
(programming facilities) :
./ Gestionnaires de bibliothques;
./ Editeur, full sereen editor ;
./ Compilateurs.
d'autres utilitaires (dependant components) :
./ data management: au niveau fichier, volume, base de donnes,
groupe de fichiers ;
./ dveloppement d'applications transactionnelles: moniteur TDS,
JCL de prparation et de gnration d'une application, dfinition
de grilles FORMGEN, RTP d'utilisation de grilles;
./ gestion du systme: analyse de l'exploitation, simulation de la
charge, droits d'accs au site, gestion des scurits, catalogage des
Mise en place d'un data mart concernant la paie du personnel de l'Etat Page JO
fichiers, joumalisation, gestion de l'exploitation du site,
installation et suivi, traces d'exploitation.
Les principales fonctions de GCOS? sont:
la gestion des jobs: job flow
Un travail depuis son introduction jusqu' l'dition de tous ses tats
est connu du systme par un numro RON (Run Occurrence Number),
indice dans la table KJOB (Knowned Job). Il transite par diffrents
tats ou phases.
la gestion des scurits
La scurit au niveau des travaux et la surveillance du systme.
l' extended machine
Gestion de la mmoire (centrale, de rserve, fichiers virtuels), des
vnements (gestion des entres/sorties), du temps (gestion de l'heure
et de la date).
la gestion des donnes
Cela passe par la gestion des fichiers, des volumes, utilisation de
fichiers, contrle de priphriques.
le logiciel tlcom
le distributed operation facility (DOF).
1.4. Le systme oprationnel actuel
Le systme oprationnel actuel est le SIGASPE (Systme Intgr de Gestion
Administrative et Salariale du Personnel de l'Etat). Le systme permet:
la gestion administrative des agents publics de l'Etat burkinab par le
ministre de la fonction publique et les directions des ressources
humaines des diffrents ministres ;
la gestion des salaires par le Ministre des Finances et du Budget
travers la Direction Gnrale du Budget, la Direction Gnrale du Trsor
et de la Comptabilit Publique, la Direction du Contrle Financier, et les
directions financires des diffrents ministres.
Le systme tourne actuellement sur un serveur IBM Netfinity 8500r avec:
deux (2) processeurs Xon P III 550 Mhz avec possibilit d'extension
quatre (4) processeurs;
une mmoire RAM de 1Go extensible;
cinq (5) disques durs de 9,10 Go chacun ;
un streamer interne 20/40 Go ;
le systme d'exploitation est Windows 2003 server.
L'application a t dveloppe sous Developper2000 (forms 4.5 et report 2.5) avec
une base de donnes sous Oracle 9i.
Les utilisateurs du systme sont dans les diffrents btiments de l'administration
travers toute la ville de Ouagadougou. Ces diffrents btiments sont interconnects
entre eux travers le rseau interministriel de l'administration (RESINA).
Les postes clients sont des micro-ordinateurs avec des systmes d'exploitation
diffrents et des configurations variables.
(jp)41(}ftq](jE 11 ;
9IflifJ;!fJ([J)d[re& refJ; c([J)1!ftcrepfJ;&
Mise enplace d'un data mart concernant la paie du personnel de l'Etat Page J3
2.1. Le data warehouse ou entrept de donnes
2.1.1. Prsentation
Le concept d'entrept de donnes a t formalis pour la premire fois en
1990. L'ide de constituer une base de donnes oriente sujet, intgre, contenant
des informations dates, non volatiles et exclusivement destines aux processus
d'aide la dcision fut dans un premier temps accueillie avec une certaine
hsitation. Beaucoup n'y voyaient qu'une autre forme du concept dj ancien:
l'infocentre.
L'entreprise doit anticiper pour faire face aux nouveaux enjeux
conomiques. Pour tre efficace, l'anticipation peut s'appuyer sur de l'information
pertinente qui est la porte de toute entreprise qui dispose d'un capital de donnes
gres par ses systmes oprationnels et qui peut en acqurir d'autres auprs de
fournisseurs externes. Mais ces donnes ne sont pas organises dans une
perspective dcisionnelle et sont parpilles dans plusieurs systmes htrognes. Il
est ncessaire de rassembler et d'homogniser les donnes afin de permettre des
analyses des indicateurs pertinents et de faciliter les prises de dcisions.
Pour rpondre ces besoins, il a t dfini et intgr une architecture qui va servir
de fondation aux applications dcisionnelles : l'entrept de donnes.
2.1.2. Pourquoi un entrept de donnes
2.1.2.1. La problmatique des entreprises
L'entreprise construit un systme dcisionnel pour amliorer sa performance.
Elle doit dcider et anticiper en fonction de l'information disponible et capitaliser
sur ses expriences.
Depuis plusieurs dizaines d'annes, une importante masse d'informations est
stocke sous forme informatique dans les entreprises. Les systmes d'informations
sont destins garder la trace d'vnements de manire fiable et intgre. Ils
automatisent de plus en plus les processus oprationnels.
L'informatique a un rle jouer, en permettant l'entreprise de devenir plus
entreprenante et d'avoir une meilleure connaissance de ses clients, de sa
comptitivit ou de son environnement.
2.1.2.2. La ralit des systmes d'information
Les donnes contenues dans les systmes d'informations oprationnels sont:
Eparpilles: il existe souvent de multiples systmes, conus pour tre
efficaces pour les fonctions sur lesquelles ils sont spcialiss.
Peu structures pour l'analyse: la plupart des systmes informatiques
actuels ont pour objet de conserver en mmoire l'information, et sont
structurs dans ce but.
Focalises pour amliorer le quotidien: toutes les amliorations
technologiques se sont focalises pour amliorer cette capacit en termes
de volume, qualit, rapidit d'accs. Il manque trs souvent la capacit
nous donner les moyens de tirer parti de cette mmoire pour prendre des
dcisions.
Utilises pour des fonctions critiques: la majorit des systmes existants
est conue dans le but unique de nous servir avec des temps de rponse
corrects.
Le tableau ci-dessous prsente les diffrences entre les donnes oprationnelles et
dcisionnelles.
Donnes oprationnelles Donnes dcisionnelles
Orientes application, dtailles, prcises Orientes activit (thme, sujet),
au moment de l'accs condenses, reprsentent des donnes
historiques
Mise jour interactive possible de la part Pas de mise jour interactive de la part
des utilisateurs des utilisateurs
Accdes de faon unitaire par une Utilises par l'ensemble des analystes,
personne la fois gres par sous-ensemble
Cohrence atomique Cohrence globale
Haute disponibilit en continu Exigence diffrente, haute disponibilit
ponctuelle
Uniques (pas de redondance en thorie) Peuvent tre redondantes
Structure statique, contenu variable Structure flexible
Petite quantit de donnes utilises par un Grande quantit de donnes utilise par
traitement les traitements
Ralisation des oprations au jour le jour Cycle de vie diffrent
Forte probabilit d'accs Faible probabilit d'accs
Utilises de faon rptitive Utilises de faon alatoire
Tableau 1: Diffrences entre donnes du systme de production et donnes dcisionnelles
S'il existe effectivement des informations importantes, il est ncessaire de
construire une structure pour les hberger, les organiser et les restituer des fins
d'analyse. Cette structure est le Data Warehouse ou " entrept de donnes ".
L'entrept de donnes permet la mise en place d'un outil dcisionnel s'appuyant
sur les informations pertinentes pour l'entreprise, centres sur le mtier utilisateur.
2.1.2.3. Les objectifs
Toutes les donnes, qu'elles proviennent du systme de production de l'entreprise
ou qu'elles soient achetes vont devoir tre organises, coordonnes, intgres et
stockes, pour donner l'utilisateur une vue intgre et oriente mtier. L'entrept
de donnes doit viser les objectifs suivants:
L'entrept de donnes doit rendre les donnes de l'organisation facilement
accessibles.
Le contenu de l'entrept de donnes doit tre facile comprendre. Les
donnes doivent tre parlantes et leur signification vidente pour l'utilisateur
et pas seulement pour le dveloppeur.
L'entrept de donnes doit prsenter l'information de l'organisation de manire
cohrente.
Les donnes de l'entrept doivent tre crdibles.
L'entrept de donnes doit tre adaptable et rsistant aux changements.
Les donnes de l'entrept devront tre conues pour traiter les changements.
De ce fait, les changements ne doivent pas invalider les donnes existantes
ou les applications.
L'entrept de donnes doit tre le socle sur lequel repose l'amlioration des
prises de dcision.
L'entrept de donnes doit tre accept par les utilisateurs pour pouvoir russir.
2.1.3. Dfinition
Selon Bill Inmon (1996) :
Le data warehouse est une collection de donnes orientes pour un sujet,
intgres, non volatiles et historises, organises pour le support du processus
d'aide la dcision.
De cette dfinition, il apparait les caractristiques suivantes d'un data warehouse :
Orientes sujet
L'entrept de donnes est organis autour des sujets majeurs de l'entreprise,
contrairement aux donnes des systmes de production qui sont gnralement
organises par processus fonctionnels. Les donnes sont structures par thme.
L'intrt de cette organisation est de disposer de l'ensemble des informations
utiles sur un sujet le plus souvent transversal aux structures fonctionnelles et
organisationnelles de l'entreprise.
Cette orientation sujet va galement permettre de dvelopper son systme
dcisionnel via une approche par itrations successives, sujet aprs sujet.
Donnes intgres
Un entrept de donnes est un projet d'entreprise. Pour y parvenir, les
donnes doivent tres intgres. Avant d'tre intgres dans l'entrept de
donnes, les donnes doivent tres mises en forme et unifies afin d'avoir un
tat cohrent. Une donne doit avoir une description et un codage unique.
Cette phase d'intgration est trs complexe et reprsente 60 90 % de la charge
totale d'un projet.
Donnes historises
Dans un systme de production, la donne est mise jour chaque
nouvelle transaction. Dans un entrept de donnes, la donne ne doit jamais tre
mise jour. Un rfrentiel temps doit tre associ la donne afm d'tre
capable d'identifier une valeur particulire dans le temps.
Donnes non volatiles
La non volatilit des donnes est en quelque sorte une consquence de
l'historisation. Une mme requte effectue quelques mois d'intervalle en
prcisant la date de rfrence de l'information recherche donnera le mme
rsultat.
Le tableau ci-aprs prsente les principales diffrences entre le systme de
production et l'entrept de donnes:
Critre Systme de production Entrept de donnes
Niveau de dtail des Trs dtaill Synthtique, parfois dtaill
informations' 'utilisateurs"
Utilisateurs Une ou quelques fonctions de Plusieurs fonctions de
l'entreprise l'entreprise
Donnes figes Non - volution en temps rel Oui - archivage
Historique Non Oui
Oprations sur les donnes Ajout/mise jour/ consultation Consultation uniquement
Tableau 2: diffrences entre systme de production et entrept de donnes
2.1.4. Concepts de base
2.1.4.1. La structure
Un entrept de donnes se structure en quatre classes de donnes, organises
selon un axe historique et un axe synthtique.
Les donnes dtailles
Les intgrations rgulires des donnes issues des systmes de production
vont habituellement tre ralises ce niveau.
Les volumes traiter sont plus importants que ceux grs en transactionnel.
Le niveau de dtail gr dans l'entrept de donnes n'est pas forcment le
mme que celui gr dans les systmes oprationnels.
Les donnes agrges
Elles correspondent des lments d'analyse reprsentatifs des besoins
utilisateurs. Elles constituent dj un rsultat d'analyse et une synthse de
l'information contenue dans le systme dcisionnel, et doivent tre facilement
accessibles et comprhensibles. La facilit d'accs est apporte par des
structures multidimensionnelles qui permettent aux utilisateurs de naviguer dans
les donnes suivant une logique intuitive, avec des performances optimales.
Les mtadonnes
Elles regroupent l'ensemble des informations concernant l'entrept de
donnes et les processus associs. Elles constituent une vritable aide en ligne
permettant de connatre l'information contenue dans l'entrept de donnes.
Elles sont intgres dans un rfrentiel.
Les principales informations sont destines :
A l'utilisateur (smantique, localisation).
Aux quipes responsables des processus de transformation des donnes du
systme de production vers l'entrept de donnes (localisation dans les
systmes de production, description des rgles, processus de transformation).
Aux quipes responsables des processus de cration des donnes agrges
partir des donnes dtailles.
Aux quipes d'administration de la base de donnes (structure de la base
implmentant l'entrept de donnes).
Aux quipes de production (procdures de changement, historique de mise
jour, ... ).
Les donnes historises
Un des objectifs de l'entrept de donnes est de conserver en ligne les
donnes historises. Chaque nouvelle insertion de donnes provenant du
systme de production ne dtruit pas les anciennes valeurs, mais cre une
nouvelle occurrence de la donne.
2.1.4.2. L'architecture
Le stockage des donnes est ralis dans un SGBD spar du systme de
production. Le SGBD est aliment par des extractions priodiques. Avant le
chargement, les donnes subissent d'importants processus d'intgration, de
nettoyage, de transformation.
L'avantage est de disposer de donnes prpares pour les besoins de la
dcision et rpondant aux objectifs de l'entrept de donnes.
Les inconvnients sont le cot de stockage supplmentaire et le manque
d'accs en temps rel.
2.1.5. Infocentre et Data Warehouse
Certaines caractristiques sont identiques. Mais il existe de nombreux
lments permettant de diffrencier les deux notions.
L'infocentre est une collection de donnes orientes sujet, intgres, volatiles,
actuelles, organises pour le support d'un processus de dcision ponctuel.
L'entrept de donnes est une collection de donnes orientes sujet, intgres, non
volatiles, historises, organises pour le support d'un processus d'aide la
dcision.
Dans un infocentre, chaque nouvelle valeur remplace l'ancienne valeur. Il est
donc impossible de retrouver une valeur calcule dans une session pralable aux
dernires alimentations. La non volatilit est une caractristique essentielle de
l'entrept de donnes.
De mme, dans un infocentre, il n'y a pas de gestion d'historique des
valeurs. L'infocentre sert prendre des dcisions oprationnelles bases sur des
valeurs courantes. Au niveau d'un entrept de donnes, l'utilisateur travaille sur les
historiques pour des prises de dcisions long terme, des positionnements
stratgiques et pour analyser des tendances.
Dans un infocentre, l'intgration des donnes est plus ou moins pousse. Le
processus d'alimentation est simple.
Le tableau ci-dessous fait une comparaison entre l'infocentre et l'entrept de
donnes.
Infocentre Entrept de donnes
Collection de donnes Collection de donnes
Orientes sujet Orientes sujet
Intgres Intgres
Volatiles Non volatiles
Actuelles Historises
Organises pour le support d'un Organises pour le support d'un
processus de dcision ponctuelle processus d'aide la dcision
Outil Architecture
Tableau 3: tableau de comparaison entre infocentre et entrept de donnes
Mise en place d 'un data mart concernant la paie du personnel de l'Etat Page 22
2.1.6. Composants d'un entrept de donnes
2.1.6.1. Les applications oprationnelles sources
Ce sont les applications oprationnelles qui capturent les transactions de
l'organisation. Les applications sources ne conservent que trs peu de donnes
historises et si vous avez un bon entrept de donnes, il peut librer les
applications sources d'une bonne partie de leurs responsabilits concernant la
reprsentation du pass.
2.1.6.2. La prparation de donnes
La zone de prparation des donnes de l'entrept est la fois une zone de
stockage et un ensemble de processus couramment appels ETC
(Extraction/Transformation/Chargement). L'extraction est la premire tape du
processus d'apport de donnes l'entrept qui se traduit par la lecture,
l'interprtation et la copie des donnes sources dans la zone de prparation. Ensuite
on passe la transformation en vue du chargement. Il faut interdire aux utilisateurs
l'accs la zone de prparation des donnes.
2.1.6.3. La prsentation de donnes
La zone de prsentation des donnes est le lieu o les donnes sont
organises, stockes et offertes aux requtes directes des utilisateurs, aux
programmes de reporting et aux autres applications d'analyse. La zone de
prsentation des donnes est l'entrept de donnes tel que vu par les utilisateurs.
2.1.6.4. Les outils d'accs aux donnes
L'ensemble des outils d'accs aux donnes constitue le dernier composant
majeur d'un environnement d'entrept de donnes. Les outils d'accs aux donnes
constituent l'ensemble des moyens foumis aux utilisateurs pour exploiter la zone de
prsentation en vue de prendre des dcisions bases sur des analyses. Un outil
d'accs aux donnes peut tre une chose aussi simple qu'un outil de requte ou
aussi complexe qu'une application de forage de donnes ou de modlisation.
Systme
oprationnel
source
Zone de prparation des
donnes
Zone de prsentation des
donnes
Outils d'accs aux
donnes
Fonctions:
Nettoie, combine, et
standardise
Rend les dimensions 1 Charger
conformes
March
d'informations # 1
Dimensionnel
Infos atomiques et
rcapitulatives
bas sur un seul
processus d'entreprise
Accder
Outils de requte ad
hoc
Gnrateurs de
rapport
Modlisation:
Prvision
Evaluation
Forage donnes
Applications
d'analyse
Accder
March
d'informations # 2...
(conception similaire)
Traitement :
Tris et traitements
squentiels
Stockage:
Fichiers plats et
tables relationnelles
Schma 1 : Composants de base de l'entrept de donnes
2.1.7. Matrice de bus de l'entrept
La matrice de bus de l'entrept de donnes permet la reprsentation des
processus de l'entreprise sous fonne de lignes et les dimensions sous forme de
colonnes. Une ligne permet de voir d'un coup les dimensions du processus. La
colonne dcrit l'interaction entre les processus et les dimensions communes. La
matrice est aussi utile comme outil de planning et de communication. Le fait de
remplir les lignes et les colonnes aboutit dfinir l'architecture d'ensemble de
l'entrept de donnes. La matrice sert galement la communication au sein des
quipes de dveloppements. Ce document succinct prsente la totalit du plan. Il
est adapt aux communications avec les dcideurs en matire d'infonnatique de
gestion de l'entreprise. C'est un document trs important parmi tous ceux dont la
prparation doit prcder toute ralisation d'un entrept de donnes.
Exemple de matrice de bus des assurances
Dimensions communes
Processus d'entreprise
t:
11,)
;>
'11,)
~
1-<
0
~
....
o
'11,)
CIl
>..
'11,) 11,)
CIl
11,)
ro 0 11,)
.t:J
a
1-<
~ ---'
11,)
~
cr' C 0..
u CIl ---'
CIl
.- .- U
1-<
~
CIl
CIl
11,)
S
...-
c
11,)
CIl
.- .-
0
.-
'11,)
.-
Cl
<
~ o:l ~ 0.. r./J. Cl E--
Transactions de police x x x x x x
Instantan des primes x x x x x x
Transactions de sinistre x x x x x x x x x
Tableau 4: matrice de bus des assurances
2.1.8. 1nfrastructures
Il Ya deux niveaux d'infrastructures:
l'infrastructure technique: l'ensemble des composants matriels et logiciels
( associer aux composants fonctionnels: alimentation, stockage et accs) .
l'infrastructure oprationnelle: l'ensemble des procdures et des services
pour administrer les donnes, grer les utilisateurs et exploiter le systme.
Pour la construction d'un entrept de donnes, de manire gnrale, il faut:
1. Bien connatre les mtiers utilisateurs
Impliquer les utilisateurs dans les projets,
Faire participer l'utilisateur la dfinition et l'volution des
mtadonnes,
Former l'utilisateur pour l'aider comprendre la logique du Data
Warehouse,
Avoir un chef de projet orient utilisateur.
2. Assurer une vritable conduite de projet
Le chef de projet fdre l'ensemble des besoins. Il organise et planifie
les diffrentes phases de dploiement en fonction de la culture de
l'entreprise.
3. Commencer petit et voir grand
Il faut commencer petit, qu'il s'agisse d'un prototype ou d'un Data Mart.
4. Grer l'volutivit
Alimentation et administration sont les points critiques du processus de
construction de l'entrept de donnes.
2.1.9. Conception d'un entrept de donnes
Quatre caractristiques ont des effets dterminants sur la dmarche de
conception d'un entrept de donnes:
Les volutions technologiques: un systme d'information peut se
construire par intgration d'un certain nombre de composants, chacun
pouvant tre choisi par rapport son contexte d'utilisation. L'entreprise
dfinit son architecture en fonction de ses besoins.
La stratgie de l'entreprise: l'entrept de donnes est trs proche de la
stratgie de l'entreprise. L'objectif de l'entrept de donnes se dfinit en
terme mtier. Il faut donc impliquer les utilisateurs ayant le plus de
connaissances dans leur entreprise ou dans leur mtier.
L'amlioration continue: un entrept de donnes doit voluer en fonction
des demandes utilisateurs ou des nouveaux objectifs de l'entreprise.
La maturit de l'entreprise: certaines entreprises ont dj un systme
dcisionnel, d'autres n'ont aucun acquis.
Dans tous les cas, il n'existe pas de cadre fig pour la conception d'un entrept de
donnes. Chaque entreprise doit adapter le projet son contexte, en ne perdant pas
les objectifs de vue.
Il est possible de proposer trois phases pour la conception :
Dfinir le pourquoi de l'entrept de donnes et les objectifs atteindre
(impliquer les utilisateurs).
Dfinir l'infrastructure technique et organisationnelle de l'entrept de
donnes.
Mettre en uvre les applications.
2.1.9.1. L'infrastructure
Il s'agit de dterminer l'infrastructure technique et organisationnelle
ncessaire la mise en place de l'entrept de donnes et la conduite du
changement.
L'infrastructure technique
Des choix technologiques en phase avec la politique de l'entreprise doivent
tre faits plusieurs niveaux:
Les fournisseurs: faut-il prendre un seul fournisseur (ce qui facilite la
politique d'intgration et en rduit les cots de mise en uvre) ou
assembler les meilleurs offres du march (ce qui apporte une flexibilit, une
adaptation chaque projet, mais cote beaucoup en intgration).
Les outils: faut-il construire, acheter ou faire avec l'existant.
Comment sera utilis l'entrept de donnes, par qui, comment sera
structure l'organisation qui l'exploitera.
Faut-il une architecture centralise (entrept de donnes), distribue
(plusieurs Data Mart), ou une architecture rplique (un entrept de
donnes et plusieurs Data Mart).
La structure de stockage, sera-t-elle relationnelle, multidimensionnelle,
hybride (Entrept de donnes en relationnel, Data Mart en
multidimensionnel).
Choisir le matriel : selon les volumes envisags, les utilisateurs concerns,
l'architecture vise, la flexibilit attendue.
Organiser l'administration des systmes et la gestion de la scurit.
Il faut vrifier que les solutions choisies fonctionnent entre elles. (Ne pas se fier
aux plaquettes commerciales en ce qui concerne la portabilit).
L'infrastructure organisationnelle
Paralllement aux choix technologiques, il faut:
Dterminer la logistique et l'organisation ncessaires la concrtisation des
initiatives.
Rpartir les tches entre les quipes de dveloppement et les quipes
d'exploitation: dterminer l'alimentation de l'entrept de donnes,
l'administration.
Dterminer les flux d' information entre l'entrept de donnes et les
utilisateurs.
2.1.9.2. La formation
Selon l'exprience de l'entreprise en matire de dcisionnel et des
technologies utilises, un plan de formation sera ncessaire.
Il sera impratif que les membres participants au projet soient favorables au
changement.
2.1.9.3. La mise en uvre des applications
La mise en uvre est ralise pour chaque initiative. La dmarche propose
est une dmarche en cinq tapes :
la spcification,
la conception,
la mise en uvre et l'intgration,
le dploiement et la mise en place des accompagnements,
les mesures.
Ces tapes correspondent celles de mise en place d'un projet informatique,
Pendant l'tape de spcification, les diffrentes tapes des initiatives sont dfinies
et planifies de manire plus dtailles. Il est recommand de faire attention aux
cots cachs que peuvent entraner les technologies informatiques.
L'tape de mesure permet de faire le bilan de la ralisation et de capitaliser les
russites et checs rencontrs pendant le dveloppement de l'application.
Il n'existe pas de dmarche complte et universelle pour la mise en uvre d'un
entrept de donnes. Toute approche doit tre adapte l'entreprise.
2.1.10. Administration des donnes
Comme tout systme informatique, un entrept de donnes s'administre. Ds la
phase de conception de l'architecture, il faut penser l'administration des
donnes qui est une des fonctions les plus importantes de l'entrept de donnes.
Cette fonction est d'autant plus importante que l'entrept de donnes volue au fur
et mesure de son utilisation.
La mise en place d'un entrept de donnes doit s'accompagner de celle d'un
rfrentiel de donnes, permettant de dcrire, stocker et diffuser les mtadonnes
associes.
Cette mise en place passe par l'organisation d'une fonction d'administration des
donnes plusieurs niveaux, par la dfinition de normes et de procdures
d'administration des rfrentiels.
La donne est forcment lie d'autres objets du systme d'information. Il est donc
ncessaire de reprsenter, dcrire et stocker les interactions avec d'autres donnes.
2.1.10.1. Le rfrentiel l'entrept de donnes
Le rfrentiel de l'entrept de donnes est l'ensemble des outils ncessaires
la mise en uvre de la fonction d'administration de donnes. Un rfrentiel de
donnes pour l'entrept de donnes est un rfrentiel de donnes dans lequel sont
dcrits l'organisation et la localisation des donnes, ainsi que les rgles de
consolidation des donnes agrges et historises. Il est conu de manire
collecter l'ensemble des modles de donnes ncessaires la construction et
l'exploitation de l'entrept de donnes.
La construction du rfrentiel est un projet qu'il est ncessaire de prvoir en
parallle celui de l'entrept de donnes.
2.1.10.2. La scurit
L'entrept de donnes a pour vocation de laisser l'utilisateur une totale
autonomie en ce qui concerne la recherche et l'analyse des donnes. Cette libert
doit cependant tre souvent restreinte, notamment pour des raisons de scurit.
L'outil doit donc permettre d'adapter l'environnement de travail l'utilisateur qui
s'y connecte selon sa fonction et donc ses droits. Il peut par exemple se connecter
partir d'Excel un serveur de donnes, via le driver ODBC.
2.1.10.3. La gestion des performances
La possibilit de limiter les accs aux ressources permet l'administrateur de
mieux contrler les requtes mises par l'utilisateur. Ce contrle des ressources
peut prendre plusieurs formes :
limitation du temps d'excution;
limitation du nombre de lignes rcupres ;
Le contrle du corps des requtes permet de limiter considrablement le
nombre de demandes coteuses. Ce contrle peut s'exercer sur diffrents
paramtres :
le nombre de tables interroges;
les jointures, l'administrateur peut notamment interdire l'utilisation des
produits cartsiens et aussi imposer d'utiliser uniquement les colonnes
indexes ou d'interdire un nombre trop important de thta-jointures, ...
Ce besoin de contrler les performances est d l'autonomie laisse aux
utilisateurs par les outils.
2.1.10.4. Les batchs
La possibilit d'effectuer des requtes en batch est une fonctionnalit
essentielle dans un contexte d'entrept de donnes o une requte peut avoir besoin
de manipuler un volume important de donnes. Un planificateur, peut alors
permettre d'envoyer une requte un instant donn ou intervalles rguliers.
Imposer des plages horaires aux utilisateurs pour ces requtes coteuses est alors
galement une ncessit.
2.2. Le Data Mart
2.2.1. Dfinition
Le Data Mart est une base de donnes moins coteuse que l'entrept de
donnes, et plus lgre puisque destine quelques utilisateurs d'un dpartement.
C'est une petite structure trs cible et pilote par les besoins utilisateurs. Il a la
mme vocation que l'entrept de donnes (fournir une architecture dcisionnelle),
mais vise une problmatique prcise avec un nombre d'utilisateurs plus restreint.
Le tableau ci-aprs donne des lments de comparaison entre un data warehouse et
un data mart.
Entrept de donnes Data Mart
Cible utilisateur Toute l'entreprise Dpartement
Implication du Eleve Faible ou moyen
service informatique
Base de donnes SQL type serveur SQL milieu de gamme, bases
d'entreprise multidimensionnelles
Modles de donnes A l'chelle de l'entreprise Dpartement
Champ applicatif Multi sujets, neutre Quelques sujets, spcifique
Sources de donnes Multiples Quelques unes
Stockage Base de donnes Plusieurs bases distribues
Taille Centaine de GO et plus Une 2 dizaines de GO
Temps de mise en 9 18 mois pour les 3 tapes 6 12 mois (installation en
place plusieurs tapes)
Tableau 5: finalits du data mart et de l'entrept de donnes
2.2.2. Mise en place
Construire un ou plusieurs Data Marts dpartementaux au lieu d'un entrept
de donnes central permet de valider rapidement le concept d'informatique
dcisionnelle. Mais construire des Data Marts n'est pas sans risques :
En effet, dans les entreprises, des Data Marts isols peuvent prolifrer. Ces
entreprises risquent de retomber dans le pige d'une architecture compose
de multiples systmes dcisionnels incohrents, contenant des informations
redondantes. Cela cote plus cher et c'est plus complexe grer qu'un
entrept de donnes centralis.
Les Data Marts rsolvent les problmes de performance des gros entrepts
de donnes. Mais ils font rgresser vers le vieux problme des lots isols.
Les entreprises vont devoir affronter des problmes techniques complexes
et coteux pour remettre en cohrence les ensembles.
Fdrer des Data Marts ou les faire voluer vers une structure centralise
n'est pas facile.
On peut se poser la question s'il est prfrable de btir un gros et unique
entrept de donnes ou bien de concevoir un rservoir plus modeste, nourri par les
donnes d'un seul dpartement. Il est intressant de commencer par un Data Mart,
condition de respecter certaines rgles :
Impliquer les utilisateurs.
Ne pas construire de multiples Data Marts isols.
Bannir les redondances.
Les data marts sont petits, moms complexes et plus facile dployer que les
entrepts de donnes. Les data marts peuvent voluer facilement vers un entrept
de donnes. Les diffrents data marts indpendants peuvent tre dynamiquement
coupls pour se mtamorphoser en entrept de donnes.
Les data marts ne se rsument qu' une seule information mtier (exemple : les
lments de bulletins de paye).
Donc le Data Mart peut prparer l'entrept de donnes. Mais il faut penser grand,
avenir, et adopter des technologies capables d'voluer.
2.3. Le concept OLAP
2.3.1. Prsentation
Les outils OLAP (On Line Analytical Processing) reposent sur une base de
donnes multidimensionnelle, destine exploiter rapidement les dimensions d'une
population de donnes.
. La plupart des solutions OLAP reposent sur un mme principe : restructurer et
stocker dans un format multidimensionnelles donnes issues de fichiers plats ou de
bases relationnelles. Ce format multidimensionnel, connu galement sous le nom
d'hypercube, organise les donnes le long de dimensions. Ainsi, les utilisateurs
analysent les donnes suivant les axes propres leur mtier.
2.3.2. Les 12 rgles OLAP
Afm de formaliser le concept OLAP, fm 1993, la demande de Arbor Software,
Edgar F. Codd publie un article intitul "Providing OLAP to User Analysts" aux
Etats-Unis. Dans cet article, il dfinit 12 rgles que tout systme de pilotage
multidimensionnel devrait respecter.
Ces rgles s'noncent ainsi :
Rgle 1 : Vue Conceptuelle Multidimensionnelle des donnes
Ces modles permettent des manipulations simples : rotation, pivot ou vues par
tranche, analyse de type permutations d'axes (slice and dice) ou en cascade (drill
anywhere).
Rgle 2 : Le systme est transparent pour l'utilisateur
Cette transparence se traduit pour l'utilisateur par un complment ses outils
habituels garantissant ainsi sa productivit et sa comptence. Elle s'appuie sur une
architecture ouverte permettant l'utilisateur d'implanter le systme OLAP sans
affecter les fonctionnalits du systme central.
Par ailleurs, l'utilisateur ne doit pas tre concern par l'intgration des donnes dans
OLAP provenant d'un environnement homogne ou htrogne.
Rgle 3 : Accessibilit toutes les donnes utiles la dcision
Le systme OLAP doit donner accs aux donnes ncessaires aux analyses
demandes. Les outils OLAP doivent avoir leur propre schma logique de stockage
des donnes physiques htrognes, doivent accder aux donnes et raliser
n'importe quelle conversion afin de prsenter l'utilisateur une vue simple et
cohrente. Ils doivent aussi savoir de quel type de systmes proviennent les
donnes.
Rgle 4 : La performance demeure stable quel que soit le volume de donnes
L'augmentation du nombre de dimensions ou du volume de la base de
donnes ne doit pas entraner de dgradation visible par l'utilisateur.
Rgle 5 : L'architecture est Client / Serveur
La plupart des donnes pour OLAP sont stockes sur des gros systmes et
sont accessibles via des PC. Il est donc ncessaire que les produits OLAP soient
capables de travailler dans un environnement Client/serveur.
Rgle 6 : Toutes les dimensions sont quivalentes en structure et en calcul
Toutes les dimensions doivent tre quivalentes en structure et en calcul. Il
ne doit exister qu'une seule structure logique pour toutes les dimensions. Toute
fonction qui s'applique une dimension doit tre aussi capable de s'appliquer une
autre dimension.
Rgle 7 : Le systme gre dynamiquement les Matrices Creuses
Le schma physique des outils OLAP doit s'adapter entirement au modle
d'analyse spcifique cr pour optimiser la gestion des matrices creuses. En effet,
dans une analyse la fois sur les produits et les rgions, tous les produits ne sont
pas vendus dans toutes les rgions.
Rgle 8 : L'accs possible plusieurs utilisateurs simultanment
Les outils OLAP doivent supporter les accs concurrents, garantir l'intgrit
et la scurit afin que plusieurs utilisateurs accdent au mme modle d'analyse.
Rgle 9 : Il n'y a pas d'oprations restrictives sur les dimensions
Les oprations doivent pouvoir s'effectuer sur toutes les dimensions et ne
doivent pas faire intervenir l'utilisateur pour dfinir un calcul hirarchique.
Rgle 10 : Manipulation intuitive des donnes
Toute manipulation doit tre accomplie via une action directe sur les cellules
du modle sans utiliser de menus ou des chemins multiples travers l'interface
utilisateur.
Rgle Il : Souplesse de Cration de Rapports
La cration des rapports dans les outils OLAP doit permettre aux utilisateurs
de prsenter comme ils le dsirent des donnes synthtiques ou des rsultats en
fonction de l'orientation du modle.
Rgle 12 : Nombre illimit de dimensions et de niveaux d'agrgation
Tout outil OLAP doit grer au moins 15 20 dimensions.
2.3.3. Composants d'un systme OLAP
Un systme OLAP est compos de diffrents lments: les sources de
donnes, un serveur OLAP et des clients.
2.3.3.1. Les sources OLAP
La source d'un systme OLAP dpend de l'utilisation du produit OLAP qui
en est faite, il peut s'agir d'un data warehouse, d'une base de donnes quelconque
d'une entreprise, d'une collection de feuilles de calculs contenant des donnes.
La capacit d'un produit OLAP exploiter des donnes provenant d'un grand
nombre de sources est importante.
2.3.3.2. Le serveur OLAP
C'est le noyau d'un systme OLAP. Il effectue tout le travail, c'est le lieu o
les donnes sont stockes. Le type de stockage des donnes est fonction de
l' architecture.
MOLAP
Le systme MOLAP (Multidimensionnal OLAP) est le plus courant. On peut
stocker des donnes de nature multidimensionnelle et fournir des temps de rponses
de requtes trs rapides.
Avantages:
Des modles qui refltent la ralit;
Des accs trs rapides sans SQL ;
Des donnes rcapitulatives prtablies.
Inconvnients :
Gre malles trs gros volumes de donnes;
Technologie non encore optimise;
Risques d'explosion de la base de donnes.
Mise en place d 'un data mart concernant la paie du personnel de l'Etat Page 40
ROLAP
Le ROLAP (Relational OLAP) s'appuie sur une base de donnes
relationnelle. Les donnes sont enregistres dans une base de donnes relationnelle
dont le schma est en gnral en toile ou en flocon.
Avantages:
Idal pour les grands volumes;
Technologie optimise et reconnue;
Evolution facile et souplesse.
Inconvnients :
Peu efficace pour les requtes complexes;
HOLAP
Le HOLAP (Hybrid OLAP) est une architecture htrogne compos de tout
ou partie des architectures prcites. Les donnes sont stockes dans des tables
relationnelles et les donnes agrges sont stockes dans des cubes. Les requtes
vont chercher les donnes dans les tables et les cubes.
DOLAP
Le DOLAP (Desktop OLAP) dcrit une catgorie de produits qui ne sont pas
ncessairement connects un serveur. Ils peuvent s'excuter sur un client avec la
possibilit d'utiliser une source de donnes sous la forme d'un Data Cube
construit et stock localement sur une machine utilisateur.
2.3.3.3. Le client OLAP
Le client est le composant utilis pour manipuler et visualiser les donnes
d'une base OLAP. Un client peut tre, une simple feuille de calculs avec des
fonctionnalits OLAP, un outil de reporting spcialis ou une application OLAP.
Le web est la forme la plus rcente de client OLAP.
Les outils de reporting
Un outil de requte ou un outil de reporting est une forme simple d'accs
des donnes OLAP. Les outils supportant la technologie OLAP produisent des
rapports interactifs contrairement aux autres qui font des rapports statiques.
Desfonctionnalits OLAP sur les feuilles de calculs
Les feuilles de calculs sont beaucoup utilises pour faire diffrentes formes
d'analyses. Mais une fois le rapport gnr, il est difficile de le visualiser sous
diffrents aspects. L'ajout de fonctionnalits OLAP permet, que lorsque le rapport
est gnr, de pouvoir faire les manipulations voulues sur ce rapport en vue
d'obtenir l'information dsire.
Le web
Le web est considr comme le dernier venu dans la famille des clients
OLAP. On trouve actuellement des produits Internet-OLAP trs diffrents, d'o la
ncessit de dfinir clairement les besoins avant de choisir un dploiement OLAP
sur le web.
Les applications
Les applications sont similaires des outils de requtes ou des outils de
reporting mais elles comportent des fonctionnalits beaucoup plus approfondies et
elles sont plus robustes.
Le dveloppement
Il existe des outils de dveloppement permettant la cration d'applications
spcifiques OLAP. Il s'agit souvent d'un environnement de dveloppement
constitu d'une interface graphique qui supporte le dveloppement orient objet. Il
existe un guide API (Application Program Interface) OLAP fourni par le conseil
OLAP: MDAPI. Ce document qui modlise en UML (Unified Modeling
Language) toutes les mtas donnes, requtes et lments d'infrastructure, a pour
but de fournir aux clients tous les lments pour dvelopper eux-mmes des outils
d'interrogation des bases de donnes OLAP.
2.3.4. Offre du march
Il existe plusieurs produits sur le march:
Oracle: avec son offre Express sous deux formes qUI sont Express Server et
Personnal Express.
Arbor: principal concurrent d'Oracle, propose Essbase.
Applix : a comme produit TM-l et a introduit le concept de RAP suivant lequel
toutes oprations OLAP se fait en temps rel.
MicroStrategy : leader dans l'industrie ROLAP avec son produit DSS.
Cognos : son offre Impromptu et PowerPlay est produit DOLAP par excellence.
Microsoft: avec son offre Plato intgrant des services OLAP dans SQL Server 7.
SAS Institue: propose son produit MDDB.
Informix: propose Metacube.
2.4. La modlisation dimensionnelle
La modlisation dimensionnelle drive des concepts OLAP (On Line
Analytical Processing). Les termes dimension et fait sont apparus dans un projet de
recherche commun de General Mills et de l'universit de Dartmouth au cours des
annes 1960. Dans les annes 1970, AC Nielsen et IR! ont utilis ces termes pour
dcrire leurs offres d'informations considres aujourd'hui comme des marchs
d'informations dimensionnels destins des donnes de vente.
L'approche dimensionnelle n'est vraisemblablement pas l'invention d'une seule
personne. Il s'agit d'une force irrsistible dans la conception de bases de donnes
qui s'impose ds lors que le concepteur fait de l'intelligibilit et de la performance
ses objectifs prioritaires.
2.4.1. Dfinitions
Table de faits
Une table de faits est la table principale d'un modle dimensionnel o
les mesures de performance sont stockes. Une mesure est une ligne dans
une table de fait. Les faits les plus utiles d'une table de faits sont numriques
et additifs.
Table de dimension
Les tables de dimension sont les points d'entre dans la table de faits.
Des attributs de dimension nombreux permettent de varier les possibilits
d'analyse en tranches et en ds. Les dimensions tablissent l'interface
homme/entrept de donnes.
2.4.2. Processus de modlisation dimensionnelle
Le processus de modlisation dimensionnelle peut tre dcompos en quatre
(4) tapes.
Etape 1. Slection du processus d'entreprise modliser
Un processus d'entreprise est une activit normale de votre
organisation, gnralement assist par un systme source collectant des
informations.
Etape 2. Dclaration du grain
Le grain dfinit exactement ce que reprsente une ligne individuelle
de table de faits. Il rpond la question comment dcrivez-vous une ligne
unique de la table de faits?.
Etape 3. Choix de dimension
Cela revient choisir les dimensions qui s'appliquent chaque ligne
de la table de faits. Les dimensions rsultent de la question : Comment les
gestionnaires dcrivent-ils des donnes qui rsultent du processus concern?
.
Etape 4. Identification des faits
C'est la dtermination des faits qui apparaitront dans la table de faits.
A ce niveau, le choix est fonction du choix du grain et comme pour l'tape
prcdant, la dtermination des faits peut conduire revoir la dclaration du
grain ou le choix des dimensions.
2.4.3. Dimensions
2.4.3.1. Les dimensions additionnelles
Ces dimensions additionnelles peuvent tre ajoutes la conception sans rien
perturber, mme aprs la mise en production de l'entrept de donnes. Cela est
possible parce qu'elles ne modifient pas le grain de la table de faits.
Dimensions causales
Ces dimensions peuvent donner des indications intressantes sur la
cause d'un vnement.
Dimensions de dates multiples ou d'horodatage
Elles sont utilises spcialement lorsque la granularit de la table de
faits est la ligne d'un document de suivi.
Dimensions dgnres
Elles sont gnralement rserves des identificateurs de transactions
oprationnelles. Elles ne doivent pas servir de prtexte pour placer dans la
table de faits un code inintelligible sans en donner le dcodage dans une
table de dimension.
Dimensions jeu de rle
Le jeu de rle intervient dans le cas d'une dimension physique unique
apparaissant plusieurs fois dans une table de faits, chaque apparition pointant
sur une table de dimension logique distincte cre par le biais de vues ayant
ses propres noms de colonne.
Dimensions d'tat
Ces dimensions identifient l'tat actuel d'une transaction ou d'un
instantan mensuel, par exemple l'tat d'un compte.
Dimension audit
Cette dimension sert suivre l'origine et la qualit des donnes.
Dimensions fourre-tout
Une dimension fourre-tout sert regrouper commodment des
drapeaux et des indicateurs de faibles cardinalits. Elle permet d'liminer les
drapeaux de la table de faits tout en les plaant dans un cadre dimensionnel
utile.
2.4.3.2. Les dimensions changeantes
Dimensions valeurs multiples
Un attribut ayant un nombre de variables multiples peut tre associ
une ligne de dimension par l'intermdiaire d'une table passerelle reliant les
diverses valeurs d'attributs la dimension.
Dimensions volution lente
Cela concerne le changement d'attribut des dimensions. Des
techniques et des approches hybrides existent pour le traitement des
changements d'attributs.
Type 1 : crasement de la valeur prcdente
Dans ce cas, l'ancienne valeur de l'attribut est remplace par la
nouvelle valeur dans la ligne de dimension concerne.
La solution de type 1 est facile mettre en uvre, mais elle ne
conserve aucune trace de valeurs antrieures des attributs.
Type 2 : ajout d'une ligne de dimension
Dans ce cas, une nouvelle ligne est ajoute indiquant la nouvelle
valeur de l'attribut. La solution de type 2 est la principale technique
permettant de survre les attributs des dimensions volution lente
correctement.
Type 3 : ajout d'une colonne de dimension
Dans ce cas, on ajoute une nouvelle colonne pour reflter le
changement d'attribut. La solution de type 3 permet de voir les
donnes antrieures la fois selon les nouvelles et les anciennes
valeurs d'attribut.
Technique hybride 1 : changements prvisibles et application aux donnes de
multiples versions des attributs modifis.
Cette technique est frquemment utilise pour traiter des
modifications de la structure commerciale.
Technique hybride 2 : changements prvisibles avec application aux donnes
antrieures de la version actuelle de l'attribut modifi.
Cette technique convient s'il faut prserver la vision exacte du pass
dans le contexte de modifications d'attributs imprvisibles tout en
ayant le moyen de prsenter les donnes antrieures selon les valeurs
actuelles de l'attribut modifi.
Dimensions volution rapide
C'est le cas o un attribut change frquemment. Une solution consiste
isoler ces attributs qui changent rapidement et les placer dans une ou
plusieurs dimensions distinctes.
2.4.3.3. Les minidimensions
Elles constituent la meilleure approche pour parcourir les principaux
attributs et en suivre les changements dans les dimensions de trs grande
taille. L'approche consiste extraire de la table un ou plusieurs petits
groupes d'attributs n'ayant qu'un nombre limit de valeurs et les placer
chacun dans une minidimension.
2.4.4. Tables des faits
2.4.4.1. Les familles de tables des faits
Chanes et cercles
Plusieurs tables de faits sont ncessaires pour prendre en compte les
activits comprenant plusieurs processus. Chaque processus engendre une ou
plusieurs tables. Lorsque les processus sont naturellement ordonnancs, on
peut qualifier l'ensemble de chane de valorisation.
Schma de produits htrognes
Plusieurs tables des faits sont ncessaires lorsqu'une activit engendre
des produits htrognes dont les faits sont naturellement diffrents mais qui
possdent la mme base client.
Exemple: une table des faits personnalise ddie l'activit comptes
courants d'une banque.
Schma des transactions
Dans la table des faits, l'enregistrement d'une transaction contient en
gnral un fait unique: la valeur de la transaction. Le schma des faits
transactionnels n'est pas aussi souple que celui des instantans.
Les entreprises munies d'un historique transactionnel riche mais dont
les transactions ne sont pas constitutives d'une recette ont gnralement
besoin de deux tables de faits pour reprsenter l'ensemble de l'activit. Une
des tables des faits sert la capture des transactions et l'autre celle des
instantans priodiques.
Schma des instantans
La table des instantans est la table compagne de la table des
transactions. La flexibilit des tables d'instantans pennet d'ajouter
progressivement des faits mesure que l'on comprend mieux les besoins des
utilisateurs.
Les instantans permettent de mesurer rapidement l'tat de l'activit
tandis que les transactions donnent une vue aussi complte que possible d'un
comportement dtaill.
Agrgats
Les agrgats sont des rcapitulatifs que l'on construit en vue
d'optimiser les performances des requtes. Les agrgats sont stocks dans
des tables qui leur sont ddies et non dans les tables des faits d'origine, qui
contiennent les donnes non agrges.
2.4.4.2. Les tables des faits sans faits
Les tables de faits sans faits sont trs intressantes pour dcrire les
vnements et les couvertures de manire permettre des requtes sur des
faits qui ne se sont pas produits.
Le premier type de table des faits sans faits est celui qui enregistre un
vnement. Par exemple la table des faits sans faits reprsentant les
vnements prsence au cours au sein d'un institut universitaire.
Le second type de table des faits sans faits est celui de la table de
couverture. Par exemple la table des faits sans faits reprsentant les ventes
promotionnelles par point de vente et par priode permet de rpondre la
question concernant des vnements qui ne sont pas produits comme la liste
des produits en promotion qui ne sont pas vendus.
2.4.5. Cls artificielles
Les cls artificielles sont des entiers affects squentiellement lors du
garnissage d'une dimension. Toute jointure entre des tables de dimension et des
tables de faits doit se baser sur des cls entires artificielles sans signification. Il
faut viter d'utiliser les codes oprationnels naturels des systmes de productions.
Aucune cl de l'entrept de donnes ne doit tre intelligible c'est--dire suffire
elle seule donner une indication sur la ligne concerne.
2.4.6. Mythe de la modlisation dimensionnelle
Malgr son acceptation, certains malentendus existent toujours dans la
profession son sujet: ce sont les mythes de la modlisation dimensionnelle.
Mythe 1. Les modles dimensionnels et les marchs d'informations ne servent que
pour les donnes cumules.
Rien dans un modle dimensionnel n'interdit le stockage
d'informations historiques. Le volume de donnes historiques disponibles
dans un march d'informations doit dpendre des besoins de l'activit
observe.
Mythe 2. Les modles dimensionnels et les marchs d'informations sont des
solutions par service et non au niveau de l'entreprise.
Les marchs d'informations doivent tre organiss autour de
processus d'entreprise.
Mythe 3. Les modles dimensionnels et les marchs d'informations ne sont pas
extensibles.
Les tables de faits modernes abritent des milliards de lignes. La
modlisation dimensionnelle a t applique presque toutes les activits
comme la banque, les assurances, la tlphonie, les administrations, les jeux,
la fabrication, la distribution, l'ducation et biens d'autres.
Mythe 4. Les modles dimensionnels et les marchs d'informations ne conviennent
que s'il existe des schmas d'utilisations prvisibles.
Les structures dimensionnelles sont extrmement souples et
adaptables au changement. Le secret de la souplesse en matire de requte
est la construction de tables de faits au grain le plus fin. Le point de dpart
correct d'un modle dimensionnel est d'exprimer les donnes au plus petit
dtail possible en vue d'une souplesse et d'une extensibilit maximales.
Mythe 5. Les modles dimensionnels et les marchs d'informations ne peuvent pas
tre intgrer et conduisent par suite des solutions verticales.
Les modles dimensionnelles et marchs d'informations peuvent tre
intgrer s'ils sont conformes l'architecture de bus des entrepts de
donnes. On ne peut rendre la modlisation dimensionnelle responsable de
l'incapacit de certaines organisations respecter l'un de ses principes
fondamentaux.
2.4.7. Modl isation
2.4.7.1. La modlisation en toile
Dans un modle en toile, tous les faits sont dfinis dans une simple table
relationnelle. Cette table des faits va tre relie par cls primaires d'autres tables
correspondant aux dimensions. En fait, le modle en toile essaie de superposer une
structure multidimensionnelle au dessus d'un modle relationnel normalis deux
dimensions.
Le modle en toile simplifie le modle logique normalis en organisant les
donnes de manire optimale pour les traitements d'analyse.
2.4.7.2. La modlisation en flocon
La modlisation en flocon est une modlisation en toile pour laquelle on
clate les tables de dimensions en sous-tables selon la hirarchie de cette
dimension. C'est un modle en toile normalis.
2.4.7.3. La modlisation en constellation
La modlisation en constellation consiste fusionner plusieurs modles en
toile qui utilisent des dimensions communes. Un modle en constellation
comprend donc plusieurs tables de faits et des tables de dimensions communes ou
non ces tables de faits.
2.4.8. Gestion du projet de modlisation dimensionnelle
La gestion d'un projet de modlisation dimensionnelle consiste surtout
faire circuler le rsultat de la conception entre les personnes. Une bonne vision du
projet est indispensable une communication efficace. Cela travers les quatre
outils graphiques suivants:
la matrice de l'architecture en bus dcisionnel;
le diagramme d'une table des faits;
le dtail d'une table des faits;
le dtail d'une table dimensionnelle.
2.4.8.1. La matrice de l'architecture en bus dcisionnel
La matrice dveloppe par l'quipe de conception pourra tre rvise en vue
de servir de support de prsentation l'intention d'autres concepteurs,
administrateurs et utilisateurs. La matrice peut tre utilise comme une introduction
gnrale la conception; elle procure alors chaque interlocuteur une vue de ce
que sera l'entrept de donnes une fois termin.
2.4.8.2. Le diagramme de la table des faits
Le diagramme de la table des faits ne se contente pas d'illustrer les spcifis
de la table des faits ; il la situe aussi dans le contexte du data mart. Il nomme la
table des faits, nonce clairement sa granularit et prsente toutes les dimensions
auxquelles elle est relie. Il donne galement un aperu de toutes les dimensions
qui ont t identifies pour l'activit concerne. Le diagramme reprsente les
dimensions non concernes sans liens et cela permet d'veiller la crativit (leur
connexion ultrieure peut devenir un objectif d'extension) et l'attention (le fait
qu'elles ne soient pas connectes montre clairement qu'elles ne seront pas
disponibles pour cette table des faits).
Un diagramme de table des faits est galement un vecteur de communication
multidirectionnel qui facilite :
Les liaisons entre le service informatique et les utilisateurs. Le diagramme
facilite le partenariat entre le service informatique et les utilisateurs. Il
suscite l'appropriation du projet par les utilisateurs; il peut aussi servir lors
de la phase de validation de la conception par les utilisateurs.
La slection des outils d'accs aux donnes. Une version moins dtaille de
ce diagramme pourra tre soumise aux diteurs d'outils.
La formation des utilisateurs. Le diagramme de la table des faits a montr
son efficacit en tant qu'outil de formation dans la mesure o il prsente les
donnes aux utilisateurs sous forme comprhensible.
2.4.8.3. Le dtail de la table des faits
Le dtail de la table des faits reprsente la liste complte des faits de la table.
On y trouve les faits prsents physiquement dans la table, les faits drivs prsents
au travers des vues des systmes de gestion de bases de donnes (SGBD) et des
faits calculs partir de ceux des deux premiers groupes. Chaque fait doit possder
ses propres rgles d'agrgation afm que la personne qui les consulte soit avertie que
tel ou tel fait est semi-additif ou non additif. La liste des faits d'une table donne
peut parfaitement reflter des donnes indisponibles mais demandes par les
utilisateurs, condition d'indiquer clairement cette indisponibilit momentane. Il
se peut que ces lments prvus n'aient aucune source potentielle aujourd'hui, ou
bien que cette source n'entre pas dans les objectifs du projet. Ils reprsentent des
objectifs futurs.
2.4.8.4. Le Dtail de la table dimensionnelle
Le dtail de la table dimensionnelle prsente les attributs d'une dimension.
Chaque dimension a son propre diagramme qui explicite sa granularit. Le
diagramme affiche les cardinalits approximatives de chaque attribut dimensionnel
et donne l'utilisateur une vue d'ensemble des nombreuses hirarchies et relations
entre les attributs. Les relations dfinissent les chemins de forage (drill) par dfaut.
Ce diagramme permet aussi d'inclure des attributs demands par les utilisateurs
mais non encore disponibles ou non prvus dans le projet initial.
(jpJ41 ~ q ( ] [ C J E ][][][00
J4lppfica11ti({))1!!t
Mise enplace d'Un data mart concernant la paie dupersonnel de l'Etat Page 56
3.1. Schma global des composants du data mart
Systme
oprationnel
source
Zone de prparation des
donnes
Zone de prsentation des
donnes
Outils d'accs aux
donnes
Fonctions:
Nettoie, combine, et
Informations
K
standardi se
-.
atomiques et
Accder
Oracle 9i Developper
-
E x t r a l ~
Rend les dimensions
Charger
-V
rcapitulatives bases Suite
conformes
sur les transactions de (
bulletins de paie - Forms Developper;
-
- JDevelopper ;
7000/250
- Reports Developper ;
Stockage:
- Discoverer.
Fichiers plats et
)
tables relationnelles
'----"
E x t r l U ~
Oracle Express
Traitement :
~
Microsoft Excel
Tris et traitements Charger
V
~
Accder
squentiels
SI
DPS
Schma 2: composant d'un data mart dans le cadre de la paie du personnel de l'Etat.
3.2. La phase Extraction Traitement Chargement (ETC)
Au regard de la diffrence des deux systmes oprationnels sources (DPS
7000/250 et SIGASPE), la phase d'extraction traitement chargement ncessitera
des procdures diffrentes selon les systmes.
3.2.1. Extraction
3.2.1.1. Sur le systme DPS 7000/250
Les donnes ont t extraites dans des fichiers texte avec le point
virgule (;) comme sparateur de colonnes. L'extraction est faite par un programme
COBOL qui crit les donnes dans des fichiers texte de taille comprise entre 8Mo
et IKo. Les fichiers sont transfrs du DPS 7000/250 vers le Bull Micral 200. A
partir du Bull Micral 200 les fichiers sont facilement rcuprables sur les micro-
ordinateurs. Pour un mois donn, on peut avoir 2 6 fichiers. Les fichiers sont
constitus par paire: un fichier concernant les bulletins et un autre fichier
concernant les lments de bulletins. Les noms des fichiers ont la nomenclature
suivante:
BULxxyyz ou Bxxyy ou BExxyy ou B40xxyy pour les bulletins;
ELMxxyyz ou Exxyy ou EExxyy ou E40xxyy pour les fichiers des lments
de bulletins.
Avec xx reprsentant l'anne sur deux(2) positions, yy le mois sur deux (2)
positions et z un numro squentiel.
A partir de la structure des fichiers texte, un modle physique est conu pour
permettre la rcupration des donnes.
La procdure de chargement propose est la suivante:
Regroupement de tous les fichiers dans un seul rpertoire acharger ;
Listage des fichiers dans un autre fichier texte par la commande : dir lB
IC IL> nomfichier.txt;
Cration d'une table dans la base de donnes pour charger la liste
contenue dans nomfichier.txt ;
Chargement de la table en utilisant l'outil d'Oracle SQLLOADER ;
Cration de deux (2) fichiers de script (un pour les bulletins
fchargebu.sql et l'autre pour les lments de bulletins
fchargelt.sql ) partir d'un programme PL/SQL ;
Lancement du script de cration des deux tables (bulletin_7000 et
r_bulletin_7000) ;
Lancement des scripts fchargebu.sql et fchargelt.sql pour charger
l'ensemble des donnes en une seule fois.
3.2.1.2. Sur le systme SIGASPE
L'extraction ce niveau est moins complexe car l'application tourne sous
une base de donnes Oracle. On utilise un fichier de sauvegarde logique fait
l'aide de l'outil EXPORT d'Oracle. Ce fichier a pour extension dmp . A partir
de ce fichier on fait un chargement en utilisant l'outil IMPORT d'Oracle.
Mm de rsoudre le problme de la disponibilit des anciens bulletins de paie
ncessaires aux agents de l'Etat pour complter leurs diffrents dossiers, une
application a t dveloppe. Cette application permet de consulter et de faire
l'dition des bulletins de paie au format de papier A4 et papier pr imprim. Cette
application a t dveloppe l'aide des outils de dveloppement Oracle
Developper.
3.2.2. La phase de traitement et de chargement
Le traitement et le chargement se rsument en un ensemble de programmes
PL/SQL que l'on peut excuter sous forme de script.
Avant de procder au chargement des donnes il est ncessaire de mettre en place
le modle dimensionnel car il dfinit la structure qui doit recevoir les donnes
extraites et traites provenant des systmes oprationnels.
3.3. Le modle dimensionnel
3.3.1. Matrice de l'architecture en bus dcisionnel
Dimensions
Processus 0
ta
d'entreprise
..... '2
=
0
0
. ~
S
0
.- ~
~
S 0 0-
0
'a
0
=
""0
0
o
ta
0
.-
.-
=
~
~
00
""0
0
0 0
a
0 . ~
""0
~
00
~
.-
---
!3
=
00
o
-=
---
0
=
t.+:l
0 0
'0
""0
-=
0
0
0
.- ::s
.....
0
.-
S
..... .....
C"
.-
.-
00
::s
0 o
ta
'C
0
.....
00
-
=
a co
o
~
0 '0
-
::s
'0 0
.-
-
.-
0
~
<
r/J.
- ....:l r.Ll co ~ co CI o
Transaction de x x x x x x x x x x
bulletins de paie
Tableau 6: matrice de bus d'un data mart de la paie du personnel de l'Etat
3.3.2. Diagramme de la table des faits
Granularit : la ligne
composant le
bulletin de paie d'un
agent de l'Etat
Table des faits
Ligne de bulletin
d'un agent
Schma 3: diagramme de la table des faits
3.3.3. Dtail de la table des faits
Table des faits Ligne de bulletin d'un agent
cleperiode
cl_agent
cleclassification
cl section/service
clJonction
cl lieu
cl billeteur
cl banque_modepaiement
cl_qualiteslt_matrimoniale
cl element salaire
montant
3.3.4. Dtail de la table dimensionnelle
Pour la reprsentation du diagramme de dtail de la table dimensionnelle le
formalisme suivant a t utilis:
nom attribut
l'-'-'-'-'-'-'-'-'-'-'-'j
i nom attribut i
! 1
L . _ . _ . _ . _ . _ . _ . _ . _ . _ . _ . _ . ~
Dsigne un attribut de la dimension.
Permet de dfinir une hirarchie entre attributs.
Dsigne la granularit.
Les autres flches matrialisent une relation entre les autres attributs
et l'attribut cl de la dimension.
Dimension priode
Description dtaille des attributs
Nom attribut Description Gestion dimension
changeante
CIe--periode Cl artificielle Pas de mise jour
Mois Reprsente le mois de paie Pas de mise jour
Trimestre Ensemble de trois mois de paie Pas de mise jour
Anne Anne de paie Pas de mise jour
Tableau 7 : description dtaille des attributs de la dimension periode
cIe---'periode
cIe---'periode
Diagramme de dtail de la table dimensionnelle
annee
trimestre
mois
1'-'-'-'-'-'-'-'-'-'-'-'
,
1
1._.-.-._._._._._._._._.
annee
1'- ._. - .-. -._ . - ._._. _.
1
1
1._._._._._._._._._.-.-.
Schma 4: diagramme de dtail de la table dimensionnelle periode
Dimension fonction
changeante
CIe fonction Cl artificielle Pas de mise jour
-
Code fonction Cl du systme oprationnel Pas de mise jour
-
Lib fonction Libell de la fonction Ecrasement
-
typefonction Les diffrents types de fonction Ecrasement
Tableau 8: description dtaille des attributs de la dimensionfonction
type_fonction
lib fonction
l'-'-'-'-'-'-'-'-'-'-'-'j
..! cIe fonction
! i

code fonction
Schma 5: diagramme de dtail de la table dimensionnelle fonction
Dimension lieu
changeante
CIe lieu Cl artificielle Pas de mise jour
Code lieu Cl du systme oprationnel Pas de mise jour
-
Lib lieu Libell du lieu Ecrasement
-
Cdprovince Code de la province. Il regroupe Pas de mise jour
un ensemble de dpartements.
Cd depart Code du dpartement. C'est un Pas de mise jour
ensemble de localits.
Cd localit Code de la localit. Le numro Pas de mise jour
-
de la localit dans le
dpartement.
Tableau 9: description dtaille des attributs de la dimension lieu
cIe lieu
cd--province
cd_depart
cd localite
cd--province
_._._._._ ..
1
1
_. _. - . _. _. - . _. _. _.1
code lieu
- 1
._._._._._._-_._._.'
Schma 6: diagramme de dtail de la table dimensionnelle lieu
Dimension banque/mode de paiement
changeante
Cle_banque_mode Cl artificielle Pas de mise jour
Code_banque Code de la banque dans le Ecrasement
systme oprationnel
Code_modepaie Code du mode de paiement Ecrasement
Lib_banque_mode Libell de la banque ou mode de Ecrasement
paiement
Tableau JO: description dtaille des attributs de la dimension banque/mode paiement
code_modepaie
1'-'-'-'-'-'-'-'-'-'-'-'-'-
1
: cle_banque_mode ~
1
I . _ . _ . _ . _ . _ . _ . _ . _ . _ . _ . _ . _ . ~
code_banque
~ . _ . _ . _ . _ . - -'-'-'-'-'-'-'-H
; cle_banque_mode ~
;. _. _. _. _. _. _. _. _. _. _. _. _. _ ~ --J
Schma 7: diagramme de dtail de la table dimensionnelle banque/mode paiement
Dimension lment de salaire
changeante
CIe eltbase Cl artificielle Pas de mise jour
-
Code elt Code de l'lment de salaire Pas de mise jour
-
utilis dans le systme
oprationnel
Lib eltbase Libell de l'lment de salaire Ecrasement
-
Cd_signe Indique le signe de l'lment : Ecrasement
positif ou ngatif
Type_elt Indique le type de l'lment de Ecrasement
salaire : gain ou retenue
Cdjmpososable Indique si l'lment de salaire Ecrasement
est imposable
Cd saisissable Indique si l'lment de salaire Ecrasement
-
est saisissable
Cd_qcessible Permet de dire si l'lment de Ecrasement
salaire participe la quotit
cessible
Cd retraite Dfinit si l'lment de salaire Ecrasement
-
est pris en compte ou pas dans
la base de retraite
Cd_recap Critre de regroupement Ecrasement
rcapitulatif des lments de
salaire.
Cdparag Dfinit le paragraphe de Ecrasement
l'lment de salaire
Tableau 11: description dtaille des attributs de la dimension lment de salaire
type_elt
cd_signe
l' - - - - _. - - - ~
! cle_eltbase ' 4 ; ~ - - -
._._._._._.. _ . _ . _ . ~
1
! cle eltbase 1
1 !
~ . _ . _ . _ . _ . _ . _ . _ . _ . _ . I
lib eltbase
cdparag
_. _. _. _. _. _. _. _. _ ,1
Schma 8: diagramme de dtail de la table dimensionnelle lment de salaire
Dimension agent
changeante
No matricule Numro matricule de l'agent Pas de mise jour
-
Lettre cle Lettre cl matricule Pas de mise jour
-
Nom Nom de l'agent Ecrasement
prenoms Prnoms de l'agent Ecrasement
Nomjf Nom de jeune fille Ecrasement
Dt naissance Date de naissance Ecrasement
-
Sexe Sexe de l'agent Ecrasement
Dt recrutement Date de recrutement Ecrasement
Cd nationalite La nationalit de l'agent Ecrasement
-
Tyjntegration Type d'intgration Ecrasement
Cd recrutement Mode de recrutement Ecrasement
-
Tableau 12: description dtaille des attributs de la dimension agent
sexe tyjntegration
'-- --'H_. -1n Cd- nationalite 1
8
'____-_._._ .. .
dt recrutement
prenoms -
'-------------'
dt naissance
1 nomjf
lettre cIe
l' _. _. _. _. _. _. - . _. _. _.,
no matricule
1 1
. .

Schma 9: diagramme de dtail de la table dimensionnelle agent
Dimension qualit/situation matrimoniale
changeante
CIe_qual_sitmatri Cl artificielle Pas de mise jour
Code_qualite Donne la qualit de l'agent Pas de mise jour
Code sit mat Donne la situation matrimoniale Pas de mise jour
- -
Lib_qual_sitmatri Libell qualit et situation Ecrasement
matrimoniale
Tableau 13: description dtaille des attributs de la dimension qualit/sit. matrimoniale
code sit mat
r'-'-'-'-'-'-'-'-'-'-'-'-'
1._._._._._._.-._._.-._._.
r'-'-'-'-'-'- _._._._._._._.
: cle_qual_sitmatri
1._._._.-._._._.-._._._.-._.-
code sit mat
code_Qualite
r'-'-'-'-'- -._.-._._._.-.
f-----...~ cle_qual_sitmatri
- - - - - - - - - - - - - - - - - - ~ '._._._._._.-._._._.-._._.
Schma 10: diagramme de dtail de la table dimensionnelle qualite/situation matrimoniale
Dimension billeteur
changeante
CIe billeteur Le nwnro du billeteur Pas de mise jour
-
No matricule Nwnro matricule du billeteur Pas de mise jour
-
Dt debut Date de dbut d'activit du Ecrasement
-
billeteur
Dt fin Date de fin d'activit Ecrasement
-
Tableau 14: description dtaille des attributs de la dimension billeteur
dt debut
._._.-._._.. _._._ ... __- ~ ~ no matricule
- - - - ~ ~ ! c1e_billeteur ~ 1
1
~ . - - - _. _. - _. _. - .1
Schma JJ: diagramme de dtail de la table dimensionnelle billeteur
Dimension section/service
changeante
CIe sect service Cl artificielle Pas de mise jour
- -
1
Code section Numro de la section dans le Pas de mise jour
-
systme oprationnel
Code service Code du service dans le systme Pas de mise jour
-
oprationnel
No struct 1 Premier niveau Pas de mise jour
-
No struct 2 Deuxime niveau Pas de mise jour
- -
No struct 3 Troisime niveau Pas de mise jour
- -
No struct 4 Quatrime niveau Pas de mise jour
- -
Lib_Iong_sce Libell long du service Ecrasement
Lib court sce Libell court du service Ecrasement
- -
No ex L'exercice Ecrasement
Titre Le titre du service Ecrasement
Chap Le chapitre du service Ecrasement
Tableau J5: description dtaille des attributs de la dimension section/service
Cd section
J'-'-'-'-'- _._._._._._._.
cie sect service
1._'_'_' '_'_'_'_0_'_'_'
Lib court
no ex
Cd section
chap
titre
code service
Schma 12: diagramme de dtail de la table dimensionnelle section/service
Dimension classification
changeante
CIe classif Cl artificielle Pas de mise jour
-
Code_categorie La categorie de l'agent Pas de mise jour
Code echelle L'chelle de l'agent Pas de mise jour
-
Code_grade Le grade de l'agent Pas de mise jour
Code echelon L'echelon de l'agent Pas de mise jour
-
Lib classif Libell classification Ecrasement
-
Tableau 16 : description dtaille des attributs de la dimension classification
cIe cIassif
code_categorie
code echelle
code echelon
1
- - - . - . _. - _. _. - .1
code_categorie
code echelle
cIe cIassif
lib cIassif
code_categorie
_ . _ . _ . _ . _ . _ . - . _ . _ . ~
cIe cIassif 1
1
- _. - _. _. _. _. - - ,1
Schma 13: diagramme de dtail de la table dimensionnelle classification
3.4. Le modle physique en toile

.. .
...

BR
detillEtrlll..f.1e$1\Jl
.....
ci deliltl:)\TE :
tJ#) 1:)\TI: ..
.
lrll'IElEl
tu_
nQ$ :.

.
:(ti.ilIli.[));TEi
..
#.. ......
.
...
..
:.i:j;; iiiIit:S!iaii .
............ _ .
. .. .. . .
.....

a:XI(EdiCJI
Q:ldELfeM
tijtnijJ
tijtn.x(2 .

rP..
.

noex .
:ii1!: ..:. :: .
.
.mf
.:
...

...
Hbld_f:.: .
C1ilcb1tri :..
.
.
.
...
CXXfJiilU
libJieu ..
.
.
.
Schma 14: modle physique en toile
3.5. Le modle multidimensionnel
ta,.
Periode
d eJ)eri ode <h:4>
annee <h:1>
ll.. Jl(jent
trimesre <h:2>
rrois <h:3>
no_matriaJle <h:2>
lettre_de
Herardly_1 <Defaut> <h>
.... Billeteur
nom
de_billeteur <h:2>
prenoms
no_rnatriaJl e
norn.Jf
dUiebut <h:1>
dt_naianoe
dt_fin
)l <h:1>
dt_reautement
HerardlL1 <Defaut> <h>
ccLreautement
tLintegration
ccLnational ite
E1t.....Paye -Periode
Q.Ja1_stmatri ta,.
de_quaLstmatri <h:3>
E1t--.PBYB
Billeteur
oode_qualite <h:1>
Element_salaire
code_st_mat <h:2>
de_el1ba <h:3>
EIt.....Pa -Jl(jent lib_quaLstmatri
oode_elt
HerardlL1 <Default> <h>
lib_el1ba
ccLsgne <h:2>
E1t--.PBye - 1_stmatri
tLelt <h:1>
aUmpoble
-

oo_saisable
EltJlSyc - "'Iaire
00_qoea;ibIe

.... Banque_Mode
l"=:-
oo_retraite
JiM_r
E1t--.PBYB -
de_banque_rrode <h:2>
oo_recap
code_banque
OO--.PBrag
code_modepaie <h:1>
Herardly_1 <Default> <h>
lib_banque
E1tJlS Fonction
E1t--.PBye - _rvioe
.... SecUBrvioe
EIt.....Pa - Oas;if
E1t--.PB -Ueu
Fonction
de_d:_rvioe <h:2>
....
code_dion <h:1>
de_fonction <h:1>
code_rvioe
code_fonction
no_Sruct_1
lib_fonction
no_Sruct_2
type_fonction <h:2>
no_Sruct_3
no_litruct_4
libJonlLs::.e
1i b_court_s::.e
Iloo. OaEEif
.... Ueu
no_ex
de_daEEif <h:3>
titre de_lieu <h:4>
chap
oode_categorie <h:1>
code_lieu
oode_echelle <h:2>
oode.Jlade
lib_lieu
00JlI"O'In <h:1>
code_echelon
oo_depart <h:2>
Iib_daEEif
oo_localite <h:3>
Schma 15 : modle multidimensionnel
3.6. Les outils d'accs
Le choix des produits est guid par l'existant. En effet, la structure possde
la gamme des outils Oracle ncessaires, et au regard de l'offre du march, nous
nous sommes rendus compte que les produits Oracle taient adapts.
Comme outils d'accs au data mart nous proposons :
La mise en place d'une application dveloppe l'aide des outils de
dveloppement Oracle comme Forms Developper, Reports Developper, ainsi
que Oracle Express qui permet de dvelopper des applications OLAP. Ceci
en vue de permettre la mise disposition des utilisateurs d'un ensemble
d'tats rpertoris et valids par les utilisateurs.
La mise la disposition des utilisateurs d'un outil de requte et de
reprsentation graphique comme Discoverer. Cet outil permet de faire des
requtes et stocke les rsultats dans des tableaux croiss que l'utilisateur a la
possibilit de modifier. Les donnes des tableaux peuvent tre slectionnes
pour faire des graphiques. Discoverer permet le renvoi des donnes vers
Microsoft Excel. Cet outil permettra aux utilisateurs d'avoir une certaine
autonomie dans la conception et la ralisation de leurs tats.
3.7. Le scenario de mise en uvre
Pour la mise en uvre, nous proposons au choix les solutions suivantes
bases sur deux architectures :
Architecture client/serveur
Pour le serveur nous proposons les caractristiques suivantes:
processeur Xon (bi processeur) ;
mmoire RAM 1 Go ;
unit de sauvegarde ;
carte rseau 10/100 Mb/s ;
cinq (5) disques SCSI hot Plug de 36 Go chacun en RAID ;
systme d'exploitation: Unix, Linux, Microsoft Windows NT.
Pour les postes clients :
processeur pentium III au moins
mmoire RAM 256 Mo
disque dur de 40 Go
carte rseau 10/100 Mb/s
systme d'exploitation: Microsoft Windows 98/NT/20001XP
Architecture 3Tiers
Pour le serveur de donnes :
processeur Xon (bi processeur) ;
mmoire RAM 1Go ;
unit de sauvegarde ;
cinq (5) disques SCSI hot Plug de 36 Go chacun en RAID ;
Pour le serveur d'application:
processeur Xon (quadri processeur) ;
mmoire RAM 2Go ;
cinq (3) disques SCSI hot Plug de 36 Go chacun en RAID;
Pour les postes clients :
processeur pentium III au moins;
mmoire RAM 128Mo ;
disque dur de 40 Go ;
systme d'exploitation: Microsoft Windows 98INT/2000/XP.
Les utilisateurs concerns par le data mart sont en premier les responsables
des services en charge des salaires du Ministre des Finances et du Budget. L'accs
au data mart peut tre largi d'autres structures comme les Directions
Administratives et Financires des diffrents ministres.
Tous les utilisateurs devront accder au data mart par identification. Cette
identification pourra se faire selon le cas: soit par le serveur de donnes dans
l'environnement client/serveur, soit par le serveur d'application dans
l'environnement 3Tiers.
Le data mart sera gr par la Direction des Services Informatiques du Ministre des
Finances et du Budget qui a en charge la gestion des applications du ministre.
Une session de formation des utilisateurs l'utilisation de l'application et
l'utilisation des outils de requte sera organise avant la mise en exploitation du
systme adopt.
Conclusion
La mise en plae d'un data mart peut tre perue comme un lment
d'amlioration des prises de dcision au niveau de l'entreprise. Nos travaux nous
ont permis de faire une tude thorique sur les entrepts de donnes ou data
warehouse, les data marts, la modlisation dimensionnelle et le concept LAP.
Cette tude tait indispensable pour la mise place d'un data mart concernant la paie
des agents de l'Etat.
La mise en uvre d'un data mart ncessite la connaissance et la maitrise des
concepts et mthodes tudis. Aussi, comme tout projet informatique, pour que le
projet russisse, il faut:
une maitrise du sujet et une bonne organisation de l'quipe de projet;
une forte implication des futurs utilisateurs ;
un engagement des responsables de l'entreprise.
Au regard des processus multiples qui peuvent exister dans l'entreprise, l'approche
par les data marts pour la mise en place d'un systme global d'aide la dcision de
l'entreprise peut s'avrer une solution efficace. Cela revient l'application de la
thorie du Diviser pour rgner.
ANNEXE 1: Prsentation du CENATRIN
Le Centre National de Traitement de l'Information (CENATRIN) a t cr
en dcembre 1970 et a pris son autonomie financire en 1975. Il est rig en
Etablissement Public caractre Industriel et Commercial (EPIC) par le dcret
n077/308IPRESIMF du 17 aot 1977.
Le CENATRIN a t transform en Socit d'Etat au capital de 400 000 000 F CFA
par le dcret n094/421IPRESIMICMlMEFP du 23 novembre 1994. Prestataire de
services informatiques, il est sous la tutelle technique de la Dlgation Gnrale
l'Informatique (DELGI). Le CENATRIN est en liquidation administrative depuis le
22/07/2005 par le dcret n? 2005-406IPRES/PMlMCPEAlMFB.
1.1 Objectifs et missions
Le CENATRIN a pour objectifs:
la conception et/ou la commercialisation de solutions adaptes aux besoins
locaux bass sur une utilisation optimale des Nouvelles Technologies de
l'Information et de la Communication (NTIC) ;
la fabrication, le montage et/ou la commercialisation d'appareillages
informatiques adapts aux conditions locales d'utilisation;
la ralisation de tous travaux ncessaires aux traitements de l'information
(dveloppement de logiciels spcifiques, installation de rseaux locaux,
installation de systmes, gestion de centres informatiques, maintenance et
dpannage d'appareillages informatiques), commands par les services de
l'Etat, les collectivits locales, les entreprises et organismes publics,
parapublics et privs;
la formation des utilisateurs ;
la formation des professionnels de l'informatique;
le recyclage et le perfectionnement des informaticiens.
Mise en place d'un data mart concernant la paie du personnel de l'Etat Page8}
1.2 Organisation de la socit
Le CENATRIN comprend une Direction Gnrale, six (6) divisions et un centre
Bobo Dioulasso. Les principales divisions sont:
la division Administrative et Financire;
la division Commerciale;
la division Etudes et Dveloppement;
la division Exploitation;
la division Formation;
la division Systme, Maintenance et Nouvelles Technologies de
l'Information et de la Communication.
1.3 Activits
Entreprise de prestation de services, le CENATRIN a pour activits:
la ralisation de schmas directeurs informatiques (SDI) ;
les tudes pralables d'informatisation;
l'audit informatique;
les tudes et dveloppement de logiciels standards et spcifiques ;
la vente de logiciels ;
l'assistance et le conseil en informatique ;
la formation aux logiciels standards ;
la saisie de donnes et le traitement de donnes ;
le conditionnement (dliassage, massicotage, reliure) ;
la vente d'quipements informatiques (matriel, consommables) ;
la formation la micro-informatique (Bureautique, Internet, etc.) ;
la vente de pices de rechange ;
la maintenance la carte et sur contrat ;
l'installation et configuration d'quipements informatiques et rseautiques ;
le cblage rseaux;
la fourniture d'accs Internet;
la ralisation et hbergement de sites WEB ;
la gestion des cybercafs.
1.4 Matriel et logiciel
1.4.1 Matriel
Le CENATRIN, dans la recherche d'une spcialisation dans la vulgarisation
des nouvelles technologies, s'est dot d'quipements informatiques de divers
constructeurs et de plate-forme varie, notamment des micro-ordinateurs Pentium
III et IV, des imprimantes laser, des serveurs, des routeurs, des onduleurs, des
modems, etc.
Egalement on y trouve un mini-ordinateur BULL (DPS7000), des imprimantes
aiguille, des drouleurs de bandes magntiques BULL, ...
1.4.2 Logiciel
Sont utiliss au CENATRIN les logiciels suivants:
systmes d'exploitation: Windows 95, Windows 98, Windows 2000 et NT,
Unix, Netware de Novell, Linux;
dveloppement: Access, Visual Basic, Delphi, Oracle, Hyper Text Markup
Language (HTML), AMC*Designor;
bureautique: Word, PowerPoint, Excel, Internet Explorer.
Les logiciels suivants ont t dvelopps:
SGPA (Systme Intgr de Gestion de Paie et Administrative) ;
KIRA_WIN (Gestion de courrier) ;
LAFIA (Gestion de stock de pharmacie) ;
GESTBUD (Gestion Budgtaire des administrations Publiques) ;
GIMAT (Gestion Intgre de Matriel) ;
FASO COMPTA (Comptabilit Gnrale);
SGCH (Systme de Gestion des Centres Hospitaliers) ;
GestCom (Gestion Commerciale) ;
GestImmo (Gestion des Immobilisations) ;
Systme d'Information et de Gestion de l'Office National des
Tlcommunications (S.I.G ONATEL sous ACCESS);
Systme Intgr de Gestion Administrative et Salariale du Personnel de
l'Etat (SIGASPE volet salarial sous ORACLE);
Systme d'information de la Caisse Autonome de Retraite des
Fonctionnaires (sous ORACLE);
Logiciel de gestion des impts pour la Direction Gnrale des Impts
(DBASE) ;
Comptabilit Intgre de l'Etat (CIE sous ORACLE) ;
Systme Intgr de Gestion Administrative et Salariale des Armes
(SIGASA sous ORACLE).
ANNEXE Il : Abrviations
API Application Program Interface
CENATRIN Centre National de Traitement de l'Information
DOLAP Desktop OLAP
DOS Disk Operating System
GCOS General Comprehensive Operating System
GCL GCOS Command Language
HOLAP Hybrid OLAP
JCL Job Control Language
KJOB Knowned Job
MOLAP MultidimensionnalOLAP
ODBC Open DataBase Connectivity
OLAP On Line Analytical Processing
OLTP On Line Transaction Processing
PL/SQL Procedural Language/Structured Query Language
ROLAP Relational OLAP
RON Run Occurrence Number
SGBD Systme de Gestion de Base de Donnes
SIGASPE Systme Intgr de Gestion Administrative et Salariale du Personnel
de l'Etat
SQL Structured Query Language
UML Unified Modeling Language
VLSI/CMOS Very Large Scale Integration / Complementary Metal Oxyde
Semiconductor
ANNEXE III : Bibliographie
Ralph KIMBALL, Laura REEVES, Margy ROSS, Warren THORNTHWAITE -
Le data warehouse : guide de conduite de projet, Eyrolles, deuxime dition, fvrier
2005.
Ralph KIMBALL, Margy ROSS - Entrepts de donnes: guide pratique de
modlisation dimensionnelle, Vuibert, deuxime dition 2003.
Georges GARDARIN - Intemet/intranet et base de donnes, Eyrolles, premire
dition 1999.
BULL - Bull DPS7 : gestion du systme GCOS7, 1988.
BULL - Migration pupitrage GCOS7 v2 vers GCOS7 v3.
Cours de base de donnes - Genevive lOMIER Avri12005.
ANNEXE IV : Ressources internet
http://www-adele.imag.fr/-donsez/cours/bdcpdw. pdf
Cours sur la modlisation dimensionnelle.
http://perso.wanadoo.fr/bernard.lupinl
Site web o l'on peut trouver des informations sur le concept LAP.
http://www.olapreport.com/
Site web entirement consacr LAP.
http://www.xrobion.com/produits.htm
Page web prsentant le produit Oracle Express.
http://www.quod.ch/webquod/dwhOl.htm
Page web sur le data warehouse.
Ibdwww.epfl.ch/f/teachinglcourses/SlidesIBDIDW.pdf -
Document PDF sur le data warehouse.
ANNEXE V: Glossaire
Attribut: un fait dcrivant chaque position d'une dimension.
Base de donnes: est un ensemble structur et organis permettant le stockage de
grandes quantits d'informations afin d'en faciliter l'exploitation.
Data mart : l'ensemble des donnes se rapportant un des mtiers de l'entreprise.
Data warehouse : entrept de donnes. Ce terme anglais est utilis pour dsigner
l'ensemble des informations d'une entreprise, enregistres sous un format
informatique.
DOLAP: Desktop OLAP. Dsigne un petit produit OLAP faisant de l'analyse
multidimensionnelle en local.
Dimension: un ensemble de donnes du mme type, permettant de structurer la
base multidimensionnelle.
Infocentre: est une collection de donnes orientes sujet, intgres, volatiles,
actuelles, organises pour le support d'un processus de dcision ponctuel.
HOLAP: Hybrid LAP. Dsigne les outils d'analyse multidimensionnelle qUI
rcuprent les donnes dans des bases relationnelles ou multidimensionnelles, de
manire transparente pour l'utilisateur.
MOLAP: Multidimensionnal OLAP. Ce terme dsigne plus spcifiquement une
technologie de stockage plus cartsien. Les jointures entre tables de dimension et
de faits sont dj faites, ce qui explique les performances.
Multidimensionnel: structure de donnes ayant au moins trois dimensions
indpendantes.
OLAP: On Line Analytical Processing. Dsigne une catgorie d'applications et de
technologies permettant de collecter, stocker, traiter et restituer des donnes
multidimensionnelles, des fins d'analyse.
OLTP : On Line Transaction Processing. Terme associ l'origine aux activits et
aux applications servant entrer de manire fiable des donnes dans une base de
donnes relationnelles.
SGBDR: Systme de Gestion de Base de Donnes Relationnelle. Permet le
stockage, le traitement et la restitution de donnes stockes dans des tables
relationnelles.
ROLAP: Relationnal OLAP. Cette technique permet de faire de l'analyse
multidimensionnelle partir de donnes stockes dans des tables relationnelles.
ANNEXE VI : Liste des tableaux et schmas
Tableau 1: Diffrences entre donnes du systme de production et donnes dcisionnelles 16
Tableau 2: diffrences entre systme de production et entrept de donnes 19
Tableau 3: tableau de comparaison entre infocentre et entrept de donnes 22
Tableau 4: matrice de bus des assurances 26
Tableau 5: finalits du data mart et de l'entrept de donnes 34
Tableau 6: matrice de bus d'un data mart de la paie du personnel de l'Etat.. 60
Tableau 7 : description dtaille des attributs de la dimension periode 63
Tableau 8: description dtaille des attributs de la dimension fonction 64
Tableau 9: description dtaille des attributs de la dimension lieu 65
Tableau 10: description dtaille des attributs de la dimension banque/mode paiement 66
Tableau Il: description dtaille des attributs de la dimension lment de salaire 68
Tableau 12: description dtaille des attributs de la dimension agent.. 69
Tableau 13: description dtaille des attributs de la dimension qualit/sit. matrimoniale 70
Tableau 14: description dtaille des attributs de la dimension billeteur 71
Tableau 15: description dtaille des attributs de la dimension section/service 72
Tableau 16 : description dtaille des attributs de la dimension classification 74
Schma 1 : Composants de base de l'entrept de donnes 25
Schma 2: composant d'un data mart dans le cadre de la paie du personnel de l'Etat. 57
Schma 3: diagramme de la table des faits 61
Schma 4: diagramme de dtail de la table dimensionnelle periode 64
Schma 5: diagramme de dtail de la table dimensionnelle fonction 65
Schma 6: diagramme de dtail de la table dimensionnelle lieu 66
Schma 7: diagramme de dtail de la table dimensionnelle banque/mode paiement 67
Schma 8: diagramme de dtail de la table dimensionnelle lment de salaire 68
Schma 9: diagramme de dtail de la table dimensionnelle agent 70
Schma 10: diagramme de dtail de la table dimensionnelle qualite/situation matrimoniale.. 71
Schma Il: diagramme de dtail de la table dimensionnelle billeteur 72
Schma 12: diagramme de dtail de la table dimensionnelle section/service 73
Schma 13: diagramme de dtail de la table dimensionnelle classification 74
Schma 14: modle physique en toile 75
Schma 15 : modle multidimensionnel 76

Memoire Mise en Place D'un Data Mart Concernant La Paie Du

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Memoire Mise en Place D'un Data Mart Concernant La Paie Du

Transféré par

Droits d'auteur :

Formats disponibles

MINISTERE DES ENSEIGNEMENTS SECONDAIRE,

SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

Vous aimerez peut-être aussi