Vous êtes sur la page 1sur 17

Anne Acadmique 2009-2010

Cours & TD Datawarehouse


Pr. A. ELOUARDIGHI
1
Support Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
2
Chapitre 1: Notions et Architecture dun DW
Systmes transactionnels vs Systmes dcisionnels
Systmes transactionnels
Les outils traditionnels de gestion et dexploitation des donnes sont du type transactionnel ou
OLTP (On-Line Transaction Processing)
Lexploitation de donnes tourn vers la saisie, le stockage, la mise jour, la scurit et
lintgrit des donnes.
Le systme transactionnel est dvelopp pour grer les transactions quotidiennes
Ces bases de donnes supportent habituellement des applications particulires telles que les
inventaires de magasins, les rservations dhtel, etc
Le contenu est fait de donnes actuelles, pas darchives
Les donnes sont trs dtailles (dtails de chacune des transactions)
La mise jour seffectue par de nouvelles transactions
Trs souvent plusieurs de ces systmes existent indpendamment les uns des autres
Oprations dans les systmes transactionnels
Ajout
Effacement
Mise jour des enregistrements
Requtes simples
Interrogations et modifications frquentes des donnes par de nombreux utilisateurs
Systmes dcisionnels
Le terme dcisionnel Business Intelligence couvre l'ensemble des technologies permettant
en bout de chane d'apporter une aide la dcision.
SI capable d'agrger les donnes internes ou externes et de les transformer en information
servant une prise de dcision rapide.
SI capable de rpondre certains types de questions:
o Quelles sont les ventes du produit X pendant le trimestre A de l'anne B dans la
rgion C ?
o Comment se comporte le produit X par rapport au produit Y?
o Quel type de client peut acheter le produit X?
o Est-ce qu'une baisse de prix de 10% par rapport la concurrence ferait redmarrer
les ventes du produit X ?
Ces exemples mettent en vidence les faits suivants:
o Les questions doivent pouvoir tre formules dans le langage de lutilisateur en
fonction de son secteur dactivit:
Service marketing, Service conomique, service relation clients
o La prvision des interrogations est difficile car elles sont du ressort de
lutilisateur.
o Les questions vont varier selon les rponses obtenues:
Si le produit X sest vendu moins bien que lanne prcdente, il va tre
utile de comprendre les raisons: Dtailler les ventes par rgion par type
de magasin,
o Des questions ouvertes vont ncessiter la mise en place de mthodes dextraction
dinformations
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
3
Des donnes aux dcisions
Donnes :
o Points de ventes, gographiques, dmographiques,
Informations :
o I vit dans R, I est g de A,
Connaissances :
o Dans X%, le produit Y est vendu en mme temps que le produit Z,
Dcisions
o Lancer la promotion de Y & Z dans R auprs des clients plus gs que A, ...
Applications transactionnelles v.s Applications dcisionnelles
Les applications transactionnelles sont constitues de traitements factuels de type OLTP (On
Line Transaction Processing)
Les applications d'aide la dcision sont constitues de traitements ensembliste de type
OLAP: On Line Analytical Processing
Incompatibilits des deux activits
Les deux activits (OLTP & OLAP) ne peuvent co-exister sur des donnes dans le mme
systme dinformation: leurs objectifs de performance sont exactement opposs:
o Les requtes complexes et lourdes dgradent les performances des systmes
transactionnels,
o Les donnes temporelles sont rparties entre donnes actuelles et donnes
archives, rendant la vue historique des donnes trs difficile ou impossible,
Le support efficace dune activit OLAP ncessite la constitution dun systme dinformation
propre: Le Datawarehouse
Naissance du Datawarehouse
Datawarehouse : Dfinition
Collection de donnes orientes sujets, intgres, non volatiles et historises, organises
pour le support du processus daide la dcision
Base de donnes dans laquelle sont dposes aprs nettoyage et homognisation les
informations en provenance des diffrents systmes de production de lentreprise OLTP
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
4
Caractristiques des donnes d'un DW
Orientes sujet :
o Organises autour de sujets majeurs de lentreprise
o Donnes pour lanalyse et la modlisation en vue de laide la dcision, et non
pas pour les oprations et transactions journalires
o Vue synthtique des donnes selon les sujets intressant les dcideurs
Intgres :
o Construit en intgrant des sources de donnes multiples et htrognes
BD relationnelles, fichiers, enregistrements de transactions
o Les donnes doivent tre mises en forme et unifies afin davoir un tat cohrent
o Phase la plus complexe (60 90 % de la charge totale dun projet DW)
Historises :
o Fournies par les sources oprationnelles
o Matire premire pour l'analyse
o Stockage de l'historique des donnes, pas de mise jour
o Un rfrentiel temps doit tre associ aux donnes
Non volatiles :
o Consquence de lhistorisation
o Une mme requte effectue intervalle de temps, en prcisant la date rfrence
de linformation donnera le mme rsultat
o Stockage indpendant des BD oprationnelles
o Pas de mises jour des donnes dans le DW
Donnes multidimensionnelles
Notion de dimension : Cest une catgorie linguistique selon laquelle les donnes sont
organises:
o Nom dun attribut
o Valeur dun attribut
Reprsentation :
Tableau simple Tableau crois
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
5
Graphique 3D Hyper cube:
Notion de Datamart
Dfinition:
o C'est un sous-ensemble de donnes drives du DW cibl sur un sujet unique.
Caractristiques:
o Orient vers un sujet unique
Ex: comportement de la clientle
o Donnes fortement agrges
Le DW joue le rle de source et d'historique pour le Datamart
o Organisation multidimensionnelle (cubique)
Dont l'une des dimensions indique souvent le temps
o Lien dynamique avec le DW
Association entre valeur agrge et valeur dtaille
o Interfaces simples et conviviales
Les domaines dapplication du dcisionnel
La gestion de la relation client (CRM) est lun des premiers champs dapplication de la
Business Intelligence.
Le contrle de gestion pour lanalyse des cots, lanalyse de la rentabilit, llaboration
budgtaire, les indicateurs de performance
La direction marketing pour le ciblage, le pilotage de gamme, les applications de
gomarketing, de fidlisation clients
La direction commerciale pour le pilotage des rseaux, les prvisions des ventes,
loptimisation des territoires
Les ressources humaines pour la gestion des carrires,
La direction de la production pour lanalyse qualit, la prvision des stocks, la gestion des
flux, la fiabilit industrielle
La direction gnrale pour les tableaux de bord, indicateurs de pilotage, gestion dalertes
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
6
Exemple: un DW dans les tlcoms
Sujets :
o Suivi du march: lignes installes/ dsinstalles, services et options choisis, rpartition
gographique, rpartition entre public et diffrents secteurs d'organisations
o Comportement de la clientle
o Comportement du rseau
Historique
o 5 ans pour le suivi du march
o 1 an pour le comportement de la clientle
o 1 mois pour le comportement du rseau
Sources
o Fichiers clients labors par les agences
o Fichiers de facturation
Requtes
o Comportement clientle
o Nombre moyen d'heures par client, par mois et par rgion
o Dure moyenne d'une communication urbaine par ville
o Dure moyenne d'une communication internationale
Architecture dun Datawarehouse
Architecture centralise
Il sagit de la version centralise et intgre dun entrept regroupant lensemble des donnes
de lentreprise. Les diffrentes bases de donnes sources sont intgres et sont distribues
partir de la mme plate-forme physique
Architecture fdre
Il sagit de la version intgre dun entrept o les donnes sont introduites dans les marchs
de donnes orients selon les diffrentes fonctions de lentreprise
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
7
Chapitre 2 : OLAP et Analyse multidimensionnelles
OLAP :
Il sagit dune catgorie de logiciels axs sur lexploration et lanalyse rapide des donnes
selon une approche multidimensionnelle plusieurs niveaux dagrgation .
OLAP vise assister lusager dans son analyse en lui facilitant lexploration de ses donnes et
en lui donnant la possibilit de le faire rapidement.
o Lusager na pas matriser des langages dinterrogation et des interfaces complexes
o Lusager interroge directement les donnes, en interagissant avec celles-ci
Modle conceptuel
Approche multidimensionnelle
o Souvent reprsents par une structure plusieurs dimensions
o Une dimension est un attribut ou un ensemble dattributs:
Temps
Gographie
Produits
Clients
o Les cellules contiennent des donnes agrges appeles Faits ou Indicateurs:
Nombre dunits vendues
Chiffre dAffaire
Cot
o Reprsentations:
Relations,
Cube de donnes,
hyper cube de donnes
Vue multidimensionnelle
Agrgation des donnes
Plusieurs niveaux dagrgation
o Les donnes peuvent tre groupes diffrents niveaux de granularit
o Les regroupements sont pr-calculs,
Par exemple, le total des ventes pour le mois dernier calcul partir de la
somme de toutes les ventes du mois.
Granularit : niveau de dtail des donnes emmagasines dans un Datawarehouse
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
8
Granularit des dimensions
Les 12 rgles OLAP (Edgar Frank Codd, 1993)
1. Vue multidimensionnelle:
o Comme par exemple lorsquon souhaite analyser les ventes selon plusieurs dimension:
par produit par rgion ou par priode.
2. Transparence du serveur OLAP diffrents types de logiciels
o Elle s'appuie sur une architecture ouverte permettant l'utilisateur d'implanter le
systme OLAP sans affecter les fonctionnalits du systme central.
3. Accessibilit de nombreuses sources de donnes
o Le systme OLAP doit donner accs aux donnes ncessaires aux analyses
demandes.
o Les outils OLAP doivent avoir leur propre schma logique de stockage des donnes
physiques
4. Performance du systme de Reporting
o L'augmentation du nombre de dimensions ou du volume de la base de donnes ne doit
pas entraner de dgradation visible par l'utilisateur.
5. Architecture Client/Serveur
o La plus part des donnes pour OLAP sont stockes sur des gros systmes et sont
accessibles via des terminaux . Il est donc ncessaire que les outils OLAP soient
capables de travailler dans un environnement Client/Serveur.
6. Dimensions Gnriques
o Toutes les dimensions doivent tre quivalentes en structure et en calcul.
o Toute fonction qui s'applique une dimension doit tre aussi applicable une autre
dimension.
7. Gestion dynamique des matrices creuses
o Le schma physique des outils OLAP doit s'adapter entirement au modle d'analyse
spcifique cr pour optimiser la gestion des matrices creuses
8. Support Multi-Utilisateurs
o Les outils OLAP doivent supporter les accs concurrents,
o Garantir l'intgrit et la scurit afin que plusieurs utilisateurs accdent au mme
modle d'analyse.
9. Opration sur les dimensions
o Les oprations doivent pouvoir s'effectuer sur toutes les dimensions.
10. Manipulation intuitive des donnes
o Toute manipulation doit tre accomplie via une action directe sur les cellules du
modle sans utiliser de menus ou des chemins multiples travers l'interface
utilisateur.
11. Souplesse et facilit de constitution des rapports
o La cration des rapports dans les outils OLAP doit permettre aux utilisateurs de
prsenter comme ils le dsirent des donnes synthtiques ou des rsultats en fonction
de l'orientation du modle.
12. Nombre illimit de niveaux d'agrgation et de dimensions
o Tout outil OLAP doit grer au moins 15 20 dimensions.
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
9
Oprations OLAP
Oprations sur la structure des cubes
Pivot (Rotation)
Switch (Permutation)
Split (Dcomposition
Oprations sur le contenu des cubes
Roll-up (passage au grain suprieur) / Drill-down (passage au grain infrieur)
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
10
Slice (Restriction)
Dice (Projection)
Oprations entre cubes
Jointure
Union
Exemple doutils OLAP
BusinessObjects, BusinessObjects : http://www.businessobjects.fr/
SAS: http://www.sas.com/offices/europe/france/software/technologies/olap/index.html
HarrySoftware , HarryPilot, HarryCube : http://www.harrysoftware.com/jahia/Jahia/pid/61
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
11
Chapitre 3: Modlisation et Conception dun DW
Construction dun Datawarehouse
Caractristiques:
Le Datawarehouse est diffrent des bases de donnes de production:
o Les besoins pour lesquels on veut le construire sont diffrents
o Il contient des informations historises, organises selon les mtiers de lentreprise
pour le processus daide dcision
Le Datawarehouse nest pas un produit ou un logiciel mais un environnement, qui se btit et
ne sachte pas.
Phases de construction dun DW:
Il ya trois parties interdpendante qui relve la construction dun Datawarehouse:
o Ltude pralable qui va dfinir les objectifs, la dmarche suivre, le retour sur
investissement,
o Ltude du modle de donnes qui reprsente le DW conceptuellement et logiquement
o Ltude de lalimentation du Datawarehouse
Etude pralable
Etude des besoins:
o Dfinir les objectifs du DW
o Dterminer le contenu du DW et son organisation, daprs:
Les rsultats attendus par les utilisateurs,
Les requtes quils formuleront,
Les projets qui ont t dfinie
o Recenser les donnes ncessaires un bon fonctionnement du DW:
Recenser les donnes disponibles dans les bases de production
Identifier les donnes supplmentaires requises
o Choisir les dimensions
Typiquement: le temps, le client, le produit, le magasin...
o Choisir les mesures de fait
De prfrences de quantits numriques additives
o Choisir la granularit des faits
Niveau de dtails des dimensions
Cots de dploiement:
o Ncessite des machines puissantes, souvent une machine parallle
o Capacit de stockage trs importante (historisation des donnes)
Evaluer la capacit de stockage
o Equipes de maintenance et dadministration
o Les cots des logiciels
Les logiciels dadministration du DW
Les outils ETL (Extract-Transform- Loading)
Les outils dinterrogation et de visualisation
Les outils de Datamining
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
12
Modlisation
Niveau conceptuel:
o Un DW est bas sur une modlisation multidimensionnelle qui reprsente les donnes
dans un cube
o Un cube permet de voir les donnes suivant plusieurs dimensions:
Tables de dimensions
La table des faits contient les mesures et les cls des dimensions
Niveau Logique:
o Plusieurs schmas types sont proposs pour reprsenter un DW:
Schma en toile;
Schma en flocon;
Schma en toile
o Une (ou plusieurs) table(s) de faits : identifiants des tables de dimension ; une ou
plusieurs mesures.
o Plusieurs tables de dimension : descripteurs des dimensions.
Schma en flocons
o Raffinement du schma toile avec des tables normalises par dimensions.
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
13
Alimentation
Lalimentation est la procdure qui permet de transfrer des donnes du systme oprationnel
vers le DW
La conception de cette opration est une tche complexe
o 60 90 % de la charge totale dun projet DW
Elle doit tre faite en collaboration avec ladministrateur des bases de productions
Il est ncessaire de dterminer:
o Quelles donnes seront charges
o Les transformations et les vrifications ncessaires
o La priodicit et le moment de transferts des donnes
Alimentation dun DW (ETL)
Extraction (Extract)
Transformation (Transform)
o Filtrer
o Homogniser
o Nettoyer
o Etc
Chargement (Loading)
Extraction:
Depuis les bases sources
Priodique et Rpte
Dater ou marquer les donnes envoyes
Difficult:
o Ne pas perturber les applications OLTP
Diffrentes techniques dextraction:
o Mthode Push: Le systme oprationnel qui au fil des transactions alimente le DW
o Mthode Pull : Le systme dcisionnel cherche priodiquement les donnes dans les
bases de production
Transformation
Cest une suite doprations qui a pour but de rendre les donnes cibles homognes et puissent
tre traites de faon cohrente.
o Unification des modles
o Convertir / uniformiser les noms des attributs
o Uniformiser les valeurs d attributs
o Nettoyer ( Valeurs manquantes, aberrantes)
Chargement
Cest lopration qui consiste charger les donnes nettoyes et prpares dans le DW.
Cest une opration qui peut tre longue :
o Mettre en place des stratgies pour assurer de bonnes conditions sa ralisation
o Dfinir la politique de rafrachissement.
Cest une phase plutt mcanique et la moins complexe
Outils ETL
BusinessObjects, Data Integrator,
http://www.businessobjects.fr/
Oracle Corporation, Warehouse builder,
http://www.oracle.com/technology/products/warehouse/index.html/
IBM, Websphere Datastage , http://www.ascential.com/products/datastage.html
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
14
Travaux dirigs
Exercice 1
Il sagit de modliser Le Datawarehouse des ventes dune entreprise commerciale. Cette entreprise
vend des produits regroups par familles de produits. Une vente correspond un produit et un seul; la
vente est effectue par lun des vendeurs du service de vente spcialis dans le produit. Le
Datawarehouse doit pouvoir fournir le chiffre daffaires des ventes dun produit, par date, client, et
vendeur, ainsi que toutes les sommations possibles de chiffre daffaires.
Les objets Du Datawarehouse sont les suivants:
produit, caractris par : code_produit, code_famille, etc
client, caractris par : code_client, nom, CSP (catgorie socio-professionnelle), etc
vente, caractrise par : code_date, code_produit, code_client, code_vendeur, Chiffre
daffaires
vendeur, caractris par : code_vendeur, nom, code_service, etc
date, caractrise par : code_dat, semaine, mois, anne, etc
1. Donner les dfinitions des termes suivants : table de faits, table de dimension, indicateur,
hirarchie.
2. Tracer le schma en toile dimensionnel du Datawarehouse, en prcisant pour chaque table sa
nature dimensionnelle (table de faits ou table de dimension), ses cls, ainsi que la nature des
champs.
Exercice 2
Un oprateur Tlcom propose ses abonns un boiter routeur ADSL qui groupe un accs
Internet, le tlphone et un bouquet de chanes de tlvision interactives. Nous ne nous
intresserons qu cette dernire fonction dans notre Datawarehouse (DW).
Les chanes de tlvision proposes par cet oprateur dans son bouquet sont des chanes
nationales et des chanes page. Le tlspectateur peut ragir (interactivement) de plusieurs
manires aux missions et aux publicits quil reoit au moyen de sa tlcommande:
A tout moment, il peut zapper vers une autre chane
A tout moment, il peut teindre son poste
Pendant une publicit, il peut zapper la pub suivante sans attendre la fin de la publicit
en cours.
Pendant une publicit, il peut demander plus dinformation sur le produit prsent.
Le DW est centr sur les actions du tlspectateur. Lobjectif de ce DW est de profiler au plus
prcis le foyer (ou plutt le tlspectateur qui dtient la tlcommande) afin de maximiser la
demande dinformation sur les produits prsents par les publicits. En effet, loprateur
peroit plus dargent de la part de lannonceur quand le spectateur demande plus
dinformation au moment au lannonce est passe. Le schma de ce DW est constitu des
tables suivantes (les cls primaires sont soulignes)
Date (ClDate, Anne, Mois, JourDeMois, JourDeSemaine, TrancheHoraire, Heure, Minute)
Foyer (ClFoyer, NomAbonn, AnneNaissanceAbonn, Rgion, Dpartement, District, Ville,
Quartier, SituationFamille, RevenuFoyer, CS, NombreAdulte, NombreEnfant)
Emission (ClEmission, Chane, DateDbut, DureSeconde, TypeEmission, Catgorie, Annonceur)
Action (ClDate, ClFoyer, ClEmission, TypeAction, DureAction, DureRestante)
1. Quelle est la table de fait dans ce DW ? Justifiez votre rponse.
2. La granularit de la table de faits.
3. Quelles sont les dimensions de ce DW?
4. Donner le schma en toile de ce DW.
5. Formulez trois requtes diffrentes quon peut poser au DW.
6. Donnez le nouveau schma du DW si on dcide de diminuer la taille de la table Foyer par
une mini-dimension dmographique.
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
15
Exercice 3
Une universit cherche tudier les facteurs influant sur la russite de ses tudiants aux examens.
Pour cela elle dcide de construire un Datawarehouse.
Elle souhaite pouvoir rpondre aux questions suivantes:
Quel est le nombre de russites aux examens par cours, pour lanne 2007?
Quel est le nombre de russites aux examens dun cours obligatoire, pour lanne 2007?
Quel est le nombre de russites aux examens par sexe (fminin, masculin), pour lanne 2007?
Combien dtudiants ayant un ge de 22 ans ont russi leurs examens de base de donnes
relationnelle?
Quel est le nombre de russites aux examens pendant le semestre dhiver 2006?
Pour cela elle dispose des donnes suivantes: Pour chaque examen pass, on connat lge et le sexe de
ltudiant, le nom du cours (les cours peuvent tre regroups en cours obligatoire et cours option), la
date de lexamen, la note obtenue et si lexamen est russi ou non.
Proposez un modle en toile pour cette application. Recherchez tout dabord les diffrentes
dimensions et proposez une hirarchie pour ces dimensions.
Exercice 4
Un distributeur (grossiste) approvisionne plusieurs magasins en produits, en effectuant au plus une
livraison par jour et par magasin. Les informations qui figurent sur chaque bon de livraison sont les
suivantes : le numro du bon de livraison, la date de livraison, la rfrence du magasin, et pour chaque
type de produit livr sa rfrence et la quantit livre (le nombre darticles). Ces informations sont
stockes chez le distributeur, et accumules pendant des longues priodes afin de les analyser pour
amliorer le service de distribution.
Les analyses se font suivant plusieurs axes, et plusieurs niveaux, en analysant les mouvements des
produits par jour et par mois, par ville et par rgion, par fournisseur et par catgorie de produit.
On supposera quun fournisseur peut fournir au distributeur des produits dans plusieurs catgories et
quune catgorie de produit peut tre fournie par plusieurs fournisseurs.
Dfinir le schma dimensionnel du Datawarehouse permettant danalyser la quantit livre par ville et
catgorie de produits, en faisant apparatre clairement les dimensions et les indicateurs.
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
16
Etude de cas
Cas dune compagnie dassurance
Une compagnie dassurance de biens (automobile, immobilier, responsabilit civile) possde une
application transactionnelle de production permet de grer les polices (contrats) de ses clients ainsi que
les sinistres (accidents) dclars par ces clients.
Gestion des polices
Pour grer les polices, les agents dassurance peuvent effectuer les transactions suivantes :
Crer, mettre jour ou supprimer une police dassurance
Crer, mettre jour ou supprimer un risque (pour une police donne)
Crer, mettre jour ou supprimer des biens assurs (voiture, maison) sur un risque
Chiffrer ou refuser le risque
Valider ou refuser la police
On enregistre dans ces transactions un grand nombre dinformations, et notamment : date dcriture
(date de la transaction), date deffet (date de dbut dassurance), client (personne(s) prive(s),
personne morale), oprateur (employ, agent: chiffrage, vrificateur : validation), risque (produit
vendu par la compagnie dassurance), couverture (description des biens assurs), police (numro de
police, note de la police ou du risque,) , transaction (code transaction).
Gestion des sinistres
Pour grer les sinistres dclars par les clients, les agents dassurance ont leur disposition les
transactions suivantes :
Crer, mettre jour ou supprimer une dclaration de sinistre
Crer, mettre jour ou supprimer une expertise
Crer, mettre jour ou supprimer des paiements
Clore le sinistre
Ces transactions comportent notamment : date dcriture (date de la transaction), date deffet (date de
dclaration), client, oprateur, risque, biens sinistrs, police, les tiers impliqus dans le sinistre, les
montants financiers (limites, dj pay, reste payer, ), code transaction.
Conception
A partir de cette application transactionnelle, on veut crer un Datawarehouse permettant de rpondre
aux questions suivantes :
Pour chaque bien assur, on veut connatre le montant de la prime (somme annuelle paye par
le client pour assurer le bien) associe au bien assur, et le nombre de transactions du mois
pour ce bien.
De mme on veut pouvoir sortir des tableaux de bord par sinistre avec le total pay dans le
mois et le total reu dans le mois pour ce sinistre.
1. Faire le schma en toile dun Datamart Police ne prenant pas en compte les sinistres.
2. De mme, faire le schma en toile dun Datamart Sinistre .
3. Faire un seul Datawarehouse de ces deux Datamarts.
Anne Acadmique 2009-2010
Cours & TD Datawarehouse
Pr. A. ELOUARDIGHI
17
Cas dune banque
Une banque distribue une carte de paiement carte de crdit ses clients. Elle dcide de raliser un
Datawarehouse (DW) afin de faire le suivi des paiements suivants effectus avec la carte :
a. Voyages en avion,
b. Locations de voiture,
c. Htellerie.
Elle veut faire un suivi indpendant de chacun des paiements a, b ou c, mais aussi avoir la possibilit
dun suivi global.
A chaque dplacement en avion, la compagnie arienne lui envoie un fichier contenant les lments
suivants: identification de la carte de paiement, coordonnes du client et de la compagnie arienne;
ville de dpart, ville darrive, n du vol, date du vol, n du billet, classe du sige, distance parcourue,
date dachat et prix pay.
Les loueurs de vhicule transmettent aprs chaque location: identification de la carte de paiement,
coordonnes du client et de la socit de location de vhicules, catgorie du vhicule, date de dbut de
location, date de fin de location, nombre de jours, distance parcourue, date de rservation et prix pay.
Lhtel transmet chaque sjour: identification de la carte de paiement, coordonnes du client et de
lhtel, catgorie de chambre, date de dbut de sjour, date de fin de sjour, nombre de nuites, date de
rservation, prix de lhbergement et prix de la restauration.
1. Un premier DW ne concerne que les dplacements en avion.
Etablir le modle dimensionnel. Faire clairement apparatre les dimensions et les indicateurs. Ce
DW doit permettre de rpondre aux questions suivantes : quel est le chiffre daffaires (CA) par
client, par date de voyage (et par mois, trimestre et anne), par compagnie arienne, par ville de
destination?
2. De mme, tablir deux autres modles dimensionnels, lun pour les locations de voiture, lautre
pour lhtellerie.
Dans le cas de la location de voiture, on souhaite diter le CA, le nombre de jours de location, et le
kilomtrage pour chaque: client, date de rservation, ville, loueur, et catgorie de vhicule.
Dans le cas de lhtellerie, on veut des tableaux de bord par client, htel, ville, date de dbut de
sjour, catgorie de chambre, faisant apparatre le nombre de nuites, le prix total pay.
3. On veut maintenant regrouper ces trois DW en un seul, afin de rpondre aux questions
supplmentaires suivantes :
Quel est le CA total induit par un dplacement en avion ? Quelle est la dure du sjour ? Quel est le
CA en location de voiture ? En htellerie ? On dsire ici pouvoir diter les dtails de CA par
priode de temps et par client, ville de destination, ville de location (si diffrente), ville
dhbergement (si diffrente), compagnie arienne, loueur et htelier, et faire tous les
regroupements utiles.
Figurer le modle dimensionnel dun tel DW, en faisant clairement apparatre les dimensions et les
indicateurs.