Vous êtes sur la page 1sur 6

DATAWAREHOUSES

Conception de modles en toile.

Bases de donnes analytiques Une base de donnes Analytique reprsente les informations de manire hirarchique, centre sur les faits, en gnral par un schma en toile. Les faits, largement numriques, sont stocks dans une table de fait, alors que toutes les dimensions hirarchiques, comme les informations sur un produit par exemple, sont stockes dans diffrentes tables de dimension.

Cette base de donnes contient la mme information mais utilise 5 tables au lieu de 9 et 4 jointures au lieu de 8.

Avantages du schma en toile Les schmas en toile utilisent beaucoup moins de jointures que les bases de donnes normalises. Les temps de rponse des requtages sont dautant plus rapides.

Les tables de faits servent de rfrences croises entre toutes les dimensions, en jouant un rle de jointure de plusieurs plusieurs globale.

Concevoir un modle en toile


Pour crer un schma en toile il faut clater les relations normalises en dimensions modlises.

Page 2

Les tables de dimension fournissent les informations de description. Elles contiennent : Les diffrentes hirarchies de la dimension, Les proprits complmentaires des niveaux Une cl primaire (plus une date de validit en cas de donnes historises) Les tables de faits contiennent les donnes par lesquelles une entreprise se mesure . Prix, Ventes, Salaires... On les appelle indiffremment faits, mtriques, mesures, indicateurs... Les tables de faits sont le point central des schmas en toile, ce sont elles qui contiennent en gnral le plus de lignes. Les tables de faits contiennent : Les mesures Les cls trangres qui les lient aux tables de dimension

Cahier des charges de projet


Il est trs difficile, en partant uniquement dune structure relationnelle, de concevoir un modle en toile. En effet, un modle relationnel comporte potentiellement un nombre indfini de modles dcisionnels, dpendants de la vue mtier du demandeur. Il est ncessaire de conduire des interviews auprs des rfrents fonctionnels comme pralable la conception. Ces interviews ont pour but dobtenir les informations suivantes :
Identification Identification Identification Identification

des vnements analyser des axes danalyse hirarchique de ces vnements des informations complmentaires, ncessaires lanalyse de la conservation des donnes historiques

Page 3

1) Quels sont les Faits*/vnements/flux qui produisent les indicateurs analyser ?


* Un Fait, dans ce contexte, reprsente un vnement rel, arriv lentreprise, pour lequel on dispose dune trace informatique date.

Pour chaque fait, lanalyse doit comporter : Le nom du fait La ou les dates significatives du fait Les mesures extraire du fait ainsi que leur mode de calcul.

2) Pour chaque fait, Quels sont les axes danalyse servant dcliner les mesures obtenues ? Parmi les axes danalyse les plus frquents, on peut donner pour exemple : Temps :
Hirarchies de temps bases sur les dates significatives des faits, ces axes existent dans tous les modles.

Tiers

:
Hirarchies reprsentant les personnes impliques dans le fait (Ex:

pour des ventes, les clients, les fournisseurs etc)

Gographiques

Hirarchies de localisation, se connectant aux autres axes et permettant une analyse gographique.

Ressources

Hirarchies reprsentant les lments matriels impliqus dans le fait (Ex. pour des ventes : les articles vendus )

Organisation

Hirarchies reprsentant lorganisation interne de lentreprise (Ex : Socit Service quipe Employ )

3) Pour chaque axe danalyse, Quels niveaux de regroupement hirarchique proposer ? Dans un systme dcisionnel, les informations doivent pouvoir tre consultes avec diffrents niveaux dagrgation selon le contexte et la demande de lutilisateur et se prsentent de lagrgation la plus gnrale lanalyse la plus dtaille utile.
Remarque : Il est noter que le niveau hirarchique le plus fin de lensemble des axes dtermine le niveau dagrgation de base de la table de fait, une augmentation de la prcision de ce niveau entrane donc une refonte concomitante de la table de faits.

Exemple de hirarchie : laxe de temps.

Page 4

4) Pour chaque niveau ainsi que pour les faits, quelles sont les informations complmentaires (non hirarchiques) ncessaires lanalyse ? Les restitutions et les analyses ne peuvent pas se contenter des niveaux hirarchiques, il y a des informations qui ne peuvent pas tre reprsentes en tant que niveau bien quelles soient utilises dans les tableaux (Par exemple le N de tlphone dun client ou le mode de paiement et la devise dune facture). Ct base de donnes, ces informations sont stockes directement dans la table de fait et dans les dimensions concernes, la vritable diffrence se situe au niveau de leur reprsentation dans les outils de restitution (Par exemple : proprits de niveau dans les cubes OLAP ou objets de type Information sous BO) Exemple avec laxe de temps :

5) Pour chaque axe danalyse, conserve-t-on lhistorique et avec quelle date deffet ? Pour certains axes, il est ncessaire de conserver la situation historique au moment du fait, il faut dans ce cas identifier dans les donnes source la date deffet dterminant le changement. Cette date, scinde en date de dbut et date de fin deffet fera alors partie de la cl primaire de la table de dimension associe laxe. Dans le cas o il ny a pas de date deffet disponible dans les donnes source, il est toujours possible, en dtectant les changements sur les donnes, de la remplacer par la date dintgration des donnes modifies.

Modlisation partir de l'interview La table de faits na pas de cl primaire mais une contrainte dunicit sur les cls trangres et les informations complmentaires.
Les relations sont toujours de 1 plusieurs vers la table de faits Les mesures sont agrges en fonction de la contrainte dunicit de la table de faits Les cls trangres de la table de faits sont dduites des cls primaires des tables de dimension

Page 5

Tableau de correspondance

Rdaction du cahier des charges : - Un document de spcifications, servant raliser un modle en toile et sa restitution doit comporter les chapitres et les points suivants : - Description fonctionnelle : Transcription directe de linterview, ordonne par fait puis par dimensions. - Modle de donnes : Reprsentation du modle physique de donnes en toile. - Cartographie des donnes : Dtail de lalimentation du modle par table et par champ. - Cartographie de la restitution : Selon les outils de restitution utiliss, correspondance entre le modle en toile et les objets proposs dans le requteur.

Page 6