Académique Documents
Professionnel Documents
Culture Documents
Modélisation multidimensionnelle
Problématique
Le concept de fait et le concept de dimension
Étapes de la modélisation dimensionnelle
Schéma conceptuel d’un ED
Schéma en étoile (star schema)
Schéma en flocon (snowflake schema)
Schéma en constellation (fact constellation)
3 4
1
06/03/2021
Les analyses décisionnelles sont basées sur considérer un sujet analysé comme un point
des traitements OLAP directement. dans un espace à plusieurs dimensions.
5 6
7 8
2
06/03/2021
Le terme fait est utilisé pour représenter une Les faits les plus utiles sont des faits:
mesure économique ◦ Numériques
Les mesures de performances sont stockées dans ◦ Additifs : les applications de l’entrepôt de données
la table de faits récupèrent presque toujours des centaines, des
Une mesure de performance est l’intersection de milliers de lignes, millions de lignes il est utile de
plusieurs dimensions les additionner (exemple: montant vendu en dinars)
La liste des dimensions définit le grain de la table
9 10
11 12
3
06/03/2021
Des attributs de dimension nombreux permettent de Conseil : Clés artificielles des dimensions
varier les possibilités d’analyse en tranches et en dès. ◦ L’usage des clés artificielles (clés entières, clés synthétiques, clés
sans signification) est recommandés dans les modèles
dimensionnels
Les dimensions établissent l’interface ◦ Toutes les jointures entre des tables de dimension et des tables
homme/entrepôt de données. de faits doit se baser sur des clés entières artificielles sans
signification
Les meilleurs attributs sont des valeurs distinctes, ◦ Clé artificielle est la même mais le code dépend des modifications
textuelles (les appellations utilisées pour les requêtes opérationnelles (les codes des comptes inactifs, des produits
obsolètes sont recyclés) !!!! L’entrepôt de données conservent les
et les états soient cohérentes), des mots véritables et données pendant des années
pas d’abréviations
◦ Les clés artificielle de la dimension date obligatoirement affectées
dans un orde séquentiel. (1er janvier 1, 2ème janvier 2, …)
Les tables de dimension typiques sont fortement
dénormalisées (priorité à la simplicité)
13 14
Dimension date
Clé date (CP)
Date
Date description complète
Jour de la semaine
Numéro du jour dans l’époque
Dimension date: Dimension Date Numéro de semaine dans l’époque
◦ Les entrepôts de données ont toujours une table de Numéro de mois dans l’époque
N° jour dans le mois calendrier
dimension date explicite N° jour dans le mois calendrier
N° jour dans l’année calendrier
Indicateur dernier jour semaine
◦ Il existe de nombreux attributs de date non Indicateur dernier jour du mois
supportés par la fonction date de SQL (les périodes Date de fin de la semaine calendrier
comptables, les saisons de vente, les jours fériés, N° semaine de l’année calendrier
les jours de weekend) Nom du mois du calendrier
N° du mois de l’année du calendrier
Année mois Calendrier (AAAA-MM)
◦ Ces données doivent être intégrer dans une table Trimestre calendrier
Année-trimestre-calendrier
de dimension Semestre calendrier
Année calendaire
Indicateur de jour férié
Saison de vente
15 Évènements majeurs 16
4
06/03/2021
Dimension Produit
Clé produit (CP)
Dimension Date Exemples de dimension Description du produit
Numéro US (clé naturelle)
Dimension magasin Description de la marge
Clé magasin (CP) Description sous-catégorie
Nom du magasin Description de la catégorie
N° du magasin Description rayon
Zone commerciale du magasin Description type emballage
Région commerciale du magasin Taille de l’emballage
Date dernière rénovation Contenu matières grasses
Type de régime
Poids
Unités de mesure de poids
Type de stockage
Type de durée sur étagère
Largeur sur étagère
Hauteur sur étagère
Profondeur sur étagère
… et d’autres attributs
17 18
19 20
5
06/03/2021
Dimension Produit
Clé produit (CP)
Description du produit
Numéro US (clé naturelle)
Clé marque (CE)
Avantage de cette modélisation : Clé type emballage (CE) Dimension marque
Contenu matières grasses Clé marque (CP)
◦ formaliser une hiérarchie au sein d'une dimension. Poids Description de la marque
◦ maintenance des tables de dimensions simplifiée Unité de mesures de poids Clé catégorie (CE)
Dimension Catégorie
Clé type de stockage (CE) Clé catégorie (CP)
◦ réduction de la redondance Largeur sur étagère Dimension Type emballage Description catégorie
Inconvénient de cette modélisation : Hauteur sur étagère Clé type emballage (CP) Clé rayon (CE)
Profondeur sur étagère Description type emballage
◦ induit une dénormalisation des dimensions …. Et autres attributs
générant une plus grande complexité en termes de Dimension Type stockage Dimension rayon
lisibilité et de gestion. Faits de transactions TPV Clé type de stockage (CP) Clé rayon(CP)
Clé date (CE) Description type de stockage Description du rayon
◦ navigation coûteuse Clé produit (CE) Clé type durée étagère (CE)
Clé magasin (CE)
Clé promotion (CE)
Numéros TPV Dimension durée étagère
Quantité vendue Clé type durée étagère (CP)
Ventes Description type durée étagère
23 24
6
06/03/2021
27 28
7
06/03/2021
La multitudes de tables en flocon complexifie la Table de faits d’un schéma dimensionnel est
présentation
Les fonctions d’optimisation des SGBD perturbées par
naturellement très normalisé et compacte
la complexité du schéma en flocon Un nombre très élevé de dimensions:
Économie d’espace disque est insuffisante (<1% de
l’espace disque requis pour l’ensemble du schéma) ◦ Signe que certaines dimensions ne sont pas
Réduction de la possibilité de navigation à l’intérieur
complètement indépendantes
d’une dimension (SQL d’apparence simple mais ◦ Donc il faut les combiner en une seule dimension.
difficile)
Pas d’utilisation d’index sous forme de bitmap
(technique d’amélioration de performances) Représenter les éléments d’une hiérarchie sous
Les tables de dimension doivent rester des tables forme de dimensions séparées dans la table de faits
physiques plates, facilité d’utilisation et meilleure est contraire aux principes de la modélisation
performance dimensionnelle
29 30
31 32
8
06/03/2021
et détermination des attributs distincts de Les deux éléments clés contribuant aux quatre étapes
chaque table de dimension sous forme de texte du processus de modélisation dimensionnelle
33 34