Académique Documents
Professionnel Documents
Culture Documents
data visualisation
pour l’entreprise
data warehousing
Data Modeling
• Les dimensions décrivent le “qui, quoi, où, quand, comment et pourquoi” d’un
processus métier.
data warehousing
Data Modeling
• Structure table dimension: Clé primaire (== clé étrangère dans les tables de faits) +
attributs
Parfois la clé métier change également dans le temps. Dans ce cas, on a recours
à une clé durable (Durable super natural Key)
63
data warehousing
Data Modeling
data warehousing
Data Modeling
• Dimensions dégénérées: N’est représentée que par une clé primaire au niveau de
la table de fait. Cette clé fait généralement référence à un identifiant de la
transaction dans la base opérationnelle ou ODS
65
data warehousing
Data Modeling
data warehousing
Data Modeling
Dimension dégénérée
utilisée quand la
combinaison des clé
étrangères n’est pas unique
67
data warehousing
Data Modeling
data warehousing
Data Modeling
• Dimension d’Audit: contient la métadata sur les chargements ETL effectués. Elle
permet de suivre la qualité des données (Erreurs etc.), les variables de
l’environnement, les versions du code ETL, timestamp de l’exécution etc.
• Une dimension audit est généralement attachée à chaque table de fait. Elle est
la dernière dimension à être mise-à-jour au niveau du processus ETL
69
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
R. Sherman - Business Intelligence Guidebook From Data Integration to Analytics Présenter les autres types de SCD avec des exemples
74
data warehousing
Data Modeling
Les abréviations, les flags, les indicateurs opérationnels doivent être traduits dans
les tables de dimensions en des attributs textes significatifs
Les valeurs “NULL” dans les attributs de dimensions devront être remplacées par
un texte descriptif “Non-applicable” ou “Inconnu” afin d’éviter toute inconsistence
du traitement lors du groupement…
75
data warehousing
Data Modeling
• Dimensions choisies:
• Date
Quelles dimensions
• Article
• Magasin
choisir?
• Promotion
• Caissier
• Méthode of paiement
76
data warehousing
Data Modeling
data warehousing
Data Modeling
• Il est possible d’avoir recours à une clé primaire spécifique à la table de faits (entier
automatiquement généré). Elle est utile pour retrouver les lignes de la table au cas
d’un processus de chargement interrompu, ou quand on veut remplacer les
updates de la table de faits en des insertions/suppressions, ou si la table de faits
contient des lignes qui sont parents de lignes dans une autre table de faits de
granularité plus fine.
78
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
• Les valeurs “NULL” doivent être évitées. Si le cas se pose, les dimensions devront
introduire des clés dummy représentant l’inconnu ou le non-applicable
Pour des besoins de comparaisons, les faits ayant le même nom doivent être
conformes sur l’ensemble du modèle (même définition technique)
• Il est possible d’avoir une table de faits sans faits (Factless Fact table). Celle-ci est
utilisée pour enregistrer qu’un événement s’est produit
81
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Data Modeling
data warehousing
Etude de cas - Data Modeling
90
data warehousing
Data Modeling
Règles d’Or
• Règle #1: Charger des données atomiques détaillées dans les structures
dimensionnelles
• Règle #2: Structurer les modèles dimensionnels autour des processus métier
• Règle #3: S’assurer que chaque table de fait a une dimension Temps qui y est
associée
The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence
91
data warehousing
Data Modeling
Règles d’Or
• Règle #4: S’assurer que tous les faits d’une table de fait ont la même granularité ou
niveau de détail.
• Règle #5: Résoudre les problèmes des relations n-à-n entre la table de fait et les
dimensions
The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence
92
data warehousing
Data Modeling
The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence
93
data warehousing
Data Modeling
The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence
94
data warehousing
Data Modeling
Règles d’Or
• Règle #4: S’assurer que tous les faits d’une table de fait ont la même granularité ou
niveau de détail.
• Règle #5: Résoudre les problèmes des relations n-à-n entre la table de fait et les
dimensions
• Règle #6: Résoudre les problèmes des relations n-à-1 dans les tables de
dimensions
• Règle #7: Stocker les labels utiles pour les rapports et filtrer les valeurs du domaine
dans les tables de dimension
The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence
95
data warehousing
Data Modeling
Règles d’Or
• Règle #8: S’assurer que les tables de dimension utilisent des clés de substitution.
• Règle #9: Créer des dimensions conformes pour intégrer les données dans
l’ensemble de l’entreprise
• Règle #10: Equilibrer en continu les exigences métiers et les réalités pour livrer une
solution DW/BI acceptée par les utilisateurs finaux et qui supporte leur processus
de prise de décision
The Kimball Group Reader: Relentlessly Practical Tools for Data Warehousing and Business Intelligence
96
data warehousing
Data Modeling
Cubes
data warehousing
Data Modeling
Cubes