Académique Documents
Professionnel Documents
Culture Documents
1
Références 2
• représentent des:
• Entités (nom, attributs, clé primaire)
• Relations entre les entités (base des jointures utilisées entre les
tables)
Initial 1 FN 2 FN 3 FN
• totalement repensées?
Modélisation d’un datawarehouse 9
Modélisation
• Relationnelle • Multidimensionnelle
• Tables • Dimensions
Différentes formes
• Relations de stockage des • Mesures
données • Cubes
• Jointures
• Hiérarchies
Modèle en étoile 12
Tables de faits
• Correspondent normalement à un seul événement d'affaires
Ex: achat d’un produit par un client, envoi du produit au client,
commande de matériaux auprès d’un fournisseur, etc.
• Contiennent deux types de colonnes:
Des métriques associées à l’événement d’affaire: Ex: total des ventes,
nombre d’items commandés, etc.
Des clés étrangères vers les tables de dimension: Ex: ID du client qui
fait la commande, ID du produit commandé, etc.
• Contiennent typiquement un très grand nombre de lignes:
Jusqu'à plusieurs millions de lignes;
Souvent plus de 90% des données du modèle.
Modèle en étoile 14
Exemple de fait : quantité vendue, chiffre d’affaire, coût, nombre de clients, nombre
d’appels
Fait additif: quantité vendue, chiffre d’affaire, coût
Fait semi additif:
• niveau de stock, niveau de solde (valeurs instantanées)
• nombre de transactions de clients (excepté sur la dimension produit)
Exemple : le nombre de clients et la dimension Produit
Soient deux faits (même magasin, même jour)
(Papier essuie tout, 20 clients) et (Mouchoir, 30 clients)
La somme du nombre de clients sur la dimension Produit n’a
pas de signification car un client peut avoir acheté des
mouchoirs et du papier
Fait non additif: un attribut ratio, marge brute = 1 - Coût/CA
Modèle en étoile 15
Modèle en étoile 16
• Avantages:
Petite économie d'espace;
Plus facile de mettre à jour les dimensions en cas de changement.
• Désavantages:
Schéma moins intuitif aux utilisateurs d'affaires;
Dégradation de la performance à cause des jointures
additionnelles.
• En général, on préfère ne pas normaliser les tables de dimension.
Stratégie d'indexation 29