Vous êtes sur la page 1sur 36
Data Warehouse El Mostafa YASSINE

Data Warehouse

Data Warehouse El Mostafa YASSINE

El Mostafa YASSINE

Sommaire
Sommaire

Historique

Définitions

Pré requis

Modélisation

Sommaire  Historique  Définitions  Pré requis  Modélisation 2
Data Warehouse: Historique
Data Warehouse: Historique

Années 1960 :

Genral Mills et l‘Université Dartmouth, dans un projet conjoint, créent les termes "faits" et "dimensions".

1983 :

Teradata introduit dans sa base de données managériale un système exclusivement destiné à la prise de décision

1988 :

Barry Devlin et Paul Murphy publient l'article "Une architecture pour les systèmes d'information financiers" ("An architecture for a business and information systems") où ils utilisent pour la première fois le terme "Datawarehouse".

1990 :

Red Brick Systems crée Red Brick Warehouse, un système spécifiquement dédié à la construction de l'Entrepôt de données.

1991 :

Bill Inmon publie Building the Data Warehouse (Construire l'Entrepôt de Données).

1995 :

Le Data Warehousing Institute, une organisation à but lucratif destinée à promouvoir le datawarehousing, est fondé.

1996 :

Ralph Kimball publie The Data Warehouse Toolkit (La boîte à outils de l'Entrepôt de données).

 1996 : Ralph Kimball publie The Data Warehouse Toolkit (La boîte à outils de l'Entrepôt
Data warehouse : Définition
Data warehouse : Définition

W.B.Inmon :

Le DataWarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision.

intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision. 4
Data warehouse :Objectifs
Data warehouse :Objectifs

On dispense de beaucoup de données, mais on ne sait pas comment y accéder.

On veut faire des manipulations OLAP sur nos données

On veut faciliter la vie des analystes, en leur permettant d’accéder directement aux données

Montrez moi ce qui est important

Deux personnes dans différents départements me montre la même mesures avec des valeurs

différentes

On veut que nos managers prennent des décisions semi structurées basées sur nos données opérationnelles

 On veut que nos managers prennent des décisions semi structurées basées sur nos données opérationnelles
L'objectif de la Business Intelligence est d'optimiser les processus décisionnels en transformant les données
L'objectif de la Business Intelligence est d'optimiser les processus décisionnels en transformant les
données de l'entreprise en informations pertinentes
L'objectif est de raccourcir la durée du processus de décision  Rendre les données utiles
L'objectif est de raccourcir la durée
du processus de décision
 Rendre les données utiles accessibles au décideur malgré les
difficultés : dispersion, complexité structurelle, volatilité,
inadaptation de la donnée brute au problème posé
 Rendre le décideur autonome
 Transformer la « donnée » en « information » pertinente, au
niveau requis (stratégique ou tactique)
 ne pas noyer le décideur
 lui permettre cependant d’explorer les détails
 lui offrir une vision dynamique, adaptable interactivement
 Permettre au décideur de prendre des décisions de plus en plus
rapidement
 pour rester compétitif sur le marché
 pour répondre aux nouveaux besoins des clients
… en mettant à la disposition du décideur des informations pertinentes Données Texte, fichier Données
… en mettant à la disposition du décideur
des informations pertinentes
Données
Texte, fichier
Données
son, image
de caisse
message …
BI
Information
Base de données
rapport, tableau
Toute l’information
sur un client
BI
Connaissance
Liste des
Résultats d’une
« bons clients »
analyse sur
l’information
« Gérer les connaissances » c’est organiser la transformation
Action

Pour les entreprises, l'enjeu est important car une prise de décision plus rapide permet une meilleure réactivité aux

évolutions de leur écosystème

L’aide à la décision répond à des besoins différents dans l’entreprise …
L’aide à la décision répond à des besoins différents dans l’entreprise …

Explorateurs de données

Besoins fréquents et réguliers

Création de leur propres rapports

Utilisent des outils statistiques

Synthèse de données

Besoins irréguliers

Données synthétiques

Formats prédéfinis

Jean - ”Je souhaite réaliser des requêtes et analyser

ces informations pour

comprendre les évolutions

de mon chiffre d'affaire”

Anne - “Je crée souvent des rapports et analyses et les met à disposition de mes collaborateurs”

Luc -“J'ai besoin de réaliser des prévisions avec mon client pour comprendre les impacts d'éventuelles campagnes marketing”

Arthur- “Je rafraîchis et analyse mes requêtes et tableaux de bords”

Herbert - “Je regarde mon top

10 des meilleurs clients sur mon email”

regarde mon top 10 des meilleurs clients sur mon email” Pascale - ” Je réalise des

Pascale -” Je réalise des requêtes prédéfinies et les analyses sous Excel”

Visualisateur de données

Besoins fréquents et réguliers

Rafraîchissement de rapports prédéfinis

Demandes aux autres acteurs de réaliser de nouveaux rapports et des analyses sophistiquées

François - “J'analyse mes

indicateurs prédéfins de vente”

nouveaux rapports et des analyses sophistiquées François - “J'analyse mes indicateurs prédéfins de vente” 7
Les applications décisionnelles couvrent toutes les activités de l’entreprise Les clients Profitabilité client
Les applications décisionnelles couvrent toutes les activités de l’entreprise
Les clients
Profitabilité client
Life time value
Satisfaction
Analyse comportement,
client
segmentation, ciblage
Gestion de la relation client,
Optimisation des ventes
Efficacité des campagnes
Cross-sell
Efficacité des forces de vente,
Analyse canaux distribution
Les salariés
Performance des
fournisseurs
Prévision de la
demande
Gestion du temps
de travail
Performance de
la production et de
La logistique
Formation
Analyse des coûts &
recrutement
marges
Fidélisation des
salariés
Optimisation
Optimisation des
Processus opérationnels
des délais
Gestion des affectations
Les fournisseurs
Analyse des
coûts fournisseurs
L’entreprise
Consolidation
CPM
Marketing
Gestion des
risques
Prévision
Simulation
Gestion des
Les actionnaires
budgétaire
Planning
actionnaires
Analyse de la
valeur
Optimisation
des achats
Gestion ressour-ces
humaines
Système décisionnel Zone de Consolidation Analyse Sources travail Stockage Restitution Bases externes
Système décisionnel
Zone de
Consolidation
Analyse
Sources
travail
Stockage
Restitution
Bases
externes
Dictionnaire de données
Outils d'analyse OLAP
Référentiel
MOLAP, ROLAP, HOLAP
Métadonnées
Mainframe
Garde la trace des données, de leur origine
et de l'exploitation faite
OLAP
ERP
ODS
Datamart 1
Consultation/Interrogation
Spécifique
Tableaux de bord - EIS
Tableur
Requêteurs
Data
Warehouse
Simulation/Prédiction
Datamart n
Statistiques
Fichiers Plats
Datamining

Retour infos de pilotage

Outil d'alimentation - ETL

Définitions et domaines d’application - 1
Définitions et domaines d’application - 1

ODS : Operational Data Store

Zone tampon permettant d’accéder à l’ensemble des données sources (dans un modèle physique très proche de leur modèle d’origine) au sein d’une base de données unique,

Objectifs :

Limiter les impacts performances sur les bases transactionnelles,

Se détacher du format d’échange (aujourd’hui fichier plat, demain DB Link),

Effectuer des agrégations multi-source performantes.

Data Warehouse

En Français : Entrepôt de données

Collection de données intégrées, contenant l’historique de l’entreprise,

Modèle organisé pour le support d’un processus d’aide à la décision

Gestion des erreurs

 Modèle organisé pour le support d’un processus d’aide à la décision  Gestion des erreurs
Définitions et domaines d’application - 2
Définitions et domaines d’application - 2

Data Mart

Collection de données organisées pour répondre à une problématique définie d’aide à la décision

Formats de stockage les plus utilisés : étoile / flocon (ROLAP) ou MOLAP / HOLAP

OLAP

Base de données proposant un format de stockage multidimensionnel (ROLAP, MOLAP, HOLAP)

Avantages :

Performances d’accès,

Règles d’agrégation (même complexes) inclues dans la définition du cube,

Gestion de la sécurité,

Vision métier simplifiée lors de la conception,

Outil d’analyse spécifique

Inconvénients :

Temps de génération du cube ou de re-calcul lors de l’ajout de nouvelles données,

Non-maîtrise l’espace de stockage et de swap nécessaire,

Utilisation avec un outil d’analyse non-propriétaire souvent problématique ou limitée

de swap nécessaire, • Utilisation avec un outil d’analyse non -propriétaire souvent problématique ou limitée 11
OLAP – Définition suite
OLAP – Définition suite

- Quelles est le volume de cahiers vendus aux magasins carrefour durant les 6 derniers mois ? -

Les cubes multidimensionnels permettent de répondre à des questions suivants des axes et des indicateurs
Les cubes multidimensionnels
permettent de répondre à des questions
suivants des axes et des indicateurs
définis à l’avance
Les cubes multidimensionnels
stockent chaque information élémentaire
à l'intersection de tous les axes d'analyse
(plan détaillé)
Quoi?
Dimension
Dimension
Produit
Temps
Produit
Où?
Magasin
Qui?
Combien?
Client
Chaque case
stocke une valeur
élémentaire :
Quel montant?
Volume vendu de
cahiers Clairefontaine,
à Carrefour Montreuil,
le 16 mai 2006
Dimension
Comment?
Magasin
Quand?
Commande
Temp
s
L'outil de restitution peut fournir
l’ensemble des ventes de
cahiers clairefontaine,
à Carrefour Montreuil,
durant les 6 derniers mois glissants
l’ensemble des ventes de cahiers clairefontaine, à Carrefour Montreuil, durant les 6 derniers mois glissants 12
Définitions et domaines d’application - 3
Définitions et domaines d’application - 3

ETL Extract, Transform and Load

Progiciel voué au transfert de données d’un source quelconque vers une cible quelconque.

2 grandes familles :

Moteurs,

Générateurs de code

Gestion et génération des méta-données associées à chaque flux

Contrairement aux EAI, progiciels optimisés pour le transfert batch de gros volumes

Métadonnées

Définition des données

Description du process d’alimentation

Permettent des analyses d’impact très poussées (de la source au rapport final impacté)

Peuvent englober la partie gestion des erreurs pour suivre les causes de rejet et l’historique des flux d’alimentation (nb de lignes insérées, mises à jours, rejetées, date de chargement, …)

l’historique des flux d’alimentation (nb de lignes insérées, mises à jours, rejetées, date de chargement, …)
4 réservoirs de données pour 4 types de besoins • Données des progiciels ERP /
4 réservoirs de données pour 4 types de besoins
• Données des progiciels ERP / CRM / spécifiques
Bases de données
de production
• Organisées pour les processus transactionnels (rapidité de mise à jour)
• Données hétérogènes et distribuées, internes et externes
Operational Data Store Data Warehouse Projets d’infrastructure
Operational
Data Store
Data
Warehouse
Projets d’infrastructure
Datamart
Datamart
Store Data Warehouse Projets d’infrastructure Datamart • • Organisation souvent très proche de celle des

Organisation souvent très proche de celle des bases opérationnelles

Répond au besoin de capture d’informations volatiles ou de synchronisation de flux

Peu ou pas d'historique : quels contrats ai-je signé hier ?

Données destinées à l’aide à la décision ou au reporting

Données modélisées spécifiquement pour optimiser l’extraction et la fourniture de données (Notion de Gisement de Données)

Organisation privilégiant l’enrichissement (insert, pas d’update)

Gestion fonctionnelle et technique de l'historique

Données modélisées spécifiquement pour l'aide à la décision répondant à des objectifs fonctionnels ou organisationnels ciblés « métier » (datawarehouse départemental)

Usage tous publics (y compris externe, e.g. extranet)

Data Warehouse: Concept
Data Warehouse: Concept
Orientée sujet Données intégrées DATA WAREHOUSE
Orientée sujet
Données intégrées
DATA WAREHOUSE
Données non volatiles
Données non volatiles
Données datées
Données datées
Data Warehouse: Concept
Data Warehouse: Concept

Données orientées sujet :

Regroupe les informations des différents métiers

Ne tiens pas compte de l’organisation fonctionnelle des données

Ass. Vie Ass. Auto Ass. Santé Client Police
Ass. Vie
Ass. Auto
Ass. Santé
Client
Police
Ne tiens pas compte de l’organisation fonctionnelle des données Ass. Vie Ass. Auto Ass. Santé Client
Data Warehouse: Concept
Data Warehouse: Concept

Données intégrées :

Normalisation des données

Définition d’un référentiel unique

h,f: • Normalisation des données • Définition d’un référentiel unique 1,0 homme, femme GBP CHF USD

1,0: • Normalisation des données • Définition d’un référentiel unique h,f homme, femme GBP CHF USD

homme, femme: • Normalisation des données • Définition d’un référentiel unique h,f 1,0 GBP CHF USD h,f

GBP: • Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme CHF USD

CHF: • Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP USD

USD: • Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF

• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD

h,f

EUR

• Normalisation des données • Définition d’un référentiel unique h,f 1,0 homme, femme GBP CHF USD
Data Warehouse: Concept
Data Warehouse: Concept

Données non volatiles :

Traçabilité des informations et des décisions prises

Copie des données de production

Bases de production

Ajout

Ajout Suppression Modification

Suppression

Modification

Entrepôts de données

Chargement Accès

Chargement

Chargement Accès

Accès

Data Warehouse: Concept
Data Warehouse: Concept

Données historisées:

Les données persistent dans le temps

Mise en place d’un référentiel temps

Base de production

Entrepôt

de

données

Image de la base en Mai 2005 Image de la base en Juillet 2006 Répertoire
Image de la base en Mai 2005
Image de la base en Juillet 2006
Répertoire
Répertoire
Nom
Ville
Nom
Ville
Dupont
Paris
Dupont
Marseille
Durand
Lyon
Durand
Lyon
Répertoire
Calendrier
Code
Année
Mois
Code
Année
Mois
1
Dupont
Paris
1
2005
Mai
1
Durand
Lyon
2
2006
Juillet
2
Dupont
Marseille
Data Warehouse: aspect technique
Data Warehouse: aspect technique

Les bases de données OLAP

OLAP (On-Line Analitical Processing)

C’est un mode de stockage prévu pour l’analyse statistique des données

contenues dans la base;

Il est appliqué à un modèle virtuel de représentation de appelé cube ou hypercube OLAP.

la base; • Il est appliqué à un modèle virtuel de représentation de appelé cube ou

donnée

Data Warehouse: aspect technique
Data Warehouse: aspect technique

Les bases de données OLTP

OLTP (On-Line Transactional Processing)

C’est un mode de stockage fait pour les systèmes opérationnels;

Ils supportent très bien une utilisation transactionnelle de la base de

données;

À ce mode de stockage est associé des requêtes type courtes et ne demandant pas beaucoup de ressource du côté du serveur de la base de données.

des requêtes type courtes et ne demandant pas beaucoup de ressource du côté du serveur de
Données opérationnelles vs Données décisionnelles
Données opérationnelles vs Données décisionnelles

Données opérationnelles

Données décisionnelles

Orientées application, détaillées, précises au

Orientée activité (thème, sujet), condensées,

moment de l’accès

représentes des données historiques

Mise à jour interactive possible de la part des utilisateurs

Pas de mise à jour interactive de la part des utilisateurs

Accédées de façon unitaires par une personne à la fois

Utilisées par l’ensemble des analystes, gérées par sous-ensemble

Cohérence atomique

Cohérence globale

Haute disponibilité en continu

Exigence différente, haute disponibilité ponctuelle

Uniques (pas de redondance en théorie)

Peuvent être redondantes

Structure statique, contenu variable

Structure flexible

Petite quantité de données utilisées par un traitement

Grande quantité de données utilisée par les traitements

Réalisation des opérations au jour le jour

Cycle de vie différent

Forte probabilité d’accès

Faible probabilité d’accès

Utilisées de façon répétitive

Utilisée de façon aléatoire

Data Warehouse: Pré requis
Data Warehouse: Pré requis

Besoins fonctionnels

Expectations sur les données, sources de données, entretiens avec les utilisateurs finaux, limites et complexités

Pré requis de conformité

Copies archivées, données stockées, flux de données, algorithmes pour l’ajustement de données, sécurité en ligne et copies des données hors ligne.

« Data Profiling »

qualité, périmètre, contexte des sources de données, données manquantes ou

nulles, intervention humaine, suppression des données, planification de

développement pragmatiques.

manquantes ou nulles, intervention humaine, suppression des données, planification de développement pragmatiques. 23
Data Warehouse: Pré requis
Data Warehouse: Pré requis

Pré requis de sécurité

un paradoxe:

Entrepôt de données: publier largement les données

Sécurité: restriction des données pour ceux qui en auront besoin

Pour les applications finales, une sécurité basé sur les rôles (pas de grant ou revoke au niveau du SGBD)

sécurité pour les développeurs (séparation sous réseaux subnets), backups (bandes, disques)

niveau du SGBD)  sécurité pour les développeurs (séparation sous réseaux subnets), backups (bandes, disques) 24
Data Warehouse: Pré requis
Data Warehouse: Pré requis

Données Intégrées

Les 360 degrés de la vue du métier

Spécifique à l’entrepôt de données: Etablir des attributs communs (conformité des dimensions), établir des mesures communes (Faits conformes) pour permettre des

calculs communs

(conformité des dimensions), établir des mesures communes (Faits conformes) pour permettre des calculs communs 25
Data Warehouse: Pré requis
Data Warehouse: Pré requis

Accès aux données

Avec quelle latence les utilisateurs finaux accéderont ils à l’information

Plus de performance en utilisant du pipelining, parallélisme, partitionning etc

Archivage and Lignage

Formule de calcul changeante

Conformité de légalité

Utilisateur final

rapports, OLAP

and Lignage • Formule de calcul changeante • Conformité de légalité  Utilisateur final • rapports,
Data Warehouse: Pré requis
Data Warehouse: Pré requis

Architecture

Outil ETL vs. développement spécifiques

Automatiser l’ordonnancement

Qualité des données/Nettoyage des données

Métadonnées

sécurité

« staging »

 Qualité des données/Nettoyage des données  Métadonnées  sécurité  « staging » 27
Data Warehouse: Pré requis
Data Warehouse: Pré requis

Modéliser les interfaces par les systèmes opérationnels

Modéliser l’entrepôt de données

Approche itérative de la modélisation de l’entrepôt, par lot

 Modéliser l’entrepôt de données  Approche itérative de la modélisation de l’entrepôt, par lot 28
Data Warehouse: Modélisation
Data Warehouse: Modélisation

Les tables de dimensions

Elles contiennent les données qui permettent de définir un axe d’une

étude.

Ce type de tables joue le rôle de référentiel au DATA WAREHOUSE.

Les tables de faits

Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA WAREHOUSE.

de faits • Comme leur nom l’indique, Ces tables contiennent uniquement les données factuelles du DATA
Data Warehouse: Modélisation
Data Warehouse: Modélisation

Les tables d'agrégats

Ces tables sont spéciales, elles permettent de simplifier le travail de restitution des logiciels d’analyse;

Elles contiennent des données à un niveau de granularité plus grand que dans les tables de faits;

d’analyse; • Elles contiennent des données à un niveau de granularité plus grand que dans les
Data Warehouse: Les types de modèle
Data Warehouse: Les types de modèle

Dimension 1

Dimension 2

Data Warehouse: Les types de modèle Dimension 1 Dimension 2 Modèle en étoile PRODUIT Id Produit

Modèle en étoile

types de modèle Dimension 1 Dimension 2 Modèle en étoile PRODUIT Id Produit Lib Produit Code

PRODUIT

Id Produit

Lib Produit

Code EAN

Gamme

Resp Produit

Couleur

Prix HT

Lib Produit Code EAN Gamme Resp Produit Couleur Prix HT TEMPS Date Jour semaine Jour ouvré

TEMPS

Date

Jour semaine

Jour ouvré

Semaine

Mois

Trimestre

Année

Jour ouvré Semaine Mois Trimestre Année Facts table FOURNISSEUR Id Fournisseur Raison Sociale
Facts table FOURNISSEUR Id Fournisseur Raison Sociale Four Type Fournisseur VENTES Id Fournisseur Id Client
Facts table
FOURNISSEUR
Id Fournisseur
Raison Sociale Four
Type Fournisseur
VENTES
Id Fournisseur
Id Client
Date
CLIENT
Id Produit
Id Client
CA
Nom
Quantité
Num Tél
Marge
Département
Région
Pays
Age

Dimension 3

Dimension 4

Data Warehouse: Les types de modèle
Data Warehouse: Les types de modèle

Modèle en étoile

Une table de fait centrale et des dimensions

Les dimensions n’ont pas de liaison entre elles

Avantages

Facilité de navigation

Nombre de jointures limité

Inconvénients

Redondance dans les dimensions

Toutes les dimensions ne concernent pas les mesures

 Inconvénients • Redondance dans les dimensions • Toutes les dimensions ne concernent pas les mesures
Data Warehouse: Les types de modèle
Data Warehouse: Les types de modèle
RESP PRODUIT Id Responsable Nom Prénom
RESP PRODUIT
Id Responsable
Nom
Prénom
GAMME Id Gamme Gamme PRODUIT Id Produit Id Responsable Id Gamme COULEUR Id Couleur Id
GAMME
Id Gamme
Gamme
PRODUIT
Id Produit
Id Responsable
Id Gamme
COULEUR
Id Couleur
Id Couleur
Lib Produit
Couleur
Code EAN
Prix HT
SEMAINE
Id Semaine
TEMPS
Semaine
Date
Id Semaine
Id Mois
MOIS
Jour semaine
Id Mois
Jour ouvré
Id Trimestre
Mois
TRIMESTRE
Id Trimestre
Id Année
Trimestre
TYPE FOURNISSEUR Id Type Fournisseur Lib Type Fournisseur FOURNISSEUR Id Fournisseur Id Type Fournisseur Raison
TYPE FOURNISSEUR
Id Type Fournisseur
Lib Type Fournisseur
FOURNISSEUR
Id Fournisseur
Id Type Fournisseur
Raison Sociale Four
VENTES Id Fournisseur Id Client Date
VENTES
Id Fournisseur
Id Client
Date
Id Produit CA Quantité Marge
Id Produit
CA
Quantité
Marge
Id Client Date Id Produit CA Quantité Marge CLIENT Id Département Id Client Nom Num Tél
CLIENT Id Département Id Client Nom Num Tél DEPARTEMENT Age Id Département Id Région Département
CLIENT
Id Département
Id Client
Nom
Num Tél
DEPARTEMENT
Age
Id Département
Id Région
Département
REGION Id Région Id Pays Région PAYS Id Pays Pays
REGION
Id Région
Id Pays
Région
PAYS
Id Pays
Pays
ANNEE Id Année Année
ANNEE
Id Année
Année

Modèle en flocon

Département REGION Id Région Id Pays Région PAYS Id Pays Pays ANNEE Id Année Année Modèle
Data Warehouse: Les types de modèle
Data Warehouse: Les types de modèle

Modèle en flocon

Une table de fait et des dimensions décomposées en sous hiérarchies.

On a un seul niveau hiérarchique dans une table de dimension.

La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait. On dit qu’elle a la granularité la plus fine.

Avantages

Normalisation des dimensions

Économie d’espace disque

Inconvénients

Modèle plus complexe (jointure)

Requêtes moins performantes

Économie d’espace disque  Inconvénients • Modèle plus complexe (jointure) • Requêtes moins performantes 34
Data Warehouse: Les types de modèle
Data Warehouse: Les types de modèle
Data Warehouse: Les types de modèle Dimension magasin Faits Ventes Date Id_magasin Id_produit Nom_magasin
Dimension magasin Faits Ventes Date Id_magasin Id_produit Nom_magasin Id_magasin Enseigne Quantité Ville Montant
Dimension magasin
Faits Ventes
Date
Id_magasin
Id_produit
Nom_magasin
Id_magasin
Enseigne
Quantité
Ville
Montant

Dimension temps

Date Mois Trimestre Année
Date
Mois
Trimestre
Année
Ville Montant Dimension temps Date Mois Trimestre Année Dimension fournisseur Id_fournisseur Nom_fournisseur

Dimension fournisseur

Id_fournisseur Nom_fournisseur Adresse_fournisseur
Id_fournisseur
Nom_fournisseur
Adresse_fournisseur

Faits Achats

Dimension produit

Date Id_produit Id_produit libellé Id_fournisseur taille Quantité catégorie Coût Faits Stocks Id_produit
Date
Id_produit
Id_produit
libellé
Id_fournisseur
taille
Quantité
catégorie
Coût
Faits Stocks
Id_produit
Quantité catégorie Coût Faits Stocks Id_produit Dimension entrepôt Id_entrepôt Nom_entrepôt

Dimension entrepôt

Id_entrepôt Nom_entrepôt Adresse_entrepôt
Id_entrepôt
Nom_entrepôt
Adresse_entrepôt
Id_entrepôt Quantité
Id_entrepôt
Quantité

Dimensions partagées

Data Warehouse: Les types de modèle Magasin Aggregates Produit
Data Warehouse: Les types de modèle
Magasin
Aggregates
Produit

Code magasin

Enseigne

Adresse

Surface

Code région

Région

Code produit

Code EAN

Libellé produit

Code gamme

Libellé gamme

Code responsable

Ventes journalières Par produit Et par magasin

responsable Ventes journalières Par produit Et par magasin Jour Date Jour de la semaine Mois Année
responsable Ventes journalières Par produit Et par magasin Jour Date Jour de la semaine Mois Année
responsable Ventes journalières Par produit Et par magasin Jour Date Jour de la semaine Mois Année

Jour

Date

Jour de la semaine Mois

Année

Et par magasin Jour Date Jour de la semaine Mois Année Gamme Code gamme Libellé gamme

Gamme

Code gamme Libellé gamme
Code gamme
Libellé gamme

Ventes journalières par gamme

Région Code région Région
Région
Code région
Région

Ventes mensuelles par région

Région Code région Région Ventes mensuelles par région Mois Id_mois Mois Année The tables « Ventes
Mois Id_mois Mois Année
Mois
Id_mois
Mois
Année

The tables « Ventes mensuelles par région », » ventes journalières par gamme », Gamme , Région et Mois are aggregates tables