Académique Documents
Professionnel Documents
Culture Documents
Plan
• C’est quoi le DATA WAREHOUSE?
• A quoi sert?
• Historique
• Concept du DW
• Architecture, Modalisation et Alimentation du DW
• Conclusion
2
Data warehouse
Le data Warehouse est une collection de
données orientées sujet, intégrées, non
volatiles et historiées, organisées pour
le support d’un processus d’aide à la
décision.
3
Objectifs
• Intégrer différentes bases de données
opérationnelles;
• Permettre l’accès aux informations historiées;
• Fournir des outils d ’analyse sur ces données;
• Résumer les données;
• Réconcilier des données inconsistantes.
4
Historique
5
Historique
6
Historique
• 1988 : Barry Devlin et Paul Murphy publient l'article "Une
architecture pour les systèmes d'information financiers" ("An
architecture for a business and information systems") où ils
utilisent pour la première fois le terme "Datawarehouse".
7
Historique
8
Historique
9
Historique
10
Historique
• 1996 : Ralph Kimball publie The Data Warehouse Toolkit (La boîte
à outils de l'Entrepôt de données).
11
Concept du Data Warehouse
• Orientées sujet
• Données intégrées
• Données non volatiles
• Données datées ou archivées historiées
• Données multidimensionnelles
12
Données orientées sujet :
13
Données intégrées :
14
Données non volatiles :
• Traçabilité des informations et des décisions prises
• Copie des données de production
Ajout
Suppression
Accès
Modification Chargement
15
Données datées :
• Les données persistent dans le temps
• Mise en place d’un référentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Répertoire Répertoire
Base de Nom Ville Nom Ville
production Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon
Calendrier Répertoire
Code Année Mois Code Année Mois
Entrepôt de 1 2005 Mai 1 Dupont Paris
données
2 2006 Juillet 1 Durand Lyon
2 Dupont Marseille 16
Données multidimensionnelles
17
DATAMART
18
19
ARCHITECTURE GÉNÉRALE
20
LES DIFFÉRENTES ZONES DE L’ARCHITECTURE
21
LES DIFFÉRENTES ZONES DE L’ARCHITECTURE
Zone de stockage:
22
LES DIFFÉRENTES ZONES DE L’ARCHITECTURE
Zone de présentation:
23
Modélisation
Data warehouse
MODÉLISATION DES ED
25
Table des faits
Clés étrangères
vers les dimensions
Faits
26
Table des dimensions
Clé de substitution
Attributs de la dimension
27
Types du modèle:
Modèle en étoile Modèle en flocon
28
Alimentation ED
29
ETL
30
Quelques solutions commerciales
31
Conclusion
32