Vous êtes sur la page 1sur 32

Présentation sous Thème:

Plan
• C’est quoi le DATA WAREHOUSE?
• A quoi sert?
• Historique
• Concept du DW
• Architecture, Modalisation et Alimentation du DW
• Conclusion

2
Data warehouse
Le data Warehouse est une collection de
données orientées sujet, intégrées, non
volatiles et historiées, organisées pour
le support d’un processus d’aide à la
décision.

3
Objectifs
• Intégrer différentes bases de données
opérationnelles;
• Permettre l’accès aux informations historiées;
• Fournir des outils d ’analyse sur ces données;
• Résumer les données;
• Réconcilier des données inconsistantes.

4
Historique

• Années 1960 : Genral Mills et l‘Université Dartmouth, dans un projet


conjoint, créent les termes "faits" et "dimensions".

5
Historique

• 1983 : Teradata introduit dans sa base de données


managériale un système exclusivement destiné à la prise de
décision.

6
Historique
• 1988 : Barry Devlin et Paul Murphy publient l'article "Une
architecture pour les systèmes d'information financiers" ("An
architecture for a business and information systems") où ils
utilisent pour la première fois le terme "Datawarehouse".

7
Historique

• 1990 : Red Brick Systems crée Red Brick Warehouse, un système


spécifiquement dédié à la construction de l'Entrepôt de données.

8
Historique

• 1991 : Bill Inmon publie Building the Data Warehouse (Construire


l'Entrepôt de Données).

9
Historique

• 1995 : Le Data Warehousing Institute, une organisation à but lucratif


destinée à promouvoir le datawarehousing, est fondé.

10
Historique

• 1996 : Ralph Kimball publie The Data Warehouse Toolkit (La boîte
à outils de l'Entrepôt de données).

11
Concept du Data Warehouse

• Orientées sujet
• Données intégrées
• Données non volatiles
• Données datées ou archivées historiées
• Données multidimensionnelles

12
Données orientées sujet :

• Regroupe les informations des différents métiers


• Ne tiens pas compte de l’organisation fonctionnelle des données

13
Données intégrées :

• Normalisation des données


• Définition d’un référentiel unique

14
Données non volatiles :
• Traçabilité des informations et des décisions prises
• Copie des données de production

Bases de production Entrepôts de données

Ajout
Suppression

Accès
Modification Chargement

15
Données datées :
• Les données persistent dans le temps
• Mise en place d’un référentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Répertoire Répertoire
Base de Nom Ville Nom Ville
production Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon

Calendrier Répertoire
Code Année Mois Code Année Mois
Entrepôt de 1 2005 Mai 1 Dupont Paris
données
2 2006 Juillet 1 Durand Lyon
2 Dupont Marseille 16
Données multidimensionnelles

• présentées selon différents axes d'analyse ou « dimensions »

17
DATAMART

Sous-ensemble d’un entrepôt


de données

18
19
ARCHITECTURE GÉNÉRALE

Préparation Stockage Présentation

20
LES DIFFÉRENTES ZONES DE L’ARCHITECTURE

Zone de préparation (Staging area) :

• Zone temporaire de stockage des données extraites


• Réalisation des transformations avant l’insertion dans le DW:
• Nettoyage Normalisation…

21
LES DIFFÉRENTES ZONES DE L’ARCHITECTURE

Zone de stockage:

• Stockage permanent des données.

22
LES DIFFÉRENTES ZONES DE L’ARCHITECTURE

Zone de présentation:

• Donne accès aux données contenues dans le DW .

23
Modélisation
Data warehouse
MODÉLISATION DES ED

• Table des faits

• Table des dimensions

25
Table des faits

• Contient les données observables (les faits) sur le sujet


étudié selon divers axes d’analyse (les dimensions)

Clés étrangères
vers les dimensions

Faits

26
Table des dimensions

• Contient le détail sur les faits

Clé de substitution

Attributs de la dimension

27
Types du modèle:
Modèle en étoile Modèle en flocon

28
Alimentation ED

• Besoin d’un outil permettant d’automatiser les chargements dans


l’entrepôt:

29
ETL

Extraction Transformation Chargement

30
Quelques solutions commerciales

31
Conclusion

32

Vous aimerez peut-être aussi