-La conception des DWH sera aussi abordée à travers l’étude des modèles
en étoile, en flocons et en constellation.
2
Plan
Introduction
Les entrepôts de données
Les datamart
Architecture
Modélisation
Alimentation
3
Contexte
Besoin: prise de décisions stratégiques
Pourquoi: besoin de réactivité / Améliorer les performances décisionnelles de
l’entreprise
Qui: les décideurs (non informaticiens)
Comment: répondre aux demandes d’analyse des données, dégager des
informations qualitatives nouvelles
Pourquoi et
Qui sont mes
comment le
meilleurs
chiffre d’affaire a
clients?
baissé?
A combien
s’élèvent mes
ventes
journalières?
4
Les données utilisables par les
décideurs
6
Problématique
8
Problématique
Prise de
décisions
Entrepôt de
données
un data
warehouse
10
Une des solutions : Construire et
Exploiter un DW
11
Raisons d’être d’un entrepôt de données
12
Le processus de prise de décision
13
Le processus de prise de décision
Prise de
décision
14
Domaines d’utilisation des DW
Banque : prime plus précise
Santé : Risque alimentaire
Commerce : Ciblage de clientèle, Déterminer des promotions
Assurance : Risque lié à un contrat d’assurance (voiture)
Logistique : Adéquation demande/production
17
Plan
Introduction
Les entrepôts de données
Les datamart
Architecture
Modélisation
18
Définition d’un DW
W. H. Inmon (1996):
« Le data Warehouse est une collection de données
orientées sujet, intégrées, non volatiles et historisées,
organisées pour le support d’un processus d’aide à la
décision »
19
Définition d'un data warehouse
21
Les 4 caractéristiques des data
warehouse
Client
Police
22
Données orientées sujet :
Organisées autour de sujets majeurs comme
consommateur, produit, ventes
Données pour l’analyse et la modélisation en vue de l’aide
à la décision, et non pas pour les opérations et
transactions journalières
Vue synthétique des données selon des sujets intéressant
les décideurs
23
Les 4 caractéristiques des data
warehouse
2. Données intégrées :
Normalisation des données
Définition d’un référentiel unique
h,f
1,0 h,f
homme, femme
D
EUR
CHF
24
USD
Données intégrées :
Construit en intégrant des sources de données
multiples et hétérogènes
BD relationnelles, fichiers, enregistrements de transactions
Nettoyage et intégration des données
Consistence dans les noms des champs, le codage des
données issues de plusieurs sources
25
Les 4 caractéristiques des data
warehouse
Ajout
Suppression
Accès
Modification Chargement
26
Données non volatiles :
Stockage indépendant des BD opérationnelles
Pas de mises à jour des données dans le DW
2 actions sur le DW
Alimentation du DW à partir des données des BD opérationnelles
Accès (lecture) de ces données
27
Les 4 caractéristiques des data
warehouse
4. Données datées
Les données persistent dans le temps
Mise en place d’un référentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Répertoire Répertoire
Base de Nom Ville Nom Ville
production
Ali Paris Ali Marseille
Mohamed Lyon Mohamed Lyon
Calendrier Répertoire
Entrepôt Code Nom VilleVille
Code Année Mois Nom
de
1 2005 Mai 1 Dupont
Ali ParisParis
données
2 2006 Juillet 1 Durand LyonLyon
Mohamed
28
2 Ali Marseille
Données datées
29
SGBD & Datawarehouse
• OLTP
• OLAP
30
OLTP
SGBD traditionnels « We are data rich … »
applications commerciales
Fondements mathématiques
32
Les Processus OLTP
Sont
• interactifs et concurrents
• nombreux
• répétitifs et structurés
• simples
Et concernent
33
OLAP
« …but information poor »
Nourrir les systèmes d’aide à la décision (DSS) avec un
ensemble de BD
• Exploration et analyse de données historiques
35
Les Processus OLAP
Sont
• interactifs et concurrents
• peu nombreux
• non prévisibles
• complexes
Et concernent
36
SGBD et DW
H
I
Data Warehouse S
T
OLAP: On-Line O
Analytical R
Clientèle I
Processing
Q
U
37 E
OLTP VS DW
OLTP DW
Orienté transaction Orienté analyse
Orienté application Orienté sujet
Données courantes Données historisées
Données détaillées Données agrégées
Données évolutives Données statiques
Utilisateurs nombreux, Utilisateurs peu nombreux,
administrateurs/opérationnels manager
Temps d’exécution: court Temps d’exécution: long
38
Comparaison
39
1. OLTP et OLAP
Reports
&
Appli.
Appli. OLAP Analysis
Appli.
ETL
DW
OLTP
DM Aide à
la décision
40
Séparation physique
• Performances.
• Conservation de données.
• Systèmes de production différents.
41
Pourquoi dissocier une BD d’un ED?
42
43
44
Facteurs de succès d’un DW
Voici les caractéristiques le plus souvent associées à la
réussite d’un DW :
Des objectifs de progrès clairs
Des informations homogènes et consolidées
Des informations utiles
La garantie de la qualité des données (cohérentes, à jour,
documentées)
Un accès direct pour les utilisateurs
45
Plan
Introduction
Les entrepôts de données
Les datamart
Architecture
Modélisation
46
Datamart - Magasin de données
Datamarts du
service Marketing
Datamart du
DW de l’entreprise service Ressources
Humaines
47
Intérêt des datamart
48
Datamart - Magasin de données
49
Entrepôts et Data Marts
50
Comparaison entre data warehouse et Datamart
Data Datamart
warehouse
Entrepôts et Data Marts
52
Plan
Introduction
Les entrepôts de données
Les datamart
Architecture
Modélisation
53
Architecture générale
Zone de
Zone de préparation Zone de stockage présentation
E
X
C
T H
R A
Transformations: Data Requêtes
A R
Nettoyage warehouse Rapports
C G
T Standardisation Visualisation
E
I … Data Mining
M
O …
E
N
N
Sources de Datamart
T
données
54
Architecture générale
55
Architecture Fonctionnelle d’un DWH
56
Architecture Fonctionnelle d’un DWH :les
composants
57
Structure générale des données dans le DWH
58
Structure générale des données dans le DWH
59
Les flux de données
Flux entrant
Extraction: multi-source, hétérogène
Transformation : filtrer, trier, homogénéiser, nettoyer
Chargement : insertion des données dans l’entrepôt
Flux sortant :
Mise à disposition des données pour les utilisateurs finaux
60
Les différentes zones de l’architecture