Académique Documents
Professionnel Documents
Culture Documents
Cycle Ingénieur
Logiciel et Système Informatique
INFORMATIQUE DECISIONNELLE
Informatique Désisionnelle
DataWareHouse et Analyse OLAP
1
Contextes économique et informationnel actuel
Contexte économique
Mondialisation de l'économie, Concurrence accrue, Besoin dʼinformations
pour prises de décisions de plus en plus rapides
Contexte informationnel
Décentralisation des données, données volumineuses (méga-data) et
difficulté d'accès à l'information
Traitement et analyse de l’information: enjeu stratégique dʼentreprise, une
source de performance et de compétitivité
Contexte informatique
Puissance de calcul croissante
Capacité de stockage croissante
Bases de données de plus en plus importantes
SGBD de plus en plus performants (parallélisme, …)
Ouverture sur le Web, …
3
2
BI/ID
Modéliser le business
5
1992 : Bill Inmon, publie «Building the Data Warehouse» . 1st Edition.
Wiley and Sons.
3
L’informatique décisionnelle
Re fédérer les données pour que l’utilisateur puisse récupérer celles qui
l’intéresse dans son langage métier.
Applications
4
Exemple
Maintenant Passé
10
5
SID Vs SIO : Données
• OLTP :
– Les ventes par catégorie et par mois :
Mois /Catégorie Nettoyage Alimentation Vêtement Papeterie
Janvier 200.000 150.000 180.000 50.000
Février 180.000 140.000 250.000 55.000
Mars 220.000 155.000 100.000 48.000
…
• OLAP :
– Les ventes par catégorie, par magasin , par vendeur et par mois
11
Système d'
d'Info. de Production
Orientation : Gestion Système d'
d'Info. Décisionnel
Orientation : Pilotage
BD
BD
Fournisseurs
Flux de Clients
données
externes
BD
Compta
Entrepôt de
BD
DRH
Données
BD
Magasins
BD
Marketing BD
Produits
6
13
14
7
Composantes d’un SID
DataWareHouse, DataMart
Requêteur
Pilotage
DM Requêteur
ORACL
Sources de Données
E DataMart Pilotage
Bases de données
DW
H
Requêteur
SYBASE DataWareHouse
Pilotage Extract DM
DM Phase de Restitution
ORACL
E
DWH
Transform
Cubes
DM Data Mining
Cube
Excel
Load
Phase d’Analyse
16 Phase d’Alimentation
Phase de Modélisation
8
Gestion de projet décisionnel
17
Phase de Modélisation
18
9
DataWareHouse
Construit par:
– Nettoyage, transformation, intégration, chargement et
rafraîchissement périodiques des données
19
DataWareHouse - DataMart
20
10
Processus général de construction et exploitation
dʼun ED
Processus en 3 phases :
1 - Construction de la BD décisionnelle
Modélisation conceptuelle des données multiformes et multi-sources
Conception de lʼentrepôt de données
Alimentation de lʼentrepôt (extraire, nettoyer, transformer, charger)
Stockage physique des données
2 - Sélection des données à analyser
Besoins dʼanalyse de lʼutilisateur
Datamarts (Magasins de données)
Cubes multidimensionnels
Tableaux ou tables bidimensionnels
3 - Analyse des données
Stastiques et reporting, OLAP, Data Mining
21
Le modèle multidimensionnel
Le fait est analysé selon des perspectives, nommées dimensions. Chacune contient
une structure hiérarchique (niveaux). Une hiérarchie est composée de niveaux
("levels") correspondant à un des attributs de la base de données
la dimension « temps », par exemple, pourrait être divisée en années, trimestres,
mois, semaines, jours…
la dimension Store" est composée des niveaux "Country", "State", "City",
"Store_Name"
22
11
Schéma dʼune BD multidimensionnelle
Tables de faits:
Tables de dimension:
12
Modèle en étoile
25
Modèle en étoile
26
13
Modèle en flocon
27
Modèle en flocon
28
14
Modèle en constellation
29
30
15
Exemple: Prix Festivals de Cinéma
Table de dimension
•Awards
31
•Award categories
32
16
Exemple: Prix Festivals de Cinéma
Table de dimension
•Year
33
•Movie
34
17
Exemple: Prix Festivals de Cinéma
Table de dimension
•Winners(names)
35
•AwardCollectionFact
36
18
OLAP & BD multi-dimensionnelles
37
•Les bases de données opérationnelles relationnelles ne sont pas adaptées à l'OLAP car
les tables représentent une vue aplatie de structures naturellement multi-
dimensionnelles.
•Non seulement perte de performances mais aussi nécessité pour les utilisateurs de
savoir comment trouver les liens entre les tables pour recréer la vue multi-
dimensionnelle.
•Il est donc nécessaire de disposer d'une structure de stockage adaptée à l'OLAP, i.e.
permettant de
•visualiser les données dans plusieurs dimensions naturelles,
•de pouvoir définir et ajouter des dimensions facilement
•de manipuler les données ainsi représentées facilement et efficacement.
Bases de données multi-dimensionnelles ("Cube")
38
19
BD multidimensionnelle = hyper-cube
VENTES
M Clio
OD mesures
EL
E Jaguar
Tutu
Tata
Espace Titi
Toto
bleu blanc rouge
COULEUR dimensions
Cube multidimensionnel
40
20
Cube multidimensionnel
Gamme
Dimension Produit
Produit
Ventes
Magasin Ville Région Pays
Trimestre
Dimension Temps
Année
41
Cube multidimensionnel
42
21
La navigation dans un hypercube
44
22
Langage de requêtes
45
46
23
Comparaison entre SQL et MDX
En MDX :
– Nombre quelconque de dimensions pour former les résultats de la requête
48 – Terme d’axe pour éviter confusion avec les dimensions du cube
24
Requête MDX
49
Requête MDX
50
25
DatawareHouse/Cube
51
52
26
Requête MDX: Membre
27
Requête MDX: Tuple
SELECT
(
[Measures].[Unit Sales], [Product].[All Products].[Food].[Baked Goods]
)
ON COLUMNS
FROM [Sales]
55
ce set contient :
• 2 mesures différentes (Units sales et Store Sales) et
56 • le même membre (Baked Goods) :
28
TPs
57
29