Académique Documents
Professionnel Documents
Culture Documents
développement et
exploitation des entrepôts
de données spatiales
Sboui Tarek
L’entrepôt : Contexte
à traiter
Synthétiser / résumer
Visualiser
Analyser
1
L’entrepôt : Contexte
L’entrepôt : Contexte
2
L’entrepôt de donnés (ED) : Définition
Data Cube
3
Data Cube (SOLAP Cube ou, BD
multidimensionnelle )
Cube - Concepts
4
Cube - Concepts
Dimension (1)
10
5
Dimension (2)
11
Hiérarchie (1)
12
6
Hiérarchie (2)
13
Granularité (1)
14
7
Granularité (2)
15
Fait
16
8
Mesure
17
Clés
18
9
Modélisation
Faits
Il est formé de mesures correspondant aux données analysées.
Dimensions
Le contexte d’analyse
19 19
20
10
Modèle en étoile (2)
21
22 22
11
Modélisation : Modèle en constellation
23
24
12
Niveau logique
25
ROLAP (1)
26
13
ROLAP (2)
27
MOLAP (1)
28
14
MOLAP (2)
29
HOLAP (1)
30
15
HOLAP (2)
31
Exercice
L’ED doit fournir le chiffre d’affaires des ventes d’un produit, par
région, date, client, et vendeur, ainsi que toutes les sommations
possibles de chiffre d’affaires dans une année donnée.
Une vente est caractérisée par: région, produit, client, vendeur,
date, prix de vente
Région: code région, nom, coordonnées, geometrie
• 3 niveaux : Region, Ville et Municipalite
Produit : code produit, code famille, libellé
• 2 niveaux : Categorie et Detail-produit
Client : code client, type client
Vendeur : code vendeur, nom, code service
Date :
• 3 niveaux : Annee, Mois et Semaine 34
16
Exercice 1 : On veut analyser la performance de coureurs qui se préparent à des
compétitions sportives à travers les entrainements. Un entrainement consiste à
effectuer plusieurs tours d'un terrain. Un coureur est performant s'il fait beaucoup
de tours de terrain et s'il réalise un temps moyen minimal par tour. Les
entrainements se font dans plusieurs terrains de plusieurs villes où chaque
terrain appartient à une seule ville. Chaque terrain est caractérisé par une
adresse et par une superficie. Chaque coureur possède un nom, un prénom et
une date de naissance et il appartient à un groupe possédant une date de
création. Aussi, chaque coureur peut être classé dans l'une de deux catégories
désignées par «A» si l'âge est compris entre 18 et 40 ans et par «B» si l'âge est
supérieur à 40 ans. Enfin, on veut analyser les entrainements par jour, par mois
et par année.
1. Représenter le schéma en étoile.
2. Transformer le schéma précédent en schéma en flocon.
35
17
SOLAP - Exploitation d’une base
multidimensionnelle
Exemple de BD
» Produit(GENCOD, Designation, Marque, Nature, PrixAchat,
PrixReventeConseille)
» Vente (GENCOD, NMAG, Date, Qte, PrixVente)
» Magasin(NMAG, Enseigne, Adresse, Ville, Dept)
» Nat2Cat(Nature, Categorie)
» Cat2Ray(Categorie, Rayonnage)
» Dep2Reg(Dept, Region)
37
38
18
SOLAP - Exploitation d’une base
multidimensionnelle
par région et par catégorie et par année
» select region, categorie, semestre(date), sum(qte*prixvente) from
vente, produit, magasin, dep2reg, nat2cat where produit.GENCOD =
vente.GENCOD and vente.NMAG = magasin.NMAG and produit.nature
= nat2cat.nature and magasin.dept = dep2reg.dept
group by region, categorie, year(date)
Remarque : year(date) n’est pas toujours disponible
Analyse multidimensionnelle
Objectif
» obtenir des informations déjà agrégées selon les besoins de
l’utilisateur : simplicité et rapidité d’accès
Analyse multidimensionnelle
» capacité à manipuler des données qui ont été agrégées selon
différentes dimensions
ex. : analyse des ventes /catégorie de produit 1 dim.
+ /année 2 dim.
+ /département commercial 3 dim.
+ / zone géographique 4 dim.
.... 40
19
Analyse multidimensionnelle - SOLAP
41
But
» Visualisation/Utilisation d'un fragment de la base
multidimensionnelle (le cube)
Opérations OLAP
» Drill-Up / Drill-Down
» Rotate
» Slicing
» Scoping
42
20
43
21
Analyse multidimensionnelle - SOLAP
Opérations - Rotate
Temps Temps
Produit Region
46
22
Analyse multidimensionnelle - SOLAP
Opérations - Scoping
Produit Region Date
Consiste à ne
travailler que sur un
sous-cube. On
s'intéressera alors
seulement à une
partie des données.
Il s’agit de spécifier
un (ou plusieurs)
membres de plus
d’une dimension 47
48
23
Références
49
24