Académique Documents
Professionnel Documents
Culture Documents
Ouvrages :
! Benitez-Guerrero E., C. Collet, M. Adiba, « Entrepôts de données : Synthèse et
analyse », Rapport de recherche IMAG N°IMAG-RR - 99-1017-I, 1999.
! Franco J-M., « Le Data Warehouse (Le Data Mining) ». Ed. Eyrolles, Paris,
1997. ISBN 2-212-08956-2
! Gardarin G., « Internet/intranet et bases de données », Ed. Eyrolles, 1999,
ISBN 2-212-09069-2.
! Han J., Kamber M., « Data Mining: Concepts and Techniques », Morgan
Kaufmann Publishers, 2004.
! Kimball R., M. Ross, « Entrepôts de données : guide pratique de modélisation
dimensionnelle », 2°édition, Ed. Vuibert, 2003, ISBN : 2-7117-4811-1.
!…
Cours :
! Cours de F. Bentayeb, O. Boussaid, J. Darmont, S. Rabaseda, Univ. Lyon 2
! Cours de P. Marcel, Univ. de Tours
! Cours de G. Gardarin, Univ. de Versailles
! Cours de M. Adiba et M.C. Fauvet, Univ. Grenoble
! …
Analyse des ventes de divers produits Analyse des ventes de divers produits :
SELECT modele, SUM(montant)
FROM ventes, produits
Exemple de questions associées : WHERE ventes.codeProduit = produits.codeProduit
GROUP BY modele ;
! Quels sont les produits dont les ventes ont chuté lʼan dernier?
! Quelles sont les quinze meilleures ventes par magasin et par semaine
durant le premier trimestre de lʼannée 2001?
! Quelle est la tendance des chiffres dʼaffaire (CA) par magasin depuis 3
ans?
Les ventes de vis sont plus faibles que prévu... Quels trimestres sont responsables ? Les ventes de vis sont plus faibles que prévu... Quels vendeurs sont responsables ?
SELECT couleur, trimestre, SUM(montant) SELECT vendeur, somme
FROM ventes, produits, temps FROM(
WHERE ventes.codeProduit = produits.codeProduit SELECT trimestre, vendeur, SUM(montant) as somme
AND ventes.date = temps.jour FROM ventes, produits, temps, vendeur
AND modele = “vis” WHERE ventes.codeProduit = produits.codeProduit
GROUP BY couleur, trimestre ; AND ventes.date = temps.jour
AND ventes.vendeur = vendeurs.nom
AND modele = “vis”
GROUP BY trimestre, vendeur)
WHERE trimestre = “jui-sep”;
De la table … … au cube
Table Ventes : Cube Ventes :
50
50
50
60
60
40
… … … … 1998 60
70 40 40
écrous total total 390
… … … … 1997
0 30
10 20
total total total 1200 30
20
2 – Opérations élémentaires
écrous régions
70
50
sud
50
50
années 1999 nord
60
50
60
40
OLAP
60
40
1998 60
70 40 40
1997
0 30
10 20
30
20
3 catégories dʼopérations élémentaires : Permettent un changement de points de vue, une réorientation selon
Restructuration : concerne la représentation, permet un changement de points de vue différentes dimensions de la vue multidimensionnelle
selon différentes dimensions : opérations liées à la structure, manipulation et visualisation du Opérations liées à la structure, la manipulation et la visualisation du cube :
cube : ! réorientation :
! Rotate/pivot ! sélection graphique
! Switch ! flexibilité du schéma
! Split, nest, push, pull ! membres complexes
Granularité : concerne un changement de niveau de détail : opérations liées au niveau de ! symétrie membres/mesures
granularité des données : ! manipulations :
! roll-up, ! bijectives
! drill-down ! relatives
Ensembliste : concerne lʼextraction et lʼOLTP classique : ! à niveau dʼinformation constant
! slice, dice Opérations de restructuration :
! selection ! rotate/pivot
! projection ! switch
! jointure (drill-across) ! split, nest, push, pull
70
régions
de
50
! consiste à inter-changer la position des membres dʼune dimension.
50
sud
50
années
lʼaxe/dimension
60
1999 nord
Split ou division : 50
60
régions
40
60
40
! consiste à présenter chaque tranche du cube et de passer dʼune présentation 1998
70
60
40 40
tridimensionnelle dʼun cube à sa présentation sous la forme dʼun ensemble de tables 1997 30
! sa généralisation permet de découper un hypercube de dimension 4 en cubes. 10
0
20
30 !
Nest ou lʼemboîtement : 20
Push ou lʼenfoncement :
! consiste à combiner les membres dʼune dimension aux mesures du cube, i.e. de
faire passer des membres comme contenu de cellules.
Switch ou permutation : consiste à interchanger la position des membres dʼune Split ou division : consiste à présenter chaque tranche du cube et de passer de sa
dimension : présentation tridimensionnelle à sa présentation sous la forme dʼun ensemble de tables.
vis
pièces est pièces vis
clous est
clous
écrous ouest ouest
70
70
50
50
50
sud sud
50
50
50
60
60
1999 nord 50
50
60
60
40
60
40
40
60
60
1998
40
60 70 40 40
1998
70 40 40 1997
0 30
10 20
1997
0 30 30
10 20 20
30 10
20 10
10 10
ici un split(region) du cube Ventes conduit aux 4 tables suivantes :
pièces vis
pièces vis
est
clous est
clous
écrous ouest ouest
régions
70
écrous régions
70
50
50
sud
50
sud
50
50
50
années 1999 nord années 1999
60
nord
60
50 50
60
60
40
40
60 60
40
40
1998 60 1998 60
70 40 40 70 40 40
1997
0 30 1997
0 30
10 20 10 20
30 30
20 20
10 10 10
10
Roll-up ou forage vers le haut: consiste à représenter les données du cube à un niveau roll-up(annee) : Ventes 97-99
de granularité supérieur conformément à la hiérarchie définie sur la dimension. pièces
clous
vis
est
70
régions
50
50
sud
50
vis années
60
pièces 1999 nord
est 50
60
pièces vis clous
20
40
est
clous ouest
160
écrous
régions 1998 60
70
60
ouest
écrous régions 40
220
70
sud
50
60
170
sud
50
1997 30
100
tout_temps 0
nord 10
50
0 20
10
années 1999
22
110
nord
60
50 30
60
60
tout_temps 20
00
60
0
22
40
60
1 11
40
10
1998 60 0 10
0
70 40 40 60 60 10 10 11
0
60 60
10 10
1997 30 10 10
0
10 20
30
20
Drill-down du niveau des régions au niveau villes : Drill-down(regions) : Objet des opérations ensemblistes :
! concernent lʼextraction
! manipulations classiques
! extension à plusieurs dimensions
slide : correspond à une projection selon dice : correspond à une sélection du cube : écrous ouest
régions pièces vis
est
70
projection
50
sud clous
50
20
une dimension du cube : ouest
50
160
années 1999 écrous
régions
150
nord
60
50
220
60
sud
40
170
60
50
40
60
100
1998 tout_temps
70 40 40 0
nord
22
110
10
dimension 3 3
60
3 1997 30 0
dimension 3 0
10
60
10 20
2 11
2 0
10
30
1 20 60 60
1
10 10
10 10
6
3 3
3 3
dimension 2 dimension 2
1
2
4
2
2
1
4
π piece, region :
2
1 9 1 9
1 1
2 5 2 5
7 1 7 1
1 1
3 3
dimension 1 2 2
dimension 1 2 2
3 1 3 1
Selection 1 Sélection 2
vente ≥ 50 (regions = nord ou regions = sud) et
(pieces = clous ou pieces = ecrous) et
pièces vis
est
(annees = 1998 ou années = 1999)
clous
écrous ouest
70
régions
=
50
50
sud
50
années
nord
pièces
60
1999
50 clous
60
sud régions
1998
60 60
écrous
70 nord
40
40
1997 années
0
10 1999
40
40
1998
20 20