Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Ouvrages :
Benitez-Guerrero E., C. Collet, M. Adiba, « Entrepôts de données : Synthèse et
analyse », Rapport de recherche IMAG N°IMAG-RR - 99-1017-I, 1999.
Franco J-M., « Le Data Warehouse (Le Data Mining) ». Ed. Eyrolles, Paris,
1997. ISBN 2-212-08956-2
Gardarin G., « Internet/intranet et bases de données », Ed. Eyrolles, 1
99
,ISBN 2-
212-09069-2.
Han J., Kamber M., « Data Mining: Concepts and Techniques », Morgan
Kaufmann Publishers, 2004.
Kimball R., M. Ross, « Entrepôts de données : guide pratique de modélisation
dimensionnelle », 2°édition, Ed. Vuibert, 2003, ISBN : 2-7117-4811-1.
…
Cours :
Cours de F. Bentayeb, O. Boussaid, J. Darmont, S. Rabaseda, Univ. Lyon 2
Cours de P. Marcel, Univ. de Tours
Cours de G. Gardarin, Univ. de Versailles
Cours de M. Adiba et M.C. Fauvet, Univ. Grenoble
…
problématique de lʼOLAP
exploitables, multidimensionnelles, consolidées
Analyse des ventes de divers produits Analyse des ventes de divers produits :
SELECT modele, SUM(montant)
FROM ventes, produits
Exemple de questions associées : WHERE ventes.codeProduit = produits.codeProduit
GROUP BY modele ;
Quels sont les produits dont les ventes ont chuté lʼandernier?
Quelles sont les quinze meilleures ventes par magasin et par semaine
durant le premier trimestre de lʼannée 2001?
Quelle est la tendance des chiffres dʼaffaire (CA) par magasin depuis 3
ans?
Les ventes de vis sont plus faibles que prévu... Quels trimestres sont responsables ? Les ventes de vis sont plus faibles que prévu... Quels vendeurs sont responsables ?
SELECT couleur, trimestre, SUM(montant) SELECT vendeur, somme
FROM ventes, produits, temps FROM(
WHERE ventes.codeProduit = produits.codeProduit SELECT trimestre, vendeur, SUM(montant) as somme
AND ventes.date = temps.jour FROM ventes, produits, temps, vendeur
AND modele = “vis” WHERE ventes.codeProduit = produits.codeProduit
GROUP BY couleur, trimestre ; AND ventes.date = temps.jour
AND ventes.vendeur = vendeurs.nom
AND modele = “vis”
GROUP BY trimestre, vendeur)
WHERE trimestre = “jui-sep”;
De la table … … au cube
Table Ventes : Cube Ventes :
2 – Opérations élémentaires
ouest
écrous
régions
sud
1998
1997
OLAP
Catégories dʼopérations OLAP
Opérations de restructuration : rotate, switch, split, nest, push, pull
Opérations de granularité : roll-up, drill-down
Terme Valeur
Cube Ventes Opérations ensemblistes : slide, dice, jointure(drill-across), data cube
Cellule ecrous, est, 1997, 100 Modèles et langages pour lʼOLAP
Référence ecrous, est, 1997 Les règles de Codd pour les produits OLAP
mesure 100
Problématique de la modélisation logique dʼunED
Membre/paramètre est
dimension lieu
niveau région
3 catégories dʼopérations élémentaires : Permettent un changement de points de vue, une réorientation selon
Restructuration : concerne la représentation, permet un changement de points de vue différentes dimensions de la vue multidimensionnelle
selon différentes dimensions : opérations liées à la structure, manipulation et visualisation du Opérations liées à la structure, la manipulation et la visualisation du cube :
cube :
réorientation :
Rotate/pivot sélection graphique
Switch flexibilité du schéma
Split, nest, push, pull membres complexes
Granularité : concerne un changement de niveau de détail : opérations liées au niveau de symétrie membres/mesures
granularité des données :
manipulations :
roll-up,
bijectives
drill-down
relatives
Ensembliste : concerne lʼextraction et lʼOLTP classique : à niveau dʼinformation constant
slice, dice Opérations de restructuration :
selection rotate/pivot
projection
switch
jointure (drill-across)
split, nest, push, pull
régions
consiste à présenter chaque tranche du cube et de passer dʼune présentation 1998
Nest ou lʼemboîtement :
imbrication des membres à partir du cube.
Permet de grouper sur une même représentation bi-dimensionnelle toutes les
informations (mesures et membres) dʼuncube quelque soit le nombre de ses
dimensions. la visualisation résultante est souvent 2D :
Push ou lʼenfoncement :
consiste à combiner les membres dʼunedimension aux mesures du cube, i.e. de
faire passer des membres comme contenu de cellules.
Switch ou permutation : consiste à interchanger la position des membres dʼune Split ou division : consiste à présenter chaque tranche du cube et de passer de sa
dimension : présentation tridimensionnelle à sa présentation sous la forme dʼunensemble de tables.
vis
pièces est pièces vis
clous est
clous
écrous ouest ouest
écrous régions
régions
sud
sud
années années 1999 nord
1999 nord
1998
1998
1997
1997
pièces vis
est pièces vis
clous est
clous
ouest ouest
écrous régions écrous régions
sud sud
1998 1998
1997 1997
Roll-up ou forage vers le haut: consiste à représenter les données du cube à un niveau roll-up(annee) : Ventes 97-99
de granularité supérieur conformément à la hiérarchie définie sur la dimension. pièces vis
est
c lo us
o ue s t
Soit : é c r o us
régions
s ud
années
pièce s vi s 1999 no rd
est
pièces vis clous
est
clous o u e st
é c r o us 1998
ouest régions
écrous régions sud
sud 1997
tout_tem ps nord
années 1999 nord
t o u t _ t e mp s
1998
1997
Drill-down du niveau des régions au niveau villes : Drill-down(regions) : Objet des opérations ensemblistes :
concernent lʼextraction
manipulations classiques
extension à plusieurs dimensions
slide : correspond à une projection selon dice : correspond à une sélection du cube : écrous
ouest
régions pièces vis
est
sud projection clous
dimension 3 3 1997
dimension 3 3
2
2
1 1
3 3
dimension 2 dimension 2
2 2 πpiece, region :
1 1
1 1
3 3
dimension 1 2 2
dimension 1 2 2
3 1 3 1
Selection 1 Sélection 2
vente ≥ 50 (regions = nord ou regions = sud) et
(pieces = clous ou pieces = ecrous) et
pièces vis (annees = 1998 ou années = 1999)
est
clous
ouest
écrous
régions
sud =
années
1999 nord
pièces
clous
sud régions
écrous
1998
nord
1997 années
1999
1998