Académique Documents
Professionnel Documents
Culture Documents
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 1 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 2
Ouvrages :
! Benitez-Guerrero E., C. Collet, M. Adiba, « Entrepôts de données : Synthèse et
analyse », Rapport de recherche IMAG N°IMAG-RR - 99-1017-I, 1999.
! Vaisman A., Zimányi E., « Data Warehouse Systems: Design and
Implementation », Springer-Verlag, 2014, ISBN 978-3-642-54654-9.
! Golfarelli M., Rizzi S., « Data Warehouse Design : Modern Principles and
Methodologies », McGrawHill, 2009.
! Kimball R., Ross, M., « Entrepôts de données : guide pratique de modélisation
dimensionnelle », 2°édition, Ed. Vuibert, 2003, ISBN : 2-7117-4811-1.
1 – Introduction aux systèmes
Cours : OLAP
! Cours de F. Bentayeb, O. Boussaid, J. Darmont, S. Rabaseda, Univ. Lyon 2
! Cours de P. Marcel, Université de Tours ! Caractéristiques des produits OLAP
! Cours de G. Gardarin, Université de Versailles
! Cours de M. Adiba et M.C. Fauvet, Université Grenoble ! Différents types de systèmes OLAP
! Cours de H. Garcia-Molina, Stanford Universitry.
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 3 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 4
En 1993 Codd définit les bases du modèle OLAP : 12 règles de Codd L’acronyme FASMI (Fast Analysis of Shared Multidimensional Information) permet de
résumer la définition des produits OLAP (http ://www.olapreport.com/fasmi.htm,
définissent l’évaluation des produits OLAP :
The OLAP Report - 2004) :
1. Vue multidimensionnelle : Une base OLAP offre une vue multidimensionnelle des
données • Fast : temps de réponse aux demandes des utilisateurs entre 1 et 20 secondes :
2. Transparence: éléments techniques mis en œuvre invisibles pour l’utilisateur utilisation dans les produits OLAP de pré-calculs pour réduire les durées des
3. Accessibilité: la complexité et l’hétérogénéité des données sont masquées par les requêtes,
outils OLAP • Analysis : faire face à toutes les logiques d’affaire et de statistiques, ainsi que
4. Stabilité: performances stables indépendamment du contexte d’analyse fournir la possibilité aux utilisateurs de construire leurs calculs et leurs analyses
5. Architecture Client/Serveur : le coté serveur a en charge l’homogénéisation des sans avoir à programmer : outils fournis avec les produits OLAP
données, les clients se connectent simplement au serveur
• Shared : le système doit créer un contexte où la confidentialité est préservée et
6. Traitement générique des dimensions : une seule structure logique pour toutes les
dimensions. Tout calcul effectué sur une dimension peut l’être sur les autres
doit gérer les cas où plusieurs utilisateurs ont des droits en écritures (plutôt une
7. Gestion dynamique des matrices creuses : gestion dynamique de la mémoire
faiblesse des produits OLAP actuels)
physique nécessaire pour stocker les données non nulles • Multidimensional : caractéristique majeure, les produits OLAP doivent fournir des
8. Support multi-utilisateurs : gestion des accès concurrents aux données vues conceptuelles multidimensionnelles des données et supporter des
9. Croisement des dimensions hiérarchies de dimensions
10. Manipulation intuitive des données • Informations : ensemble des données et les informations nécessaires pour un
11. Flexibilité des restitutions produit OLAP.
12. Nombre illimité de niveaux d’agrégations et de dimensions
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 5 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 6
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 7 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 8
! les SGBD relationnels représentant plus de 80% des SGBD : c’est la
stratégie la plus couramment utilisée pour implanter un ED
! les SGBD relationnels doivent cependant être adaptés car ils n’ont pas les
2 – Systèmes ROLAP caractéristiques adéquates pour répondre aux besoins des ED :
! Extensions du langage SQL à de nouveaux opérateurs
! Stratégie ROLAP d’implantation d’un ED ! Usage de vues matérialisées
! Modèles logiques d’un ED « ROLAP »
! Indexation binaire pour améliorer les performances
! Introduction à la technologie ROLAP
! Techniques d’indexation ROLAP !…
! Sélection et matérialisation des vues en Rolap
! ils réalisent des calculs de données dérivés et agrégations à différents
! Fragmentation des tables
niveaux
! Forces et faiblesses de la technologie ROLAP
! Quelques produits de technologie ROLAP ! ils génèrent des requêtes adaptées au schéma relationnel de l’ED et tirent
profit des vues matérialisées existantes (facteur principal de performance)
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 9 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 10
année
typeProduit
• chaque dimension correspond à une table, appelée table de trimestre
saison
année
région
gamme
nomProduit
dimension. mois
jour
typProduit
quantité
couleur
montant
Ainsi :
• la table de fait est constituée :
! d'attributs représentant les mesures d'activité et GEOGRAPHIE
région
! les attributs clés étrangères de chacune des tables de dimension. département
ville
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 11 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 12
! un SGBR relationnel est utilisé pour stocker l’ED (en étoile ou flocon)
! Systèmes ROLAP = technologie de stockage relationnelle
! le moteur OLAP est un élément complémentaire qui :
! fournit une vision multidimensionnelle de l’ED, ! Le modèle relationnel demande des extensions pour supporter
! fait des calculs de données dérivés et des agrégations à différents les requêtes d’analyses multidimensionnelles du niveau
niveaux d’application :
! génère des requêtes SQL adaptées au schéma relationnelle de l’ED en
profitant de vues matérialisées existantes ! Extensions du langage SQL :
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 13 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 14
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 15 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 16
Inverted Lists
listesinversées
listes inversées(inverted
(invertedlists)
lists): : Exempled’utilisation
Exemple d’utilisation::
18
19 !!Requête
Requête::
r4 rId name age GET people
people WITH
WITH age
age == 20
20 AND
AND name
name == ‘’Fred’’
‘’Fred’’
r4 joe 20
GET
20 r18
20 r34 r18 fred 20
23
21 r35 r19 sally 21 !!Soit
SoitL1
L1==liste
listepour
pourattribut
attribut««age
age==20
20 »» :: {r4,
{r4, r18,
r18, r34,
r34, r35}
r35}
22 r34 nancy 20
r35 tom 20 !!Soit
SoitL2
L2==liste
listepour
pourattribut
attribut««name
name== Fred
Fred »» :: {r18,
{r18, r52}
r52}
r5
r36 pat 25
r19
23 r5 dave 21
r37
25 r41 jeff 26
26
r40 !!Réponse
Réponseààla
larequête
requête::
...
c’estl’intersection
c’est l’intersectionde
deL1
L1avec
avecL2
L2 ::
indexationbinaire
binaire==index
indexde
devecteurs
vecteursde
debits
bits==bitmap
bitmapindex
index Intérêtsde
Intérêts del’indexation
l’indexationbinaire
binaire ::
indexation
!! opérations
opérationssursurles
lesbits
bitstrès
trèsrapides
rapides(AND,
(AND,OR,
OR,XOR,
XOR, NOT)NOT)
Principegénéral
Principe général: :
!! permet
permetl’optimisation
l’optimisationde derequêtes
requêtesdedetypes
typessélection,
sélection, comparaison,
comparaison, jointure,
jointure,
! !dans
dansune unetable,
table,ununindex
indexassocie,
associe,pourpourchaque
chaquevaleur
valeurpossible
possibled’un
d’un agrégation…
agrégation …
attribut (ou groupe d’attributs), la liste des tuples
attribut (ou groupe d’attributs), la liste des tuples contenant cettecontenant cette !! un
unvecteur
vecteurde
debits
bitspour
pourchaque
chaquevaleur
valeurd’attribut
d’attribut
valeur
valeur ! la longueur du vecteur de bits = nb de tuplesdedelala table
table
! la longueur du vecteur de bits = nb de tuples
! !un indexbinaire
unindex binaireutilise
utiliseununvecteur
vecteurde debits
bitspour
pourreprésenter
représenterune
unetelle
telle !! plus
pluscompact
compactquequeles
lesBBarbres
arbres
liste : chaque tuple d’une table est associé à un bit qui prend la valeur : :
liste : chaque tuple d’une table est associé à un bit qui prend la valeur
! !11sisileletuple
tupleassocié
associéfaitfaitpartie
partiededelalaliste
listeou Inconvénientsde
Inconvénients del’indexation
l’indexationbinaire
binaire ::
! !00dans
danslelecascascontraire
contraire !! lelecoût
coûtde
demaintenance
maintenancepeut peutêtre
êtreimportant
importantcar cartous
tous les
les index
index binaires
binaires d’une
d’une
table doivent être actualisés lors de l’insertion d’un nouveau tuple dans la table
! !index
indexbinaire
binaire==structure
structurede detaille
tailleréduite
réduitequi
quipeut
peutêtreêtregérée
géréetotalement
totalement table doivent être actualisés lors de l’insertion d’un nouveau tuple dans la table
en mémoire centrale améliorant les performances des SGBDR ! espace important pour leur stockage : cependant
! espace important pour leur stockage : cependant vecteurs avecvecteurs avec
en mémoire centrale améliorant les performances des SGBDR principalementdes
desbits
bitsde
devaleur
valeur0,0,d’où
d’oùusage
usagededetechniques
techniques de de compression
compression
! indexationadaptée
! indexation adaptéelorsque
lorsquelelenombre
nombrede devaleurs
valeurspossibles
possiblesd’un
d’un principalement
(run-lengh encoding)
(run-lengh encoding)
attribut est
attribut est faiblefaible
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 19 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 20
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 19 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 20
Bit Maps
D’après H. Garcia-Molina
D’après H. Garcia-Molina
Exemple : soit le cube Ventes :
Exemple : soit le cube Ventes :
18 1
19 1
0
1 id name age
1 1 joe 20
20 2 fred 20
20 0
23 0
3 sally 21
21 0 0
22 0 4 nancy 20 index Bitmap associés :
1
0 0
5 tom 20 index Bitmap associés :
6 pat 25
23
0
7 dave 21
Index Bitmap sur l’attribut produit : Index Bitmap sur l’attribut ville :
0 Index Bitmap sur l’attribut produit : Index Bitmap sur l’attribut ville :
25 8 jeff 26
1
26
0
...
1
1
age bit data
index maps records
(d’aprèsH.H.Garcia-Molina)
(d’après Garcia-Molina)
SystèmesOLAP
Systèmes
OLAP: :ROLAP,
Systèmes OLAP
ROLAP,MOLAP
MOLAP et HOLAP
et HOLAP
: ROLAP, MOLAP
- Bernard
- Bernard
et HOLAP
ESPINASSE
ESPINASSE
- Bernard - -
ESPINASSE
- 2525 25 Systèmes
Systèmes
SystèmesOLAP
OLAP : ROLAP,etMOLAP
OLAP: ROLAP,
: ROLAP,MOLAP
MOLAP etHOLAP
et HOLAPESPINASSE
HOLAP- -Bernard
- Bernard ESPINASSE -
Bernard ESPINASSE- - 26 26
Exemple
Exemple dede
Exemple
de Cube
Cube ««Ventes
Cube «Ventes» »avec
Ventes » avec tous
tous
tous les
les
les agrégats
agrégats
agrégats possibles
possibles
possibles :: : Cube
Cube
Cube = treillis
==treillis
treillis de Cuboïdes
deCuboïdes
de Cuboïdes:: :
TV TV Q1 Q1
ALL ALL
0-D cuboïde
0-D cuboïde
200
200
product
product DVD
DVD
Q2 Q2
CDCD datedate
100
100
sum
sum Q3 Q3
200
Annual sales of
200
Annual sales of
TV in France
Q4 TV in France
Q4
300
300
sum
sum
800
800
2-D cuboïde
Italy date, country 2-D cuboïde
Italy date, product date, country product, country
date, product product, country
sum
sum
3-D cuboïde
Annual sales of all
products in all countries 3-D cuboïde
Annual sales of all date, product, country
products in all countries sum, sum, sum (ALL, ALL, ALL)
date, product, country
sum, sum, sum (ALL, ALL, ALL)
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 31 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 32
! La requête Q1 : ! Afin d’optimiser les requêtes OLAP , on peut fragmenter les tables du
SELECT modele, annee, departement, SUM(prix)
FROM ventes, vendeur, temps schéma en étoile :
WHERE ventes.vendeur = vendeur.nom
AND ventes.date = temps.jour ! Découpage des tables du schéma en étoile :
GROUP BY modele, annee, departement
peut être traitée par : ! Par fragmentation horizontale : par sélection
SELECT modele, annee, departement, SUM(prix)
FROM ventesVue1, vendeur, temps ! Par fragmentation verticale : par projection
WHERE ventesVue1.ville = vendeur.ville
AND ventesVue1.mois = temps.mois ! Les requêtes sont évaluées sur chaque fragment
GROUP BY modele, annee, departement
! La requête Q1 : ! L’obtention de la réponse nécessite une requête de reconstruction :
SELECT modele, couleur, date, SUM(prix)
FROM ventes ! Par union pour la fragmentation horizontale
GROUP BY modele, couleur, date
Q3 ne peut être traitée ni via ventesVue1, ni via ventesVue2 : ! par jointure pour la fragmentation horizontale
• grain des vues trop gros
• ventesVue2 ne regroupe pas par couleur
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 33 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 34
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 35 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 36
SQL Server 2000 :
! Offre Microsoft
! il supporte le concept de « fédération » de bases de données
relationnelles (shared nothing database), et la liaison entre bases de
données distribuées et hétérogènes
! il dispose d’une gamme d’outils, notamment : 3 – Systèmes MOLAP
! L’optimiser de SQL Server : basé sur les coûts avec création automatique de
statistiques et leur rafraîchissement ! Introduction à la technologie MOLAP
! Le Query Processor : supporte des requêtes multidimensionnelles, ainsi que les
index composites et semi-jointures.
! Techniques de stockage
! Le SQL Query Analyzer : peut faire des suggestions par rapport à l’implantation ! Densité et compression
des index additionnels et des statistiques complémentaires. ! Agrégation et calcul des agrégats
! Microsoft DTS (Data Transformation Services) : outil ETL intégré dans Microsoft
! Forces et faiblesses de la technologie MOLAP
SQL Server.
! Quelques produits de technologie MOLAP
Autres produits :
! Sybase IQ, DSS Agents de MicroStrategy, MetaCube de Informix, …
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 37 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 38
! Utilise un SGBD Multidimensionnel (SGBDM) capable de stocker et ! MOLAP permet de stocker les données de manière multidimensionnelle
traiter des données multidimensionnelles
! A ce jour pas de cadre technologique commun pour ces systèmes : ! Le calcul des agrégats dans un tel tableau se fait en colonne ou en ligne
chaque produit a sa version du modèle multidimensionnel et ses et est par conséquent très rapide : Pas de jointure à faire
stratégies de stockage
! Taille limitée
! ont des bonnes performances du fait qu’ils effectuent la pré-agrégation
et le pré-calcul des données sur tous les niveaux des hiérarchies du ! Pas de langage d’interrogation des données : nécessité de redéfinir
modèle de l’entrepôt les opérations de manipulation de structures multidimensionnelles
! génèrent de très grands volumes d’information,
Intérêt : les temps d'accès sont optimisés,
! les techniques incrémentales de rafraîchissement associées sont
encore limitées, conduisant à reconstruire périodiquement l’ED Inconvenient : nécessite de redéfinir des opérations pour manipuler ces
structures multidimensionnelles.
! sont adaptés à de petits ED (quelques Go) et lorsque le modèle
multidimensionnel ne change pas beaucoup
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 39 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 40
! un SGBD Multidimensionnel est utilisé pour stocker l’ED :
Technologie des bases de données multidimensionnelles :
! structure de stockage = tableaux
! correspondance directe avec la vue multidimensionnelle
Bases de OLAP
intégration ! les membres sont implicites :
données
SGBD Multidimensionnel
Gestion de la faible densité (sparsity) :
! techniques de compression spécifiques
! les systèmes MOLAP réalisent des pré-agrégations et des pré-culculs de ! structure d’index spécifiques
données sur tous les niveaux de hiérarchies des dimensions de l’ED
! si le tableau est dense, la mémoire ne contiendra que les mesures
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 41 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 42
(D’après P. Marcel)
Exemple de tableau MOLAP :
! 1460 jours
5
! 200 000 produits (2x10 )
2
! 300 magasins (3x10 )
! promotion : 1 valeur booléenne (2)
Nombres de cellules du cube :
5 2 11
1460 x 2x10 x 3x10 x 2 = 1,75 × 10 cellules
Densité du cube :
! seulement 10% de produits vendu par jour :
10 11
! densité = 1,75 × 10 /1,75 × 10 = 0,1
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 43 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 44
(D’après P. Marcel) • Typiquement, jusqu’à 90 % de cellules vides
• Stocker les données en blocs denses, pour cela on utilise des techniques
de compression (similaires pour certaines à celles utilisées en relationnel)
• Ces techniques fonctionnant bien pour 2 ou 3 dimensions échouent en
implantation “row major” 20 dimensions :
Exemple :
a[2][3][4] avec 3 dimensions de 8, 9 et 10 membres :
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 45 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 46
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 47 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 48
Datawarehouse and OLAP
MOLAP
aggregation
(D’après P. Marcel) minimiser le nombre de visite par cellule dans le calcul d’agrégats : exploiter
(D’après P. Marcel) minimiser le nombre de visite par cellule des
dans le calculpartiels
d’agrégats : exploiter
l’ordre de visite pour calculer simultanément agrégats (réduction des
l’ordre de visite pour calculer simultanément des agrégats partiels (réduction des
accès mémoire et des coûts de stockage)
accès mémoire et des coûts de stockage)
Exemple :
Exemple :
• cube à 3 dimension A, B, C
• cube à 3 dimension A, B, C
• tailles :
• tailles :
taille
taille
A 40
A 40
B 400
B 400
B 4000
B 4000
BC 1 600 000
BC 1 600 000
AC 160 000
AC 160 000
AB 16 000
AB 16 000
• dimensions partitionnées en 4 sous-cubes de même taille
• dimensions partitionnées en 4 sous-cubes de même taille
scan dans l’ordre 1, 2, 3, ..., 64 (BC, AC, AB) :
scan dans l’ordre 1, 2, 3, ..., 64 (BC, AC, AB) :
! le calcul de b0c0 demande 4 scans (1, 2 , 3 , 4)
! le calcul de b0c0 demande 4 scans (1, 2 , 3 , 4)
! le calcul de a0c0 demande 13 scans ( 1, 5, 9, 13)
! le calcul de a0c0 demande 13 scans ( 1, 5, 9, 13)
!! lelecalcul
calculde
dea0b0
a0b0demande
demande 49 49 scans
scans (1,
(1, 17,
17, 33,
33, 49)
49)
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 49 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 50
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 49 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 50
Datawarehouse and OLAP Datawarehouse and OLAP
MOLAP MOLAP
aggregation
aggregation
Systèmes OLAP
Systèmes : ROLAP,
OLAP MOLAP
: ROLAP, et HOLAP
MOLAP - Bernard
et HOLAP ESPINASSE
- Bernard - -
ESPINASSE 51
51 Systèmes
SystèmesOLAP
OLAP: ROLAP,
: ROLAP,MOLAP
MOLAPetetHOLAP
HOLAP- -Bernard
BernardESPINASSE
ESPINASSE- - 52
• Occupation mémoire minimum : Coût MOLAP des opérations typiques :
16000 AB
+ 10 × 4000 une colonne de AC
+ 100 × 1000 un sous-cube de BC
= 156 000
• Scan dans l’ordre 1, 17, 33, 49, 5, 21, ... (AB, AC, BC)
le calcul de b0c0 demande 49 scans
le calcul de a0c0 demande 13 scans
le calcul de a0b0 demande 4 scans
• Occupation mémoire minimum :
1 600 000 BC
+ 10 × 4000 une colonne de AC
+ 10 × 100 un sous-cube de AB
= 1 641 000
• Méthode (valable pour un petit nombre de dimensions) :
les cuboïdes doivent être calculés par taille croissante (D’après P. Marcel)
garder le plus petit cuboïdes en mémoire principale
rechercher et calculer seulement un sous-cube à la fois pour le plus grand
cuboïde
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 53 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 54
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 55 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 56
Informix MetaCube (Informix) :
! SGBD multidimensionnel
! il dispose d’une gamme d’outils, notamment :
! MetaCube Analysis Engine : Il fournit une interface multidimensionnel et étend la
fonctionnalité d’analyse de la base de données avec l’incorporation des
opérations OLAP, par exemple l’opération rotation (rotate).
! MetaCube Explorer : C’est une interface graphique qui permet aux utilisateurs
d’exécuter des requêtes au travers du MetaCube Analysis Engine.
! MetaCube Warehouse Manager : C’est une interface graphique pour créer une
4 – Systèmes HOLAP
description multidimensionnelle des tables et des colonnes dans l’entrepôt de
données.
! Introduction à la technologie HOLAP
! MetaCube Analysis Engine : stocke cette description multidimensionnelle
comme un ensemble de tables. ! Quelques produits de technologie HOLAP
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 57 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 58
Dans l’approche relationnelle (ROLAP) : ! Stratégie hybride : tire profit des avantages des technologies
ROLAP et MOLAP en utilisant :
! 30% du temps est consacré aux entrées/sorties
! un SGBD Relationnel pour stocker, gérer les données
Dans l’approche multidimensionnelle (MOLAP) : détaillées
! 20% du temps est consacré aux entrées/sorties ! un SGBD Multidimensionnel pour stocker, gérer les
données agrégées
(70% calculs et 10% décompression)
! Permettent :
L’approche HOLAP (Hybride OLAP) : ! de gérer de très grandes quantités de données
! consiste à utiliser les tables comme structure permanente de ! d’avoir des temps de réponses acceptables en analyse
stockage des données OLAP
! et les tableaux comme structure pour les requêtes. ! Produits : Express d’Oracle, Media/MR de Speedware, Holos de
Seagate Technology, …
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 59 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 60
! De nombreux systèmes commerciaux utilisent l’approche HOLAP :
! Les systèmes HOPAL essaient de combiner les bons cotés des
systèmes ROLAP et MOLAP : ! ils manipulent les informations de l’entrepôt de données avec un
moteur ROLAP et
! En stockant les données détaillées de l’ED dans un SGBD ! ils exploitent les « data marts » avec une approche
Relationnel - ROLAP multidimensionnelle MOLAP
! architecture générale de ces systèmes :
! En stockant les données agrégées, souvent des magasins
de données (data marts) de l’ED dans un SGBD Data Marts
Bases de
Multidimensionnel - MOLAP : données intégration Entrepôt
OLAP
• granularité moins fine Sources de données
Sources
• index en mémoire centrale externes Serveur
Interface
MOLAP
Moteur OLAP
! Ils permettent ainsi d’avoir des ED de taille importante tout en
ROLAP
ayant des temps de réponse satisfaisants.
Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 61 Systèmes OLAP : ROLAP, MOLAP et HOLAP - Bernard ESPINASSE - 62