Vous êtes sur la page 1sur 43

Université Mohammed Première ‫جامــــعة محمـــذ األول بــوجذة‬

Faculté Pluridisciplinaire De Nador ‫كلــية متعذدة التخصصــــات الناظـــــــور‬


Département Informatique

Master de recherche
Master Sciences des Données et Systèmes
Intelligents (MSDSI’23)

Entrepôt de données
Section 3
OLAP Technology
Présenté par :
Pr. EL ALLALI Naoufal
Année Universitaire
2022/2023
À propos de ce cours

 Dans ce cours, vous apprendrez tous les concepts et terminologies liés à l'entrepôt de données, tels que OLTP,
OLAP, Dimensions, Facts et bien plus encore, ainsi que d'autres concepts associés tels que ce que l'on entend
par Start Schema, Snow flake Schema, etc.

 Ce cours explique aussi la manière dont les données sont gérées dans l'entrepôt de données et le processus de
lecture et d'écriture des données dans l'entrepôt. Vous apprendrez également les bases de la modélisation des
données et comment l'aborder de manière logique et physique.

 À la fin de ce cours, vous aurez une idée claire de tous les concepts liés à l'entrepôt de données, ce qui
devrait être suffisant pour vous aider à passer à l'étape suivante, à savoir devenir un développeur ETL ou
administrer l'environnement de l'entrepôt de données à l'aide de divers outils (SSIS, SSAS, SSRS et Talend).
Plan du cours

 Plan du cours

● Section 1 : Introduction aux entrepôts de données

● Section 2: Architecture d'entrepôt de données

● Section 3: OLAP technologie

● Section 4: La modélisation dimensionnelle

● Section 5: Ateliers SQL Server 2019


Objectifs

 Vous apprendrez dans ce chapitre :

 Qu'est-ce qu'OLAP ?
 Opérations analytiques de base d'OLAP
 Les différents types de systèmes OLAP
 Quels sont les avantages et les inconvénients d'OLAP ?

 Objectifs pédagogiques

 À la fin de ce cours, vous serez capable de :

 Concevoir et de construire un entrepôt de données de A à Z

 Acquérir les connaissances, les compétences pratiques et la capacité à mettre en

œuvre un entrepôt de données moderne de manière professionnelle.


Prérequis

 Avoir + 8 Go de RAM (recommandé) et une connexion d’internet..

 Avoir un IDE (Environnement de développement) installé sur votre ordinateur ex : Visual Studio 2019.

 Avoir des connaissances sur les bases de données relationnelles et les notions fondamentales de SQL

(Familiarisé avec le concept de base des bases de données/SGDB).

 Certains outils sont nécessaires.


OLAP

 Les bases de données multidimensionnelles sont une des applications des entrepôts de données destinées à l’aide

à la décision. Par leur intermédiaire, une grande partie du travail de préparation des données est effectuée.

 Les données sont présentées sous forme de cubes multidimensionnels dont les cellules contiennent des mesures

pré- calculées. Cette présentation est plus naturelle et plus lisible pour les analystes.

6
OLAP

 OLAP (Online Analytical Processing) est une catégorie de logiciels qui permet aux utilisateurs d'analyser

simultanément des informations provenant de plusieurs systèmes de bases de données.


 Avec OLAP, les données peuvent être pré-calculées et pré-agrégées, ce qui rend l'analyse plus rapide.
 Il s'agit d'une technologie qui permet aux analystes d'extraire et de visualiser des données commerciales à
partir de différents points de vue.
 La technologie OLAP organise les données sous une forme cubique ou d’hypercube (cube de plus de trois
dimensions) (Pendense, 2001) (Harinarayan et al., 1996).
 L'idée est de fournir un temps de réponse très rapide afin de faciliter la prise de décision itérative.

7
OLAP

 OLAP est une technologie qui permet aux analystes et aux administrateurs d’accéder de façon rapide, consistante et interactive

à un grand volume de données.

 La technologie OLAP correspond aux traitements visant à interroger, à visualiser et à synthétiser les données, ces traitements

concernent un nombre d’enregistrements importants.

 Il est basé sur un modèle de données multidimensionnel et permet à l'utilisateur d'effectuer des requêtes sur des données

multidimensionnelles

 par exemple :
 Product(DVD) > 1Qtr->America -> total des ventes annuelles de DVD en Amérique = Quantité totale des ventes
annuelles de DVD en Amérique

8
OLAP

 La figure suivante représente les données dans un espace à trois dimensions: la dimension catégorie, la dimension temps

et la dimension région. Chaque intersection de ces dimensions représente une cellule comportant le montant des ventes

(fait).

 Les points à l’intérieur d’un cube servent à enregistrer les mesures d’activités pour chaque combinaison donnée entre les

dimensions. Ces points sont appelés cellules, une cellule peut être vide.

9
Qu'est-ce qu'un cube de données ?
 Un cube de données est une structure de données multidimensionnelle utilisée pour stocker et analyser les données dans les
entrepôts de données.

 Il est souvent utilisé pour stocker des données détaillées, telles que les ventes ou les finances, et permet aux utilisateurs de

naviguer et de filtrer les données de manière interactive.

 Un cube de données est composé de dimensions et de mesures.


 Les dimensions sont des catégories de données, telles que le temps, la région ou le produit, qui permettent de segmenter
les données.
 Les mesures sont des données quantitatives, telles que les ventes ou les coûts, qui peuvent être utilisées pour calculer
des statistiques.

10
Qu'est-ce qu'un cube de données ?
 Un cube de données permet de modéliser et de visualiser des données en plusieurs dimensions. Il est défini par des dimensions
et des faits
 En général, les dimensions sont les perspectives ou les entités pour lesquelles une organisation souhaite conserver des
enregistrements.
 Par exemple, AllElectronics peut créer un entrepôt de données sur les ventes afin de conserver les enregistrements des
ventes du magasin en fonction des dimensions suivantes :
 temps,
 article,
 secteur et emplacements dans lesquels les articles ont été vendus.
 Ces dimensions permettent au magasin de garder la trace d'éléments tels que les ventes mensuelles d'articles et les
secteurs et emplacements dans lesquels les articles ont été vendus.
 Chaque dimension peut être associée à une table, appelée table de dimension, qui décrit plus précisément la
dimension. Par exemple, une table de dimension pour un article peut contenir les attributs nom de l'article, marque et
type.

11
Modèle de données multidimensionnel - Cube OLAP

 Un modèle de données multidimensionnel est généralement organisé autour d'un thème principal, comme les ventes, par

exemple. Ce thème est représenté par une table de faits. Les faits sont des mesures numériques.

 Ils représentent les quantités par lesquelles nous voulons analyser les relations entre les dimensions.

 Par exemple, pour un entrepôt de données sur les ventes, les faits sont les suivants : dollars vendus (montant des

ventes en dollars), unités vendues (nombre d'unités vendues) et montant prévu pour le budget.

 La table de faits contient les noms des faits, ou mesures, ainsi que les clés de chacune des tables de dimensions associées.

Vous aurez bientôt une idée plus claire de la façon dont cela fonctionne lorsque nous examinerons les schémas

multidimensionnels ( chapitre 4 ).

12
Modèle de données multidimensionnel - Cube OLAP

 Pour mieux comprendre les cubes de données et le modèle de données multidimensionnel, commençons par examiner un
simple cube de données bidimensionnel :

13
Modèle de données multidimensionnel - Cube OLAP
 Supposons maintenant que nous souhaitions visualiser les données de vente avec une troisième dimension.
 Par exemple, nous souhaitons visualiser les données en fonction du temps et de l'article, ainsi que du lieu pour les villes
de Chicago, New York, Toronto et Vancouver. Ces données 3D comme présentées dans le tableau et Les données 3D du
tableau sont représentées par une série de tableaux 2D.
 D'un point de vue conceptuel, nous pouvons également représenter les mêmes données sous la forme d'un cube de
données en 3D, comme dans la figure illustré.

14
Modèle de données multidimensionnel - Cube OLAP

15
Modèle de données multidimensionnel - Cube OLAP
 Supposons que nous souhaitions maintenant visualiser nos données de vente avec une quatrième dimension supplémentaire,
comme le fournisseur. La visualisation des choses en 4-D devient très difficille. Cependant, nous pouvons considérer qu'un
cube 4-D est une série de cubes 3-D, comme le montre la figure ci-dessous.
 Si nous continuons ainsi, nous pouvons afficher n'importe quelles données n-D comme une série de (n-1)-D "cubes".
 Le cube de données est une métaphore du stockage de données multidimensionnelles. Le stockage physique réel de ces données
peut différer de leur représentation logique.

16
Le cube OLAP : A lattice of cuboids

17
Le cube OLAP : A lattice of cuboids

18
Le cube OLAP
 Imaginons que nous avons un entrepôt de données qui contient des données sur les ventes de différents magasins d'une
entreprise de détail. Pour faciliter l'analyse des données, nous avons créé un cube de données qui contient les dimensions
"mois", "nom du magasin" et "catégorie de produit", ainsi que les mesures "ventes totales", "bénéfices" et "nombre de
clients".
 Dans cet exemple, nous allons nous intéresser aux ventes de tous les magasins "XXX".

19
Le cube OLAP
 Voyons maintenant comment peut-on utiliser ce cube. Pour cela, nous allons nous intéresser aux différentes vues de ce cube.
 Vue - 1 : On s'intéresse à toutes les ventes du magasin d'ANNECY (toutes catégories confondues durant toute l'année)

20
Le cube OLAP
 Voyons maintenant comment peut-on utiliser ce cube. Pour cela, nous allons nous intéresser aux différentes vues de ce cube.
 Vue - 3 : On s'intéresse à toutes les ventes durant le mois de Février (toutes catégories confondues et dans tous les magasins)

21
Le cube OLAP
 Voyons maintenant comment peut-on utiliser ce cube. Pour cela, nous allons nous intéresser aux différentes vues de ce cube.
 Vue - 4 : On s'intéresse aux ventes du magasin d'ANNECY dans la catégorie "vêtements pour enfants" durant le mois de
Février

22
Les opérations multidimensionnelles – Cube OLAP

 Le cube OLAP permet de réaliser de nombreuses opérations qui sont très pratiques dans le travail de l'analyste :

 Slice-and-dice

 Drill-down

 Roll-up

 Pivot

 La principale raison de l'utilisation des opérations de cube OLAP est de permettre aux utilisateurs d'analyser leurs

données sous différents angles et avec différents niveaux de détail.

 Ces opérations permettent aux utilisateurs de naviguer rapidement et facilement à travers les dimensions des

données et d'obtenir des informations qui ne seraient pas immédiatement évidentes lors d'une analyse plus

basique.
23
Les opérations multidimensionnelles – Cube OLAP

 La fonction de découpage (ou slice) dans les cubes OLAP permet de sélectionner un sous-ensemble de données

(un seul dimension) en fonction de critères spécifiques. Cela permet aux utilisateurs de se concentrer sur une

partie spécifique des données pour une analyse plus détaillée.

 Dans l'exemple ci-dessous, nous avons découpé le cube de données pour sélectionner que les données de

2004 uniquement.

Dans le cube donné dans la


partie générale, Slice est
effectué sur la dimension
Time = « 2004».

 Il sélectionne une seule dimension du cube OLAP, ce qui entraîne la création d'un nouveau sous-cube.
24
Les opérations multidimensionnelles – Cube OLAP

 L'opération du "dice" est très similaire à celle du "slice", mais au lieu de prendre une seule valeur pour une

dimension, nous prenons plus d'une valeur dans les dimensions que nous choisissons.
 Dans l'exemple ci-dessous, nous avons découpé le cube de données en fonction de la dimension du produit
(nous avons choisi uniquement "Accessoires", "Équipement de protection extérieure" et "Équipement de
golf") tout en conservant les dimensions de la date et de la région.

Dans le cube donné , un sous-cube est


sélectionné en choisissant les dimensions
suivantes avec les critères :
 Produits = « Accessesoires » or
« Outdoor protective equipement » or
« Golf equipement »

 Il sélectionne un sous-cube à partir du cube OLAP en sélectionnant deux ou plusieurs dimensions.


25
Les opérations multidimensionnelles – Cube OLAP

 Les fonctions "drill-down" et "roll-up" nous permettent d'aller plus en détail dans la hiérarchie d'une dimension

(drill-down) ou de remonter vers le haut de la hiérarchie d'une dimension globale (roll-up).


 Dans l'exemple ci-dessous, si nous nous déplaçons de gauche à droite, nous sommes descendus dans la
rubrique « Outdoor proective equipement" pour montrer uniquement ses enfants ("Insect repellant",
"Sunblock" et "First aid").

 En revanche, si nous allons dans la direction opposée et que nous agrégeons les ventes totales pour les
produits "insectifuges", "écrans solaires" et "premiers soins", nous aurons regroupé les valeurs dans les
"équipements de protection extérieure".
26
Les opérations multidimensionnelles – Cube OLAP

 Les fonctions "drill-down" et "roll-up" nous permettent d'aller plus en détail dans la hiérarchie d'une dimension

 Drill-down: Dans l'opération de drill-down, les données moins détaillées sont converties en données très

détaillées. Cela peut être fait en :

Se déplaçant vers plus bas dans la hiérarchie des concepts

Ajout d'une nouvelle dimension

27
Les opérations multidimensionnelles – Cube OLAP

 Les fonctions "drill-down" et "roll-up" nous permettent d'aller plus en détail dans la hiérarchie d'une dimension

 Roll-up: C'est l'opposé de l'opération de drill-down. Elle effectue une agrégation sur le cube OLAP. Elle peut être

réalisée en :

Remontant dans la hiérarchie des concepts

Réduisant les dimensions

28
Les opérations multidimensionnelles – Cube OLAP

 Les fonctions "drill-down" et "roll-up" nous permettent d'aller plus en détail dans la hiérarchie d'une dimension

 Roll-up: C'est l'opposé de l'opération de drill-down. Elle effectue une agrégation sur le cube OLAP. Elle peut être

réalisée en :

Remontant dans la hiérarchie des concepts

Réduisant les dimensions

29
Les opérations multidimensionnelles – Cube OLAP

 Pivot : Elle est également connue sous le nom d'opération de rotation car elle fait tourner la vue actuelle pour

obtenir une nouvelle vue de la représentation. Dans le sous-cube obtenu après l'opération de découpage,

l'opération de pivot permet d'obtenir une nouvelle vue de celui-ci.

30
Les opérations multidimensionnelles – Cube OLAP

 Pivot : Elle est également connue sous le nom d'opération de rotation car elle fait tourner la vue actuelle pour

obtenir une nouvelle vue de la représentation. Dans le sous-cube obtenu après l'opération de découpage,

l'opération de pivot permet d'obtenir une nouvelle vue de celui-ci.

31
Avantages des cubes OLAP

 Rapidité : Les cubes OLAP sont optimisés pour une récupération rapide des données, ce qui permet une analyse

rapide et efficace de grandes quantités de données.

 Analyse multidimensionnelle : Les cubes OLAP permettent l'analyse des données à partir de plusieurs

dimensions, ce qui peut fournir une compréhension plus approfondie des données et permettre d'identifier de

nouvelles stratégies et de nouveaux modèles.

 Facilité de navigation : Les cubes OLAP permettent de naviguer facilement et rapidement dans les données, ce

qui facilite l'accès et l'analyse des données par les utilisateurs.

 Évolutivité : Les cubes OLAP peuvent être adaptés pour traiter de grandes quantités de données, ce qui peut

faciliter la tâche aux organisations lorsque leurs données augmentent.

32
Avantages des cubes OLAP

 La technologie OLAP présente trois avantages majeurs selon(Pendense, 2001) (Sapia & al., 1999):

 L’accès aux données contenues dans les cellules d’un hyper-cube est plus direct que dans toute autre

structure, la notion de jointure n’existe pas, puisque toutes les données sont dans un seul tableau. Les temps

de réponses sont donc très courts

 L’administration d’un schéma matriciel est beaucoup plus simple que celle d’une base de données

relationnelle. Les traitements des agrégats pré-calculés sont automatiques et transparents.

 Permet aux analystes et aux administrateurs d’accéder de façon rapide, consistante et interactive à un grand

volume de données.

33
Les inconvénients des cubes OLAP
 Coût: La mise en place et la maintenance d'un cube OLAP peuvent être coûteuses, surtout pour les organisations
de taille petite ou modeste.
 La complexité :
 Les cubes OLAP peuvent être complexes à mettre en place et à maintenir, et peuvent nécessiter des
connaissances et des compétences spécialisées.
 OLAP nécessite d'organiser les données dans un schéma en étoile ou en flocon de neige. Ces schémas sont
complexes à mettre en œuvre et à administrer
 Toute modification dans un cube OLAP nécessite une mise à jour complète du cube. C'est un processus qui
prend beaucoup de temps
 Scalabilité limitée :
 Les cubes OLAP peuvent ne pas être en mesure de traiter de très grandes quantités de données, ce qui peut
limiter leur efficacité pour les organisations ayant de très grands ensembles de données.
 Vous ne pouvez pas avoir un grand nombre de dimensions dans un seul cube OLAP.
 Sécurité des données limitée : Les cubes OLAP peuvent ne pas être en mesure de gérer des données hautement
sécurisées, ce qui peut limiter leur utilité pour les organisations qui ont beaucoup de données sensibles.
34
Types de systèmes OLAP

 Il existe 3 principaux types de systèmes OLAP :

 ROLAP (Relational OLAP)

 MOLAP

 HOLAP (Hybrid OLAP)

35
Types de systèmes OLAP

 Il existe 3 principaux types de systèmes OLAP :

 ROLAP (Relational OLAP):

• ROLAP (Relational OLAP) est un type de système OLAP (Online Analytical Processing) qui se base

sur des bases de données relationnelles pour stocker les données et utilise SQL pour les interroger.

• Les systèmes ROLAP sont généralement plus flexibles que les autres types de systèmes OLAP, car

ils peuvent exploiter la puissance des bases de données relationnelles, qui sont largement utilisées et

faciles à comprendre.

36
Types de systèmes OLAP
 Il existe 3 principaux types de systèmes OLAP :
 ROLAP (Relational OLAP):
• Avantages :
• Prise en charge de SQL standard : Les systèmes ROLAP utilisent SQL pour interroger les données,
ce qui permet aux développeurs et aux analystes de travailler facilement avec les données.
• flexibilité: Ce type de système OLAP offre la possibilité de traiter des requêtes plus complexes.
• Inconvénients:
• Performance : Les systèmes ROLAP peuvent ne pas être aussi performants que les autres systèmes
OLAP lorsqu'ils traitent de grandes quantités de données, car le processus d'extraction des données peut
être plus lent en raison de l'utilisation de requêtes SQL.
• La complexité : Les systèmes ROLAP peuvent être complexes à mettre en place et à maintenir, car ils
reposent sur la base de données relationnelle sous-jacente et peuvent nécessiter des connaissances et des
compétences spécialisées.

37
Types de systèmes OLAP
 Il existe 3 principaux types de systèmes OLAP :

 MOLAP (Multidimensional OLAP)

• MOLAP (Multidimensional OLAP) est un type d'OLAP (Online Analytical Processing) qui utilise un

modèle de données multidimensionnel pour stocker et analyser les données.

• MOLAP stocke les données dans un tableau multidimensionnel pré-calculé appelé cube.

• Les systèmes MOLAP sont performants et peuvent récupérer et analyser rapidement de grandes

quantités de données, en offrant des capacités avancées de visualisation des données et des fonctions

avancées de sécurité des données.

38
Types de systèmes OLAP
 Il existe 3 principaux types de systèmes OLAP :
 MOLAP (Multidimensional OLAP)
• Avantages :
• MOLAP permet l'indexation la plus rapide des données résumées pré-calculées.
• Les systèmes MOLAP peuvent effectuer des analyses de données avancées, telles que des calculs
complexes et l'exploration de données, qui peuvent fournir des informations qu'il serait difficile de
découvrir avec d'autres méthodes.
• Inconvénients:
• Les MOLAP ne sont pas capables de contenir des données détaillées.
• L'utilisation du stockage peut être faible si l'ensemble des données est peu volumineux.

39
Types de systèmes OLAP
 Il existe 3 principaux types de systèmes OLAP :
 HOLAP (Hybrid OLAP)
• HOLAP (Hybrid OLAP) est un type d'OLAP (Online Analytical Processing) qui combine les avantages des
systèmes MOLAP (Multidimensional OLAP) et ROLAP (Relational OLAP).
• Dans un système HOLAP, les données sont stockées à la fois dans une base de données relationnelle et
dans un cube multidimensionnel. Cela permet de bénéficier des hautes performances et des capacités
d'analyse de données avancées de MOLAP, ainsi que de la flexibilité et de l'évolutivité de ROLAP.
• Les systèmes HOLAP stockent des données détaillées dans une base de données relationnelle et
résument ces données dans le cube.
• Lorsqu'un utilisateur demande des données, le système vérifie :
 Si le cube contient les informations demandées.
 Si l'information ne se trouve pas dans le cube, le système récupère les données détaillées dans
la base de données relationnelle et les utilise pour mettre à jour le cube. Cela permet au système
d'offrir les avantages du MOLAP et du ROLAP.
40
Types de systèmes OLAP
 Il existe 3 principaux types de systèmes OLAP :
 HOLAP (Hybrid OLAP)
• Avantages :
• Performance : Combine les avantages de MOLAP et de ROLAP : HOLAP combine les hautes
performances et les capacités d'analyse de données avancées de MOLAP avec la flexibilité et
l'évolutivité de ROLAP.
• Support SQL : Les systèmes HOLAP peuvent exploiter la puissance de SQL pour effectuer des
analyses de données complexes, ce qui peut être utile pour les organisations ayant beaucoup de données
structurées.
• Inconvénients:
• Scalabilité: les systèmes HOLAP peuvent être limités en termes de scalabilité car ils stockent les
données à la fois dans une base de données relationnelle et dans un cube multidimensionnel, ce qui peut
augmenter l'espace de stockage et avoir un impact sur les performances.
• Complexité : les systèmes HOLAP peuvent être plus complexes que les systèmes MOLAP ou ROLAP,
car ils nécessitent la maintenance d'une base de données relationnelle et d'un cube multidimensionnel.
41
Etude comparative entre ROLAP (Relational OLAP) et MOLAP (Multidimensional OLAP).

 Le stockage des données : ROLAP stocke les données dans une base de données relationnelle, tandis que
MOLAP stocke les données dans un cube multidimensionnel.
 Modélisation des données : Les systèmes ROLAP utilisent un modèle de données relationnel, tandis que les
systèmes MOLAP utilisent un modèle de données multidimensionnel.
 Analyse des données : Les systèmes MOLAP peuvent effectuer des analyses de données avancées, telles que des
calculs complexes et l'exploration de données, tandis que les systèmes ROLAP reposent généralement sur le
langage SQL pour l'analyse des données.
 Complexité : Les systèmes ROLAP peuvent être plus flexibles et plus faciles à utiliser car ils utilisent un modèle
de données relationnel, tandis que les systèmes MOLAP peuvent être plus complexes car ils utilisent un modèle
de données multidimensionnel.

42
Etude comparative entre ROLAP (Relational OLAP) et MOLAP (Multidimensional OLAP).

43

Vous aimerez peut-être aussi