Vous êtes sur la page 1sur 29

Notions de modélisation

multidimensionnelle
(conceptuelle)
Dr Yvan Bédard
Marie-Josée Proulx M.Sc.,
Sonia Rivest M.Sc.,
professionnelles de recherche

19 octobre 2006
Formalisme multidimensionnel
Le modèle multidimensionnel comprend trois
niveaux d’abstraction
Niveau Cube (1) : Permet une visualisation générale
des cubes de l’application ainsi que des dimensions
partagées
Inclut les cubes, mesures et dimensions

Niveau Dimension (2) : Permet la visualisation


détaillées des dimensions
Inclut les hiérarchies et niveaux des dimensions

Niveau Membres (3) : Permet la visualisation spécifique


des membres des dimensions
Inclut les membres des dimensions
Formalisme multidimensionnel
Les éléments de modélisation UML utilisés sont :
Paquetage (Cube
( et Dimension)
Classe (Mesures,
( Niveau et Membres (objets))
Relation (liens entre les niveaux et liens entre les membres)
Stéréotype de classe <racine> et <feuille> pour les
membres
Stéréotype de relation {incomplet} pour les modèles de
membres
Pictogrammes de géométrie et de temporalité
Pictogrammes multidimensionnels
Pictogrammes
Cube

Dimension

Mesure

Membre
Cube
On définit un ‘Cube’ à partir de l’élément
Paquetage du gabarit de modélisation.
On ajoute le pictogramme ‘Cube’ à partir du
stéréotype de paquetage.
Les propriétés du paquetage permettent de :
Définir les métadonnées – Pour compléter le
nom, la définition, etc.
Mesure
On définit des mesures avec l’élément ‘classe’
du gabarit de modélisation (1 seule par cube).
On ajoute le pictogramme ‘mesure’ avec le
stéréotype de la classe.
On ajoute les différentes mesures dans la
classe avec l’élément ‘attribut’.
Les propriétés des mesures sont les suivantes :
Définir les métadonnées – Pour compléter le
nom, la définition, la règle d’acquisition, la règle de
dérivation, etc.
Dimensions
On définit un élément ‘Dimension’ à partir d’un
paquetage. Celui-ci peut être glissé dans un cube
ou utilisé seul. Les propriétés de la
dimension permettent de :
Définir les métadonnées – Pour compléter le nom,
la définition, etc
Type de dimension -
Identifie le type de dimension
(descriptive, spatiale ou
temporelle) à l’aide d’un
stéréotype sur le paquetage.
Niveau 1 : Cube

Niveau 1
(cube, dimensions et mesures)
Hiérarchie
Une hiérarchie définit une relation 1-N entre les niveaux
d’une dimension (sauf exception).
On utilise l’élément de modélisation ‘agrégation’ pour
associer les niveaux entres-eux.
On définit les niveaux d’une dimension à l’aide de
l’élément de modélisation ‘Classe’.
Les propriétés d’un niveau permettent de :
Définir les métadonnées – Pour compléter le nom, la
définition, la règle d’acquisition, la règle de dérivation, etc.
Géométrie du niveau - Ajouter une géométrie à un niveau
spatial en utilisant les pictogrammes spatiaux de la classe.
Niveau 2 : Dimensions

Niveau 2
(hiérarchies et niveaux)
Membres
On définit un membre d’une dimension à l’aide de
l’élément de modélisation ‘Classe’.
On y ajoute le stéréotype de classe ‘membre’, ‘membre
racine’ ou ‘membre feuille’.
On utilise les généralisation ou agrégation/composition
pour définir les relations entre les membres.

On ajoute le stéréotype:
‘incomplet’ à la généralisation quand l’ensemble des membres
ne sont pas tous définis pour un niveau donné
On enlève le stéréotype incomplet du niveau quand l’ensemble
des membres est défini pour un niveau donné
Membres
Les propriétés d’un membre permettent de :
Définir les métadonnées - Pour compléter le nom, la
définition, la règle d’acquisition, la règle de dérivation, etc.
Ajouter une géométrie - Ajoute une géométrie avec ou sans
évolution spatiale à un membre
Membre ‘feuille’ - Stéréotype indiquant que le membre
appartient au niveau le plus bas de la hiérarchie
Membre ‘racine’- Stéréotype indiquant que le membre
appartient au niveau le plus haut de la hiérarchie
Membre- Stéréotype indiquant que le membre appartient aux
niveaux intermédiaires de la hiérarchie.
Niveau 3 : Membres

(incomplète)

(incomplète) (incomplète)

Niveau 3
(modèle de membres)
Type de hiérarchie
Une hiérarchie stricte présente une relation 1-N entre les
membres. L’enfant a un seul parent.

Hiérarchie à
3 niveaux

La municipalité compose
une seule région et la région
compose une seule province.
Type de hiérarchie
Une hiérarchie non-stricte est une dimension qui partage entre
plusieurs niveaux les mêmes membres. Il s’agit d’une relation N-N
entre les membres. L’enfant a plus d’un parent.
Cette hiérarchie n’est
pas agrégative!!

L’employé peut travailler


dans plus d’un département.
Type de hiérarchie
Une hiérarchie multiple partage plusieurs niveaux d’une
dimension.

Hiérarchie parallèle

Hiérarchie alternative
Type de hiérarchie
Une hiérarchie Hiérarchie balancée
balancée est une
hiérarchie où toutes
les feuilles sont à
égale distance du
(incomplète)
niveau supérieur.
La profondeur des
branches de la (incomplète) (incomplète)
hiérarchie est égale.
Type de hiérarchie
Une dimension
débalancée est une
dimension:
où la profondeur
d’une ou plusieurs
branches de la
hiérarchie est
inégale.
Type de hiérarchie
Une dimension
débalancée est une
dimension:
où le parent d’un
membre ne se trouve pas
au niveau
immédiatement avant
(non-covering hierarchy)
Autres problématiques particulières
Gestion de relations N-N entre les faits et une dimension: Il est
possible que les faits d’un cube ne respectent pas la relation 1-N
avec une dimension. Par exemple, quand un accident est causé
par plus d’une cause, il peux y avoir plus d’un fait ‘accident’
associé à la dimension ‘cause’.
Il faut identifier la bonne
stratégie d’implantation
selon que la relation N-N
est finie (ex. 1-3) ou
non (N-N).
N-N

MESURE
nombre accidents
Relation N-N entre faits et dimension
Plusieurs approches existent pour implanter ce
type de relation en exploitant la redondance
d’information dans la dimension.
Toutefois, ces approches peuvent dénaturer
sensiblement les données, car on peut introduire
une dimension non-stricte.

Créer dans la dimension l’ensemble des combinaisons


possibles.
Multiplier les membres dans la dimension (ex.
principal, secondaire)
Multiplier les dimension dans le cubes
(ex. principal, secondaire)
Relation N-N entre faits et dimension
Une approche existe pour implanter ce type de
relation en exploitant la redondance
d’information dans les faits:
Utiliser les faits multiples, en considérant les
doublons lors de l’agrégation des données.

Si le nombre de fois où la relation N-N est


exploitée est faible et le nombre calculé
résultant (sans tenir compte de cette
particularité) varie peu par rapport au nombre
réel, on pourrait décider d’implanter la relation
en 1-N et aviser l’usager par une
mise en garde.
Relation N-N entre faits et dimension
Une dernière approche existe sans utiliser la
redondance d’information.
Utiliser une table-pont pour décrire directement
les relations N-N entre la dimension et la table de
fait
Ces deux approches sont possibles en
ROLAP seulement et la table-pont n’est
pas supportée par l’outil JMAP SOLAP.
Créer des combinaisons.
Avantages
Intéressant si le nombre de combinaisons possibles est faible.
Aucun doublons dans les faits -> mesures agrégatives
naturellement.

Désavantages:
Un nombre de
membres élevé est plus
difficile à interroger.
Il n’existe pas dans le
cube la valeur du total
des accidents
impliquant la cause
‘Vitesse’ puisque les
causes sont toujours
combinées.
Multiplier les membres d’une
dimension.
Avantages
Intéressant si la relation N-N est finie (ex. 1-3)
Aucun doublons dans les faits -> mesures agrégatives naturellement.

Désavantages:
Oblige à prioriser ou
ordonner les membres (ex.
Primaire, secondaire).
Il n’existe pas dans le cube
la valeur du total d’un
membre feuilles (ex. nb
accidents impliquant la
cause ‘Vitesse’). puisque
cette feuille est répartie
entre différentes branches
oui dimension.
Multiplier les dimensions dans le cube.
Avantages
Intéressant si la relation N-N est finie (ex. 1-3)
Aucun doublons dans les faits -> mesures agrégatives naturellement.
Le croisement entre les membres identiques des dimensions permet de calculer la valeur
du total d’un membre feuilles (ex. nb accidents impliquant la cause ‘Vitesse’).

Désavantages:
Oblige à prioriser ou
ordonner les dimensions
(ex. Primaire, secondaire).
Multiplie le nombre de
dimension à utiliser dans le
cube.
Utiliser les faits multiples.
Avantages
Méthode simple qui consiste à insérer plusieurs occurrences du
même faits afin de l’associer plusieurs fois à la dimension.
Simple à mettre en œuvre, si le nombre la relation n’est pas finie
(N-N).
La valeur du total d’un membre feuilles existe dans le cube.

Désavantages
Approche la plus simple à interroger (pas de doublons de membre,
ni de dimension).
Taille de la table de fait peut être volumineuse à cause des
doublons de faits.
La présence de doublons de faits rend les mesures d’une telle
dimension non agrégatives, il devient nécessaire de
préagréger les données dans le cube:
En utilisant une formule considérant la présence de doublons de faits.
En modifiant les valeurs de mesure pour considérer la présence
de doublons de faits.
Autres problématiques particulières
Évolution des membres d’une dimension:
Lorsque les membres changent dans le temps, il
doit être possible de faire des analyses
évolutives.
L’absence d’un membre à une certaine époque
ou la fusion de plusieurs peuvent entraver
l’analyse temporelle (Exemple du découpage
municipal).
Autres problématiques particulières
Gestion des différents niveaux de détail des données
détaillées.
Il est possible que les données détaillées aient été consignées à
différents niveaux de détail. Par exemple, on pourrait posséder les
données de vaccination au niveau des arrondissements pour
certains CLSC et au niveau de la ville de Québec pour d’autres
CLSC.
Il y aurait une perte d’information, si on
décidait d’uniformiser les données au niveau
de la Ville de Québec.
Pour s’assurer d’obtenir des résultats agrégés
corrects au niveau supérieur, il faut tenir
compte de ces valeurs pré-agrégées dans le faits
faits
calcul des agrégations.
Il faut indiquer à l’usager l’imprécision des
données sur le niveau arrondissement. faits
faits
faits

Vous aimerez peut-être aussi