Vous êtes sur la page 1sur 53

Entrepôt de données spatiales

 Introduction
 Notions fondamentales en Informatique décisionnelle(BI)
 EDS et SOLAP : Définitions et Architecture
 Modèles conceptuels et multidimensionnels
 MOLAP vs ROLAP vs HOLAP avec la prise en charge de
l’information spatiale
 Opérateurs spatiaux
 Typologie des applications SOLAP
 Conclusion
Introduction 1/4
Entrepôt de données
spatiales & SOLAP
• L'aide à la décision reposait autrefois sur :
• l'expérience individuelle;
• le savoir capitalisé et l'expérience des conseillers des
décideurs,
• L'analyse historique des situations.

L'opinion et la subjectivité avaient une grande importance.


Introduction 2/4
Entrepôt de données
spatiales & SOLAP • Au XXe siècle,
• des modèles mathématiques sont introduits dans les processus
d’analyse en s’appuyant sur des concepts et théories tels que :
les probabilités, la théorie des graphes, ou encore la
recherche opérationnelle.
Apparition de l’informatique décisionnelle (BI)
(systèmes interactif d’aide à la décision)
Objectif: Améliorer les processus d’analyse en vue d’une prise
de décisions efficaces et rapides du fait de la complexité croissante
de l’environnement des entreprises:
(Mondialisation, abondance de l’information manipulée aspect
concurrentiel ardu, etc.)
Introduction 3/4
Entrepôt de données
spatiales & SOLAP
Etudier ces systèmes décisionnels s’avère être une vaste tâche
pour plusieurs raisons interdépendantes telles que :
• le nombre croissant de décisions que peuvent supporter ces
systèmes;
• les perpétuelles évolutions de la technologie
• l’émergence de nouvelles pratiques de management
• la croissance et la complexité des phénomène à analyser
Entrepôt de données Introduction 4/4
spatiales & SOLAP De plus
80% des données transactionnelles manipulées au sein de
l’entreprise sont dotées de composante spatiale dont
l’exploitation dans le processus décisionnel s’avère
indispensable (elle offre une visualisation cartographique facilement
perceptible )
 l’exploitation de cette information dotée de référence spatiale
passe par :
- l’intégration de sa représentation graphique ou
cartographique ou encore géométrique qui nécessite
Des opérateurs spécifiques ( opérateurs spatiaux)
Les SIG dans la prise de décisions
Par conséquent
Entrepôt de données
spatiales & SOLAP
Les entreprises se trouvent confrontées à la gestion de gros
volumes de données historisées et spatialement référencées
extraites de différentes sources.
Mais
Malgré que les systèmes SIG offrent plusieurs
fonctionnalités d’analyse spatiales, ils demeurent complexe à
utiliser et exigent des compétences liées aux domaine de la
géomatique
>>> présentent des limites vis à de l’analyse de ce volume
d’information à but décisionnel.
Entrepôt de données Les SIG dans la prise de décisions
spatiales & SOLAP Et

 Les applications OLAP présentent des limites quant à l’exploitation de


la composante spatiale : la représentation nominale ou non
géométrique (ex. nom du lieu , adresse, etc.)

La solution est de s’orienter vers la combinaison des deux technologies

OLAP + SIG  Géo-décisionnel


Entrepôts de Données Spatiales
et Spatial OLAP (SOLAP
Entrepôt de données Notions fondamentales en BI
spatiales & SOLAP
• Qu’est ce que l’informatique ?
« Science du traitement rationnel, notamment par machine automatique,
de l'information considérée comme le support des connaissances et des
communications dans les domaines techniques, économiques et sociaux »
(Académie Française, 1967).
• Qu’est ce que l’informatique décisionnelle ?
« Est un processus technologique qui analyse des données pour présenter
des informations exploitables par les dirigeants, les cadres commerciaux
et les autres utilisateurs, afin de leur permettre de prendre des décisions
plus avisées ».
« Désigne un ensemble de méthodes, de moyens et d'outils informatiques
utilisés pour piloter une entreprise et aider à la prise de décision… »
Notions fondamentales en BI
Entrepôt de données
spatiales & SOLAP
• L’informatique décisionnelle ?

- La Collecte et la modélisation des données éparses, déstructurées et


hétérogènes que génère une entreprise ( archives papier, bases de
données, feuilles de calcul, données clients collectées via un service
en ligne, etc.)
- Analyse des données par traitement automatique et proposition des
solutions les plus efficaces possibles afin d’aider efficacement les
décideurs.
Notions fondamentales en BI
Entrepôt de données
spatiales & SOLAP
Quelques précisions

• L’informatique décisionnelle n’a pas pour objectif de remplacer les


systèmes existants (transactionnels), mais elle vient plutôt les
compléter afin qu’ils répondent efficacement aux besoins d'analyses.
• un système décisionnel s’articule autour des fonctions principales
suivantes :
La collecte des données.
Le stockage des données.
La diffusion ou distribution des données.
L'exploitation ou présentation des données
Entrepôt de données Notions fondamentales en BI
spatiales & SOLAP
• La collecte des données : préparer les données qui seront stockées dans des
bases spécialisées par métier et organisées en vue de leur analyse. Cette phase
est réalisé par Le processus ETL(Extract Transform Load):
Extract (extraction des données) : chercher les données depuis des sources
hétérogènes : SGBD, applications, fichiers, pages Web Internet ;
Transform (préparation/transformation) : vérifier qu'une donnée est
cohérente par rapport aux données déjà existantes dans la base cible, la
convertir si besoin est ;
Load : (chargement): prendre en compte la gestion du format final des
données.
Notions fondamentales en BI
Entrepôt de données
spatiales & SOLAP
Le stockage : les données sont stockées dans les bases spécialisées
Datawarehouse et datamart, en vue de les analyser pour la prise de
décisions.

 La diffusion ou distribution des données: ouvre l’accès à l’ED via le


portail informationnel décisionnel de l'entreprise (EIP :Enterprise
Information Portal).

L'exploitation ou présentation des données : les données sont


accessibles et exploitables par différentes familles d'outils : des
tableaux de bords, des outils de data mining/Spatial Data mining, des
outils OLAP ou SOLAP
Notions fondamentales en BI
Entrepôt de données
spatiales & SOLAP
Les quatre principales fonctions d’un système décisionnel
Entrepôt de données EDS: Définitions
spatiales & SOLAP
Les EDS combinent les approches d’entrepôts de données
classiques et des bases de données spatiales

+ =
OLAP
SIG SOLAP
EDS: Définitions
La définition d’un EDS étend celle d’un ED proposé par Bill Inmon :
Entrepôt de données
spatiales & SOLAP créateur de ce concept

« Un EDS est une reformulation d’un entrepôt de données


conventionnel ; Il intègre à la fois des données spatiales et
alphanumériques et il reformule les concepts des ED
(dimension , mesures, etc.) ».

« Gère des gros volumes de données historiées et


spatialement référencées extraites de différentes sources pour
supporter le processus de prise de décision »(Stefanovic et al.,
2000)
Entrepôt de données
spatiales & SOLAP

SOLAP
SIG + OLAP =
EDS: Architecture
Entrepôt de données EDS : Architecture
spatiales & SOLAP L’architecture décisionnelle basée sur les entrepôts de
données spatiales est organisé principalement autour de :

(1) ETL spatial:


• Les sources de données spatiales présentent des types
d'hétérogénéité particuliers liées à leur nature(différents systèmes
de référence spatiale, différentes échelles géographiques, etc.).

• Leur intégration dans les EDS nécessite donc des outils ETL
dédiés de fonctionnalités telles que: le géocodage la re-projection,
etc.
Entrepôt de données EDS: Architecture
spatiales & SOLAP
(2) L’entrepôt de données spatial (EDS) : assure le
stockage des données spatiales et non-spatiales, résultat de
l’ETL, afin de les exploiter dans les systèmes Géo-
décisionnels

(3) Serveur SOLAP : Le serveur SOLAP implémente les


cubes spatiaux.

(4) Client SOLAP : Le client SOLAP représente un


enrichissement du client OLAP avec la visualisation
cartographique.
Entrepôt de données SOLAP
spatiales & SOLAP

Plateforme visuelle supportant l’analyse et


l’exploration rapides et faciles des données
selon une approche multidimensionnelle à
plusieurs niveaux d’agrégation via un affichage
cartographique, tabulaire ou en diagramme
statistique (Yvan Bédard,2005)
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Dimension spatiale
 Les dimensions sont les diverses perspectives utilisées
pour analyser les données (axes d’analyse),
 Les instances d’une dimension sont appelées membres
 Est décrite par une ou plusieurs hiérarchies
 Contient au moins une hiérarchie spatiale
 Peut être de trois types:
Non géométrique ou descriptive, géométrique et mixte
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Exemple de Dimension spatiale
Dans un système SOLAP dédié à la santé : la dimension hôpital peut
être représenté comme suit :
Localisation
Région
Hôpital Département -num région
-num hôpital -num dept -nom région
-nom hôpital -nom departement
-Nb lits…

Un hôpital est de type point est inclu dans un


département qui est à son tour inclu dans une région
Cette dimension est de type ……………………Pourquoi?
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Descriptive : les membres de la dimension ont une référence spatiale
textuelle (ex. nom de lieu). Une telle dimension spatiale peut être gérée
par des outils OLAP;

Géométrique : les membres de tous les niveaux des hiérarchies de la


dimension, ont une composante géométrique pouvant être
cartographiquement visualisée;

Mixte : C’est la combinaison des deux premières dans la mesure où


certains membres comportent une composante géométrique, d'autres une
référence spatiale nominale seulement.
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP Exemples illustrant les Types de Dimension spatiale
Algérie

Algérie

Alger Sétif …

Hussein Dey….
Dar el Beida

non géométrique Géométrique Mixte


Entrepôt de données Concepts fondamentaux
spatiales & SOLAP Hiérarchie spatiale
 Une hiérarchie est spatiale s’il y a au moins un niveau contenant la
composante spatiale. Celui-ci est dit niveau spatial.

 une hiérarchie est


 totalement spatiale si tous les niveaux sont spatiaux,
 partiellement spatiale s’il y a au moins un niveau non
spatial.
 Les membres (un membre est une instance d’un niveau) de deux
niveaux spatiaux sont liés par une relation topologique d’inclusion ou
d’intersection
Exemple : pays inclut ville, ville inclut rue et rue à proximité d’un
bâtiment.
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Hiérarchie de généralisation
 Les membres des niveaux représentent l’information
géographique à différentes échelles.

 Les membres d’un niveau sont les résultats de la


généralisation des membres du niveau directement
inférieur. Wilaya Daïra Communes

Généralisation
Niveau de détail
Le Moins élevé Niveau de détail Niveau de détail
intermédiaire Élevé
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP Mesure spatiale

 Dans les EDS, tout comme les ED, Le concept de fait


constitue le sujet de l’analyse

un fait est dit spatial s’il contient au moins une mesure
spatiale ou un niveau d’agrégation spatiale, il peut
être géométrique ou non géométrique.

Géométrique, numérique et complète.


Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Mesure spatiale
 Numérique :
Une valeur numérique qui peut être une métrique ou une
valeur dérivée d’une mesure géométrique
(ex. la surface d'une région géographique, la distance
entre régions spatiales ou le nombre de voisins d’une
région)
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Mesure spatiale
 Géométrique
Un ensemble de coordonnées ou de pointeurs vers un
ensemble de géométries résultant de l’application d’une
fonction d’agrégation spatiale.
Exemple : agrégation des géométries des régions contiguës ayant un taux
de précipitation similaire( opération d’union)
Entrepôt de données Concepts fondamentaux
spatiales & SOLAP
Mesure spatiale
 Complète
Mesure spatiale complète : est une combinaison d’une
valeur numérique avec la géométrie qui lui est associée.

Exemple : le nombre de zones vertes d’une ville et leurs


localisations.
Entrepôt de données Modèle spatio-multidimensionnel
spatiales & SOLAP
 Le modèle multidimensionnel présente les données dans un
espace à n dimensions, généralement appelé
« cube de données » ou un « hypercube ».
 Le modèle spatio-multi-dimensionnel étend le modèle
multidimensionnel des systèmes d’ED avec de nouveaux
concepts :
Un cube/hypercube spatial est défini par des dimensions et des
faits, il contient au moins une dimension ou une mesure
spatiale.
Modèle spatio-multidimensionnel
Entrepôt de données
spatiales & SOLAP
Exemple d’un cube à 3 dimensions dont l’une d’entre
elles représente la localisation, elle est donc spatiale
(ville  pays )
Entrepôt de données Modélisation multidimensionnelle
spatiales & SOLAP
 Considère le sujet analysé comme un point dans un espace à
plusieurs dimensions.

 Les données sont organisées de manière à mettre en évidence le sujet


analysé et les différentes perspectives de l'analyse
nécessite :

Approche1 : Une analyse des besoins : qu’est ce qu’on va étudier ?


Approche 2: Une analyse des données disponibles : que peux-on
étudier?
Approche 3: une hybridations entre les deux premières approches

32
Entrepôt de données Modélisation dimensionnelle
spatiales & SOLAP
Schémas conceptuels

 En étoile

 En flocon de neige

 En constellation
Entrepôt de données Modélisation dimensionnelle
spatiales & SOLAP
Exemple 1

Analyser les ventes d’une entreprise de restauration rapide dont ses


enseignes sont installées dans différentes villes d’un pays

L’objectif est de mesurer les ventes grâce aux quantités vendues et aux
bénéfices, en fonction des ventes réalisées par jour, par semaine, par
mois et par annéedans un restaurant donné, pour un aliment donné
Entrepôt de données Modélisation dimensionnelle
spatiales & SOLAP Suite Exemple 1:
Les restaurants peuvent être regroupés en fonction de leurs villes et de
leur pays.

Sujet d’analyse : les ventes d’une entreprise de restauration rapide


exemples de mesures: QtesVendues, bénéfices.

Dimensions: temps
Restaurant
Aliment ou Produit

on peut enrichir selon les besoins exprimés par les utilisateurs du système
Entrepôt de données Modèles conceptuels :
spatiales & SOLAP
Le schéma en étoile :
Entrepôt de données Modèles conceptuels :
spatiales & SOLAP
Exemple 1: modèle en flocon de neige
Entrepôt de données Modèles conceptuels
spatiales & SOLAP
Suite Exemple 1: Niveaux de Hiérarchies de la dimension spatiale
Restaurant
Restaurant Est plus fin que ville
geometry: point geometry : polygone
Est plus fin que

pays
geometry: polygone

Une relation d’inclusion est vérifiée entre les différents niveaux de hiérarchie
Modèles conceptuels :
Exemple 2 : analyse des ventes d’une Exemples pratiques
Entrepôt de données
spatiales & SOLAP entreprise géographiquement étendu
sur des continents

Relation spatiales
avec ses hiérarchies
Dimension spatiale
Entrepôt de données Opérateurs spatiaux
spatiales & SOLAP

Les opérateurs SOLAP, parcourent les hiérarchies des


dimensions spatiales et permettent de visualiser les
mesures à différentes granularités de détail (par exemple,
pays, régions, villes, quartier, etc.).
spatiaux
Spatial Drill-down : Est un opérateur de forage qui permet de naviguer
Entrepôt de données
spatiales & SOLAP
dans la hiérarchie d’une dimension spatiale du niveau le plus général au
niveau le plus détaillé (par exemple, pays).
données Opérateurs spatiaux
SOLAP
dedonnées
&SOLAP
Exemple 2: Spatial Roll-up :
opérateur de remontage
(opérateur qui permet de
naviguer du niveau le
Entrepôtde

plus détaillé au niveau


spatiales&

plus général tout en


spatiales
Entrepôt

agrégeant les mesures


des membres du niveau
détaillé
Entrepôt de données Opérateurs spatiaux
spatiales & SOLAP
Spatial Roll-up est
l’inverse de
Spatial Drill-down
Entrepôt de données
spatiales & SOLAP Spatial Drill-Across : Permet de
visualiser un autre membre dans le même
niveau de la hiérarchie.
Opérateurs spatiaux
Le pivot : appliquée sur une carte, cette opération permet de changer l'orientation
Entrepôt de données
spatiales & SOLAP des dimensions pour produire une autre carte.
Entrepôt de données Opérateurs spatiaux
spatiales & SOLAP
Spatial Slice : Est un opérateur de coupe permet de sélectionner un
sous-ensemble des cellules de l’hypercube spatial en appliquant un
prédicat spatial (métrique, d’ordre ou topologique) sur les membres
d’une dimension spatiale.

Spatial Dice: cet opérateur de coupe permet de sélectionner un sous-


ensemble de données en appliquant des prédicats spatiaux à des
membres spatiaux de deux dimensions spatiales ou plus.
Entrepôt de données Opérateurs spatiaux
spatiales & SOLAP Opérateurs dans BD versus opérateur OLAP
Entrepôt de données Typologies des solutions SOLAP
spatiales & SOLAP Classification de (Bédard et al. 2005):
(1) OLAP dominant
(2) SIG dominant
(3) OLAP-SIG intégrés.
SIG dominant :
 disposent de toutes les fonctionnalités d’un SIG pour la gestion
et la visualisation des données spatiales
 Possibilités limitées en matière d’analyse des données spatiales
 pas de serveur OLAP : simulé avec une base de données
relationnelle modélisée sous forme d’étoile (Hernandez et al.
2005)..
Entrepôt de données
spatiales & SOLAP
Typologies des solutions SOLAP
OLAP dominant :
 disposent d’un serveur OLAP et offrent ainsi toutes
les fonctionnalités de l’analyse multidimensionnelle
(Stolte et al., 2003)
 les opérations SIG sont seulement limitées à la
navigation cartographique et la sélection d’objets,
aussi
 les opérateurs spatiaux de forage et de coupe sont
souvent impossibles ou très limités.
Entrepôt de données
spatiales & SOLAP
Typologies des solutions SOLAP
OLAP-SIG intégrés : c’est la solution la plus complète et le
plus adapté pour une analyse spatio-multidimensionnelle.

 Fusionne toutes les fonctionnalités d’un SIG et d’un


système OLAP, ce qui lui permet de gérer les différents
concepts de SOLAP
Exemple de visualisation avec un client SOLAP JRubik extrait de
(Mahboubi et al,2011)
Entrepôt de données
spatiales & SOLAP
Entrepôt de données Conclusions
spatiales & SOLAP
 L'entrepôt de données contient des informations
historisées, globalement cohérentes, organisées selon les
métiers de l'entreprise pour le processus de décision.
 l’ED est donc bien différent des bases de données
 SOLAP = SIG +OLAP
 L’ entrepôt de données spatiales et les applications
SOLAP offrent des fonctionnalités d’analyse permettant
la restitution de résultats sous différentes forme :
rapports et graphes ainsi qu’un nouvelle forme : la
visualisation cartographique
Entrepôt de données Conclusions
spatiales & SOLAP
 la visualisation cartographique constitue un support
efficace d’aide à la décision ;

 l’amélioration des systèmes d’accès à l’information dans


SOLAP constitue un axe de recherche d’actualité

« Le défi du Datawarehouse, c’est le passage de


l'informatique de gestion à la gestion de l'information ».
J.P. Minarro

53

Vous aimerez peut-être aussi