Vous êtes sur la page 1sur 31

COURS :

SYSTÈME D’INFORMATION
4GINDUS

Pr F. EL MOSAID

ENSA- 2021/2022
CHAPITRE V : SIAD
CHAPITRE V : INFORMATIQUE DÉCISIONNELLE-BUSINESS INTELLIGENCE

POINTS CLÉS

-Architecture d’un système décisionnel


-Le datawarehousing
Architecture d’un système décisionnel
LE PROCESSUS D’ENTREPOSAGE DES DONNÉES
(DATA WAREHOUSING)
Les différentes phases du data warehousing

-Modélisation et structuration
-ETL
-Analyse en ligne - OLAP
-Administration
Phase MODELISATION ET STRUCTURATION

Il s'agit de définir la finalité de l'ED :


-Cibler l'activité de l'entreprise à piloter.
-Déterminer et recenser les données à entreposer.
-Définir les aspects techniques de la réalisation.
-Modèle de données.
-Définir des démarches d'alimentation.
-Arrêter des stratégies d'administration.
-Définir des espaces d'analyse.
-Choisir un mode de restitution…
Phase MODELISATION ET STRUCTURATION

-Concepts de bases : Faits, Dimensions


-Modèles multidimensionnels : étoile; flocons de
neige; constellation
-Les hiérarchies
-Estimer le volume d’un ED
-Modèles logiques : ROLAP; MOLAP; HOLAP
-Administration : rôles et responsabilités
Phase ETL

-Sélection et extraction de données


-Transformation de données
- Chargement de données ou Alimentation
d'un ED
-Administration d'un ED
Phase ETL

Travail technique.
-Extraction des données des différentes
sources de production (sources de données
internes ou externes).

-Nettoyage des données, règles


d'homogénéisation des données sous formes
de métadonnées.
Phase ETL

-Techniques d'alimentation :

→Chargement des données dans l'ED.


→Fréquences de rafraîchissement :
--par des applications sur les sources de
données et l'ED.
--par des serveurs de réplication du SGBD ou
par des outils spécialisés.
Phase OLAP

C'est le but du processus d'entreposage des


données :

-Elle conditionne le choix de l'architecture de


l'ED et de sa construction.

-Elle doit permettre toutes les analyses


nécessaires pour la construction des
indicateurs recherchés.
Phase ADMINISTRATION

-C’est une phase transversale.


-Elle est constituée de plusieurs tâches pour
assurer :
--la qualité et la pérennité des données aux
différents applicatifs.
--la maintenance.
--la gestion de configuration.
--les mises à jour.
--l'organisation, l'optimisation du SID.
--la mise en sécurité du SID.
LA MODÉLISATION D’UN DATA WAREHOUSE
Il existe 3 formes de modèles multidimensionnels :

1. Le modèle en étoile (Star schema)

2. Le modèle en flocon de neige (Snowflaked


schema)

3. Le modèle en constellation (Factflaked schema)


Concepts clés :
Les Faits

Déf: Un fait est la plus petite information


analysable.
C'est une information qui contient les données
observables (les faits) que l'on possède sur un
sujet et que l'on veut étudier, selon divers axes
d'analyse (les dimensions).

Un fait : une mesure (généralement quantifiable)


Un fait : un indicateur
Concepts clés :

Les « faits » dans un entrepôt de données, sont


normalement numériques, puisque d'ordre
quantitatif.

Il peut s'agir du montant en argent des ventes,


du nombre d'unités vendues d'un produit, etc.
Structure de base d’une table de faits

Table de fait
Mesure
Mesure

Table de fait
Id_dim1
Id_dim2

Mesure
Mesure

Les Dimensions
Déf: Une dimension est une ''table'' qui
représente un axe d'analyse selon lequel on veut
étudier des données observables (les faits) qui,
soumises à une analyse multidimensionnelle,
donnent aux utilisateurs des renseignements
nécessaires à la prise de décision.
Les Dimensions
Une ''dimension'' : un axe d'analyse.

Il peut s'agir des Clients ou des Produits d'une


Entreprise, d'une Période de temps comme un
exercice financier, des activités menées au sein
d'une société, etc.
Granularité et hiérarchie des dimensions

Temps Jours Mois Trimestres Années

Villes Régions Pays


Géographie

Produits Numéros Types Gammes Marques


Structure de base d’une dimension

Dim1

Id_dim1
Attribut
Attribut

Le modèle en étoile

Une « table » de faits : identifiants des tables de


dimensions et une ou plusieurs mesures.

Plusieurs tables de dimension : descripteurs des


dimensions

Une granularité définie par les identifiants dans la


table des faits.
Le modèle en étoile
Le modèle en étoile
Avantages :
-Facilité de navigation
-Performances : nombre limité de jointures ; gestion
des données creuses.
-Gestion des agrégats
-Fiabilité des résultats

Inconvénients :
-Toutes les dimensions ne concernent pas les mesures.
-Redondances dans les dimensions
-Alimentation complexe.
Propriétés des mesures :

Additivité : somme sur toutes les dimensions

Exemple :
Quantités vendues, chiffre d’affaire
 Peut être le résultat d’un calcul (Bénéfice =
montant vente – coût)
Semi‐additivité :
somme sur certaines dimensions

Exemple :
Solde d’un compte bancaire
 Pas de sens d’additionner les dates
(représente des instantanés d’un niveau).
Non additif : fait non additionnable quelque
soit la dimension.

Exemple :
Prix unitaire : l’addition sur n’importe quelle
dimension donne un nombre dépourvu de sens.
Exercice
Le directeur d’une entreprise de la grande distribution
souhaite analyser et suivre les ventes de produits dans son
réseau de magasins. Il souhaite obtenir réponse aux questions
suivantes :
-Quels produits dégagent la plus forte rentabilité dans le
temps?
-Existe-t-il des disparités régionales de consommation des
produits?
-Quel est la répartition des ventes entre les produits de
marque des fabricants et ceux de la marque du distributeur?
-Quel est le chiffre d’affaire réalisé avec les plus gros
fournisseurs?
L’ensemble des informations seront issues des tickets de
caisse.

Les axes d’analyse : L’axe produit, l’axe magasin, l’axe


temps, l’axe localité, l’axe fournisseur.

Il faut ensuite décrire la hiérarchie de chacun de ces axes :


-Pour l’axe produit : un produit appartient à une sous-famille
de produits, laquelle appartient à une famille de produits,
laquelle appartient à une gamme de produit.
-Pour l’axe magasin : un magasin est rattaché à une enseigne.
-Pour l’axe fournisseur : un fournisseur appartient à un
groupe de fournisseur.
-Pour l’axe localité: une localité est rattachée à une ville,
laquelle est rattaché à une région, laquelle est rattaché à un
pays.
-Pour l’axe temps : un mois est rattaché à un trimestre qui est
rattaché à un semestre qui est rattaché à une année.

On cherche alors décrire les indicateurs suivants : les ventes


par produits, par magasin, par fournisseur, par région et dans
le temps.

Travail à faire :
Proposer un schéma en étoile pour ce cas.

Vous aimerez peut-être aussi