Vous êtes sur la page 1sur 41

Chapitre 5 : Exploitation des

entrepôts de données.
Exploitation de entrepôts de données : place
dans le processus d’entreposage

112
Principales applications autour d'un ED
 Réalisation de rapports divers (Reporting)

 Réalisation de tableaux de bords

(Dashboards)

 Analyse en ligne diverses (OLAP)

 Fouille de données (Data Mining)

113
Rapports (Reporting)
Pour les utilisateurs qui ont besoin d'un accès régulier à des
informations d'une manière presque statique. Ces
informations sont envoyées à l’usager (mode push);
Ex: les hôpitaux doivent envoyer des rapports mensuels à des
agences nationales
 Les utilisateurs ont moins de contrôle sur les données
présentées;
 Nécessitent peu de connaissances techniques et d’interaction
de la part des utilisateurs;

114
Rapports (Reporting)
 Un rapport est défini par une requête (plusieurs requêtes) et une
mise en page (diagrammes, histogrammes, etc).
 Un rapport est normalement présenté dans un format souvent
prédéfini et peu flexible et facilitant la lecture.
 Les rapports peuvent être exécutés automatiquement ou
manuellement

115
Rapports (Reporting) : Types
 Rapports préformatés:
 Fournir une libraire de rapports fréquemment employés
avec une description de leur contenu.
 Exemples:

Ventes YTD vs ventes prédites;


Taux de réponses courrier par promotion par produit;
 Rapports paramétrables:
 Offrir la possibilité de modifier facilement le contenu du
rapport à l’aide de paramètres (ex: choix d’un produit, d’une
région, etc.)
116
Rapports (Reporting) : Exemple

117
Tableaux de bords (Dashboards)
 Affichent une quantité limitée d'informations dans un format
graphique facile à lire.
 Mettent en valeur les indicateurs de performance et les
problèmes à l’aide d’éléments visuels:
 Graphiques (ex: courbes, tarte, etc.);
 Jauges (ex: profits par utilisateur);
 Feux de circulation (ex: rouge signifie problème);

118
Indicateurs clés de performance (KPI)
Définition : mesures permettant d’évaluer la performance
d’une entreprise et le progrès réalisé dans l’atteinte de ses
objectifs d’affaires.
Caractéristiques:
 Mesurables;
 Faciles à comprendre;
 Reliés à des objectifs d’affaires concrets;
 Décidés par les gestionnaires et la haute direction;
 Associés à des individus responsables de leurs résultats.
 Calculés à partir des mesures des faits

119
Indicateurs clés de performance : exemples

120
Indicateurs clés de performance : KPI Ventes
 Taux d’acceptation : ce KPI permet de déterminer le nombre de devis qui a abouti
en projet, en %.
 Ventes par pays : ce KPI permet de localiser les ventes ce qui permet de
déterminer dans quel pays/régions les commandes sont les plus nombreuses. Peut
aider à savoir où s’implanter.
 Différences des ventes entre la Tunisie, et les autres pays : permet de comparer les
ventes en Tunisie, avec l’exportation dans les autres pays.
 Meilleurs commerciaux : permet de savoir quels sont les meilleurs commerciaux,
ce qui permet par exemple de mieux les motiver (récompenses, etc)
 Chiffre d’affaires : permet de comparer régulièrement ses performances réelles
avec celles prévues initialement ce qui permet d’adapter sa stratégie et maîtriser
ses coûts.
121
Tableaux de bords (Dashboards)
 Requièrent très peu de connaissances techniques des
utilisateurs;
 Ces utilisateurs sont généralement les cadres supérieurs
qui ont besoin d'un rapide aperçu des changements les plus
importants
 Ex : un aperçu en temps réel d'évolutions
 Pas vraiment utile pour une analyse complexe et détaillée.

122
Tableaux de bords des ventes

123
rapports et tableaux de bord : outils
Trois outils ciblant les grandes entreprises

 Qlik – Qlik Sense

 Salesforce – Tableau

 Microsoft – Power BI

124
Tableau software
 Tableau est une solution Business Intelligence (BI)
de reporting éditée par la société Tableau Software, récemment
rachetée par Salesforce permettant d’obtenir des visualisations
détaillées et significatives.

 Tableau permet de créer des dashboards de


façon intuitive et visuelle mais également d’effectuer des analyses
efficaces en les publiant de façon dynamique

 La solution possède 5 modules : Tableau Desktop, Tableau Reader,


Tableau Server, Tableau Online et Tableau Public.

125
Tableau software

126
Analyse OLAP (On-Line Analytical processing)
Permettent de réaliser des synthèses, des analyses
et de la consolidation dynamique de données
multidimensionnelles
Permet de visualiser des données sous la forme de
tableaux croisés appelés pivots
 Constitue la façon la plus naturelle d'exploiter un
ED du fait de son organisation multidimensionnelle

127
Analyse OLAP : Exemple d’un pivot

128
Fouille de données (Data Mining)
 Recherche de connaissances, sous forme de modèle de
comportement, cachés dans les données
 Domaine jeune à lʼintersection de lʼIntelligence Artificielle, les
Statistiques, les BD
 Nombreuses techniques de fouille : régression linéaire,
induction d'arbres de décision, algorithmes génériques,
réseaux de neurones, …
 Les techniques de fouille sont en pleine évolution et sont
de plus en plus intégrées dans les ED

129
Fouille de données : Exemples réels
 Une grande université américaine prédit si un étudiant va choisir de
s’inscrire en appliquant des modèles d’analyse prédictive sur les
données des candidats et l’historique d’admission;

 Une compagnie aérienne a augmenté ses revenus et le taux de


satisfaction de ses clients en estimant mieux le nombre de passagers
ne se présentant pas à un certain vol (gestion de l’overbooking).

130
Chapitre 6 : Analyse en ligne
des entrepôts de données.
Introduction
Un ED a besoin d'être manipulé pour extraire des
informations nécessaires à la prise de décision
Exemples de questions associées :
 Quels sont les produits dont les ventes ont chuté l'an dernier?
 Quelles sont les quinze meilleures ventes par magasin et par semaine durant
le premier trimestre de l'année 2001?
 Quelle est la tendance des chiffres d'affaire (CA) par magasin depuis 3 ans?
 Quelles prévisions peut-on faire sur les ventes d'une catégorie de produits
dans les 6 mois à venir ?

132
…Introduction

Analyse des ventes de


divers produits. écrous
Clous
Vis

Les ventes de vis sont


plus faibles que prévu...
quelles couleurs sont rose
noire
verte
rouge
responsables ?

133
…Introduction
 L'exploitation des données multidimensionnelles peut se faire par
divers outils (reporting, OLAP, fouille de données)
 OLAP (On Line Analytical Processing) : navigation interactive dans un
cube de données.
Dim1
 Notion de cube :
 Métaphore d'une structure multidimensionnelle. Dim3 Dim2
 Graphiquement, limité à trois dimensions, au delà de trois, difficile à schématiser.
 Peut être extraite d'un entrepôt de données ou d'un magasin de données pour
effectuer l'OLAP.
 Peut contenir les données à la base (les plus détaillées) ou les données agrégées
(cuboïde).
 Peut être créé à la volée et analysé ou créé et stocké.

134
Exemple

135
Opérations élémentaires OLAP
3 catégories d'opérations élémentaires :

 Restructuration : Permettent un changement de points de vue, une réorientation


selon différentes dimensions de la vue multidimensionnelle :
 Rotate/pivot Switch Split, nest, push, pull

 Granularité : concerne un changement de niveau de détail : opérations liées au


niveau de granularité des données :
 roll-up drill-down

 Ensembliste : concerne l'extraction et l’OLTP classique :


 slice, dice sélection projection jointure (drill-across)

136
Opérations de restructuration : Rotate/Pivot
 Sélection de faces :
 Rotation du cube autour d'un de ses 3 axes passant par le centre de 2 faces
opposées
 Présentation d'un ensemble de faces différentes
Le cube a pivoté
autour de
lʼaxe/dimension
régions

137
Exemple

Pivot (Temps.Année, Géographie.Département


-> Temps.Année, Véhicules.Couleur)

? 138
Opérations de restructuration : Switch/permutation

 consiste à inter-changer la position des membres (niveaux) d’une


dimension.

Inter-changer les
membres nord et sud
de la dimension
régions

sud 1999 1998 1997


vis 50 60 20
clous 10
écrous 40

139
Opérations de restructuration :Split/division

 Présentation de chaque tranche du cube


 Passer d'une présentation tridimensionnelle a une présentation
d'un ensemble de tables

Split (régions) Ventes est 1999 1998 1997 Ventes ouest 1999 1998 1997
écrous 50 70 100 écrous 10 30
vis 10 10 vis 50 50 50
clous 70 70 100 clous 10 40

Ventes sud 1999 1998 1997 Ventes nord 1999 1998 1997
écrous 40 écrous 10
vis 50 60 20 vis 60 30 20
clous 10 clous 40 20

140
Opérations de restructuration : Nest/Emboîtement
 Imbrication des membres a partir du cube Ventes Nest 1999 1998 1997

Est
50 70 100
 Regrouper sur une même représentation Ouest
10 30
bidimensionnelle toutes les informations écrous
Nord
10
(mesures et membres) d'un cube Sud
40
indépendamment du nombre de ses dimensions. Est
10 10
Ouest
50 50 50
vis
Nord
60 30 20
Nest (pièces, région) Sud
50 60 20
Est
70 70 100
Ouest
10 40
clous
Nord
40 20
Sud
10

141
Exemple

Nest (Véhicules.Couleur, Temps.Année)

? 142
Opérations de restructuration : Push / Enfoncement
 Consiste à combiner les membres d’une dimension aux
mesures du cube, i.e. de faire passer des membres comme
contenu de cellules. Ventes push Est Ouest Nord Sud

1999 50 1999 40

Écrous 1998 70 1998 10


1997 100 1997 30 1997 10
push(année) 1999 50 1999 60 1999 50

Vis 1998 10 1998 50 1998 30 1998 60


1997 10 1997 50 1997 20 1997 20
1999 70 1999 40

Clous 1998 70 1998 10 1998 20 1998 10


1997 100 1997 40

143
Exemple

Push (Véhicules.Couleur)

? 144
Opérations de granularité : Roll-up / forage vers le haut
 Passer d'un niveau de détail à un niveau moins détaillé.

145
roll-up(annee.All) : Ventes 97-99

roll-up(annees.All, pieces.All)

146
Exemple

roll-up(Geographie.Region)

?
147
Opérations de granularité : Drill-down / forage vers le bas

 Passer d'un niveau de détail à un niveau plus détaillé.


Drill-Down du
niveau régions au
niveau villes :

Drill-down(regions)

148
Opérations ensemblistes : Slice (projection)
 Projection selon une dimension du cube.

π piece, region :

149
Opérations ensemblistes : Dice (sélection)
 Sélection du cube. Sélection 2 :
(régions = nord ou régions = sud) et
Sélection 1 : Ventes >= 50 (pièces = clous ou pièces = écrous) et
(années = 1998 ou années = 1999)

150
Exemple

avgLevel est une mesure de soutien nécessaire pour calculer le


niveau moyen
minLevel est nécessaire pour calculer le niveau minimum pour
chaque mois et pour chaque type de produit
Dice (Département = « Loir et Cher » ou « Gironde »,
Année = « 2007 » ou « 2008 »)

? 151

Vous aimerez peut-être aussi