Vous êtes sur la page 1sur 43

LE DECISIONNEL D’ENTREPRISE

IUT de Quimper
Licence professionnelle
« Logistique des filières alimentaires »

Intervenant : Stephane Oberlechner

S. Oberlechner Décisionnel d ’entreprise


Plan de l ’ensemble

• Concepts et structure • Les cubes - l ’OLAP


– terminologie – Description de ce principe
– Objectifs d’interrogation
• Construction du Datawarehouse – Présentation en ligne
– Cadre général • La restitution de l ’information
– Les différents composants – Présentation des requéteurs

• L ’administration des données • Le datamining et la recherche de


– Contraintes et pré requis connaissances
– Présentation des quelques techniques
de valorisation de l’information
• La modélisation des données
– Principales techniques

S. Oberlechner Décisionnel d ’entreprise


Concepts et structure
- Terminologie-

• OLTP (on line transactional processing) est le principe dont l'application régit le
relationnel classique. Il s'applique en général à la création et à la mise à jour
individuelle des informations par le biais de transactions légère.
• OLAP (on line analytical processing) est un principe plus récent dont l'application
régit le relationnel d'analyse. Il fait généralement intervenir des requêtes complexes
manipulant de grande quantité de données.
• Datawarehouse : collection de données orientées sujet, intégrées, non volatiles et
historisées, organisées pour le support d ’un processus d ’aide à la décision.
• Datamarts : Datawarehouses satellites du datawarehouse principal et liés à un métier
de l'entreprise (marketing, finance, DRH, etc).
• Infocentre : Système d'information regroupant des données thématiques, intégrées,
volatiles et actuelles, organisées pour un processus de décision ponctuel.
• S.G.B.D. : Système de Gestion de Base de Données

S. Oberlechner Décisionnel d ’entreprise


Concepts et structure
- Objectifs-

• Pourquoi un entrepôt de données ?


Service Service Service
fabrication Commercial Livraison
Information
BD segmentée
Productions peu
Infos clients d ’historique

Information
BD regroupée et
historisée
Décisionnelle Infos clients

S. Oberlechner Décisionnel d ’entreprise


Concepts et structure
- Objectifs-

• Pourquoi un entrepôt de données ? (point de vue du décideur)

– Pouvoir disposer d ’une information utile, disponible, dans un format


compréhensible.

– Amélioration de la performance de l ’entreprise, d ’un point de vue interne


et externe

– La tendance actuelle est à la personnalisation, et se rajoute aux 4


tendances précédentes : Les prix, la qualité, le temps, les services.

S. Oberlechner Décisionnel d ’entreprise


Concepts et structure
- Objectifs-

• Pourquoi un entrepôt de données ? (point de vue de la technique)

– L ’analyse de l ’activité par un non informaticien est complexe en OLTP


• Ex : Lecture d ’un modèle logique

– Les requêtes autorisées ne sont jamais ouvertes (toujours prédéfinies), et


ne permettent d ’analyser qu ’un historique réduit.

S. Oberlechner Décisionnel d ’entreprise


Concepts et structure
- Objectifs-

• 2 mondes différents
Données Structure Utilisateurs

Oltp et bases de -Atomiques -Statique -Maj autorisées


production -Orientées -Normalisée -Requetes prédéfinies
application -Réponses immédiates
-Dynamiques -Employés de bureau
-Peu d’historique
-Petite quantité
utilisée pour un
traitement
Datawarehouse -résumées -flexible -Pas de maj de la part des
-Orientées sujet -Dénormalisée utilisateurs
-Statiques -Requetes
-Haute disponibilité ouvertes/prédéfinies
- grande quantité -Analystes / Managers
utilisée pour un
traitement

S. Oberlechner Décisionnel d ’entreprise


Concepts et structure
- Architecture-

• 3 types d ’architecture sont possibles:

– L ’architecture réelle : stockage réalisé dans un SGBD séparé du système


de production . C’est l’architecture à favoriser.

– L ’architecture virtuelle : Les données sont conservées dans le système de


production mais une couche logicielle les rend visibles.

– L ’architecture remote : Les données détaillées sont conservées dans le


système de production, seules les agrégations sont stockées séparément.

S. Oberlechner Décisionnel d ’entreprise


Construction du Datawarehouse
- Cadre général-

• Objectif: recomposer les données disponibles pour en obtenir une vision intégrée et
transversale aux différentes fonctions de l ’entreprise, une vision métier au travers de
différents axes d ’analyse et une vision agrégée ou détaillée, adaptée à son besoin.
Application N
Application 3
Application 2
Application 1

ACQUISITION

STOCKAGE ACCES

IDENTIFIER
Infrastructure opérationnelle
Infrastructure technique

S. Oberlechner Décisionnel d ’entreprise


Construction du Datawarehouse
- Les composants fonctionnels-

• L ’acquisition ( Ou « ETL » : Extract, Transform & Load) est le


premier des 3 composants fonctionnels du DW (Acquisition
/stockage/Accès)

– L ’extraction : la récupération des données des bases de production,


transactionnelles

– La préparation / transformation : Recodification ou suppression de


certaines valeurs

– Le chargement : alimentation du datawarehouse

S. Oberlechner Décisionnel d ’entreprise


Construction du Datawarehouse
- Les composants fonctionnels-

• Le stockage

– Composant de base : Le SGBD

– Il doit proposer des extensions pour répondre aux caractéristiques du


décisionnel.

– Il doit apporter la transparence à l ’évolution matérielle.

S. Oberlechner Décisionnel d ’entreprise


Construction du Datawarehouse
- Les composants fonctionnels-

• L ’accès

– Laisser aux utilisateurs l ’opportunité d ’utiliser les solutions les mieux


adaptées à leur besoin :
– Interrogation
Analyse simple
– Analyse
– ...

– Géomarketing
– Segmentation Data Mining
– Prévision
– ...

S. Oberlechner Décisionnel d ’entreprise


Construction du Datawarehouse
- L ’infrastructure-

• L ’infrastructure technique :
– Choix du fournisseur : « One stop shopping » ou assemblage de briques
logicielles ?
– Choix des outils : Construire, acheter, faire avec l ’existant ?
– Quels sont les utilisateurs, où sont ils situés , (Datamart vs datawarehouse,
Web vs C/S)
– quelle Structure de stockage?

• L ’infrastructure organisationnelle :
– Organisation des équipes de développement et d ’exploitation.

S. Oberlechner Décisionnel d ’entreprise


L ’administration des données
- Cohérence et fiabilité (En Amont)-

• Redondance, duplication du système de production :


– La vision du client est différente suivant les services de l ’entreprise.

• Incohérence selon l ’origine ou dans le temps :


– La notion de produit peut ne pas être la même partout malgré une
dénomination identique. (La gamme « Golf » chez Wolkswagen)
– Inversement, un produit peut changer de formulation (« Raider » en
« Twix »)

» Solution: Gérer un versionnement, écraser l ’ancienne valeur…

• Non fiabilité de la donnée selon l ’origine de la donnée

S. Oberlechner Décisionnel d ’entreprise


L ’administration des données
- Cohérence et fiabilité (En Aval)-

Dans le cadre du Datawarehouse, on retrouve ces problèmes


avec en plus le besoin d ’agréger et/ou de consolider les
données, d ’ou un effort pour assurer :

• la cohérence et l ’indépendance (Par rapport aux différentes


sources de données)
• La consolidation: Interpréter correctement un CA dépend du
périmètre de consolidation par exemple.
• L ’historisation : Pouvoir restituer un contexte.

S. Oberlechner Décisionnel d ’entreprise


L ’administration des données
- Metadonnées-

• La mise en place d ’un DW doit s ’accompagner d ’un référentiel


de données

• Metadonnées : « Data about data »


Type d’information Signification

Sémantique Que signifie la donnée


Origine D’où vient-elle, où, par qui est-elle créée ou mise à jour
Règle de calcul Règle de calcul, de gestion
Règle d’agrégation Périmètre de consolidation
Stockage, format Où, comment est-elle stockée, sous quel format
Programmes informatiques qui l’utilisent,
Utilisation Machines : comment et sur lesquelles, à disposition,
Temps de conservation

S. Oberlechner Décisionnel d ’entreprise


Modélisation des données
- Qualification d ’un modèle décisionnel-

Lisibilité

Performances Administration
(Chargement)

Évolutivité
Performances
(Exécution)

S. Oberlechner Décisionnel d ’entreprise


Modélisation des données
- Introduction-

Analyse d ’un modèle normalisé

GAMME Pays
Id gamme Fournisseur
Id fourn Id pays
libellé libellé CLIENT
objectif marge nom
Id client
id pays
nom
adresse
id pays
Produit Commande
Id prod Id cde
id gamme Ligne cde
id exp
id fourn Id cde
id client
nom code pays N° ligne
id prod date
prix ht remise
qte
remise
id tva

S. Oberlechner Décisionnel d ’entreprise


Modélisation des données
- Processus de conception-

• Modèle en étoile
– Table de fait
– Table de dimension à un niveau (volume important)

• Modèle en flocon
– Table de fait
– Plusieurs niveaux de tables de dimensions (volume moindre mais jointures
pour reconstruire)

S. Oberlechner Décisionnel d ’entreprise


Modélisation des données
- Techniques de modélisation - Dénormalisation-

Le modèle en étoile

Fournisseur
Id fourn Produit
libellé
Id prod
type
libellé
region gamme
Ventes cout unitaire
Id prod couleur
id fourn
jjmmaaaa
id client
.
Temps .
jjmmaaaa . Client
semaine Id client
trimestre Ca nom
quadrimestre Marge adresse
année unité situation maritale

S. Oberlechner Décisionnel d ’entreprise


Modélisation des données
- Techniques de modélisation - Dénormalisation-

Le modèle en Flocon Gamme


id gamme
Fournisseur nom gamme
fourchette prix
Id fourn
libellé
type Produit
region Id prod
libellé
id gamme
Ventes
Jour_sem cout unitaire
Id prod couleur
jj id fourn
jour jjmmaaaa
id client
.
Mois Temps .
jjmmaaaa . Client
mm Id client
Nom semaine
Ca nom
trimestre adresse
Marge
année situation maritale
unité

S. Oberlechner Décisionnel d ’entreprise


Modélisation des données
- Optimisation physique-

• Agrégation de tables
– avantages : temps d ’exécution des requêtes amélioré (information déjà
agrégée)
– inconvénients : coût de stockage

• Partitionnement de tables
– avantages : permet de réduire le volume manipulé par le moteur de la base
de donnée -> gain à l ’exécution des requêtes.
– Inconvénient : rigueur à l ’administration

• Autres : indexation, indexation Bitmap, choix de l ’OLAP,… la


liste n’est pas finie
S. Oberlechner Décisionnel d ’entreprise
Modélisation des données
- Optimisation physique-

Principe d’indexation Bitmap :

blond(es) aux
personne index bitmap index bitmap
couleur cheveux couleur yeux yeux vert ?
nom cheveux yeux noir brun blond bleu vert marron
a noir bleu 1 0 0 1 0 0 0 0
b brun bleu 0 1 0 1 0 0 0 0
c brun vert 0 1 0 0 1 0 0 1
d noir marron 1 0 0 0 0 1 0 0
e blond vert 0 0 1 0 1 0 1 1
f brun bleu 0 1 0 1 0 0 0 0
g blond bleu 0 0 1 1 0 0 1 0

Système performant si les colonnes à indexer


comportent une liste réduite de valeurs

S. Oberlechner Décisionnel d ’entreprise


Du Datawarehouse
vers Les bases multidimensionnelles
(Cubes)

S. Oberlechner Décisionnel d ’entreprise


OLAP -Terminologie

•Analyse multidimensionnelle:

Manipulation d ’un ensemble de données préalablement agrégées, pouvant être


analysées suivant différentes dimensions (axes d ’analyse).

•Principe du cube :

Restructurer et stocker dans un format multidimensionnel les données issues de


fichiers plats ou de bases de données relationnelles ainsi que leurs jointures.
Ce format organise les données en dimensions (axe d ’analyse comme Produit,
Région, Temps...), en niveaux (hiérarchies d ’une dimension ex : famille
produit, gamme produit, nom produit).
Les catégories sont les valeurs discrètes que l ’on peut trouver dans un niveau.
Ex : 1999 et 2000 sont 2 catégories du niveau année de la dimension temps.

S. Oberlechner Décisionnel d ’entreprise


OLAP- Les règles et principes associés

D ’après les travaux d ’Edgar Codd, tout système de pilotage multidimensionnel


devrait respecter au mois les 12 règles suivantes (« Les 12 règles OLAP »).

•Vue multidimensionnelle •Gestion dynamique des matrices creuses


•Transparence du serveur OLAP à •Support multi-utilisateurs
différents types de logiciels
•Calculs à travers les dimensions
•Accessibilité à de nombreuses sources de
données •Manipulation intuitive des données

•Performance du système de Reporting •Souplesse et facilité de constitution des


rapports
•Architecture Client/Serveur
•Nombre illimité de niveaux d'agrégation
•Dimensions Génériques et de dimensions

S. Oberlechner Décisionnel d ’entreprise


L ’OLAP - Un peu plus concrètement ...

Dimension
Temps
Dimension
produit
Arêtes du cube : dimensions d ’analyse

Dimension
Vendeurs
Valeurs
observées

La comparaison (base multidimentionnelle /cube) s ’arrête


sur cette représentation. En effet, le nombre de dimensions
n ’est pas limité à 12.

S. Oberlechner Décisionnel d ’entreprise


L ’OLAP - Un peu plus concrètement ...

Ce que voit l ’utilisateur dans l ’exemple précédent :


95 96 97
Produits frais 200 240 250
Boisson 340 321 327

Où encore:
400
350
300
250
Produits frais
200
Boisson
150
100
50
0
95 96 97

(suivant la performance du système de reporting)

S. Oberlechner Décisionnel d ’entreprise


OLAP -Les principales opérations

Drill Up
(Zoom avant) 95 96 97
Zoom sur niveau ‘ 95 ’
Produits 540 561 577

Toutes dates 95 96 97 T1-95 T2-95 … … T4-97


Produits frais 690 Produits frais 200 240 250 Produits frais 43 45 88
Boisson 988 Boisson 340 321 327 Boisson 57 89 78

95 96 97
Jus d'orange 31 29 27
Lait … … …
… … … …
vin 18 12 23 Drill down
Zoom sur niveau ‘ Boisson ’ (Zoom arriere)

S. Oberlechner Décisionnel d ’entreprise


OLAP -Les principales opérations

Rotate
(Rotation-changement d ’axes)

95 96 97 95 96 97
Produits Frais 200 240 250 Paris 123 134 154
Boisson 340 321 327 Marseille 232 211 345
Lyon 254 276 287
Bordeau 276 254 199

S. Oberlechner Décisionnel d ’entreprise


OLAP -Les principales opérations

Slicing
(ou filtre)

95 96 97 95 96 97
Produits Frais 200 240 250 Produits Frais 200 240 250
Boisson 340 321 327

S. Oberlechner Décisionnel d ’entreprise


OLAP - Conclusion

Ce que permet le cube :

•Manipulation intuitive des données

•analyse des données sur plusieurs axes

•agrégations instantanées (« Drill »)

•confirmer des intuitions,et/ou l ’existence de modèles par ex:


→ saisonnalité marquée dans les ventes
→probable corrélation entre ce type de produit et ce type de
client
Démonstration sur www.multimania.com/oberlechner
S. Oberlechner Décisionnel d ’entreprise
La restitution de l ’information
-Les requeteurs -

Principe:
Utilisateurs

Le catalogue rassemble les


informations relatives:
-au DWH (Tables, vues)
« Catalogue » -aux utilisateurs (droits d ’accès,
visibilité, type de requêtes autorisée)
ou « Univers »
et permet de :
-redéfinir une vision du DWH en
fonction de l ’utilisateur, et lui
permettre la construction de requetes
en mode Graphique (GQL)

DWH

S. Oberlechner Décisionnel d ’entreprise


La restitution de l ’information
-Les requeteurs (Exemple) -

Définition de la
requête, via
l’interface
graphique

S. Oberlechner Décisionnel d ’entreprise


La restitution de l ’information
-Les requeteurs (Exemple) -

Résultat de la
requête

S. Oberlechner Décisionnel d ’entreprise


La restitution de l ’information
-Les requeteurs (Exemple) -

Avec un peu
d’entraînement…

S. Oberlechner Décisionnel d ’entreprise


La restitution de l ’information
-Les requeteurs -

• Intérêt pour l ’utilisateur :


– accéder au datawarehouse ou datamart avec une vision métier et non une
vision technique.
– Lancer des requêtes sur l ’entrepôt de données sans connaître le SQL ou
autre langage d ’interrogation, mais en utilisant une interface graphique
conviviale, permettant le « GQL » (Graphic Query Language).
– Mise en forme et présentation des résultats de bonne qualité

• Intérêt pour le service informatique:


– contrôler les accès à la base , aux tables
– maîtriser les sollicitations du serveur de données, en filtrant l ’accès aux
données

S. Oberlechner Décisionnel d ’entreprise


Le data mining et la recherche opérationnelle
-La recherche de connaissances -

• Dernier maillon de la chaîne décisionnelle : la valorisation de


l ’information

• Taches et Domaines d ’application


– La classification (ascendante ou descendante)
– L ’estimation
– La prévision
– Le regroupement par similitude

S. Oberlechner Décisionnel d ’entreprise


Le data mining et la recherche opérationnelle
-Positionnement du Data Mining -

• Statistiques descriptives et statistiques exploratoires sont


complémentaires.
• Il est nécessaire de maîtriser les règles de construction des
indicateurs de tendance centrale et de dispersion.
• Une moyenne peut être correcte, mais la variance (dispersion) importante,
traduisant une absence de maîtrise du processus
• Pourquoi utilise –t-on régulièrement le salaire « médian » et non « moyen »
dans les communiqués ?

– > Objectif: utiliser cet ensemble d ’indicateurs dans la phase de


préparation des données (première synthèse, recherche des valeurs
aberrantes ou exceptionnelles…)

S. Oberlechner Décisionnel d ’entreprise


Le data mining et la recherche opérationnelle
-La découverte de connaissance -

La découverte de connaissances non dirigée sert à reconnaître les


relations exprimées par les données tandis que la découverte de
connaissances dirigée permet d'expliquer ces relations une fois
qu'elles ont été trouvées.

S. Oberlechner Décisionnel d ’entreprise


Le data mining et la recherche opérationnelle
-quelques techniques de découverte de connaissance non dirigée -

• Analyse du panier de la ménagère

– > une approche de la matrice des corrélations

• Classification par la méthode des K-moyennes

– > comment mettre en œuvre un algorithme de classification

Présentation et exemple de mise en œuvre de ces méthodes sur


www.multimania.com/oberlechner

S. Oberlechner Décisionnel d ’entreprise


Quelques points de repères

… et des plateformes
décisionnelles open source
Communauté Insight Object Pentaho Pragmatis
Strategy web consulting

outils BEE Spago Pentaho Open


BI Decision-
nel
Source : solutions.journaldunet.com ETL Oui Oui Non Oui
Oct. 2005
Reporting Oui Oui Oui Oui
Olap Oui Oui Oui Oui
Datamining Oui Oui Oui Non

Source : 01 informatique du 11/11/2005

S. Oberlechner Décisionnel d ’entreprise


Revue de Presse

Une des réalisations d’Agrostar commentée


L’Usine Nouvelle : Le concept du
par la presse spécialisée ...
(N° 1711 du 14/02/2003) décisionnel mis à l’épreuve dans la
distribution

S. Oberlechner Décisionnel d ’entreprise