Académique Documents
Professionnel Documents
Culture Documents
1. Définitions
Une base de données peut être locale, c'est-à-dire utilisable sur une
machine par un utilisateur, ou bien répartie, c'est-à-dire que les
informations sont stockées sur des machines distantes et accessibles
par réseau.
SUPMTI/ISI
N. Zidane
A quoi cela sert-il ?
3. Comment ça marche ?
AEROPORT PAYS
AER_ID PAY_ID
PAY_ID PAY_COD
AER_COD PAY_LIB
SUPMTI/ISI
N. Zidane
Comment ça marche ?
4. Bénéfices/Contraintes
pour l’entreprise
7. Écueils à éviter
N. Zidane
1. Introduction
Objectif
» Améliorer les performances décisionnelles de l'entreprise
Comment ?
» en répondant aux demandes d’analyse des décideurs
Exemple
2012-2013
A traiter :
2012-2013
» Synthétiser / Résumer
» Visualiser
» Analyser
» NON informaticiens
» NON statisticiens
N. Zidane
Introduction –
Le système d’information
Mailing
» amélioration du taux de réponse
Banque, Assurance
» déterminer les profils client
2012-2013
Commerce
» ciblage de clientèle
» déterminer les promotions
» aménagement des rayons (2 produits en corrélation)
SUPMTI/ISI
N. Zidane
Introduction – Utilisation
Logistique
» adéquation demande / production
Santé
» épidémiologie (VIH, Amiante, ...)
2012-2013
Econométrie
» prédiction de trafic autoroutier
Ressources Humaines
» adéquation activité / personnel
SUPMTI/ISI
N. Zidane
Déclinaisons métiers du Décisionnel
Retour sur
investissement du
datawarehousing
réactives
» Cf livre de David Gotteland
SUPMTI/ISI
N. Zidane
Exploitation de données
2. L'Entrepôt de Données
(Data Warehouse)
Principe
2012-2013
DW - OLTP versus DW
N. Zidane SUPMTI/ISI 2012-2013
DW - OLTP DW
DW - Alimentation (ETL) du DW
2012-2013
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
DW - Transformations
N. Zidane SUPMTI/ISI 2012-2013
DW - Transformations
DW - Constitution de l'entrepôt
Optimisation
» besoin de synthèse agrégation des données
vs
» besoin de détails conservation des données détaillées
Notion de granularité
2012-2013
Structures
» directe simple
» cumul simple
» résumés roulants : structure généralement choisie
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
DW - Stockage
N. Zidane SUPMTI/ISI 2012-2013
DW - Stockage
N. Zidane SUPMTI/ISI 2012-2013
DW - Stockage
Un datawarehouse : Qu’est-ce que c’est ?
formes
Les différentes fonctions peuvent être couvertes par une ou plusieurs briques
logicielles.
N. Zidane
Un datawarehouse : Pourquoi ?
Afin d’optimiser le stockage des données et les restitutions (réduire la durée des interrogations)
Donner accès à des gros volumes de données qui répondent autant à des besoins
de reporting opérationnel qu’à des approches du type « tableau de bord »
synthétique.
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
N. Zidane SUPMTI/ISI 2012-2013
Architecture de BW
Extraction, Transformation et
Chargement
Ouvert pour tous types de sources
Ensemble flexible des fonctionalités d‘ETL (extract,
transform, load)
• Fichiers plats
• DBconnect
• XML (version 3.xx)
Intégration au monde SAP
• Programmes standard SAP (Business Content)
• Programmes spécifiques
• Accès direct à une table
Ouvert aux outils tiers
2012-2013
• Ascential Datastage
Supporte différents standards
SUPMTI/ISI
N. Zidane
Interface Utilisateur
client
2012-2013
Fonds
Les données transactionelles contienent
Les ratios pour l’analyse et la clés pour
acceder Master Data comme Fond,CF…
Hiérarchies
Fournisseur
Données transactionelles
2012-2013
comptabilité
avec ratios d’analyse
SUPMTI/ISI
Plan Centre
comptable Financier
N. Zidane
Le modèle en étoile des INFOCUBES
MASTER DATA
INFOCUBE DONNEES DE BASE FOURNISSEUR
DIM-ID Nom
Adresse
Attributs de navigation Groupe de fournisseurs
Four ID
DIM-ID Nom Produit ID
DIM-ID groupe de
marchandise
DIMENSION Ventes ID ...
Produit ID DIMENSION
Fournisseur ID
Temps ID
Lieu d’origine ID Lieu d’aqusition ID Temps Code ID
DIM-ID Pays Montant facturé
Année
DIM-ID Region
Trimestre
SUPMTI/ISI
MSSQL-Commandes Economat
ORACLE-ISAcademia Doctorants
EBP – Paniers
ORACLE-ISAcademia Etudiants
XLS-Inventaire UOTS
Données Base Données Base Données Base Données Base Données Base
Fond Centre Financier Employé Personne Compte Budgetaire
+420 InfoCubes
2012-2013
+1700 Queries
d‘applications spécifiques
N. Zidane
• Datawarehouse
entrepôt des données historisées de l'entreprise
• Datamart
magasin de données ciblé sur un sujet précis
• Datamining
exploration des données afin de découvrir des connaissances
• Datacube
cube de présentation d'unités selon 3 dimensions
• Datawebhouse
2012-2013
Adéquation demande/production
Assurance
Risque lié à un contrat d’assurance (voiture)
…
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
DW - Modélisation
N. Zidane SUPMTI/ISI 2012-2013
DW - Schéma «étoile»
N. Zidane SUPMTI/ISI 2012-2013
DW - Schéma «flocon»
DW - Rappel sur les Aggrégats
Exemple de BD:
» Produit(GENCOD, Designation, Marque, Nature,
PrixAchat, PrixReventeConseille)
» Vente (GENCOD, NMAG, Date, Qte, PrixVente)
» Magasin(NMAG, Enseigne, Adresse, Ville, Dept)
» Nat2Cat(Nature, Categorie)
2012-2013
» Cat2Ray(Categorie, Rayonnage)
» Dep2Reg(Dept, Region)
Exercice:
» Donnez les clés primaires et les clés étrangères
SUPMTI/ISI
N. Zidane
DW - Questions et Requêtes
Montant totale des ventes par ville et par produit:
Mode
Transporteur d’expédition
Produit
Contrat Commande
client
Groupe de
2012-2013
Type de
contrat Client produits
Magasin
Famille de
Employé Région de produits
SUPMTI/ISI
Stock ventes
Fonction Division de
Fournisseurs
N. Zidane
ventes
Modélisation des DW
Table de dimensions
Introduction de nouveaux modèles:
Modèle en étoile
Modèle en flocon
SUPMTI/ISI
N. Zidane
Table de faits
Fait:
Ce que l’on souhaite mesurer
Quantités vendues, montant des ventes…
Contient les clés étrangères des axes d’analyse (dimension)
2012-2013
Non additif
N. Zidane
Typologie des faits
Additif: additionnable suivant toutes les dimensions
Quantités vendues, chiffre d’affaire
Peut être le résultat d’un calcul:
Bénéfice = montant vente - coût
Semi additif: additionnable suivant certaines dimensions
Solde d’un compte bancaire:
Pas de sens d’additionner sur les dates car cela représente
des instantanés d’un niveau
2012-2013
- Précision des
+
SUPMTI/ISI
analyses Finesse
Taille de l’entrepôt
N. Zidane
Table de dimension
Dimension produit
Clé de substitution Clé produit (CP)
Code produit
Description du produit
Attributs de la Famille du produits
dimension Marque
Emballage
Poids
N. Zidane
2012-2013
SUPMTI/ISI
Table de dimension (suite)
table de faits
SUPMTI/ISI
N. Zidane
La dimension Temps
N. Zidane SUPMTI/ISI
2012-2013
Granularité d’une dimension
Temps :
3. BM - D.W. Base
Multidimensionnelle
Dimension
» Temps, Produit, Géographie, ...
Niveau : hiérarchisation des dimensions
» Temps :
Année, Semestre, Trimestre, Mois, Semaine, ...
» Produit :
Rayon, Catégorie, Nature, ...
» Géographie :
2012-2013
But
» Visualisation/Utilisation
d'un fragment de l'Hypercube
2012-2013
Opérations OLAP
» Drill Up / Drill Down
» Rotate
» Slicing
» Scoping
SUPMTI/ISI
N. Zidane
BM - Opérations OLAP –
Drill Up/Down
2012-2013
SUPMTI/ISI
N. Zidane
BM - Opérations OLAP - Rotate
2012-2013
SUPMTI/ISI
N. Zidane
BM - Opérations OLAP - Slicing
2012-2013
SUPMTI/ISI
N. Zidane
BM - Opérations OLAP - Scoping
2012-2013
SUPMTI/ISI
N. Zidane
BM - OLAP
Constitution de l'Hypercube
» Administration
» Définition des Dimensions / Niveaux / Membres
¾ Automatique, Manuel, Configuration Métier
Serveurs OLAP / Clients OLAP
» Le client utilise une partie de l'hypercube qu'il cache
» Le serveur calcule, stocke l'hypercube et permet son
partage.
2012-2013
Stockage
» M-OLAP : accède à une base multidimensionnelle
+ rapidité
» R-OLAP : accède à une base relationnelle
+ mise à jour
SUPMTI/ISI
4. Restitution des
informations
Requêteurs
» donne une réponse à une question plus ou moins
complexe(type SQL)
Data Mining
» outils évolués de prédiction, simulation, ...
N. Zidane
Restitution des informations
2012-2013
SUPMTI/ISI
N. Zidane
Restitution des informations
2012-2013
SUPMTI/ISI
N. Zidane
Restitution des informations
2012-2013
SUPMTI/ISI
N. Zidane
Restitution des informations
2012-2013
SUPMTI/ISI
N. Zidane
Restitution des informations
2012-2013
SUPMTI/ISI
N. Zidane
Data Mining
Principe
» Creuser une mine (le DW) pour rechercher un filon
(l’information)
» Evolution par rapport aux statistiques «classiques»
Objectifs
» Prédiction (What-if)
¾ ex. demande de prêt
2012-2013
Arbres de Décision
Principe :
» division de la population par groupes dont les individus
partagent une caractéristique commune
» construction à partir d’une base d’exemples
2012-2013
d’un «arbre»
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
Réseaux de Neurones
Principe :
» neurones = petits modules de calcul organisés en
«couches» constituant un réseau
» activation et apprentissage
activation d’un neurone par ceux de la couche amont
2012-2013
Résultat
» Création d’un modèle reposant sur les données
existantes
par un réseau apprenant
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
d’une
régression logique,
optimisation d’arbres de décision : isoler les variables les plus
pertinentes pour expliquer un comportement,
optimisation de réseaux de neurones : modification des poids
SUPMTI/ISI
des
liaisons
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
Synthèse
Exploitation de données
Le «sponsor»
» membre de la direction, soutient le projet
Le comité utilisateur
» différentes catégories (regroupement par
besoins)
» des représentants
Les administrateurs du système
2012-2013
d’information
» très importants (connaissance des données)
» maintenance future du Data Warehouse
L’équipe de conception
» souvent : consultants externes
SUPMTI/ISI
N. Zidane
Cycle de vie
Justification du projet
Itérations :
» Conception
» Développement (prototypage)
2012-2013
» Evaluation
Tests et Mise en exploitation
Evaluation et évolution
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
Justification du projet
N. Zidane SUPMTI/ISI 2012-2013
Cycle de prototypage
N. Zidane SUPMTI/ISI 2012-2013
architecture)
» qui les gèrent
» leur format
» leur signification
» leur qualité
méta-données stockées dans la métabase
SUPMTI/ISI
N. Zidane
La métabase
Tout Data Warehouse comporte une métabase qui
regroupe des méta-données. Les méta-données sont
utilisées pour stocker des informations à propos des
données utilisées par le Data Warehouse.
la métabase comprend :
» un dictionnaire des données : contient les définitions
des éléments
2012-2013
La métabase
Communiquer avec les utilisateurs
Rétro-Ingénierie
Intégration
difficultés :
» conflit de classification
» conflit de description
2012-2013
» conflit de structure
Il est très important de mémoriser les transformations opérées afin de garder une
trace permettant de retrouver le lien entre un élément du Data Warehouse et les
données correspondantes des bases opérationnelles.
N. Zidane
Modélisation : les dimensions
2012-2013
SUPMTI/ISI
N. Zidane
Modélisation : les dimensions
2012-2013
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
Finalisation
N. Zidane SUPMTI/ISI 2012-2013
Evolution
Exploitation de données
6. Les outils
Un marché fragmenté :
» Constitution du DataWarehouse
2012-2013
» Stockage
» Extraction d’Information
SUPMTI/ISI
N. Zidane
Constitution du DataWarehouse
Administration
Extraction et Purification
DataWarehouse
Serveur OLAP
2012-2013
Browser OLAP
» Discoverer (Oracle), ESPERANT (Software AG), InfoBeacon
(Platinum), Explorer (Business Objects), le VCL DecisionCube de
Delphi Cl/Sv
Arbres de Décision
2012-2013
Réseaux de Neurones
» Predict (Neuralware), Neural Connection (SPSS), Previa (Elseware)
Autres
SUPMTI/ISI
7. Perspectives du Data
Warehouse
homogénéisation
» des outils intégrant les différentes étapes de la suite
Décisionnelle
données externes
» ouverture à l’internet
2012-2013
8. Bibliographie - Livres
2-7117-4811-1
N. Zidane
Bibliographie - Livres
http://www.dw-institute.com/
The Data Warehouse Institute
http://pwp.starnetic.com/larryg/
Infos dont accès à des livres blancs sur le DW
http://www.promotheus.eds-fr/themes/dw/
Institut Promotheus, thème DW
http://www.cait.wustl.edu/cait/papers/prism/
Société Prisme fondée par W.H. Inmon
2012-2013
http://www.olapcouncil.org/
Outils OLAP
http://www.valoris.fr/amplitude/j101.htm
http://www.mediatid.fr/datawarehouse
forum sur le Data Warehouse
SUPMTI/ISI
N. Zidane
Bibliographie - Recherche
ACM SIGMOD
VLDB
DOLAP
SUPMTI/ISI
N. Zidane
Pause-réflexion sur cette 2ème partie
module n°1
Data warehouse Introduction et
généralités.
SUPMTI/ISI
N. Zidane
N. Zidane SUPMTI/ISI 2012-2013
FIN