Académique Documents
Professionnel Documents
Culture Documents
3 - DataWarehouse
3 - DataWarehouse
Business Intelligence: BI
Cours:
• Systèmes Transactionnels et systèmes décisionnels
• ETL Extract-Transform-Load
• Datawarehouse
• DataMart
• Systèmes OLAP
• Cube et Hypercube
Datawarehouse : Définition
Stockage
Les domaines d’application du décisionnel
▪ La gestion de la relation client (CRM) est l’un des premiers champs d’application de
la Business Intelligence.
▪ Le contrôle de gestion pour l’analyse des coûts, l’analyse de la rentabilité,
l’élaboration budgétaire, les indicateurs de performance…
▪ La direction marketing pour le ciblage, le pilotage de gamme, les applications de
géomarketing, de fidélisation clients…
▪ La direction commerciale pour le pilotage des réseaux, les prévisions des ventes,
l’optimisation des territoires…
▪ Les ressources humaines pour la gestion des carrières,
▪ La direction de la production pour l’analyse qualité, la prévision des stocks, la
gestion des flux, la fiabilité industrielle…
▪ Les directions générales pour les tableaux de bord, indicateurs de pilotage, gestion
d’alertes…
Conception du schéma intégré
• Isoler les faits à étudier
• Schéma des tables de faits
• Définir les dimensions
• Axes d'analyse
• Normaliser les dimensions
• Éclater en plusieurs tables liés par contraintes référentielles
• Intégrer l'ensemble
• Plusieurs tables de faits partagent quelques tables de dimension (constellation d’étoiles)
Conception DW
Caractéristiques des données d'un DW
Orientées sujet
▪ Organisées autour de sujets majeurs de l’entreprise
▪ Données pour l’analyse et la modélisation en vue de l’aide à la décision, et non pas pour les opérations et
transactions journalières
Intégrées
Construit en intégrant des sources de données multiples et hétérogènes
BD relationnelles, fichiers, enregistrements de transactions
Historiées
▪ Stockage de l'historique des données, pas de mise à jour
▪ Un référentiel temps doit être associé aux données
Non volatiles
Une même requête effectuée à intervalle de temps, en précisant la date référence de
l’information donnera le même résultat
Données multidimensionnelles
Notion de dimension
Architecture centralisée
▪ Conception
▪ Construction
▪ Administration
▪ Restitution
Les différentes phases du Datawarehouse
▪ Conception:
▪ Piloter quelle activité de l’entreprise ;
▪ Modèle de données ;
▪ Démarches d’alimentation ;
▪ Stratégies d’administration ;
▪ Mode de restitution, …
Schémas en étoile
• Une table de faits encadrées par N tables de dimensions
Produits
IDprod
Periode Table de faits “ventes” description
couleur
sIDper
periode taille
année fournisseur
trimestre produit
mois Magasins
magasin
jour
IDmag
unités_vendues nom
montant_ventes ville
département
taxes_ventes pays
Conception DW
Schémas en flocons
• Raffinement du schéma étoile avec des tables normalisées par dimensions
Produits Fournisseurs
IDprod IDfour
description description
couleur type
taille Adresse
Ventes IDfour
• Avantages
• Évite les redondances
• Conduit aux constellations (plusieurs tables de faits à dimensions partagées)
Conception DW
Les différentes phases du Datawarehouse
Construction:
Travail technique:
Administration:
Elle est constituée de plusieurs tâches pour assurer:
▪ La maintenance;
▪ La gestion de configuration;
Restitution:
▪ C’est le but du processus d’entreposage des données.