Vous êtes sur la page 1sur 15

BUSINESS INTELLIGENCE

DATA
WAREHOUSE
Data Warehousing

1. Les entrepôts des données

2. Modélisation des données décisionnelles

3. Alimentation

4. Les bases de données multidimensionnelles


Pourquoi ne pas utiliser un SGBD?

➢ SGBD
▪ Mode de travail transactionnel (OLTP)
▪ Permettent d’insérer, modifier, interroger des informations rapidement, efficacement et en sécurité
▪ Objectifs:
✓ Sélectionner, ajouter, mettre à jour et supprimer des tuples
✓ Opérations rapides, faites par plusieurs utilisateurs simultanément

▪ SGBD vs. Datawarehouse


➢ Stockent des données différentes
➢ Font l’objet de requêtes différentes
➢ Besoin d’une organisation différente des données
➢ Ont des objectifs différents et font des traitement différents
➢ Doivent être physiquement séparés
Les entrepôts de données
Objectifs

➢ Regrouper, organiser des informations provenant de sources diverses


➢ Les intégrer et les stocker pour donner à l’utilisateur une vue orientée métier
➢ Retrouver et analyser l’information selon plusieurs critères
➢ Transformer un système d’information qui avait une vocation de production en un SI décisionnel
➢ Doit contenir des informations cohérentes
➢ Les données doivent pouvoir être séparées et combinées au moyen de toutes les mesures
possibles de l’activité
➢ Le DW ne contient pas uniquement des données, mais aussi un ensemble d’outils de requêtes,
d’analyse et de présentation de l’information.
Les entrepôts de données
Définition

«Un entrepôt de données est une collection de données orientées sujet, intégrées,
non volatiles et historisées pour la prise de décisions»
(Bill Inmon)
Les entrepôts de données
Caractéristiques d’un DW

Le DW est orienté sujets, ce qui signifie que les données collectées doivent être orientées métier, et donc triées
par thème.
Les entrepôts de données
Caractéristiques d’un DW

Le DW est composé de données intégrées, c’est à dire qu’un « nettoyage » préalable des données est nécessaire
dans un souci de rationalisation et de normalisation.
Les entrepôts de données
Caractéristiques d’un DW

Les données du DW sont non volatiles, ce qui signifie qu’une donnée entrée dans l’entrepôt l’est pour de bon et
n’a pas vocation à être supprimée.
Les entrepôts de données
Caractéristiques d’un DW

▪ Les données du DW doivent être historisées, donc datées:

➢ L'historisation est nécessaire pour suivre dans le temps l'évolution des différentes valeurs
des indicateurs à analyser.
Les entrepôts de données
De l’ED à l’aide à la décision

Entreposage des données


Avant d’être chargées dans l’entrepôt, les données sélectionnées doivent être :
• extraites des sources (internes : BD opérationnelles, externes : BD et fichiers notamment issus du
Web)
• soigneusement épurées afin d’éliminer des erreurs et réconcilier les différentes sémantiques associées
aux sources

Exploitation des données de l’ED : systèmes décisionnels


• A partir des données d’un ED diverses analyses peuvent être faites, notamment par des techniques OLAP
ou de Data Mining et de visualisation.
Les entrepôts de données
De l’ED à l’aide à la décision
Les entrepôts de données
Data Warehouse vs Data Mart

L'entrepôt de données - ED (Data Warehouse - DW) :


• nécessitent de puissantes machines pour gérer de très grandes bases de données contenant des données de
détail historisées
• lieu de stockage centralisé d'un extrait des bases de production.
• l’organisation des données est faite selon un modèle facilitant la gestion efficace des données et leur
historisation.

Les magasins de données – MD (Data Marts - DM) :


• petits entrepôts nécessitant une infrastructure plus légère et sont mis en œuvre plus rapidement
• conçus pour l’aide à la décision à partir de données extraites d’un ED plus conséquent ou de BD sources
existantes
• les données extraites sont adaptées pour l’aide à la décision (pour classe de décideurs, usage particulier,
recherche de corrélation, logiciel de statistiques,...)
• l’organisation des données est faite selon un modèle facilitant les traitements décisionnels
Les entrepôts de données
Data Warehouse vs Data Mart
Les entrepôts de données
Architecture fonctionnelle d’un entrepôt de donnée

▪ Niveau extraction : extraction de données des BD opérationnelles (SGBD traditionnel en OLTP) et de l’extérieur :
• approche « push » : détection instantanée des mises à jour sur les BD opérationnelles pour intégration dans
l’ED
• approche « pull » : détection périodique des mises à jour des BD opérationnelles pour intégration dans l’ED

▪ Niveau fusion :
• Intégration, chargement et stockage des données dans la BD entrepôt organisée par sujets
• Rafraîchissement au fur et à mesure des mises à jour

▪ Niveau exploitation :
• Rapports, tableaux de bords, visualisation graphiques diverses, …
• Analyse et l’exploration des données entreposées (OLAP)
• Requêtes complexes pour analyse de tendance, extrapolation, découverte de connaissance, … (Fouille de
données)
Les entrepôts de données
Architecture fonctionnelle d’un entrepôt de donnée

Vous aimerez peut-être aussi