Vous êtes sur la page 1sur 36

Cours Entrepôts des données

02
Enseignante: Salma DAMMAK
Niveau: 2 GLID
Année Universitaire: 2022/2023
Objectifs du cours

 Avoir une idée sur le rôle joué par les systèmes décisionnels

 Découvrir l’architecture d’un système décisionnel et les différentes étapes


de modélisation

 Maitriser la conception d’un entrepôt de données

Cours entrepôt des données 2


Plan de cours
I. Introduction

II. Les Systèmes décisionnel

III. Architecture des Systèmes décisionnels


1. Sources de données
2. Processus de chargement ETL
3. Entrepôt et magasins de données
4. Exploitation des données

IV. Conception d’un Système décisionnel

Cours entrepôt des données 3


Introduction
 SI est le véhicule de la communication dans l’entreprise

 Permet aux différents acteurs de véhiculer des informations et de communiquer grâce à un


ensemble de ressources matérielles, humaines et logicielles
 Principales fonctions d’un SI: Saisie, Mémorisation, Traitement, Communication

Cours entrepôt des données 4


Introduction
 Une entreprise dispose de données provenant soit de son système opérationnel soit
de l’extérieur:
 Bases de données, Fichiers, Gestion RH, …

 Caractéristiques des données :

 Distribuées : systèmes éparpillés


 Hétérogènes : systèmes et structures de données différents
 Détaillées : organisation de données selon les processus fonctionnels
 Peu/pas adaptées à l’analyse : des requêtes lourdes peuvent bloquer le système transactionnel
 Volatiles : pas d’historisation systématique

 Surabondance de données
 Les données représentent une mine d’informations

Cours entrepôt des données 5


Introduction
A combien je peux élever
Qui sont mes meilleurs mes ventes journalières?
………………..
clients?

Améliorer les performances décisionnelles de l'entreprise en répondant aux


demandes d’analyse des décideurs non informaticiens et non statisticiens.

Cours entrepôt des données 6


Introduction
 Solution
 Passer d’système d’information qui avait une vocation de
production à un SI décisionnel dont la vocation de
pilotage devient majeure.

 L’entreprise a besoin:
 Accès rapide et simple à l’information stratégique

 Vision transversale des données de l’entreprise

 Extraire, grouper, organiser, transformer les données

Cours entrepôt des données 7


Les Systèmes décisionnels
Base données transactionnelle:

Une BD classique destinée à assumer des


transactions en temps réel Ajout, mise à
jour suppression de données

Data warehouse:

Un DW destiné uniquement à l'exécution


de questions statistiques sur des données
statiques (ou faiblement dynamiques).

Cours entrepôt des données 8


Les Systèmes décisionnels
 Fonctions d’un DW :
 Systèmes pour l’aide à la prise de décisions (OLAP)

 Regrouper, organiser des informations de sources diverses

 Intégrer et stocker les données pour une vue orientée métier

 Retrouver et analyser l’information rapidement et facilement

Cours entrepôt des données 9


Les Systèmes décisionnels

Cours entrepôt des données 10


Les Systèmes décisionnels
Augmenter l’efficience
d’exploitation
Accélérer et d’améliorer Générer de nouveaux
la prise de décision revenus

Prendre l’avantage sur la Identifier les tendances


concurrence Du marché

Repérer les problèmes à


résoudre plus rapidement

Cours entrepôt des données 11


Les Systèmes décisionnels
 Intégration des données à partir de sources multiples et Hétérogènes

 Répondre aux requêtes du système d'aide à la décision.

 Plus efficace en coût d'exécution des requêtes

On-Line Analytical Processing OLAP

Cours entrepôt des données 12


Les Systèmes décisionnels
 OLTP: consultent et mettent à jour les données des BD opérationnelles.
 Exécution en temps réel des transactions, pour l'enregistrement des opérations
quotidiennes : inventaires, commandes, paye, comptabilité

 OLAP: lisent les données seulement pour avoir de nouvelles informations à


partir des données sources.
 Rapports, Etats, Tableaux de Bord, Graphiques, Synthèses, Groupement,...
 Traitement efficace des requêtes d'analyse pour la prise de décision.

Cours entrepôt des données 13


Les Systèmes décisionnels

Peut on partager la même BD entre OLAP et OLTP?

Cours entrepôt des données 14


Les Systèmes décisionnels
 Désavantage de partager la même BD entre OLAP et OLTP

 OLAP ne peut utiliser que les données actuellement stockées dans les BD.

 Les analyses historiques sont souvent impossibles à cause des opérations de


mises à jour qui changent les données historiques.

 Des opérations de verrouillage des données (Locking operations) .

 Des problèmes de performance .


 les requêtes analytiques demandent l'accès à de très grands nombre de tuples.

Cours entrepôt des données 15


Les Systèmes décisionnels
Critères OLTP OLAP
Espace requis Relativement petit Grand due aux données historiques
et aux données d’agrégation
Données exhaustives, courantes, dynamiques , Résumées, historiques, statiques,
non volumineuses volumineuses
Modélisation de la BD Un grand nombre de tables hautement Moins de tables, pas de normalisation
normalisées (schémas en étoile ou flocon)
Requêtes Simples Complexe
Mise à jour, Interrogation Interrogation
Sauvegarde et Fait de façon régulière Fait de façon irrégulière
récupération
Ressources requises Simple DBMS relationnel DBMS spécialisé multi-processeurs
et à grande capacité
Vue Relationnelle Multidimensionnelle

Nombre d’utilisateurs simultanés Grand Petit

Cours entrepôt des données 16


Architecture des Systèmes décisionnels
Sources des données ETL Entrepôts des données Outils d’analyse

Cours entrepôt des données 17


Architecture des Systèmes décisionnels
1. Les sources de données
 Enterprise Resource Planning (ERP):
 Gèrent les processus opérationnels d'une entreprise (ex: ressources humaines, finances, distribution,
approvisionnement, etc.).

 Customer Relationship Management (CRM):


 Gèrent les interactions d’une entreprise avec ses clients (ex: marketing, ventes, après-vente,
assistance technique, etc.).

Cours entrepôt des données 18


Architecture des Systèmes décisionnels
1. Les sources de données
 Point of sale (POS):
 Matériels et logiciels utilisés dans les caisses de sorties d’un magasin.

 WEB:
 Clickstreams (fichier log), structure site web.

 Externes:
 Ex: données concurrentielles achetées, données démographiques

Cours entrepôt des données 19


Architecture des Systèmes décisionnels
1. Les sources de données:
 DSA: Data Staging Area

 Zone de préparation des données

 Base de données intermédiaire qui stocke les données issues des systèmes de production
opérationnelle dans un format proche de ces derniers.

 Un stockage tampon avant l'intégration des données dans l’ED.

Cours entrepôt des données 20


Architecture des Systèmes décisionnels

 Sources diverses et disparates (ex: BD, fichier texte, etc.);

 Sources sur différentes plateformes et OS (operating system);

 Qualité de données douteuse et changeante dans le temps;

 Incohérence entre les différentes sources;

 Données dans un format difficilement interprétable ou ambigu.

Cours entrepôt des données 21


Architecture des Systèmes décisionnels
2. Les processus ETL: Extract-Transform-Load

 ETL résume généralement les données afin de réduire leur taille et d'améliorer leur
performance pour des types d'analyse spécifiques.

 Partie la plus complexe du développement (jusqu’à 70% du temps total).

Cours entrepôt des données 22


Architecture des Systèmes décisionnels
2. Les processus ETL: Extract-Transform-Load
 Extrait l'information nécessaire à l'analyse
 Identifier les données sources utiles
 Déterminer tous les changements survenus durant une période donnée (ex: heure, jour,
semaine, mois).

 Transforme : Consolider les données


 Données redondantes, manquantes, incohérentes, etc.
 Découpage, fusion, conversion, aggrégation, ..

 Charge (Load) les données dans l’ED


 Faire les chargements en lot dans une période creuse (entrepôt de données non utilisé);
 Avoir un plan pour évaluer la qualité des données chargées dans l'entrepôt;
 Commencer par charger les données des tables de dimension
Cours entrepôt des données 23
Architecture des Systèmes décisionnels
3.1. L’Entrepôt de données: Data Warehouse

 Lieu de stockage centralisé

 intègre et «historise» l’ensemble des données utiles pour les prises de décisions.

 Son organisation doit faciliter la gestion des données et la conservation des évolutions.

Cours entrepôt des données 24


Architecture des Systèmes décisionnels
3.1. L’Entrepôt de données: Data Warehouse

«Un entrepôt de données est une collection de données orientées


sujet, integrées, non volatiles, historisées, organisées pour le support
d'un processus d'aide a la décision.»
(Bill Inmon, 1996)

Cours entrepôt des données 25


Architecture des Systèmes décisionnels
3.1. L’Entrepôt de données: Data Warehouse
 Orientées sujet :
• L’entrepôt renferme des informations de différents services de l’entreprise
• Les informations de l’entrepôt sont organisées par sujet avant d’être intégrées dans l’entrepôt

 Intégrées :
• Le contenu d’un entrepôt est le résultat de l’intégration des données
en provenance de multiples sources.
• L’intégration nécessite une bonne maîtrise de la sémantique des
données.

Cours entrepôt des données 26


Architecture des Systèmes décisionnels
3.1. L’Entrepôt de données: Data Warehouse
 Non volatiles :
 Les données stockées dans un ED sont en mode consultation

 elles ne peuvent être ni supprimées ni modifiées

 Historisés :
 L’historisation des données permet de suivre l’évolution

des différentes valeurs dans le temps

Cours entrepôt des données 27


Architecture des Systèmes décisionnels
3.1. L’Entrepôt de données: Data Warehouse
 organisées pour le support d’un processus d’aide à la décision :
 Les utilisateurs peuvent consulter les données réorganisées de façon multidimensionnelle à travers des outils
d’aide à la manipulation et l’analyse

Cours entrepôt des données 28


Architecture des Systèmes décisionnels
3.2. Les Magasins de données: Data Marts
 Contiennent une portion du contenu de l’entrepôt de données;

 Se concentrent sur un seul sujet d’analyse (ex: les ventes OU l’inventaire, mais pas les
deux);

 Servent à faire des analyses simples et spécialisées (ex: Suivi des ventes par catégorie
de produits);

Cours entrepôt des données 29


Architecture des Systèmes décisionnels
 Deux approches pour la conception des systèmes décisionnels:
 Approche descendante (top-down)
 Conception intégrale de l’ED.

 ED le dépôt centralisé de toutes les données

 Les Data Marts des différents secteurs sont ensuite créés sur la base du modèle de l’entrepôt.

 Approche Ascendantes (bottom-up)

 Conception incrémentale de l’ED.

 Le Data Warehouse est simplement une combinaison (union) de différents Data Marts qui facilite le
reporting et l’analyse.

Cours entrepôt des données 30


Architecture des Systèmes décisionnels
4. Outils d’analyse
 Les données agrégées dans un système décisionnel servent à trois grandes catégories
d'usage :
 La production de rapport récurrents (reporting)
 Rapports, tableaux de bords, visualisation graphiques diverses, …

 L'exploration manuelle
 Analyse et l’exploration des données entreposées (OLAP)

 L'analyse de données (descriptive ou prédictive)


 Requêtes complexes pour analyse de tendance, découverte de connaissance, … (Fouille de données)

Cours entrepôt des données 31


Conception d’un Système Décisionnel
 Les différentes phases de conception d’un projet de système décisionnel:

 Conception: Étude des besoins et de l'existant

 Construction: Modélisation

 Diffusion et Administration: Implémentation du data warehouse

 Restitution: Implémentation des outils d'exploitation

Cours entrepôt des données 32


Conception d’un Système Décisionnel
 Conception: définir la finalité de l’ED :
 Piloter quelle activité de l’entreprise ;
 Déterminer et recenser les données à entreposer ;

 Définir les aspects techniques de la réalisation ;

 Modèle de données ;

 Démarches d’alimentation ;

 Mode de restitution…

Cours entrepôt des données 33


Conception d’un Système Décisionnel
 Construction: Travail technique

 Extraction des données des différentes BD de production (internes ou externes)

 Transformation des données: Nettoyage, filtrage…

 Techniques d’alimentation :

 Chargement des données dans l’ED

 Stockage des données dans les Eds et les magasins de données

 Rafraîchissement

Cours entrepôt des données 34


Conception d’un Système Décisionnel
 Diffusion et Administration: constituée de plusieurs tâches pour assurer :
 la qualité et la pérennité des données aux différents applicatifs

 la gestion des droits d’accès selon le profil métier de chacun

 Interdire l’accès direct à l’ED

 Segmenter les données collectées en contextes qui soient cohérents, simples à utiliser
et qui correspondent à une activité décisionnelle particulière (par exemple aux besoins
d’un service particulier).

 Modéliser sous la forme d'un hypercube et à disposition via un outil OLAP.

Cours entrepôt des données 35


Conception d’un Système Décisionnel
 Restitution:
 C’est le but du processus d’entreposage des données.
 Reporting: présenter les informations de façon plus lisible dans le cadre d’aide à la
décision.
 Les données sont principalement modélisées par des représentations à base de
requêtes afin de constituer des tableaux de bord ou des rapports via des outils
d'analyse décisionnelle.
 Des instruments de type tableau de bord équipés de fonctions d'analyses
multidimensionnelles de type Olap sont aussi utilisés.

Cours entrepôt des données 36

Vous aimerez peut-être aussi