Vous êtes sur la page 1sur 33

Institut National des Sciences Appliques et de Technologie

Business Intelligence

Chp2 Les Entrepts de Donnes (Data Warehouses)

Dr. Lilia SFAXI


GL5 - 2013-2014

Plan du Chapitre

Problmatique des donnes dans un systme dcisionnel

Architecture fonctionnelle dun systme dcisionnel

Les entrepts de donnes

Business Intelligence

22/10/12

Problmatique
des donnes dans
un systme
dcisionnel

CHAPITRE 2:
ENTREPTS DE DONNES DATA
WAREHOUSE

Business Intelligence

22/10/12

Systmes
Oprationnels vs. Dcisionnels
Systmes oprationnels

Systmes dcisionnels

Appels OLAP (On-Line Analytical


Processing)

Appels OLTP (On-Line Transaction Processing) ou systmes


de gestion

Ddis la gestion de lentreprise pour


laider au pilotage de lactivit pour une
vision transversale de lentreprise

Utilisation des Entrepts de donnes

Ddis aux mtiers de lentreprise pour les assister dans


leurs tches de gestion quotidiennes

Utilisation des PGI (ou ERP) pour la gestion des donnes

Business Intelligence

22/10/12

Donnes
Oprationnelles vs. Dcisionnelles
Donnes Oprationnelles

Donnes dtailles

Donnes rcentes

Structure comprhensible et optimise pour linformaticien

Donnes rparties et non homognes

Utilisateurs: Agents oprationnels, nombreux, et


concurrents

Business Intelligence

Donnes Dcisionnelles

Donnes globalises

Donnes historiques

Structure comprhensible par le


dcideur

Donnes centralises, intgres

Utilisateurs: Dcideurs, analystes,


peu nombreux et non concurrents
22/10/12

Charge du Serveur de Donnes

Business Intelligence

22/10/12

Solutions

Stockage de donnes : Data Warehouse


o

Base de donnes unique - vocabulaire unique

Contenu adapt aux besoins des dcideurs

Structure multidimentionnelle spciale

Niveau de dtail bien tudi

Donnes historiques

Interrogation des donnes :


o

Outil interactif, convivial

Outil offrant des fonctions danalyse

Tri des donnes

Roll-up, Drill-down

Calcul et comparaison

Analyse des tendances, relations et exceptions

Simulation

Business Intelligence

22/10/12

OLTP vs. OLAP

OLTP : On Line Transaction Processing


o

Systme destin offrir le moyen une application dutiliser de faon transactionnelle un


serveur de base de donnes. Cest un ensemble logiciel que lutilisateur peut employer de faon
interactive pour accder aux donnes de la manire la plus rapide et simple possible.

Exemple : Le 15/01/2012 13h12, le client X a retir 500dt du compte Y

OLAP : On Line Analytical Processing


o

Catgorie de technologie logicielle permettant aux analystes, managers et dcideurs daccder


de manire rapide, consistante et interactive une large varit dinformation, transforme
pour reflter la dimension relle dune entreprise.

Exemple : Quel est le volume des ventes par produit et par rgion durant le deuxime trimestre
de 2012?

Business Intelligence

22/10/12

OLTP vs. OLAP

9
OLTP

Conception

OLAP
-

Oriente application (Application de


production, de facturation)
Structure statique (E/R)

Oriente sujet (Client, produit,


vendeur)
Structure volutive (en toile, en flocon)

Donnes

Dtailles, non agrges


Rcentes, mises jour
Accessibles de faon individuelle
Normalises

Rsumes, recalcules, agrges


Historiques
Accessibles de faon ensembliste
Dnormalises

Vue

Relationnelle

Multidimensionnelle

Requtes/Utili
sation

Simples, nombreuses, rgulires,


prvisibles, rptitives
Sensibles aux performances (rponses
immdiates)
Accs beaucoup de donnes

Complexes, peu nombreuses,


irrgulires, non prvisibles
Non sensibles aux performances
(rponses moins rapides)
Accs beaucoup dinformations

Utilisateurs

Agents oprationnels
Nombreux (par milliers)
Concurrents

Managers / Analystes
Peu (par dizaines, centaines)
Non concurrents

Accs

Lecture / criture

Lecture

Taille de la
base

100 MB 1 GB

100 GB 1 TB

Business Intelligence

22/10/12

10

Technologies
Stockage et
Gestion Efficace
des Gros Volumes

Entrept de Donnes
(Data Warehouse)

Traitements
Complexes sur ces
Volumes

Serveur OLAP

Application
Cliente

Fouille de Donnes
(Data Mining)

Business Intelligence

22/10/12

Structure dun Systme Dcisionnel

Business Intelligence

11

22/10/12

12

Structures de
Stockage de
Donnes dans un
Systme
Dcisionnel

Business Intelligence

CHAPITRE 2:
ENTREPTS DE DONNES DATA
WAREHOUSE

22/10/12

Structures de Stockage de Donnes dans un Systme Dcisionnel

13

Data Mining
(Extraction de donnes)

Data Marts
(Magasins de donnes)

Synthse

Data Warehouse
(Entrept de donnes)

Alimentation
Transformation

ODS
(Operational Data Store)

Extraction

Business Intelligence

Systmes
Oprationnels

22/10/12

15

Dfinitions

ODS: Operational Data Store


o

Collection de donnes orientes sujet, volatiles, organises pour le support dun processus de dcision ponctuel, en support
une activit oprationnelle particulire

Donne la vision immdiate et intgre de ltat dun ou plusieurs systmes oprants

Data Warehouse
o

Entrept de donnes spcifique au monde dcisionnel, destin principalement analyser les leviers business potentiels

Collection de donnes orientes sujet, intgres, non volatiles et historises, organises pour le support dun processus
daide la dcision

Data Mart
o

Magasin de donnes orient sujet, non volatile, mis la disposition des utilisateurs dans un contexte dcisionnel
dcentralis, cibl pour un usage particulier

Data Mining
o

Ensemble doutils, mthodes et technologies danalyse mises en uvre pour dfinir des tendances, pour segmenter
linformation ou pour tablir des corrlations entre les donnes

Business Intelligence

22/10/12

16

Data Warehouse vs. ODS

Data Warehouse
o

Intgration des donnes hors ligne

ODS
o

Intgration des donnes en ligne

Sauvegarde des donnes rcentes

Utilis quand les donnes sont disperses sur plusieurs supports de stockage, et on a besoin de les
rassembler

Exemple:
o

On veut avoir une vue unique sur un patient quon pourra modifier en ligne

Les donnes de ce patient sont disposes dans plusieurs bases de donnes (liste des
hospitalisations, liste des diagnostics, liste des achats pharmaceutiques)

ODS peut tre utilis pour extraire ces donnes et les afficher

Business Intelligence

22/10/12

17

Data Warehouse vs. Data Mart

Data Warehouse
o

Dpt de donnes au niveau entreprise

Combinaison de plusieurs Data Marts

Contient toutes les mesures et dimensions ncessaires

Assure lintgrit de ces mmes dimensions travers tous les Data Marts

Data Mart
o

Ensemble de dimensions et mesures limites

Utilises pour des thmes mtier spcifiques

Construites partir des donnes des entrepts

Exemple
o

Dans une entreprise, il existe un seul entrept de donnes mais plusieurs magasins de donnes :
Finance, Vente

Business Intelligence

22/10/12

18

Les Entrepts de
Donnes
CHAPITRE 2:
ENTREPTS DE DONNES DATA
WAREHOUSE

Business Intelligence

22/10/12

19

Pourquoi ne pas utiliser un SGBD?

SGBD et DW
o

Ont des objectifs diffrents et font des traitement diffrents

Stockent des donnes diffrentes

Font lobjet de requtes diffrentes

Besoin dune organisation diffrente des donnes

Doivent tre physiquement spars

SGBD

Mode de travail transactionnel (OLTP)

Permettent dinsrer, modifier, interroger des informations rapidement, efficacement et en scurit

Objectifs:
1.

Slectionner, ajouter, mettre jour et supprimer des tuples

2.

Oprations rapides, faites par plusieurs utilisateurs simultanment

Business Intelligence

22/10/12

20

Entrept de Donnes : Objectifs

Regrouper, organiser des informations provenant de sources diverses

Les intgrer et les stocker pour donner lutilisateur une vue oriente mtier

Retrouver et analyser linformation selon plusieurs critres

Transformer un systme dinformation qui avait une vocation de production en un SI


dcisionnel

Doit contenir des informations cohrentes

Les donnes doivent pouvoir tre spares et combines au moyen de toutes les
mesures possibles de lactivit

Le DW ne contient pas uniquement des donnes, mais aussi un ensemble doutils de


requtes, danalyse et de prsentation de linformation.

Business Intelligence

22/10/12

Entrept de Donnes: Dfinition


(Bill Inmon)

21

Le Data Warehouse est une collection de donnes


orientes sujet, intgres, non volatiles et
historises, organises pour la prise de dcision.

Business Intelligence

22/10/12

22

Caractristiques dun DW
Donnes Orientes Sujet

Le DW est orient sujets, ce qui signifie que les donnes collectes


doivent tre orientes mtier, et donc tries par thme

Business Intelligence

Bases de donnes

Entrept de donnes

22/10/12

23

Caractristiques dun DW
Donnes Intgres

Le DW est compos de donnes intgres, cest dire quun


nettoyage pralable des donnes est ncessaire dans un souci de
rationalisation et de normalisation

Business Intelligence

Bases de donnes

Entrept de donnes

22/10/12

24

Caractristiques dun DW
Donnes Historises et Non Volatiles

Les donnes du DW sont non volatiles, ce qui signifie quune donne


entre dans lentrept lest pour de bon et na pas vocation tre
supprime

Les donnes du DW doivent tre historises, donc dates

Business Intelligence

Bases de donnes

Entrept de donnes

22/10/12

25

Data Warehouse : ETL

Outils dalimentation pour


o

Extraire

Transformer

Charger dans un DW

les donnes sources

BD

BD

BD

Extraction
Transformation

Chargement

DW
Business Intelligence

22/10/12

BD

BD

BD

Extraction

ETL : Extraction

26

Transformation

Chargement
DW

Extraction des donnes de leur environnement dorigine (base de donnes


relationnelles, fichiers plats)

Besoin doutils spcifiques pour accder aux bases de production (requtes sur
des BD htrognes)

Besoin dune technique approprie pour nextraire que les donnes ncessaires
o

Donnes cres ou modifies depuis la dernire opration dextraction

Attention:
o

Lextraction ne doit pas perturber lactivit de production

Business Intelligence

22/10/12

BD

BD
Extraction

ETL : Transformation

BD

27

Transformation

Chargement
DW

Intgration des donnes


o

Homognisation du vocabulaire, structures, valeurs

Suppression et fusion des redondances

puration des donnes (suppression des donnes incohrentes)

Transformation des donnes dans un format cible

Business Intelligence

22/10/12

BD

BD
Extraction

ETL : Chargement

BD

28

Transformation

Chargement
DW

Oprations de calcul et dagrgation des donnes


o

Mise en place de procdures de chargement (nocturne?) et de restauration (en cas de


problme)
o

Remplacement de certaines bases si aucune solution dextraction satisfaisante nest possible

Envisager la mise en place de systmes redondants si la disponibilit du systme ne peut


tre interrompue

Prise en compte de la notion de granularit


o

Conservation des donnes dtailles

Possibilit dagrgation des donnes pour la synthse

Business Intelligence

22/10/12

BD

BD

BD

Extraction

DW : Mtabase de Donnes

29

Transformation

Chargement
DW

Existence dune mtabase de donnes ou catalogue de mtadonnes:


o

Contient des mtadonnes du DW

Idalement: Lieu de stockage unique des informations qui pilotent des processus dans
lentrept

Dtails sur :

Les donnes entreposes, leur format, leur signification, leur degr dexactitude

Les processus de rcupration/extraction dans les bases sources

La date du dernier chargement de lentrept

Lhistorique des donnes sources et de celles de lentrept

Business Intelligence

22/10/12

BD

BD
Extraction

DW : Structure (1/3)

BD

30

Transformation

Chargement
DW

1.

Directe simple :
o

On fait des mises jour du


datawarehouse avec des laps
de temps importants.

Business Intelligence

22/10/12

BD

BD
Extraction

DW : Structure (2/3)

BD

31

Transformation

Chargement
DW

2.

Cumul simple :
o

On stocke les donnes de


chaque mise jour, les
mises jour tant
frquentes (par exemple
tous les jours) on a un
espace occup important,
mais on ne perd pas
dinformation.

Business Intelligence

22/10/12

BD

BD
Extraction

DW : Structure (3/3)

BD

32

Transformation

Chargement
DW

3.

Rsum droulant :
o

chaque mise jour, on stocke des


donnes dtailles, et on synthtise les
anciennes donnes en fonction de leur
ge. Plus une donne est vieille, moins
elle est dtaille.

Business Intelligence

22/10/12

33

Bibliographie
Supports de Cours

Karima Tekaya Informatique Dcisionnelle - INSAT

Fatma Baklouti Les entrepts de donnes (Data Warehouses) - INSAT

Hweichao Lu Online Analytical Processing (OLAP) - CS157B-02 Spring 2007

Didier Donsez Systmes dinformation dcisionnels (Data Warehouse / Data Mining) - Universit
Joseph Fourier

Jacky Akoka et Isabelle Comyn-Wattiau Le Data Warehouse et les Systmes Multidimentionnels Universit de Versailles

Livres

Ralph Kimball - Concevoir et dployer un Data Warehouse - Editions Eyrolles, 2000

Business Intelligence

22/10/12