Vous êtes sur la page 1sur 44

Data Warehouse

Entrept de donnes

Free Powerpoint Templates


Page 1
Plan
Introduction
Dfinition
Objectifs
Historique
Structure du Data Warehouse
Concept du Data Warehouse
Les aspects techniques
SGBD et DW
Conclusion
Free Powerpoint Templates
Page 2
Introduction

Free Powerpoint Templates


Page 3
Introduction
On qualifie d'informatique dcisionnelle (en
anglais Business intelligence , parfois
appel tout simplement le dcisionnel )
l'exploitation des donnes de l'entreprise dans le
but de faciliter la prise de dcision par les
dcideurs, c'est--dire la comprhension du
fonctionnement actuel et l'anticipation des
actions pour un pilotage clair de l'entreprise.

Free Powerpoint Templates


Page 4
Introduction

Les outils dcisionnels comme le Data


Warehouse et le Data Mining sont bass
sur l'exploitation d'un systme
d'information dcisionnel aliment grce
l'extraction de donnes diverses partir
des donnes de production, d'informations
concernant l'entreprise ou son entourage
et de donnes conomiques.

Free Powerpoint Templates


Page 5
Dfinition

Free Powerpoint Templates


Page 6
Dfinition

W.B.Inmon
Le data Warehouse est une collection
de donnes orientes sujet,
intgres, non volatiles et
historises, organises pour le support
dun processus daide la dcision

Free Powerpoint Templates


Page 7
Objectifs

Free Powerpoint Templates


Page 8
Objectifs dune Data Warehouse

Intgrer diffrentes bases de donnes


oprationnelles;
Permettre laccs aux informations historises;
Fournir des outils d analyse sur ces donnes;
Rsumer les donnes;
Rconcilier des donnes inconsistantes.

Free Powerpoint Templates


Page 9
Historique

Free Powerpoint Templates


Page 10
Historique du Data Warehouse

Annes 1960 : Genral Mills et lUniversit Dartmouth,


dans un projet conjoint, crent les termes "faits" et
"dimensions".
1983 : Teradata introduit dans sa base de donnes
managriale un systme exclusivement destin la
prise de dcision.
1988 : Barry Devlin et Paul Murphy publient l'article
"Une architecture pour les systmes d'information
financiers" ("An architecture for a business and
information systems") o ils utilisent pour la premire fois
le terme "Datawarehouse".
Free Powerpoint Templates
Page 11
Historique du Data Warehouse

1990 : Red Brick Systems cre Red Brick Warehouse,


un systme spcifiquement ddi la construction de
l'Entrept de donnes.
1991 : Bill Inmon publie Building the Data
Warehouse (Construire l'Entrept de Donnes).
1995 : Le Data Warehousing Institute, une
organisation but lucratif destine promouvoir le
datawarehousing, est fond.
1996 : Ralph Kimball publie The Data Warehouse
Toolkit (La bote outils de l'Entrept de donnes).

Free Powerpoint Templates


Page 12
Structure du Data
Warehouse

Free Powerpoint Templates


Page 13
Structure du DATA WAREHOUSE

Le Data Warehouse se structure en quatre


classes de donnes, organises selon un
axe historique est un axe synthtique.

Free Powerpoint Templates


Page 14
Structure du DATA WAREHOUSE

Les donnes agrges Les mta- donnes

DATA WAREHOUSE

Les donnes dtailles Les donnes historises

Free Powerpoint Templates


Page 15
Donnes dtailles

Elles refltent les vnements les plus


rcents.
Les donnes provenant des systmes
de production sont intgres ce
niveau.

Free Powerpoint Templates


Page 16
Donnes agrges

Elles correspondent des lments d'analyse


reprsentatifs des besoins des utilisateurs.

Ce sont donc des donnes dj traites par le


systme et reprsentant un premier rsultat
d'analyse et de synthse des donnes
contenues dans les systmes de production.

Elles doivent tre facilement accessibles et


comprhensibles.
Free Powerpoint Templates
Page 17
Donnes historises

Chaque nouvelle insertion dans le Data


Warehouse ne dtruit pas les anciennes
valeurs mais cr une nouvelle insertion.

Free Powerpoint Templates


Page 18
Mta-donnes

Il s'agit de donnes sur les donnes .


Elles dcrivent les rgles ou processus
attachs aux donnes du systme.
Il permet aussi de faciliter la recherche de
donnes.

Free Powerpoint Templates


Page 19
Concept du Data
Warehouse

Free Powerpoint Templates


Page 20
Concept du Data Warehouse

Oriente sujet Donnes intgres

DATA WAREHOUSE

Donnes non volatiles Donnes dates

Free Powerpoint Templates


Page 21
Concept du Data Warehouse
Donnes orientes sujet :
Regroupe les informations des diffrents mtiers
Ne tiens pas compte de lorganisation
fonctionnelle des donnes

Ass. Vie Ass. Auto Ass. Sant

Client
Police

Free Powerpoint Templates


Page 22
Concept du Data Warehouse
Donnes intgres :
Normalisation des donnes
Dfinition dun rfrentiel unique
h,f

1,0 h,f

homme, femme

GBP
EUR
CHF

USD Free Powerpoint Templates


Page 23
Concept du Data Warehouse
Donnes non volatiles :
Traabilit des informations et des dcisions
prises
Copie des donnes de production
Bases de production Entrepts de donnes

Ajout
Suppression

Accs
Modification Chargement

Free Powerpoint Templates


Page 24
Concept du Data Warehouse
Donnes dates :
Les donnes persistent dans le temps
Mise en place dun rfrentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Rpertoire Rpertoire
Base de Nom Ville Nom Ville
production Dupont Paris Dupont Marseille
Durand Lyon Durand Lyon

Calendrier Rpertoire
Entrept Code Anne Mois Code Anne Mois
de
1 2005 Mai 1 Dupont Paris
donnes
2 2006 Juillet 1 Durand Lyon
Free Powerpoint2Templates
Dupont MarseillePage 25
Les aspects
techniques

Free Powerpoint Templates


Page 26
Les aspects techniques du DW

1. Les bases de donnes

. OLAP (On-Line Analitical Processing)


Cest un mode de stockage prvu pour lanalyse
statistique des donnes contenues dans la base;
Il est appliqu un modle virtuel de
reprsentation de donne appel cube ou
hypercube OLAP.

Free Powerpoint Templates


Page 27
Les aspects techniques du DW

OLTP (On-Line Transactional Processing)


Cest un mode de stockage fait pour les systmes
oprationnels;
Ils supportent trs bien une utilisation
transactionnelle de la base de donnes;
ce mode de stockage est associ des requtes
type courtes et ne demandant pas beaucoup de
ressource du ct du serveur de la base de
donnes.

Free Powerpoint Templates


Page 28
Les aspects techniques du DW

2. Modlisation
. Les tables de dimensions
- Elles contiennent les donnes qui permettent de
dfinir un axe dune tude.
- Ce type de tables joue le rle de rfrentiel au DATA
WAREHOUSE.
. Les tables de faits
- Comme leur nom lindique, Ces tables contiennent
uniquement les donnes factuelles du DATA
WAREHOUSE.
Free Powerpoint Templates
Page 29
Les aspects techniques du DW

Les tables d'agrgats


- Ces tables sont spciales, elles permettent
de simplifier le travail de restitution des
logiciels danalyse;
- Elles contiennent des donnes un niveau
de granularit plus grand que dans les
tables de faits;

Free Powerpoint Templates


Page 30
Les aspects techniques du DW
3. Les types de modle

Modle en toile Modle


Free Powerpoint Templates en flocon
Page 31
Modle en toile

Une table de fait centrale et des dimensions


Les dimensions nont pas de liaison entre elles
Avantages
Facilit de navigation
Nombre de jointures limit
Inconvnients
Redondance dans les dimensions
Toutes les dimensions ne concernent pas les
mesures
Free Powerpoint Templates
Page 32
Modle en toile
Dimension
Dimension Temps
Temps
ID
ID temps
temps
anne
anne
mois
mois
Dimension
Dimension produit
produit
jour
jour
Dimension ID
ID produit
produit
Dimension Magasin
Magasin

ID nom
nom
ID magasin
magasin
description code
code
description
ville Table
Table dede faits
faits Achat
Achat prix
prix
ville
surface ID
ID client
client poids
poids
surface

ID
ID temps
temps groupe
groupe
ID
ID magasin
magasin famille
famille
ID
ID rgion
rgion

ID
ID produit
produit
Dimension
Dimension Region
Region Quantit
Quantit achete
achete Dimension
Dimension Client
Client
ID
ID rgion
rgion Montant
Montant des des achats
achats ID
ID client
client
pays
pays nom
nom
description
description prnom
prnom
district
district vente
vente adresse
adresse
.
. Free Powerpoint Templates

Page 33
Modle en flocon
Une table de fait et des dimensions dcomposes en
sous hirarchies.
On a un seul niveau hirarchique dans une table de
dimension.
La table de dimension de niveau hirarchique le plus bas
est relie la table de fait. On dit quelle a la granularit
la plus fine.
Avantages
Normalisation des dimensions
conomie despace disque
Inconvnients
Modle plus complexe (jointure)
Requtes moins performantes
Free Powerpoint Templates
Page 34
Dimension
Dimension produit
produit
ID
ID produit
produit
Dimension
Dimension Temps
Temps ID
ID groupe
groupe
ID temps
ID temps nom
nom
annee
annee code
code
mois
mois prix
prix
Dimension
Dimension Magasin
Magasin jour Dimension
Dimension groupe
groupe
jour poids
poids
ID magasin
ID magasin ID
ID groupe
groupe


description
description ID
ID famille
famille
ville
ville Table
Table de
de faits
faits Achat
Achat
ID client
nom
nom
surface
surface ID client
ID
ID temps
temps


ID
ID magasin
magasin
Dimension
Dimension Region
Region ID
ID rgion
rgion Dimension
Dimension Famille
Famille
ID rgion
ID rgion ID
ID produit
produit
ID
ID division
division vente
vente ID
ID famille
famille
Quantit
Quantit achete
achete
pays
pays Montant
Montant des des achats
achats
nom
nom
description
description
.
. Dimension
Dimension Client
Client
Dimension
Dimension ID
ID client
client
Division
Division vente
vente nom
nom
ID
ID division
division vente
vente prnom
prnom
description
description Free Powerpoint Templates adresse
adresse Page 35
.
.

SGBD et DW

Free Powerpoint Templates


Page 36
SGBD et DW
Service Service Service
OLTP: On-Line commercial Financier livraison
Transactional BD prod BD prod BD prod
Processing
Clientle

H
I
Data Warehouse S
T
OLAP: On-Line O
Analitical R
Clientle I
Processing
Q
U
Free Powerpoint Templates E
Page 37
SGBD et DW

OLTP DW
Orient transaction Orient analyse
Orient application Orient sujet
Donnes courantes Donnes historises
Donnes dtailles Donnes agrges
Donnes volutives Donnes statiques
Utilisateurs nombreux, Utilisateurs peu nombreux,
administrateurs/oprationnels manager
Temps dexcution: court Temps dexcution: long

Free Powerpoint Templates


Page 38
SGBD et DW

Free Powerpoint Templates


Page 39
Conclusion

Free Powerpoint Templates


Page 40
Conclusion

Lutilisation des DATAWAREHOUSE est


aujourdhui trs demand dans le monde
de lentreprise, demande qui rpond au
besoin toujours plus prsent des
utilisateurs davoir les bonnes informations
au bon moment.

Free Powerpoint Templates


Page 41
Webographie

Free Powerpoint Templates


Page 42
Webographie

www.wikipdia.org
www.supinfo.com Introdution au
DataWareHouse.htm lauteur Nicolas GUILLOT
www.ultrafluide.com
www.journaldunet.com
www.lincoln.fr

Free Powerpoint Templates


Page 43
Merci pour votre attention

Free Powerpoint Templates


Page 44