Vous êtes sur la page 1sur 23

Plan

Introduction Les entrepts de donnes Les datamart Architecture Modlisation Alimentation Les bases de donnes multidimensionnelles Le march du dcisionnel Dmonstration
1

Le contexte

Besoin: prise de dcisions stratgiques et tactiques Pourquoi: besoin de ractivit Qui: les dcideurs (non informaticiens) Comment: rpondre aux demandes danalyse des donnes, dgager des informations qualitatives nouvelles
Qui sont mes meilleurs clients? Pourquoi et comment le chiffre daffaire a baiss? A combien slvent mes ventes journalires?
2

Quels marocains consomment beaucoup de poisson?

Les donnes utilisables par les dcideurs


Donnes oprationnelles (de production) Bases de donnes (Oracle, SQL Server) Fichiers, Paye, gestion des RH, gestion des commandes Caractristiques de ces donnes: Distribues: systmes parpills Htrognes: systmes et structures de donnes diffrents Dtailles: organisation des donnes selon les processus fonctionnels, donnes surabondantes pour lanalyse Peu/pas adaptes lanalyse : les requtes lourdes peuvent bloquer le systme transactionnel Volatiles: pas dhistorisation systmatique
3

Problmatique
Comment rpondre aux demandes des dcideurs?

En donnant un accs rapide et simple linformation stratgique En donnant du sens aux donnes

Mettre en place un systme dinformation ddi aux applications dcisionnelles: un data warehouse

Le processus de prise de dcision


Champs dapplication des systmes dcisionnels Dfinir le Rassembler problme les donnes Analyser les tablir des donnes solutions Dcider

Temps de prise dune dcision

Le processus de prise de dcision

Prise de dcision

Bases de production

Data warehouse

Base multi dimensionnelle

Prdiction / simulation

Domaines dutilisation des DW


Banque Risques dun prt, prime plus prcise Sant pidmiologie Risque alimentaire Commerce Ciblage de clientle Dterminer des promotions Logistique Adquation demande/production Assurance Risque li un contrat dassurance (voiture)
7

Quelques mtiers du dcisionnel


Strategic Performance Management

Dterminer et contrler les indicateurs cl de la performance de lentreprise Finance Intelligence Planifier, analyser et diffuser linformation financire. Mesurer et grer les risques Human Capital Management (gestion de la relation avec les employs) Aligner les stratgies RH, les processus et les technologies. Customer Relationship Management (gestion de la relation client) Amliorer la connaissance client, identifier et prvoir la rentabilit client, accroitre lefficacit du marketing client Supplier Relationship Management (gestion de la relation fournisseur) Classifier et valuer lensemble des fournisseurs. Planifier et 8 piloter la stratgie Achat.

Plan
Introduction Les entrepts de donnes Les datamart Architecture Modlisation Alimentation Les bases de donnes multidimensionnelles Le march du dcisionnel Dmonstration
9

Dfinition dun DW
W. H. Inmon (1996):

Le data Warehouse est une collection de donnes orientes sujet, intgres, non volatiles et historises, organises pour le support dun processus daide la dcision
Principe: mettre en place une base de donnes

utilise des fins danalyse

10

Les 4 caractristiques des data warehouse


1. Donnes orientes sujet: Regroupe les informations des diffrents mtiers Ne tiens pas compte de lorganisation fonctionnelle des donnes
Ass. Vie Ass. Auto Ass. Sant Client Empl

11

Les 4 caractristiques des data warehouse


2. Donnes intgres: Normalisation des donnes Dfinition dun rfrentiel unique
h,f 1,0 homme, femme MAD FF USD
EUR

h,f

12

Les 4 caractristiques des data warehouse


3. Donnes non volatiles Traabilit des informations et des dcisions prises Copie des donnes de production
Bases de production Ajout Suppression Accs Modification Chargement
13

Entrepts de donnes

Les 4 caractristiques des data warehouse


4. Donnes dates Les donnes persistent dans le temps Mise en place dun rfrentiel temps
Image de la base en Mai 2005 Image de la base en Juillet 2006
Rpertoire

Base de production

Nom

Rpertoire

Ville Paris Lyon

Nom Dupont Durand


Rpertoire

Ville Marseille Lyon

Dupont Durand

Entrept de donnes

Calendrier

Code Anne 1 2 2005 2006

Mois Mai Juillet

Code Anne 1 1 2 Dupont Durand Dupont

Mois Paris Lyon Marseille


14

SGBD et DW
OLTP: On-Line Transactional Processing Service commercial
BD prod

Service Financier
BD prod

Service livraison
BD prod

Clientle
H I S T O R I Q U E

Data Warehouse
OLAP: On-Line Analitical Processing Clientle

15

OLTP VS DW
OLTP
Orient transaction Orient application Donnes courantes Donnes dtailles Donnes volutives

DW
Orient analyse Orient sujet Donnes historises Donnes agrges Donnes statiques

Utilisateurs nombreux, Utilisateurs peu nombreux, administrateurs/oprationnels manager Temps dexcution: court Temps dexcution: long
16

Plan
Introduction Les entrepts de donnes Les datamart Architecture Modlisation Alimentation Les bases de donnes multidimensionnelles Le march du dcisionnel Dmonstration
17

Datamart
Sous-ensemble dun entrept de donnes Destin rpondre aux besoins dun secteur ou

dune fonction particulire de lentreprise Point de vue spcifique selon des critres mtiers
Datamarts du service Marketing

DW de lentreprise

Datamart du service Ressources Humaines

18

Intrt des datamart


Nouvel environnement structur et format en

fonction des besoins dun mtier ou dun usage particulier Moins de donnes que DW
Plus facile comprendre, manipuler Amlioration des temps de rponse

Utilisateurs plus cibls: DM plus facile dfinir

19

Plan
Introduction Les entrepts de donnes Les datamart Architecture Modlisation Alimentation Les bases de donnes multidimensionnelles Le march du dcisionnel Dmonstration
20

Architecture gnrale
Zone de prparation
E X T R A C T I O N

Zone de stockage C H A R G E M E N T

Zone de prsentation

Transformations: Nettoyage Standardisation

Data warehouse

Requtes Rapports Visualisation Data Mining

Sources de donnes

Datamart

21

Les flux de donnes


Flux entrant

Extraction: multi-source, htrogne Transformation: filtrer, trier, homogniser, nettoyer Chargement: insertion des donnes dans lentrept

Flux sortant:

Mise disposition des donnes pour les utilisateurs finaux

22

Les diffrentes zones de larchitecture


Zone de prparation (Staging area) Zone temporaire de stockage des donnes extraites Ralisation des transformations avant linsertion dans le DW: Nettoyage Normalisation Donnes souvent dtruites aprs chargement dans le DW Zone de stockage (DW, DM) On y transfre les donnes nettoyes Stockage permanent des donnes Zone de prsentation Donne accs aux donnes contenues dans le DW Peut contenir des outils danalyse programms: Rapports Requtes

23