Vous êtes sur la page 1sur 57

Ecole nationale Suprieure dInformatique

Prsent par: FILALI Abderrahmane KEDJNANE Sofiane

Date: 06/07/2010 Dure: 30min

Introduction

Prambule

Organisme daccueil

Problmatique

Dfinitions Prsentation de la solution Conclusion et perspectives

Systmes dcisionnels

Dcisionnel VS oprationnel

Data Warehouse

Dmarche adopte

Conception de la solution

Mise en uvre

Introduction Dfinitions Prsentation de la solution Conclusion

Introduction Dfinitions Prsentation de la solution Conclusion

1947, Cration de EGA 1969, Cration de SONELGAZ

1991, SONELGAZ devient un EPIC Juin 2002, Le statut de SPA


4

Introduction Dfinitions Prsentation de la solution Conclusion

Le mtier de la distribution:

Introduction Dfinitions Prsentation de la solution Conclusion

Le mtier de la distribution:
Direction de Distribution 1

Direction de Distribution 2

Direction de Distribution N

Agence 1 Agence 2 Agence N


6

Introduction Dfinitions Prsentation de la solution Conclusion

Quantit de donnes

Besoin dun support De dcision Insuffisances de la mthode actuelle

Opportunits pour un tel projet

Introduction Dfinitions Prsentation de la solution Conclusion

Introduction Dfinitions Prsentation de la solution Conclusion

Consolidation

ELIT ou SD

Envoie

Extraction

Introduction Dfinitions Prsentation de la solution Conclusion

SGC

SQL

10

Introduction Dfinitions Prsentation de la solution Conclusion

11

Introduction Dfinitions Prsentation de la solution Conclusion

Rendre les donnes accessibles,

Prsenter les donnes dune faon cohrente et


fiable,

Minimiser le cot dlaboration de rapport en


ressources (temps et argent),

Assurer une indpendance fonctionnelle vis--vis


du systme oprationnel,
12

Introduction Dfinitions Prsentation de la solution Conclusion

DD2

DD1

DD58

13

Introduction Dfinitions Prsentation de la solution Conclusion

14

Introduction Dfinitions Prsentation de la solution Conclusion

Entrept de donnes Infocentre

bases de donnes oprationnelles


1970 1980 1990

volution des bases de donnes dcisionnelles


15

Introduction Dfinitions Prsentation de la solution Conclusion

Le Data Warehouse est une collection de donnes orientes sujet, intgres, non volatiles et volutives dans le temps, organises pour le support dun processus daide la dcision. [Inmon, 2002]

16

Introduction Dfinitions Prsentation de la solution Conclusion

Donnes
Lorientation des donnes La situation reflte Le stockage des donnes

Usage
La Finalit Les manipulations Les utilisateurs
17

Introduction Dfinitions Prsentation de la solution Conclusion

Les systmes dcisionnels et oprationnels sont appels, de part leurs finalits et leurs usages, la cohabitation. Les systmes oprationnels reprsentent la premire source de donnes pour les systmes dcisionnels.
18

Introduction Dfinitions Prsentation de la solution Conclusion

Extraction

Chargement

Prsentation

Architecture et environnement du DW

19

Introduction Dfinitions Prsentation de la solution Conclusion

La zone de prsentation:
On-Line Analytical Processing (O.L.A.P.) est un style dinterrogation spcifiquement dimensionnel. Dfinit par E. Codd (Pre des BDD relationnelles). On trouve les types suivants de serveurs :

Entrept

Traitement

Prsentation 21

Introduction Dfinitions

Prsentation de la solution Conclusion

Conception de la zone dentreposage Dfinition des besoins

Conception de la zone dalimentation


Mise en route

tude technique

Conception des cubes dimensionnels

22

Introduction Dfinitions Prsentation de la solution Conclusion

Dmarche

Modlisation dimensionnelle

Dfinition de larchitecture technique Conception physique

Buttom Top

Gestion et planification du projet Maintenance et croissance

up (sources de Construction donnes)


de la zone dalimentation Portail de restitution

Etude des besoins

Down (besoins utilisateurs)


tude des besoins dans un projet Data Warehouse.[Kimball, 96]
23

Planification du dploiement

Introduction Dfinitions Prsentation de la solution Conclusion

Audit de la base de donnes et SO Supports existantsEntretiens

Dmarche mixte

24

Introduction Dfinitions Prsentation de la solution Conclusion

Cette tude a abouti :


LIdentification des postes utilisateur (DCM, DCF, PDG, ETC.)

La Dtection des besoins,


La classification des besoins en quatre volets, qui sont : Ventes, Suivi des abonns,

Suivi des affaires,


Recouvrement,
25

Introduction Dfinitions Prsentation de la solution Conclusion

Analyse des priorits :


Ventes GA

Rec

GA: Gestion des affaires. Ventes: Suivi des ventes SA: Suivi des abonns Rec: Recouvrement

Intrt

SA

Facilit

26

Introduction Dfinitions Prsentation de la solution Conclusion

Nouveaux besoins

Nouvelle modlisation
Nouveaux objectifs

27

Introduction Dfinitions Prsentation de la solution Conclusion

La Modlisation dimensionnelle:
Dimension Temps
-Cl temps -Anne -Mois -Jours -

Table de fait
-Cl temps -Cl produit -Cl magasin -. -Montant -

Dimension produit -Cl produit -Dsignation produit -Type produit

Dimension magasin
-Cl magasin

Modlisation dimensionnelle 28

Introduction Dfinitions Prsentation de la solution Conclusion

Dimension

Dimension Fait

Dimension

Fait

Dimension

Dimension

Dimension

Dimension

Fait

Dimension

Dimension

29

Introduction Dfinitions Prsentation de la solution Conclusion

Avantages :
Performant,

Simple et intuitif,
Rutilisation des dimensions,

Rduction des temps de chargement,


30

Introduction Dfinitions Prsentation de la solution Conclusion

Le Processus de Modlisation:
Choix de lactivit

Construction des agrgats

Dfinition de la granularit

Dtection des dimensions

Dtection des mesurables


31

Introduction Dfinitions Prsentation de la solution Conclusion

Structure de la zone dentreposage:

META DATA ZONE AGRGE

ZONE DTAILLE
32

Introduction Dfinitions Prsentation de la solution Conclusion

Extract. Transform. Load (E.T.L.):


Extraire Transformer Nettoyer Intgrer Charger Charger Indexer agrger

Lire Interprter Copier

33

Introduction Dfinitions Prsentation de la solution Conclusion

tre rapide

Processus ETL

tre correctif tre sr tre transparent Qualit de donnes


34

Introduction Dfinitions Prsentation de la solution Conclusion

Etapes de la construction:

Etude des sources

Elaboration de stratgie dextraction

Mise en place dune architecture

35

Introduction Dfinitions Prsentation de la solution Conclusion

Contraintes
Rseau

Qualit de donnes

ETL

Quantit de donnes

Structure de lentreprise

36

Introduction Dfinitions Prsentation de la solution Conclusion

Etude des sources


Gestion des Travaux (Raccordements BT/BP)
Relve et facturation BT/BP, MT, MP

Recouvrement SGBD : INGRES 2006, Trsorerie et comptabilit 452 Tables,

Open ROAD 35 applications 2900 utilisateurs, 6 millions de clients, 70000 factures / jour
37

Introduction Dfinitions Prsentation de la solution Conclusion

Etude des sources

38

Introduction Dfinitions Prsentation de la solution Conclusion

Stratgie dextraction:

Processus de chargement

Dimensions
Faits Particulires

Donnes prtes a tre charges

Processus de chargement

39

Introduction Dfinitions Prsentation de la solution Conclusion

Architecture de la zone dalimentation:


Pousse Tire

La mthode Push and Pull


Systme source

Base de donnes intermdiaire

Serveur ELIT

40

Introduction Dfinitions Prsentation de la solution Conclusion

Architecture globale de la zone dalimentation:


SGC

Extraction

Transformation

Meta-Data

Staging

Direction regionale
Transformation

SGC

Extraction

Staging

Serveur ETL Elit

DW

Direction regionale

SGC

Extraction

Transformation

FTP

Staging

Direction regionale

41

Introduction Dfinitions Prsentation de la solution Conclusion

En cas de problmes? Rle des METADATA

Solution secours numro une:


Lancement du chargement paramtr

Solutions secours numro deux:


Recourt au fichiers historiques.

42

Introduction Dfinitions Prsentation de la solution Conclusion

Avantages:
Outre un chargement sr, Cette architecture permet :
Une rduction importante des temps de chargement, grce au chargement parallle Facilit de recours la solution secours en cas dchec dun chargement Limpact rduit dun chargement chou
43

Introduction Dfinitions Prsentation de la solution Conclusion

Dfinition des dimensions

Construction des hirarchies

Dfinition des mesurables

44

Introduction Dfinitions Prsentation de la solution Conclusion

45

Introduction Dfinitions Prsentation de la solution Conclusion

Architecture technique:

Entreposage de donnes

Alimentation de lentrept

Outil de reporting

Serveur R-OLAP

QBE

48

Introduction Dfinitions Prsentation de la solution Conclusion

Expansion

Formation

Data Warehouse

Support

Support technique
46

Introduction Dfinitions Prsentation de la solution Conclusion

Meta Data

Gestion des utilisateurs

Suivi de lalimentation

Constitution zone de restitution


47

Introduction Dfinitions Prsentation de la solution Conclusion

Une dmarche spcifique.


Prsentation de la solution a un comit de projet Dploiement sur des sites pilotes. Intgration dans une quipe pour tendre la solution. Offrir un rapport comme support la solution.

Evolution dans un milieu fort intressant.


49

Introduction Dfinitions Prsentation de la solution Conclusion

Suivre le dploiement actuel et recueillir les correctifs et remarques des utilisateurs. Etendre le dploiement de manire couvrir, terme la, totalit du territoire national.

Etendre la solution vers dautres systmes oprationnels notamment les


systmes de la HP/HT. Utilisation des mthodes et algorithmes de Data Mining pour une meilleure

exploitation des donnes.


Continuer le dveloppement du portail de restitution.
50

51