Vous êtes sur la page 1sur 60

Prof.

CHRAYAH Mohamed

Les entreprises passent l re de linformation. Dfi : Transformer leur systme dinformation qui avait une vocation de production un SI dcisionnel Dont la vocation de pilotage devient majeure.

Definition dun Data warehouse (DW)


La Data warehouse entre!"t de donnes# est une $olle$tion de donnes orientes su%et& int'res& non (olatiles et historises& or'anises !our le su!!ort d un !ro$essus d aide ) la d$ision *nmon& +,#.

Definition dun Data warehouse (DW)


-.Donnes orientes su%et Donnes structures par thmes sujets majeurs de lentreprise! et non suivant les processus fonctionnels. Le sujet est transversal au" structures fonctionnelles et organisationnelles de lentreprise. #n peut accder au" donnes utiles sur un sujet. Lintgration des diffrents sujets se fait dans une structure uni$ue.

Definition dun Data warehouse (DW)


-.Donnes orientes su%et Il n % a pas de duplication des informations communes plusieurs sujets. La &ase de donnes est construite selon les thmes $ui touchent au" mtiers de lentreprise clients' produits' ris$ues' renta&ilit' (!. Les donnes de &ase sont toutefois issues des S%stmes dInformation #prationnels SI#!.

Definition dun Data warehouse (DW)


/ Donnes int'res Les donnes' issues de diffrentes applications de production' peuvent e"ister sous toutes formes diffrentes. Il faut les intgrer afin de les homogniser et de leur donner un sens uni$ue' comprhensi&le par tous les utilisateurs. )lle doivent possder un codage et une description uni$ue.

Definition dun Data warehouse (DW)


0 Donnes non.(olatiles *ne information est considre volatile $uand les
donnes sont rgulirement mises jour comme dans les S%stmes dInformation #prationnels. Dans un SI#' les re$u+tes portent sur les donnes actuelles. Il est difficile de retrouver un ancien rsultat. Dans un D,' il est ncessaire de conserver lhistori$ue de la donne. -insi' une m+me re$u+te effectue deu" mois dintervalle en spcifiant la date de rfrence de la donne' donnera le m+me rsultat.

Definition dun Data warehouse (DW)


, Donnes historises Dans un SI#' les transactions se font en temps rel' et les donnes sont mises jour constamment. L histori$ue des valeurs de ces donnes n est gnralement pas conserv car il est inutile. Dans un D,' la donne nest jamais mise jour. Les donnes du D, s ajoutent au" donnes dj engranges../ ajout de couches de donnes successives' la manire des strates gologi$ues

Definition dun Data warehouse (DW)


, Donnes historises Le D, stoc0e donc lhistori$ue des valeurs $ue la donne aura prises au cours du temps. *n rfrentiel de temps est alors associ la donne afin d+tre capa&le didentifier une valeur particulire dans le temps. Les utilisateurs possdent un accs au" donnes courantes ainsi $u des donnes historises.

Definition dun Data warehouse (DW)


1 2u!!ort d un !ro$essus d aide ) la d$ision
*n D, est un s%stme d information ddi au" applications dcisionnelles dont les principales contraintes sont 1 des re$u+tes comple"es plusieurs niveau" d agrgation la ncessit de disposer d informations s%nthti$ues 2 reporting 3 de gestion' anal%se des ventes' gestion de la masse salariale' etc! le stoc0age des donnes sous une forme multi4 dimensionnelle des mises jour priodi$ues

Objectifs dun Data warehouse


permet le dveloppement d applications dcisionnelles
et de pilotage de l entreprise et de ses processus joue un r5le de rfrentiel pour l entreprise puis$u il permet de fdrer des donnes souvent parpilles dans diffrentes &ases de donnes offre une vision glo&ale et oriente mtier de toutes les donnes $ue manipule l entreprise permet de faire face au" changements du march et de l entreprise offre une information comprhensi&le' utile ' rapide et jour

Architecture dun Data warehouse


autres sources Metadonnes

Monitor & Integrator

OLAP Server

BD Extraire oprationnelles Transformer Charger Mettre jour

Data Warehouse

Analyse Requtes Rapports Data mining

Data Marts Sources Stockage OLAP Outils Front-End

Architecture dun Data warehouse


- 3es 4ases de Donnes 6ases de donnes internes1 6ases de production de lentreprise 6ases cres par les utilisateurs 6ases de donnes e"ternes lentreprise $ui ncessitent leur identification' leur rapatriement et leur intgration. Donnes achetes des fournisseurs de donnes Donnes rcupres sur Internet

Architecture dun Data warehouse


/ 5!rations sur les donnes 67TRACT*58 )"traire les donnes de leur environnement dorigine &ases de donnes relationnelles' fichiers plats' (!. *tiliser une techni$ue approprie pour n e"traire $ue les donnes ncessaires 1 donnes cres ou modifies depuis la dernire opration de"traction.

Architecture dun Data warehouse


/ 5!rations sur les donnes TRA8295RMAT*58
*ne m+me donne peut avoir une structure ou une valeur diffrente en fonction de la &ase production' e"terne' utilisateurs! dont elle provient. #n peut +tre confront des redondances un m+me client peut appara7tre avec diffrents attri&uts et proprits selon la source consulte!. Il faut supprimer certaines donnes a&errantes $ui ris$ueraient de fausser les anal%ses. Il faut donc purer et transformer les donnes.

Architecture dun Data warehouse


/ 5!rations sur les donnes CHAR:6M68T;RA9RA*CH*226M68T
)ffectuer sur les donnes des oprations de calcul et dagrgation. 8emplacer certaines &ases si aucune solution de"traction satisfaisante nest possi&le. 9ettre en place des procdures de chargement et de restauration en cas de pro&lme!. :%pi$uement' la fr$uence du chargement est $uotidienne et il est effectu en tout d&ut de matine. Si la disponi&ilit du s%stme ne peut +tre interrompue' envisager la mise en place de s%stmes redondants.

Architecture dun Data warehouse


/ 5!rations sur les donnes 362 5<T*32 #n peut automatiser tout ou partie des oprations dcrites. Des outils sont disponi&les 1 )"tract d):I' SIS de 9I;8#S#<:' S-S=,arehouse -dministrator de S-S( Le dveloppement doutils spcifi$ues est envisagea&le mais ris$ue d alourdir les t>ches.

Architecture dun Data warehouse


0 Di$tionnaire de Donnes
Le dictionnaire de donnes regroupe les mta4donnes. *ne mta4donne reprsente une donne sur les donnes. Il sagit de lensem&le des informations $ui permettent de $ualifier une donne' notamment par sa smanti$ue' sa rgle de calcul' sa provenance' sa $ualit' etc( les mta4donnes permettent de prciser de $uelle ta&le provient la donne' $uelles dates et heures elle en a t e"traite' ltat de la &ase cet instant' etc...

Architecture dun Data warehouse


0 Di$tionnaire de Donnes
*ne mta4donne permet de 2 remonter la cha7ne 3 et de reconstituer lensem&le dvnements et donnes $ui ont servi o&tenir linformation associe. Le dictionnaire de donnes contient toutes les informations permettant de"ploiter les donnes. ;est un rfrentiel destin au" utilisateurs et ladministrateur du D,. - ce jour' il ne"iste pas de normes en ce $ui concerne la structure et la gestion des dictionnaires de donnes. ;ha$ue outil propose sa solution et son approche.

Architecture dun Data warehouse


, 362 DATA MART2
*n data mart magasin de donnes! est un D, focalis sur un sujet particulier' souvent au niveau dpartemental ou mtier. ; est donc un mini D, li un mtier particulier de l entreprise finance' commercial' (!. *n D, est souvent volumineu" plusieurs centaines de ?o voire $uel$ues :o ! avec des performances inappropries temps de rponse trop longs!. *n Data mart' $uant lui' comporte moins de @A ?o' ce $ui permet des performances accepta&les. La cration dun data mart peut +tre un mo%en de d&uter un projet de D, projet pilote!.

LES DATA MARTS

Mod isation dun Data warehouse


DI9)BSI#B #n entend par dimensions les a"es avec les$uels on veut faire lCanal%se. Il peut % avoir une dimension client' une dimension produit' une dimension gographie pour faire des anal%ses par secteur gographi$ue!. <ne dimension est tout $e qu=on utilisera !our faire nos analyses.

Mod isation dun Data warehouse


<-I:
Les faits sont ce sur $uoi va porter lCanal%se. ;e sont des ta&les $ui contiennent des informations oprationnelles et $ui relatent la vie de lCentreprise. #n aura des ta&les de faits pour les ventes chiffre dCaffaire net' $uantits et montants commands' $uantits factures' $uantits retournes' volumes des ventes' etc.! par e"emple ou sur les stoc0s nom&re dCe"emplaires dCun produit en stoc0' niveau de remplissage du stoc0' tau" de roulement dCune Done' etc(.

<n fait est tout $e qu=on (oudra analyser.

Mod isation dun Data warehouse


3e modle en toile
;ommande 8> Cde Date ;de
TA436 D6 9A*T2

Produit
Code !roduit Bom Produit Description Produit ;atgorie Description catgorie Pri" unitaire

;lient
8> Client Bom ;lient -dresse ;lient Eille

Eendeur

8> Cde Code (endeur 8> Client Clef date Code !roduit 8om ?ille @uantit AriB total

Date Eille
8om ?ille 8gion Pa%s Clef date Date 9ois -nne

Code (endeur Bom Eendeur Eille Eendeur Fuota

Mod isation dun Data warehouse


3e modle en toile
*ne ou plusieurs! taCle s# de faits : identifiants des taCles de dimension G une ou plusieurs mesures . Plusieurs taCles de dimension : des$ri!teurs des dimensions. Avantages : <acilit de navigation Performances 1 nom&re de jointures limit . ?estion des agrgats <ia&ilit des rsultats Inconvnients : :outes les dimensions ne concernent pas les mesures 8edondances dans les dimensions -limentation comple"e.

Mod isation dun Data warehouse


Proprits des mesures Additi(it : somme sur toutes les mesures )"emple 1 ;- G Fuantit vendue' ... 2emi.additi(it : somme sur $ertaine mesures : )"emple 1 n&re de contacts clients' )tats des stoc0s' ... 8on.additi(it : !as de somme & re$al$uler )"emple 1 encours mo%en fin de mois' plus grand ;pour lensem&le des magasins

Mod isation dun Data warehouse


La ta&le de fait contient se $uCon appelle des H mesures 2 . Les ta&les de dimension contiennent les lments $uCutiliseront les dcideurs pour voir la ta&le de faits. #n nCutilise I-9-IS la cl dCun s%stme de production comme cl de dimension. ;ha$ue ligne de la ta&le de faits doit avoir une relation avec chacune des ta&les de dimensions Il nCe"iste de relations $uCentre les dimensions et les ta&les de faits.

Mod isation dun Data warehouse


#n vous demande de crer un data 9art une toile! pour lCanal%se de lCactivit des reprsentants dCune entreprise de vente dCimprimantes. Le chef dCentreprise veut savoir ce $ui se passe pour ses vendeurs. Les emplo%s font ils leur travail' $uelle est la Done de couverture des vendeurs' ou sont les endroits oJ les vendeurs sont le moins efficaces' $uelle est la mo%enne de ventes des reprsentants' etc.' etc. LCentreprise possde un s%stme de gestion de ressources humaines' un s%stme de gestion des ventes et des feuilles de routes avec des informations concernant les vendeurs 1 0ilomtres parcourus' litres dCessence utilise' frais de vo%age' ventes' promesses de ventes' etc.

Mod isation dun Data warehouse


Date Annes Mois Jours Heures !endeur Nom Prnom Salaire "roduit Catgorie Type Groupe #one $o$ra%hi&ue Pays Province Ville Nom Adresse Pays ' ient

Analyse : consommation d essence! "te commande! "te prcommande! #ilomtrage!nom$re de visites! etc%

Mod isation dun Data warehouse


Produit
IDKproduit Bom Prenom ;athegorie ?roupe

:emps
IDKtemps -BB)) 9#IS I#*8 S)9-IB)

?eographie
IDK?)# P-LS EILL) P8#EIB;)

<ait -nal%se 8epresentantes IDKanalKrepresentant IDKdateKcommande IDKvendeur IDK?)# IDKproduit

Eendeur
IDKvendeur Bom Prenom Salaire DateKem&auche

:emps
IDK;lient B#9 -D8)SS) P)8S#BB) 8)SS

Mod isation dun Data warehouse


#n vous demande de crer un data 9art une toile! pour lCanal%se de lCactivit dMun magasins de &oissons. *ne chaine nationale fictive de magasins de &oissons. ;elle4ci vient dM implmenter un programme carte de fidlit dans les points de vente. Fuoi$ue le programme soit relativement rcent et $ue les ventes sur carte de fidlit ne reprsentent encore $ue @N des ventes nationales' la direction dsire anal%ser les ventes et le mar0eting au niveau du client et savoir si la manire dMacheter des clients dtenteurs dMune carte de fidlit diffre du mode de consommation des clients anon%mes.

Mod isation dun Data warehouse

&'ercice
*ne agence de vo%age dsire connaitre le chiffre daffaires ;-! par client' par date de vo%age date' semaine' mois' trimestre' et anne!' par compagnie arienne' par ville de destination O Les ta&leau" de &ord doivent pouvoir prsenter les totau" et sous totau" de ;- 1 tous clients confondus' et=ou toutes dates' et=ou toutes compagnies' et=ou toutes destinations. DessineD le modle dimensionnel O

Mod isation dun Data warehouse


;ommande 8> Cde Date ;de
TA436 D6 9A*T2

Produit
Code !roduit Bom Produit Description Produit ;atgorie Description catgorie Pri" unitaire

;lient
8> Client Bom ;lient -dresse ;lient Eille

Eendeur

8> Cde Code (endeur 8> Client Clef date Code !roduit 8om ?ille @uantit AriB total

Date Eille
8om ?ille 8gion Pa%s Clef date Date 9ois -nne

Code (endeur Bom Eendeur Eille Eendeur Fuota

Mod isation dun Data warehouse


3e modle flo$onn
;ommande 8> Cde Date ;de
TA436 D6 9A*T2

Produit
Code !roduit Bom Produit Description Produit catgorie Pri" unitaire

;athegorie
;atgorie Description

;lient
8> Client Bom ;lient -dresse ;lient Eille

8> Cde Code (endeur 8> Client Clef date Code !roduit 8om ?ille @uantit AriB total

Date
Clef date Date 9ois

9#IS
9ois -nne

-BB))
-nne

Eendeur

Code (endeur Bom Eendeur Eille Eendeur Fuota

Eille
8om ?ille 8gion

8egion
8gion Pa%s

Pa%s
Pa%s

Mod isation dun Data warehouse


La modlisation en flocon tant une variante de la modlisation en toile. Le principe de la modlisation en flocon est de crer des hirarchies de dimensions' de telle manire avoir moins de lignes par dimensions

Mod isation dun Data warehouse


Modle flo$onn D Modle en toile E normalisation des dimension Lors$ue les ta&les sont trop volumineuses A(anta'es : rduction du volume' permettre des anal%ses sur la dimension hirarchise. *n$on(nients : navigation difficile G nom&reuses jointures.

Mod isation dun Data warehouse


;onstellation *ne constellation est une srie dCtoiles ou de flocons relies entre eu" par des dimensions. Il sCagit donc dCtoiles avec des dimensions en commun. *n environnement dcisionnel idal serait une place ou il serait possi&le de naviguer dCtoile en toile' de constellation en constellation et de Data 9art en Data9art la recherche de lCinformation si prcieuse.

Mod isation dun Data warehouse


lib_temps Identite_etudiant date_du_chargement code-etudiant jour date_de_chargement jour_semaine numero-etudiant mois nom trimestre anne Table de faits tudiants prenom code_composante date_du_chargement code_pers date_du_chargement Table de faits enseignants

(a constellations de )aits permet de reprsenter plusieurs ta$les de )aits partageant *uel*ues ta$les de dimension% E(e)% es * (es ta$les de )aits +tudiants, et +enseignants, peuvent -tre mises en relation par la dimension temps et gograp.ie%

code_etudiant

code_profil_pers

code_profil_etudiant

lib_pays

lib_pays lib_profil_etudiant nb_heures_eq_td code_pru date_de_chargement libelle_profil_etudiant nb_heures_eq_tp date_de_chargement pays lib_composante libelle_pays mesures groupe_pays lib_pays

code_composante

date_de_chargement libelle_groupe_pays code_composante europe libelle_composante libelle_europe

Le 'once%t OLA"
L#L-P ou #nline -nal%tical Processing est une techni$ue informati$ue dCanal%se multidimensionnelle' $ui permet au" dcideurs' dCavoir accs rapidement et de manire interactive une information pertinente prsente sous des angles divers et multiples' selon leurs &esoins particuliers. - titre de"emple on peut reprsenter de faPon graphi$ue des informations contenues dans une &ase de donnes' sous la forme dCun cu&e plusieurs dimensions' le$uel cu&e permet dCanal%ser ces donnes sous diffrents angles' gr>ce lCorganisation de celles4ci en a"es dCanal%ses et en varia&les anal%ser.

OLA" et Data Warehouse


Il est important de distinguer les capacits dun data warehouse de celles dun systme OLAP. Contrairement un data warehouse qui se base le plus sou ent sur une technologie relationnelle! OLAP utilise des ues multidimensionnelles de donnes agrges a"in de permettre un accs rapide des in"ormations stratgiques pour une analyse plus "ine. H

OLA" et Data Warehouse


#L-P est un mode de stoc0age prvu pour lanal%se statisti$ue des donnes. *ne &ase de donnes #L-P peut se reprsenter comme un cu&e B dimensions oJ toutes les intersections sont pr4calcules. Le"emple suivant ne possde $ue trois dimensions pour $ue lon puisse le reprsenter visuellement mais ce nest en aucun cas une limite. Il sagit dun cu&e reprsentant les ventes de fruits dune entreprise. Les trois a"es reprsents sont 1 Le pa%s de vente Le t%pe de fruit La priode

Le 'once%t OLA"
Les QR rgles #L-P1
Eue multidimensionnelle. :ransparence du serveur #L-P a diffrents t%pes de logiciels. -ccessi&ilit a de nom&reuses sources de donnes. Performance du s%stme de 8eporting. -rchitecture ;lient=serveur. Dimension gnri$ues. ?estion d%nami$ue des matrices creuses. Support multi4utilisateurs. ;alculs a travers les dimensions. 9anipulation intuitive des donnes. Souplesse et facilit de constitution des rapports. Bom&re illimit de niveau" dagrgation et de dimensions

Analyse Multidimentionnelle
Les serveurs #L-P ont t conPus pour sintgrer dans un environnement client=serveur afin den retirer les possi&ilits offertes.
:)9PS
SAAA TAAA QAAA UAAA

;LI)B:
QRAAA SAAA

P8#D*I:

Analyse Multidimentionnelle
Q4 o&tenir des informations dj agrges selon les &esoins de lutilisateur. R4 simplicit et rapidit daccs V4 capacit manipuler les donnes agrges selon diffrentes dimensions S4 un cu&e utilise les fonctions classi$ues dagrgation 1 min' ma"' count' sum' avg' mais peut utiliser des fonctions dagrgations spcifi$ues.

Analyse Multidimentionnelle

Analyse Multidimentionnelle
L)S DI9)BSI#BS L)S E-8I-6L)S
Lutilisateur formulera alors ses re$u+tes en prcisant les indicateurs a anal%ser le chiffre daffaire!'les dimensions sur les$uelles ces anal%seurs doivent +tre projetes le produit et le client! et la population a o&server le mois mars RAQA!

Cu$e de donnes
Date NumFou 2002

V@A WAA VAA VAA @AA SAA R@A


P1 P2

2001

NumPro

2000

RAA
F1 P3

F2

Le multidimensionnel

(a granularit des dimensions


:emps
Iours 9ois :rimestres -nnes

?ographie

Eilles

8gions

Pa%s

Produits
Le multidimensionnel

Bumros

:%pes

?ammes

9ar$ues

&'emple
9ontant des ventes fonction de 9ois' rgion' Produit!
:ranularit des dimensions : Ty!e R'ion Anne Cat'orie Aays
Produit

Trimestre Mois 2emaine

Aroduit

?ille

Ma'asin
9ois Le multidimensionnel

Four

(a navigation multidimensionnelle
Projection en 2 dimensions
Produits

Coupe d un cube
Produits pour une rgion donne

CA
Rgion

CA

Temps en semaines

Rduction selon 1 dimension


Produits

Zoom selon une dimension


France

CA
Temps en mois

Est Lyon

Sud

Ouest Nice

Marseille

Le multidimensionnel

&'emple
La figure suivante presente un cu&e de donnees forme de montants de vente en cellules et de trois aretes graduees respectivement par des categories de produits' des villes de magasins et des trimestres. La notion de cu&e de donnees ne se limite pas a trois a"es mais se generalise en h%per4cu&e ou le nom&re da"es est $uelcon$ue pouvant aller jus$ua plusieurs diDaines.

Structure de visualisation
Il sagit dune vision s%nthti$ue et prcise des donnes $ue les dcideurs apprhendent facilement. )lle drive directement de la mtaphore du cu&e de donnes puis$uelle peut +tre considre comme la tranche du cu&e de donnes comme lillustre la figure suivante.

Analyse Multidimentionnelle
Bavigation dans les donnes1
D8ILL4D#,B'D8ILL4*P
Le drill4doXn=up dsigne la facult daller du niveau glo&al vers le niveau dtaill 'et inversement. Ce m$anisme est totalement Cas sur la notion de hirar$hie

SLID) -BD DI;)


Dsigne la possi&ilit de faire pivoter d%nami$uement les a"es du ta&leau danal%se croise.

D-:- S*8<IB?
La possi&ilit laisse a lutilisateur de circuler li&rement' de manire intuitive et ergonomi$ue dans un modle dimensionnel' lutilisateur peut alors modifier d%nami$uement ses a"es danal%se ou appli$uer un nouveau filtre a ses donnes.

LES D+,,ERE-TS O.T+LS OLA"


Deu" versions dC#L-P sCaffrontent actuellement1 Les outils 9#L-P 9ultidimensional #L-P! dCune part $ui sCappuient sur une &ase de donnes multidimensionnelle. Les outils 8#L-P 8elational #L-P! dCautre part' $ui reprsente leur $uivalent sur une &ase de donnes relationnelle.

LES O.T+LS ROLA"


Data Warehouse Moteur ROLAP Aide la dcision

Donnes Stockage des donnes dtailles (et agrges) et des mta-donnes

Traitements Gnration de plans d'excution SQL afin d'obtenir des fonctionnalits OLAP.

Prsentation Rapports Multi-Dimensionnel

LES O.T+LS ROLA"


Lapproche la plus rpandue consiste a stoc0er les &ases de donnes multidimensionnelles dans un environnement relationnel 1 on parle de lapproche 8elational #L-P 84#L-P!. Dans le conte"te relationnel' la 6D9 est traduite par des relations. ;ette approche procure de nom&reu" avantages 1 reutilisation des mecanismes de gestion des donnees prouves depuis des dcennies et capacite a gerer des volumes de donnees tres importants.

LES O.T+LS MOLA"


Data Warehouse Moteur MOLAP Aide la dcision

Donnes Stockage des donnes dtailles (et agrges)

Traitements

Prsentation Rapports Multi-Dimensionnel

LES O.T+LS MOLA"


*ne autre approche consiste a dvelopper une technologie ddie a la gestion des structures multidimensionnelles. Cette approche dite #ultidimensionnel #L-P 94#L-P! vise a offrir des niveau" levs de performance. Les &ases 94#L-P stoc0ent les donnes nativement sous une forme multidimensionnelle 1 il sagit dune application ph%si$ue du concept de cu&e. Les &ases de donnes de t%pe 94#L-P restent limites dans leur capacit a grer dimportants volumes de donnes au4del du gigaoctet! et se heurtent a la ncessit de dvelopper spcifi$uement et entirement tous les mcanismes des s%stmes de gestion de &ase de donnes.