Vous êtes sur la page 1sur 7

Business Intelligence Datawarehouse :

Un entrept de donnes est une collection de donnes thmatiques, intgres, non volatiles et historises, organises pour la prise de dcision (Bill Immon) Un entrept de donnes est un stockage intermdiaire de donnes issues dapplications de production, dans lequel les utilisateurs finaux puisent avec des outils de restitution et danalyse. Trois fonctions essentielles : o o o collecte de donnes de bases existantes et chargement gestion des donnes dans lentrept analyse de donnes pour la prise de dcision

Non volatiles et historises : Il ny a pas de suppressions, ce qui ncessite un rfrentiel de temps. Intgres : Les donnes sont smantiquement intgres. On procde par Data Reconciliation ou Data Clearing, ou Data Cleansing. Le nettoyage doit tre fait le plus tt possible dans la chane de traitement. Datamart : Cest un extrait du datawarehouse. Il est orient utilisateurs, mais permet aussi de gagner en performance. Ce sont souvent des bases de donnes multidimensionnelles. Rfrentiel : Il contient les meta donnes, toutes les rgles de calculs, dextractions, dintgrations, de nettoyage Les rfrentiels ne sont pas encore trop partags entre les diffrentes tapes, mais des standards arrivent ; OIM, CWMI.. Modle multidimensionnel (Cube) : Il est centr sur une activit. Cest un modle de stockage, il relate un fait. ETL (Extract, Transform, Load) : Outil de transfert de donnes dune BDD une autre, capable de grer une programmation et des transformations telles que d-normalisation, agrgation, etc. A distinguer des Entreprise Application Integration (EAI), qui grent des rplications en temps rel. Dautomatiser des transferts de donnes avancs De dvelopper des processus dalimentation un haut niveau dabstraction De disposer dune bibliothque de validations et transformations complexes cls en main Rcuprent les donnes des systmes oprationnels Convertissent, transforment et stockent les donnes dans lentrept

Outils : Ardent Software, DataStage Carleton, Passport ETI, ETI*Extract Hummingbird, Genio Informatica, Powermart Sagent, Sagent Solution SAS Institute, Warehouse Administrator

Outils de requte : Permettent aux utilisateurs d interroger les donnes dans une base relationnelle sans crire le code sql Editeurs et outils : Brio Technologies / Hyperion : Brio Query, Business Objects : BusinessObjects / Crystal Report Andyne : GQL Pablo, Cognos : Impromptu Oracle : Reports

ODS (Operational Data Store) est une copie, rafrachie frquemment, des bases de production ; il permet de rpondre aux problmatiques de reporting oprationnel et de validation des donnes sans surcharger le serveur de production. Il permet : De produire un reporting oprationnel partir de donnes de dtailles Dattendre la compltude des donnes pour le calcul dindicateurs agrgs o Exemple : calcul de dlais, de taux

Les donnes ne sont pas conserves dans lODS, qui est effac priodiquement.

Tableau comparatif entre transactionnel et dcisionnel

Donnes

Traitements

Conception BDD

Transactionnel OLTP (Online Transactionnal Processing) Conserves le temps de leur validit Sont dtailles Donnes personnelles Mise jour directement Temps de validit + temps de transaction Requtes plutt simples Rptitifs Sensibles aux performances Orientes fonction Relativement statiques Agents oprationnels Des milliers Dizaines centaines Mo/Go

Dcisionnel OLAP (Online Analytical Processing) Historises Agrges Anonymes Recalcules Temps dextraction + temps de validit + temps de transaction

Requtes complexes Requtes varies Problmes de performance Oriente sujet Evolutive pour rpondre aux nouveaux besoins Dcideurs Des centaines Milliers millions Go/To

Utilisateurs Nombre de tuples accds Taille de la BDD

Dimension : cest un ensemble d'lments, appels Membres, organiss selon un mode hirarchique. Membre : lments de base composant une dimension

OLAP (On Line Analytical Processing) :

C'est un modle de donnes optimis pour la restitution et l'analyse des donnes. La structure d'un modle OLAP permet une navigation dans les donnes plus rapide et plus intuitive. Relationel Olap Informix : Metacube Microstrategy : DSS Oracle : Discoverer Sterling Software : Eureka:Suite SAP BW

Multidimensionnel Olap Cognos : Powerplay Hyperion Solutions : Essbase Server Microsoft : SQL Server 7.0 Olap Services Oracle : Express Server SAS Institute : SAS/MDDB Seagate Software : Holos

Cube :

cest un rceptacle o les donnes sont stockes dans une base de donnes OLAP. Un cube est constitu de dimensions (20 au maximum). Un cube est l'quivalent d'une table dans une base de donnes relationnelle.

Roll up : Agrger selon une dimension

Semaine Mois
Drill down : Dtailler selon une dimension

Mois Semaine
Slice et Dice: Slection et projection selon 1 axe Mois = 04-2003 ; Projeter(Rgion, Produit) Pivot : Tourne le cube pour visualiser une face

(Rgion,Produit)(Rgion, Mois)

Couche smantique : univers

Alimentation en delta Capacit ne traiter, entre deux sessions dalimentation du datawarehouse, que des donnes utiles : celles qui ont t cres, modifies, supprimes, dans lintervalle.

Relationel ou multidimensionnel ? M-Olap : outil Olap qui repose sur une base de donnes multidimensionnelle (axes danalyses, cubes...) R-Olap : outil Olap qui repose sur une base de donnes relationnelle (tables, index, relations...) H-Olap : outil qui combine les deux technologies les donnes sont stockes dans une base de donnes relationnelle une structure multidimensionnelle est lutilisateur de manipuler les donnes. gnre pour permettre

La construction dun data warehouse doit servir un objectif conomique Rduction des cots (faible parce que peu dautomatisation) Rduction des dlais

Exemple : 50% du temps traiter de linformation et 4/5 collecter et transformer les donnes

des utilisateurs de ces 50% est

est pass consacr