Vous êtes sur la page 1sur 11

BI Systme Dcisionnel WRS / DW / DM / SAS

Les applications de Business Intelligence, dcisionnels, CRM peuvent tre capables dextraire les informations qui leur sont ncessaires dans les fichiers de production de lentreprise. Toutefois, les donnes y sont souvent sous des formats diffrents et, surtout, elles ne sont pas facilement exploitables, car codifies ou incompltes. On constitue donc des entrepts de donnes o les applications dcisionnelles pourront puiser librement.

Principe du Data Warehouse


Dans un systme dcisionnel, le Data Warehouse est utilis pour accumuler sur une longue priode les donnes oprationnelles qui seront exploites par les outils de reporting, danalyse et de prise de dcision, pour suivre lactivit ou dterminer des tendances.

Contenu du Data Warehouse


Le data Warehouse, ou entrept de donnes, est utilis comme stockage intermdiaire des donnes issues des applications de production et rassemble une copie des donnes vitales de lentreprise. Il peut ainsi contenir les commandes, la facturation, la production, les prospects Il ne sagit donc pas dun stockage documentaire, de type KM ou CM. Ces donnes sont : intgres et parfois agrges, cest--dire quelles sont compltes et directement exploitables (et non sous la forme de code ou de liens rsoudre avant exploitation), on utilise pour cela un ETL. non volatiles, elles ne peuvent pas tre supprimes aprs exploitation. historises, cest--dire que les donnes sont positionnes dans le temps, pour permettre ltude de leur volution. Ces donnes sont donc gnralement impropres une utilisation de production ultrieure, cependant certaines peuvent tre rinjectes dans des processus oprationnels.. Le data Warehouse correspond un projet au niveau de lentreprise. Pour le constituer on runira une description des informations disponibles dans lentreprise: les mta donnes.

Data Warehouse et Data Mart


Le data Warehouse dentreprise est un systme unique pour toute lentreprise capable de traiter de tous les thmes. Cest un gisement de donnes mis disposition de tous. Par exemple, chez un oprateur tlphonique, on met disposition les CDR (call detail record dtails des appels tlphoniques) pour tous les dpartements de lentreprises. Un data mart est un gisement de donnes constitu pour une partie de lentreprise, gnralement un dpartement, qui structure et agrge les informations en fonction de son besoin et donc ne conserve pas les dtails qui ne lui sont pas ncessaires. Donc nous pouvons avoir plusieurs data warehouses dans une entreprise traitant de thmes diffrents (achats, facturation, logistique, production), mais si deux gisements traitent dun mme thme il sagit alors de data marts.

Combien de data Warehouses

Qui fournit les donnes ? quand ? quel niveau de dtail ? Le data warehouse nest pas forcment un projet dentreprise. Il est souvent plus simple politiquement de rgler les problmes dpartement par dpartement et de ninvestir que sur les informations dont on aura besoin. Par exemple, chez lun des leaders de lassurance, il y a 60 bases de donnes Mais les dpartements mtier ont besoin des informations de leur propre mtier mais aussi des autres dpartements et le niveau de suivi dtaill nest pas le mme dun dpartement lautre. Si lon prend exemple dans le monde des tlcommunications, tous les oprateurs stockent les dtails des appels CDR (Call Detail Record). Cette information intresse : le marketing : pour connaitre les clients et proposer des offres adaptes, les gestionnaires du rseau : pour voir comment se rpartit le trafic (suivant les heures, les jours, les rgions). les financiers : pour prvoir la trsorerie, les investissements, les rsultats Pour ces raisons, les experts conseillent gnralement de constituer un data ware house dentreprise, grand gisement de donnes dtaill dans un seul et mme environnement pour rpondre tous les besoins des mtiers.

Les tapes du dcisionnel


La maturit des dcisionnels peut tre illustre en cinq tapes Par exemple dans le domaine logistique, au niveau de toutes les oprations lies au transport et lentreposage : tapes 1 et 2 : Que sest-il pass ? Pourquoi ? Mode Ractif : suivi des stocks, des ordres, des capacits de transport au niveau de chaque site, analyse dynamique des flux, des ressources, tapes 3 : Que va-t-il se passer ? Mode Practif : visibilit et projection de la situation au niveau de lensemble des sites, dans un mode planning, simulation, tape 4 : Quest-il en train de se passer ? Mode Interactif : vision globale et dtaille des situations en temps rel en prenant en compte tous les acteurs y compris les partenaires extrieurs dans un schma collaboratif, tape 5 : Quest-ce que je voudrais quil se passe ? Mode Proactif : actions doptimisation technique et financire de la prestation logistique et des niveaux de stocks.

Capacit des data Warehouses


Vouloir rassembler les donnes oprationnelles dans un seul data warehouse gnre des contraintes techniques lourdes : la capacit de stockage qui peut dpasser les 100 Tera octets pour les plus grosses bases. Et mme si lon ne conserve les donnes que sur une certaine priode (un an suffit gnralement), la quantit de donnes stocker et le niveau de dtail souhait ne feront que crotre. la capacit traiter des requtes de plus en plus complexes et de plus en plus nombreuses (la ranon du succs). lalimentation en continue des donnes (pour pouvoir analyser des donnes les plus fraches possible). Le paralllisme inconditionnel suppose un systme massivement parallle mais aussi des caractristiques logicielles spcifiques de la base de donnes.

On met galement en place des fonctionnalits dites ETLT (Extract Transform Load Transform) pour valoriser les donnes dj intgres. Que veulent dire ces termes de BI, de Systmes Dcisionnels, de WRS, de DW et de DM ? BI Business Intelligence Systmes Dcisionnels WRS Web Report Studio DW Data Warehouse DM DataMart

Le dcisionnel au service de la performance financire Au cur de la stratgie de lentreprise, lingnierie dcisionnelle a pour objectif de faciliter la gestion stratgique et tactique de lentreprise, la fois de faon globale et locale ; ce que nous regroupons sous le terme de performance management. La gestion de la performance se situe au niveau des couches suprieures de la Business Intelligence base sur la technologie Datawarehouse. Cette Business Intelligence inclut la prvision, la simulation ainsi que la supervision au niveau le plus lev de lorganisation. Aujourdhui, lingnierie dcisionnelle se dclique sous plusieurs forme de nomenclature : Corporate Performance Management (CPM), Business Performance Management (BPM), Enterprise Performance Management (EPM) sont en effet trois appellations dsignant une mme proccupation, celle daider les dcideurs mieux piloter leurs entreprises.

Le portail des systmes ETL

Extract-Transform-Load est connu sous le terme ETL (ou parfois : datapumping). Il s'agit d'une technologie informatique intergicielle permettant d'effectuer des synchronisations massives d'information d'une banque de donnes vers une autre. Selon le contexte, on traduira par alimentation , extraction , transformation , constitution ou conversion , souvent combins. Elle est base sur des connecteurs servant exporter ou importer les donnes dans les applications (Ex : connecteur Oracle ou SAP...), des transformateurs qui manipulent les donnes (agrgations, filtres, conversions...), et des mises en correspondance (mappages). Le but est l'intgration de l'entreprise par ses donnes. A l'origine, les solutions d'ETL sont apparues pour le chargement rgulier de donnes agrges dans lesentrepts de donnes (ou datawarehouse), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilises dans le monde bancaire et financier, et en dveloppement dans l'industrie. Actuellement il existe trois catgories doutils ETL :

Engine-based : les transformations sont excutes sur un serveur ETL, disposant en gnral dun rfrentiel. Ce genre de doutil dispose dun moteur de transformation ;

Database-embedded : les transformations sont intgres dans la BD ;

Code-generators : les transformations sont conues et un code est gnr. Ce code est dployabe indpendamment de la base de donnes. Ce portail sur est une excellente ressource pour les personnes qui cherchent une information spcialise pour dcider d'un choix technologique, ou tout simplement les personnes qui dsirent rester jour et au courant des derniers dveloppements de nature techniques dans le domaine. Nous y ajoutons du matriel au fur et mesure, vous tes donc convi nous rendre visite souvent pour y avoir accs.

La dfinition

Modlisation dimensionnelle

La modlisation multidimensionnelle t introduite par Ralph Kimball. Elle consiste en deux nouveaux concepts tels que les faits et les dimensions. Chaque modle multidimensionnel est compos dune table contenant une cl, la table des faits qui permettent de mesurer lactivit et dun ensemble de tables dimensionnelles qui contiennent les informations contextuelles faisant varier les mesures de lactivit en question. Chaque table de faits possde une cl qui la relie avec la cl primaire de chaque table de dimension. Selon l'architecture de Ralph Kimball (Back Room et Front Room), les structures de donnes dimensionnelles sont la destination ultime des processus ETL et ces tables se positionnent la frontire entre le Back Room et le Front Room. En gnral les tables dimensionnelles sont l'tape finale de stockage physique de donnes avant leur transfert vers l'environnement des utilisateurs finaux. Le modle dimensionnel est la structure de donnes la plus utilise et la plus approprie aux requtes et analyses des utilisateurs d'entrepts de donnes. Elles sont simples crer, stables et intuitivement comprhensibles par les utilisateurs finaux. Le modle dimensionnel est la fondation mme pour la construction des cubes OLAP. iL consiste en une grande table de faits ( fact table) et un cercle dautres tables quicontiennent les lments descriptifs du fait, appeles dimensions . Quand illustr, le modle ressemble une toile, cest dailleurs lorigine du terme En toile .

Les

Pour bien russir le modle dimensionnel il est ncessaire de raliser les quatre tapes suivantes : i. Choisir le Processus Modliser

quatre

tapes

de

la

Modlisation

Dimensionnelle:

Il s'agit de choisir le processus d'affaire tudier. Un processus une sries d'activits qui transforment des intrants en extrants en y ajoutant de la valeur et ce en faisant appel diffrentes ressources humaines, matrielles et financires. Le choix du processus est en gnral effectu par les utilisateurs finaux ( Un logigramme ou cartographie devrait exister pour documenter le processus d'affaire en question). D'ailleurs c'est ce stade que l'on essaye de traduire les objectifs des scorecards en KPI dans le cas des DSS d'indicateurs de gestion... ii. Dfinir la granularit du processus

Il s'agit de rpondre la question : Que reprsente un enregistrement de la table de fait ? La granularit dfinit le niveau de dtail contenu dans la table de fait. Voici quelques exemples : o Une ligne de commande par produit, par client et par jour.

o Une transaction bancaire par client par type de retrait et par mois. Il s'agit de l'tape la plus critique lors de la cration du modle.
iii. Choisir les Dimensions

Dans cette tape on doit choisir les diffrentes dimensions qui reprsentent le contexte dans lequel le fait a eu lieu. iv. Identifier les Faits

Pour identifier les faits, il faut rpondre la question : Qu'est ce qu'on mesure ?

Types de modle dimensionnel:


Il existe trois types de base de modle dimensionnel (cliquez sur le lien pour plus de dtail) Schma en toile (Star schema) Schma en flocons de neige (Snowflake schema) Schma en constellation de faits ( Multi-star schema) La figure suivante prsente les diffrents types de modle dimensionnel.

La dfinition

Star Schema ou Schma en toile

Portail

Accueil

La modlisation dimensionnelle structure les donnes d'une faon trs diffrente de la structure en 3FN ( 3ime forme normale) frquemment utilise par les modlisateurs des systmes OLTP. La modlisation dimensionnelle produit ce qu'on appelle le modle dimensionnel ou communment le schma en toile. C'est la structure de donnes la plus utilise et la plus approprie aux requtes et analyses des utilisateurs d'entrepts de donnes. Elle est simples crer, stable et intuitivement comprhensible par les utilisateurs finaux. Le modle dimensionnel est la fondation mme de la construction des cubes OLAP. Il consiste en une grande table de faits ( fact table) et un cercle dautres tables qui contient les lments descriptifs du fait, appeles dimensions . Quand illustr, le modle ressemble une toile, cest dailleurs lorigine du terme En toile . La figure suivante illustre le schma en toile (star schema)

Modlis

Star Sc

Snowfla

Dimens

Dimens

Types d

Dimens

Fait - D

Types d

Cycle d

Articles Retour

figure 1 : schma en toile La premire composante: la table de Faits


Table qui contient les donnes observables (les faits) que l'on possde sur un sujet et que l'on veut tudier, selon divers axes d'analyse (les dimensions). les faits , dans un entrept de donnes, sont normalement numriques, puisque d'ordre quantitatif. Il peut s'agir du montant en argent des ventes, du nombre d'units vendues d'<un produit, etc. Pour plus de dtail sur les tables de faits veuillez suivre le lien suivant : Dfinition de table de faits

La deuxime composante : la table de Dimension


Table qui contient les axes d'analyse (les dimensions) selon lesquels on veut tudier des donnes observables (les faits) qui, soumises une analyse multidimensionnelle, donnent aux utilisateurs des renseignements ncessaires la prise de dcision. On appelle dimension un axe d'analyse. Il peut s'agir des clients ou des produits d'une entreprise, d'une priode de temps comme un exercice financier, des activits menes au sein d'une socit, etc. Pour plus de dtail sur les dimensions veuillez suivre le lien suivant : Dfinition de dimension

La dfinition
Une dimension est une table qui contient les axes d'analyse (les dimensions) selon lesquels on veut tudier des donnes observables (les faits) qui, soumises une analyse multidimensionnelle, donnent aux utilisateurs des renseignements ncessaires la prise de dcision. On appelle donc dimension un axe d'analyse. Il peut s'agir des clients ou des produits d'une entreprise, d'une priode de temps comme un exercice financier, des activits menes au sein d'une socit, etc

Structure de base dune dimension


Une dimension devrait avoir la structure suivante :

figure 1 : Structure de base d'une table de dimension Caractristiques d'une dimension


Une table de dimension contient le dtail sur les faits; Une table de dimension contient les informations descriptives des valeurs numriques de la table de faits; Vu que les donnes dans la table de dimensions sont normalises, elle contient un plus grand nombre de colonnes; Une table de dimension contient en gnral beaucoup moins denregistrement quune table de faits; Les attributs dune table de dimension sont souvent utiliss comme Lignes et Colonne dans un rapport ou rsultat de requte. Par exemple, les attributs textuels dun rapport proviennent souvent dune dimension comme dans la figure suivante :

figure 1 : Exemple d'utilisation des dimensions et faits

La Business Intelligence, dfinition

a Business intelligence, dnomme aussi par simplification "Informatique Dcisionnelle",

est vraisemblablement l'unique solution pour pour btir une entreprise pro-active au sens propre du terme. La Business Intelligence dsigne en effet un ensemble d'outils technologiques, mthodiquement assembls, et dploys en parfaite cohrence avec la stratgie d'entreprise pralablement labore. La Business Intelligence n'a d'autre finalit que de dlivrer les informations pertinentes chaque manager afin qu'ils puissent prendre le plus efficacement possible les meilleures dcisions selon son contexte d'action, ses prrogatives et ses objectifs tactiques et stratgiques.

La Business Intelligence en 5 temps et 78 fiches pratiques


Conduire un projet de Business Intelligence, c'est adopter une nouvelle logique de l'informatisation de l'entreprise axe sur l'anticipation des besoins et des attentes des utilisateurs. Piloter.org
Temps 1. Le systme dcisionnel de l'entreprise

La Business Intelligence n'a d'autre finalit que d'assister le processus d'aide la dcision de l'entreprise. L'architecture dcisionnelle mise en place a ainsi pour mission de rendre accessible, de mettre en forme et de prsenter les informations cls afin de faciliter la prise de dcision. Voyons ci-aprs l'architecture d'un systme dcisionnel : Collecter, Stocker, Exploiter... Comment s'imbriquent les diffrents outils de la Business Intelligence, logiciels, progiciels et autres composants technologiques (Data warehouse, Data mart, Reporting, tableau de bord, Data mining, portails informationnels et autres outils. Quelques prcisions complmentaires en 3 fiches pour bien mettre en vidence l'importance de conduire de concert le projet Business Intelligence et la stratgie d'entreprise.

Temps 2. Perspectives de la BI
Pour bien comprendre un concept aussi complexe que l'aide la dcision et bien en saisir les conditions de mise en oeuvre optimale, il est recommand de se livrer un petit exercice d'anticipation propos des orientations pratiques de la BI. o Voyons ds prsent les perspectives de la Business Intelligence de la BI 1.0, la BI actuelle au futur de la BI, la BI de demain telle que l'on peut l'imaginer aujourd'hui. o Intressons-nous maintenant au concept de Business Intelligence 2.0, qualificatif un peu "mode" pour dsigner la BI de nouvelle gnration, dans la dynamique du Web 2.0 afin de rpondre aux attentes des dcideurs. Quelques complments propos de la mise en pratique sur le terrain : la Business Intelligence 2.0 en pratique ou comment intgrer les outils du Web 2.0 et de la gestion de la connaissance au coeur du systme dcisionnel. o Un point prcis sur la Business Intelligence temps rel, un concept encore mal dfini, qui mrite d'tre clairer en se basant non pas su les offres des constructeurs mais bien sur les attentes des utilisateurs. o Et pour terminer ce chapitre, un point sur la Business Intelligence Mobile, l'heure du dploiement des Blackberry, Apple iPad, iPhone et autres tablettes et smartphones.

Temps 3. La gestion des donnes


Pour esprer prendre de bonnes dcisions, il est indispensable de disposer des donnes ncessaires, utilisables et de qualit. Une vidence dans le propos, mais bien dlicate concrtiser. La gestion qualit des donnes est la cl de vote du projet d'informatique dcisionnelle. La gestion de la qualit des donnes est troitement lie l'opration de collecte et de mise en forme des donnes avec l'utilisation desoutils d'ETL Extract Transform Load. L'volution de la quantit des donnes traiter suit une courbe quasi exponentielle. Il semble indispensable de mettre en place une gouvernance des donnes, une responsabilit transversale en charge de la gestion dans la dure des donnes de l'entreprise. Le MDM Master Data Management, ou gestion des donnes de rfrence, joue un rle de rfrentiel essentiel au coeur du projet Business Intelligence. Leprojet MDM est un projet part entire. Et comme pour tout projet correctement conduit, on mesurera le ROI du projet Master Data Management. Le Data Warehouse, tout comme constitu le coeur de toute la rflexion du projet BI. le Data Mart, ont longtemps

Le projet data warehouse est assez spcifique. Les questions de l'architecture Data Warehouse et de la modlisation des donnes seront troitement lies une tude srieuse des usages prsents et futurs. Dans tous les cas il faudra valuer le ROI du projet Data Warehouse, une question essentielle mais pas des plus simples traiter.

Le concept de "Big Data", le stockage et les traitements massivement distribus bousculent dj les lignes. Pour mieux comprendre, attardez-vous sur le concept de Map Reduce de Google Corp, ainsi que sur Hadoop et Hadoop et les calculs massifs sans oublier les bases No SQL.

Temps 4. Les outils de la Business Intelligence


Pour exploiter les grandes masses de donnes mises disposition, il est indispensable de disposer d'outils d'analyse de la BI adapts. seules. L'usage des statistiques ne sont pas suffisantes elles

Le Data mining est d'un usage plus dlicat, mais nettement mieux adapt l'exploitation des grandes quantits de donnes. aux arbres de dcision, et au text mining. On s'intressera aussi de prs aux analyses prdictives,

Le tableau de bord est l'instrument cl de l'assistance la prise de dcision. Cette formulation est d'autant plus avre dans un contexte complexe et en environnement incertain.

Le tableau de bord, instrument d'aide la dcision est au coeur mme du systme d'information dcisionnel. La russite de sa conception conditionne la viabilit du projet.

Les outils de reporting et autres requteurs ad hoc ont longtemps t les outils phares de la BI pour le plus grand bonheur des intgrateurs. Voir aussi la dclinaison : reporting financier.

En complment, les hyper cubes de type OLAP sont toujours d'actualit et bien utiles pour les analyses multidimensionnelles, condition de bien en saisir les principes d'utilisation et de constitution. Les 2 principes sont troitement lis. L'offre commerciale est suffisamment vaste pour drouler un processus de choix en tenant compte des orientations stratgiques, des attentes des utilisateurs et des contraintes propres aux systmes d'information d'entreprise.

Comparez les principales solutions proposes par les diteurs d'outils dcisionnels et aussi les principales solutions BI Open Source. Ces rnires mritent en effet d'tre retenues dans la short-list. Depuis dj quelques temps, ces produits nt dsormais suffisamment professionnels pour tre concurrentiels de l'offre des diteurs plus ditionnels, et ce pour de multiples types d'utilisation. A voir au cas par cas.

mps 5. Les ressources de la Business Intelligence

elques ressources complmentaires pour achever ce dossier de fond.

Ce dossier de 78 fiches peut tre comme une auto formation la Business Intelligence, dans le cadre d'une sensibilisation aux pts et la technologie pour manager dcideur. Le programme de ce cours en auto formation est nible sur le Perfologue : Cours Business Intelligence

Quelques rflexions et mmandations, toujours d'actualit, pourconduire le projet dcisionnel. Ce texte fut crit en rponse au lat :"Pour dcider, il faut un maximum d'informations" qui sert encore, de rgles de conduite pour mbreux projets BI malgr les checs rpts. sur le blog pro Le

Lire aussi ogue, le dossier : Les 5 points d'inflexion du projet Business Intelligence

Ainsi que Les 10 principales causes

c du projet Business Intelligence

ues rfrences bibliographiques pour pousser plus avant ses investigations. Le web c'est bien, c'est ue pour collecter "rapidement" une information ponctuelle, mais il ne remplacera jamais un ouvrage nd. Les livres de la Business

e n de livres de rfrence du projet BI Les livres du Data Mining

n de livres de rfrence du projet Data Mining Les sites web de la Business

e n de sites de rfrence du projet BI Le projet Open Source

iciels de la Business intelligence en Open Source, le projet