Vous êtes sur la page 1sur 9

Qu'est-ce que l'informatique dcisionnelle ?

- Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

Michael TRANCHANT
Informatique Dcisionnelle, Recherche en GoSpatial, Dveloppement, Gomatique Accueil Mentions Lgales Contact

Accueil > Godcisionnel, Informatique dcisionnelle, Systmes d'Information Gographique > Quest-ce que linformatique dcisionnelle ?

Quest-ce que linformatique dcisionnelle ?


03/11/2011
3 33

Pour commencer cette srie darticles, tous portant sur lutilisation du Spatial OLAP, de diffrentes faons, je vais vous faire un petit topo introductif sur ce quest plus prcisment, linformatique dcisionnelle. (Cet article est extrait du rapport TEST Capacits des outils SOLAP en termes de requtes spatiales, temporelles et spatio-temporelles que jai rdig en vue de lobtention de lunit ENG111 du CNAM, en Juin 2011) Vous pouvez aussi retrouver cet article sur le site developpez.com et dans le magazine dAvril-Mai 2012 du mme nom .

Introduction
Conscients que lune des plus grandes richesses dune entreprise est son information, mais noys sous de nombreuses donnes, parses, dstructures et htrognes, les dirigeants sont faces une problmatique de taille : comment analyser ces informations, dans des temps raisonnables ? Celles-ci concernent-elles toutes les mmes priodes ? Ces dcideurs ont besoin quon leur expose les faits importants, bases de leurs dcisions Cest ce quoi linformatique dcisionnelle (aussi nomme DSS pour Decision Support System ou encore BI pour Business Intelligence) est destine. Elle prend une place en constante croissance dans les systmes dinformation (SI) depuis son apparition, dans les annes 90. Elle permet une slection des informations oprationnelles pertinentes pour lentreprise. Celles-ci sont ensuite normalises pour alimenter un entrept de donnes. De ce concept est ne la notion de modlisation dimensionnelle. Cette dernire est fondamentale pour rpondre aux exigences de rapidit et de facilit danalyse. Elle permet, en outre, de rendre les donnes dun entrept cohrentes, lisibles, intelligibles et faciles daccs. Linformatique dcisionnelle doit produire des indicateurs et des rapports lattention des analystes. Elle doit galement proposer des outils de navigation, dinterrogation et de visualisation de lentrept.

1. Le modle multidimensionnel
Le modle multidimensionnel est la combinaison de tables de dimensions et de faits. Le fait est le sujet de lanalyse. Il est form de mesures, gnralement numriques, renseignes de manire continue. Ces

1 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

mesures permettent de rsumer un grand nombre denregistrements des donnes sources en quelques-uns. Le fait est analys selon des perspectives, nommes dimensions. Chacune contient une structure hirarchique ; la dimension temps , par exemple, pourrait tre divise en annes, trimestres, mois, semaines, jours

Cube multidimensionnel trois perspectives danalyse (inspir de "Introduction pratique aux bases de donnes relationnelles") De cette hirarchie dcoule le niveau de granularit de lentrept, et donc, les niveaux dagrgations. La figure ci-dessus montre le cube permettant lanalyse de l indicateur de vente selon trois dimensions : produit, temps (divis en trimestres), et rgion.

2. Architecture dun systme dcisionnel

Ensemble des composants intervenant dans un systme dcisionnel (Source: "Informatique Dcisionnelle" NFE115) Cette section propose de parcourir les diffrents lments ncessaires la mise en place dune solution daide la dcision, depuis lextraction des donnes jusqu leur restitution sous forme agrge, synthtise et normalise.

2 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

a. Sources de donnes
Afin dalimenter les entrepts, les informations doivent tre identifies et extraites de leurs emplacements originels. Il sagit majoritairement de donnes internes lentreprise, mais diffuses, car stockes dans les bases de donnes de production des diffrents services (legacy systems). Ce peut tre aussi des sources externes, rcupres via des services distants, des web services, par exemple. Ce sont des donnes complexes : plusieurs technologies (types de fichiers, encodages, liens daccs aux systmes de gestion de bases de donnes SGBD), environnements (systmes dexploitation, matriels) et principes de scurit pour les atteindre (mcanismes rseaux, authentifications) entrent en jeu pour les acqurir.

b. Outils dextraction, transformation et chargement


Plus connus sous le terme anglo-saxon Extract Transform Load (ETL), ces outils sont fondamentaux pour la construction des entrepts de donnes. Ils extraient les donnes des systmes htrognes sources, les normalisent et les rendent cohrentes entre elles, pour quelles puissent tre utilises ensemble. Les donnes sont fournies dans un format permettant leur stockage immdiat dans les entrepts, et ultrieurement exploitables, sans recalculs par les dcideurs et les analystes. En accord avec le rsultat obtenir, et une fois les donnes importantes localises dans les systmes sources, loutil doit les extraire, selon une frquence dtermine (planification). Elles sont alors stockes temporairement (staging). Cette tape et le type de fichier choisi pour ce stockage (fichiers plats, XML, tables relationnelles, etc.) sont dcisifs car ils permettent de filtrer et fdrer les donnes afin de les rendre homognes : - Le filtrage sert identifier les donnes aberrantes ou problmatiques, notamment les donnes manquantes ; - Le ddoublonnage est ncessaire lorsque plusieurs sources de donnes partagent des donnes communes ; - Le formatage est crucial, notamment dans le cas de donnes codifies (par exemple, des abrviations difficilement convertibles), ou de dates qui doivent tre dcomposes en un ensemble de champs (anne, mois, jour, heure, minute, etc.), contenant chacun une information pertinente ; - La dnormalisation est invitable si la source est une base de donnes relationnelle, qui utilise gnralement la troisime forme normale (3FN), interdisant toute redondance. noter que le formatage et la dnormalisation peuvent tre contradictoires car dans le cas de fichiers sources dont les informations sont dj dnormalises, il est alors prfrable de les normaliser nouveau ; - La synchronisation garantit la cohrence des agrgats de lentrept ; - Lagrgation est une collection doprations possibles effectuer sur les donnes. Les plus courantes sont la somme, la moyenne, le comptage, la somme cumule, le minimum, le maximum. Ces oprations sont considrer compte tenu du niveau de granularit de lentrept. Ces tches conditionnent la qualit des donnes du systme dcisionnel. ce titre, cette tape apparat comme la plus importante et la plus complexe effectuer lors de limplantation dun entrept de donnes .

c. Entrept de donnes
Lentrept de donnes est une base de donnes architecture pour des requtes et des analyses, plutt que pour le traitement transactionnel des donnes , et les rsultats de ces requtes doivent tre obtenus rapidement. Lentrept est organis sur le modle multidimensionnel voqu prcdemment. Il y a nanmoins deux types de stockage : - Lentrept (data warehouse), qui concentre toutes les donnes ; - Le march de donnes (data mart) focalise sur une partie du mtier comme les relations clients, par exemple. Yvan Bdard a prcis que lentrept [...] est prvu pour lentreprise dans son ensemble alors le march de donnes est sectoriel (il peut tre un sous-ensemble exact ou modifi de lentrept de donnes) .

3 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

d. Traitement analytique en ligne OLAP


En 1993, Edgar Frank Codd introduit le terme On-Line Analytical Processing (OLAP) qui dsigne une catgorie dapplications et de technologies permettant de collecter, stocker, traiter et restituer des donnes multidimensionnelles des fins danalyses . Il a aussi introduit 12 rgles de base permettant de qualifier lOLAP : 1. Transparence : lutilisateur doit pouvoir accder la base, sans se proccuper de lemplacement du serveur ; 2. Accessibilit : les donnes doivent toutes tre accessibles, sans ambigut ; 3. Manipulation des donnes : la navigation doit pouvoir seffectuer intuitivement via des interfaces ergonomiques ; 4. Souplesse daffichage et flexibilit : le serveur doit permettre souplesse pour ldition et rutilisation des rapports gnrs ; 5. Multidimensionnalit : il sagit de la nature mme dOLAP ; 6. Client-serveur : architecture du systme ; 7. Multi-utilisateur : laccs et les recherches simultans de la base doivent tre possibles ; 8. Stabilit : les performances sont indpendantes du nombre de dimensions, ce nombre et le niveau dagrgation doivent pouvoir tre modifis sans impact sur les temps de rponse ; 9. Gestion complte : le serveur supporte la reprsentation dinformations manquantes ; 10. Croisement des dimensions : le systme permet deffectuer des oprations entre et dans les dimensions ; 11. Dimensionnalit gnrique : toutes les dimensions dun hypercube doivent tre accessibles de manire gnrique, elles sont, de plus, indpendantes ; 12. Analyse sans limite : le nombre de dimensions et de niveaux dagrgation permet des analyses complexes. Entre entrept et OLAP, il ny a quun pas. En effet, lentrept est le lieu de stockage physique des donnes, tandis que lOLAP est loutil permettant leur analyse multidimensionnelle. Celle-ci est lobjet dune requte particulire, mise par lutilisateur, a contrario du forage (data mining) qui vise la recherche de corrlations entre les donnes dans lintgralit de lentrept. Afin de rendre lanalyse la moins contraignante et la plus souple possible, lOLAP propose des oprateurs. Il sagit de mcanismes servant naviguer dans les hirarchies et les dimensions. Les oprateurs permettent de : Tailler (slicing, scoping) : autorise lextraction dune tranche, dun bloc dinformations. Il sagit dune slection classique ;

Oprateurs Slicing & Scoping Pivoter (rotate ou swap) : permet dinterchanger deux dimensions ;

4 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

Oprateur Rotate Remonter (roll-up) : synthtise les informations en fonction dune dimension. Par exemple, sur la dimension gographique, il sagirait de passer du niveau dpartement au niveau rgion ; Forer (drill-down) : il sagit de linverse du (drill-up), on zoome sur une des dimensions (de la rgion au dpartement) ;

Oprateurs Roll-Up & Drill-Down Forer latralement (drill-accross) : en restant au mme niveau de dimension, permet de changer lune des valeurs. Par exemple, passer de lanne 1998 lanne 1999. Le forage latral sur une dimension spatiale peut paratre aussi simple, si lon considre que lon passe, par exemple, dun dpartement un autre. On peut sinterroger sur la pertinence de passer de lAin lAine. Ne serait-il pas plus pertinent de rester dans la rgion ? Ou de considrer des critres de voisinage ?

Oprateur Drill Across Percer (drill-through) : permet daccder au dtail des informations, lorsquon ne dispose que de donnes agrges (possible uniquement avec Hybrid OLAP). Larchitecture dun systme OLAP peut se dcliner sous plusieurs formes, selon la technologie utilise.

5 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

On peut rencontrer des approches sans serveur OLAP, il sagit alors de bases de donnes relationnelles, o rien nest nativement prvu pour linformatique dcisionnelle. Il faut alors que la requte, construite dans le langage SQL (Structured Query Language), fasse tat des agrgations. Ceci demande des comptences spcifiques, que tous les analystes nont pas forcment. Lapproche ROLAP (Relationnal OLAP) est aussi base sur une BDR, mais simulant une structure multidimensionnelle. Lapproche MOLAP (Multidimensional OLAP) est optimise, comme son nom lindique, pour lanalyse multidimensionnelle dont elle en gre la structure de manire physique. HOLAP (Hybrid OLAP) est un croisement des approches MOLAP et ROLAP. Les donnes dtailles sont stockes dans une BDR tandis que celles agrges le sont dans une BDM.

e. Outils de visualisation
Les outils de restitution sont la partie visible offerte aux utilisateurs. Par leur biais, les analystes sont mme de manipuler les donnes contenues dans les entrepts et les marchs de donnes. Les intrts de ces outils sont ldition de rapports et la facilit de manipulation. En effet, la structure entire du systme dcisionnel est pense pour fournir les rsultats aux requtes des utilisateurs, dans un temps acceptable (de lordre de quelques secondes), et sans connaissance particulire dans le domaine de linformatique. Gnralement, les outils offrent des facilits de manipulation, comme le glisser-dposer, permettant une prise en main rapide, intuitive et conviviale.

f. Mtadonnes
Les mtadonnes, prsentes tous les niveaux, permettent de connatre les donnes, quelles soient brutes ou transformes. Moriarty et Greenwood ont dclar, en 1997, que les mtadonnes sont aussi essentielles aux usagers que ne le sont les donnes elles-mmes . Elles dcrivent le schma de lentrept, ainsi que lensemble des rgles, des dfinitions, des transformations et des processus qui sont appliques chacune des donnes. Il y a deux types de mtadonnes : Structurelles : dcrivant la structure et le contenu de lentrept (aussi appeles mtaschma) ; Accessibilit : permettant le lien entre lentrept et les utilisateurs (description des donnes). Sources : Il se peut que certaines sources aient disparu depuis leur consultation. Jai sauvegard une copie de la plupart dentre elles, si besoin, je peux les produire, sous rserve de laccord de leurs propritaires respectifs. Gilles Lebrun, Christopher Charrier. 2008. Informatique Dcisionnelle. Cours DEST CNAM UE NFE115. Andreas Meier. 2006. Introduction pratique aux bases de donnes relationnelles. Seconde dition. (pages 197 203). Yvan Bdard, Franois Ltourneau, Bernard Moulin. 1998. Perspectives dutilisation du concept dentrept de donnes pour les gorpertoires sur Internet. Claire Noirault. Novembre 2006. Business Intelligence avec Oracle 10g: ETL, Data warehouse, Data mining, rapports Thrse Roug-Libourel. 2008. Entrepts de donnes spatiales OLAP et SOLAP. Bernard Lupin. Septembre 2007. Osez OLAP Les bases de donnes OLAP par lexemple. Benot Le Rubrus. Juin 2009. Capacit de rendu cartographique autour des technologies SOLAP. preuve TEST CNAM UE ENG111. Didier Donsez. Janvier 2006. Principes et architectures des entrepts de donnes.
6 sur 9 13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

Adrien Gabriel, Elias Ohayon. 2008. Les outils dcisionnels: description de loffre commerciale et Open Source. Yvan Bdard. OLAP et SOLAP : notions avances des bases de donnes SIG. Eric de Malleray. 24 Fvrier 2008. Meta donnes et analyses multidimensionnelles travers les hypercubes. Mmoire Ecole Nationale Suprieure des Mines de Nancy LORIA Frdrique Peguiron, Odile Thierry. 2005. A propos dun entrept de donnes universitaire : modlisation des acteurs et mta donnes. Remerciements : Un grand merci Kaly Parker, du forum Developpez.com pour ses commentaires. Categories: Godcisionnel, Informatique dcisionnelle, Systmes d'Information Gographique Tags: dartmart, data warehouse, dcisionnel, dimension, entrept, ETL, fait, godcisionnel, GIS, HOLAP, Hybrid OLAP, hypercube, informatique dcisionnelle, mtadonnes, MOLAP, Multidimensional OLAP, OLAP, Relational OLAP, ROLAP, SOLAP, Spatial OLAP Commentaires (2) 1. Sylvain 03/11/2011 16:27 | #1 Rpondre | Citer Sympa ce petit article de prsentation de la business intelligence Moi je serai trs intress de lire votre rapport Capacits des outils SOLAP en termes de requtes spatiales, temporelles et spatio-temporelles Il est dispo qq part ? 2. Michal Tranchant 03/11/2011 16:45 | #2 Rpondre | Citer Bonjour, Merci de lintrt port ce billet. Le rapport est disponible cette adresse : Capacits des outils SOLAP en termes de requtes spatiales, temporelles et spatio-temporelles . Certains extraits seront le sujets de billets ultrieurs sur ce blog, afin darriver ensuite sur des applications plus concrtes. Les commentaires sont ferms. Quest-ce que linformation gographique ? Rechercher avec Google SSL RSS

7 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

Catgories
Godcisionnel Informatique dcisionnelle MDX Mon humeur Plugin Systmes d'Information Gographique Ubuntu Web

Moi, travers le Web


Mon Code Issue Mon LinkedIn Mon PearlTree Mon Viadeo

Twitter Goodies
Michal Tranchant

mtranchant
mtranchant Problme la #BanqueDeFrance #Grenoble ?
32 days ago reply retweet favorite

SaikuAnalytics Happy to announce that the #pivot4j and #saiku team will be working together to bring existing jpivot features into saiku on #olap4j
42 days ago reply retweet favorite

osbi_fr Un job de dveloppeur au Qubec, dans une boite sympa spcialise dans le #GeoBI, a vous tente ? goo.gl/bHuaj @Spatialytics
95 days ago reply retweet favorite

mtranchant Le dernier single de @Muse, en ligne ? youtu.be/-VdNRipXkbw Join the conversation

Liens
Plane Finder Reprsentation cartographique en temps rel du dplacement des avions

Sites d'intrts
Blog de l'diteur Intelli3 Dcigo SIG et BI

8 sur 9

13/11/2012 11:49

Qu'est-ce que l'informatique dcisionnelle ? - Michal Tranchant

http://tranchant.name/2011/11/informatique-decisionnelle/

Sites Amis
Gwenalle Colin Infographiste

Nuage
ancien menu chrome CNAM entrept ETL fait firefox GIS

Configuration CrossJoin dartmart data warehouse dimension documents dcisionnel Ensimag google godcisionnel gographique Hierarchize HOLAP Hybrid OLAP hypercube
interface internet explorer libreoffice LIG

informatique dcisionnelle Mondrian SOLAP Spatial OLAP XMLA


ssl synchroniser

MDX

MOLAP

moteur de recherche Multidimensional OLAP mtadonnes office

OLAP plugin recherche Relational OLAP ROLAP

Copyright : Creative Commons


Sauf exception, auquel cas la licence sera prcise, ce site est mis disposition selon les termes de la Licence Creative Commons Paternit Partage lIdentique 3.0 non transpos.

Rfrents :
Mon site est list dans la catgorie Gomatique de l'annuaire Remonter ;) WordPress Copyright 2011-2012 Michael TRANCHANT Theme par NeoEase. Valide XHTML 1.1 et CSS 3. Nom *

E-Mail *

Message *

Page optimized by WP Minify WordPress Plugin

9 sur 9

13/11/2012 11:49