Vous êtes sur la page 1sur 3

Quest-ce que linformatique dcisionnelle ?

Rfrence site developpez.com

Introduction
Conscients que lune des plus grandes richesses dune entreprise est son
information, mais noys sous de nombreuses donnes, parses, dstructures et
htrognes, les dirigeants sont faces une problmatique de taille : comment
analyser ces informations, dans des temps raisonnables ? Celles-ci concernent-
elles toutes les mmes priodes ? Ces dcideurs ont besoin quon leur expose les
faits importants, bases de leurs dcisions.
Cest ce quoi linformatique dcisionnelle (aussi nomme DSS pour Decision
Support System ou encore BI pour Business Intelligence) est destine. Elle prend
une place en constante croissance dans les systmes dinformation (SI) depuis
son apparition, dans les annes 90.
Elle permet une slection des informations oprationnelles pertinentes pour
lentreprise. Celles-ci sont ensuite normalises pour alimenter un entrept de
donnes. De ce concept est ne la notion de modlisation dimensionnelle. Cette
dernire est fondamentale pour rpondre aux exigences de rapidit et de facilit
danalyse. Elle permet, en outre, de rendre les donnes dun entrept
cohrentes, lisibles, intelligibles et faciles daccs.
Linformatique dcisionnelle doit produire des indicateurs et des rapports
lattention des analystes. Elle doit galement proposer des outils de navigation,
dinterrogation et de visualisation de lentrept.

1. Le modle multidimensionnel
Le modle multidimensionnel est la combinaison de tables de dimensions et
de faits. Le fait est le sujet de lanalyse. Il est form de mesures, gnralement
numriques, renseignes de manire continue. Ces mesures permettent de
rsumer un grand nombre denregistrements des donnes sources en quelques-
uns. Le fait est analys selon des perspectives, nommes dimensions. Chacune
contient une structure hirarchique ; la dimension temps , par exemple,
pourrait tre divise en annes, trimestres, mois, semaines, jours

2. Architecture dun systme dcisionnel

a. Sources de donnes
Afin dalimenter les entrepts, les informations doivent tre identifies et
extraites de leurs emplacements originels. Il sagit majoritairement de donnes
internes lentreprise, mais diffuss, car stockes dans les bases de donnes de
production des diffrents services (legacy systems). Ce peut tre aussi des
sources externes, rcupres via des services distants, desweb services, par
exemple. Ce sont des donnes complexes : plusieurs technologies (types de
fichiers, encodages, liens daccs aux systmes de gestion de bases de
donnes SGBD), environnements (systmes dexploitation, matriels) et
principes de scurit pour les atteindre (mcanismes rseaux, authentifications)
entrent en jeu pour les acqurir.

b. Outils dextraction, transformation et chargement


Plus connus sous le terme anglo-saxon Extract Transform Load (ETL), ces outils
sont fondamentaux pour la construction des entrepts de donnes. Ils extraient
les donnes des systmes htrognes sources, les normalisent et les rendent
cohrentes entre elles, pour quelles puissent tre utilises ensemble. Les
donnes sont fournies dans un format permettant leur stockage immdiat dans
les entrepts, et ultrieurement exploitables, sans recalcules par les dcideurs et
les analystes.
En accord avec le rsultat obtenir, et une fois les donnes importantes
localises dans les systmes sources, loutil doit les extraire, selon une frquence
dtermine (planification).
Elles sont alors stockes temporairement (staging). Cette tape et le type de
fichier choisi pour ce stockage (fichiers plats, XML, tables relationnelles, etc.)
sont dcisifs car ils permettent de filtrer et fdrer les donnes afin de les rendre
homognes :
- Le filtrage sert identifier les donnes aberrantes ou problmatiques,
notamment les donnes manquantes ;
- Le dboulonnage est ncessaire lorsque plusieurs sources de donnes
partagent des donnes communes ;
- Le formatage est crucial, notamment dans le cas de donnes codifies (par
exemple, des abrviations difficilement convertibles), ou de dates qui doivent
tre dcomposes en un ensemble de champs (anne, mois, jour, heure, minute,
etc.), contenant chacun une information pertinente ;
- La dmoralisation est invitable si la source est une base de donnes
relationnelle, qui utilise gnralement la troisime forme normale (3FN),
interdisant toute redondance. noter que le formatage et la dnormalisation
peuvent tre contradictoires car dans le cas de fichiers sources dont les
informations sont dj dmoralises, il est alors prfrable de les normaliser
nouveau ;
- La synchronisation garantit la cohrence des agrgats de lentrept ;
- Lagrgation est une collection doprations possibles effectuer sur les
donnes. Les plus courantes sont la somme, la moyenne, le comptage, la somme
cumule, le minimum, le maximum. Ces oprations sont considrer compte
tenu du niveau de granularit de lentrept.
Ces tches conditionnent la qualit des donnes du systme dcisionnel. ce
titre, cette tape apparat comme la plus importante et la plus complexe
effectuer lors de limplantation dun entrept de donnes .
c. Entrept de donnes
Lentrept de donnes est une base de donnes architecture pour des
requtes et des analyses, plutt que pour le traitement transactionnel des
donnes , et les rsultats de ces requtes doivent tre obtenus rapidement.
Lentrept est organis sur le modle multidimensionnel voqu prcdemment.
Il y a nanmoins deux types de stockage :
- Lentrept (data warehouse), qui concentre toutes les donnes ;
- Le march de donnes (data mart) se focalise sur une partie du mtier comme
les relations clients, par exemple.
Yvan Bdard a prcis que lentrept [...] est prvu pour lentreprise dans son
ensemble alors le march de donnes est sectoriel (il peut tre un sous-
ensemble exact ou modifi de lentrept de donnes) .

d. Outils de visualisation
Les outils de restitution sont la partie visible offerte aux utilisateurs. Par leur
biais, les analystes sont mme de manipuler les donnes contenues dans les
entrepts et les marchs de donnes. Les intrts de ces outils sont ldition de
rapports et la facilit de manipulation.
En effet, la structure entire du systme dcisionnel est pense pour fournir les
rsultats aux requtes des utilisateurs, dans un temps acceptable (de lordre de
quelques secondes), et sans connaissance particulire dans le domaine de
linformatique.
Gnralement, les outils offrent des facilits de manipulation, comme le glisser-
dposer, permettant une prise en main rapide, intuitive et conviviale.