Vous êtes sur la page 1sur 13

Système d'Information Décisionnel et Datawarehouse

Système d'Information Décisionnel et Datawarehouse

Introduction

Avec l'apparition et le développement de phénomènes économiques comme la


mondialisation les entreprises évoluent dans un environnement difficile à
appréhender. Il en résulte que la prise de décision stratégique ou politique est de
plus en plus complexe (augmentation du nombre de paramètres à prendre en
compte) et, en même temps, doit intervenir très rapidement pour ne pas laisser le
temps aux concurrents de prendre de l'avance.

Les nouvelles technologies de l'information permettent de concevoir des systèmes


d'information particulièrement performants et novateurs. Avec l'apparition des
entrepôts de données (datawarehouse) et des requêteurs tous les utilisateurs
peuvent désormais accéder à l'information stratégique. Ceci permet à l'entreprise
d'être plus réactive mais pose aussi sans cesse de nouveaux problèmes (problèmes
de confidentialité, de compétences pour l'analyse, etc.)

Comment, dans l'entreprise, s'organise la prise de décision ? Nous répondrons à


cette question en organisant notre réflexion en quatre temps. D'abord nous
commencerons par affiner et préciser la problématique en délimitant le champ de la
réflexion. Ensuite, nous examinerons les concepts du Datawarehouse et des
EIS/SIAD. Pour terminer nous illustrerons nos propos par l'exemple de logiciels
proposant des solutions plus ou moins complètes.

1 Problématique générale
-1-
Système d'Information Décisionnel et Datawarehouse

1.1 Le système d'information

Les entreprises sont désormais confrontées à des problèmes complexes comme la


mondialisation ou le passage à l'euro. Ainsi, il ne s'agit plus de découvrir et de se
lancer sur de nouveaux marchés. Encore faut-il bien connaître l'environnement dans
lequel l'entreprise va évoluer. Pour cela, il faut obtenir des informations de nature
technique, juridique, fiscale, politique ou commerciale. L'organisation doit alors être
capable d'exploiter efficacement de grandes quantités d'information.

Figure : La mondialisation des échanges

Le système d'information de l'entreprise utilise et produit des informations différentes


mais pourtant toujours liées entre elles. Par exemple, les contrôleurs de gestion
génèrent des informations à partir des données de vente et de production. Ils traitent
ensuite ces données pour aider au pilotage de l'entreprise.

-2-
Système d'Information Décisionnel et Datawarehouse

Figure : Les différentes données de l'entreprise

La qualité et l'exhaustivité des informations sont primordiales pour la direction


générale. En effet, à ce niveau, les décideurs sont confrontés à des réalités très
complexes ou de nombreux phénomènes se trouvent liés entre eux. Chaque couche
du système ci-dessus produit ses propres indicateurs et prend des décisions.
Cependant, plus on se trouve haut dans la pyramide plus les informations
extérieures à l'entreprise vont rentrer en compte et prendre de l'importance.

Figure : La prise de décision

-3-
Système d'Information Décisionnel et Datawarehouse
L'architecture fonctionnelle que nous venons de décrire doit être accompagnée par le
système d'information de l'entreprise. Il doit donc être fiable et adaptable, ce qui
évidemment est très difficile à obtenir.

1.2 Le décisionnel

Le système d'information décisionnel est un ensemble de données organisées de


façon spécifique, facilement accessible et appropriées à la prise de décision ou encore
une représentation intelligente de ces données au travers d'outils spécialisés. La
finalité d'un système décisionnel est le pilotage de l'entreprise.

Figure : Le décisionnel

Les systèmes décisionnels sont dédiés au management de l'entreprise pour l'aider au


pilotage de l'activité, et indirectement opérationnels car n'offrant que rarement le
moyen d'appliquer les décisions. Ils constituent une synthèse d'informations
opérationnelles, internes ou externes, choisies pour leur pertinence et leur
transversalité fonctionnelles, et sont basés sur des structures particulières de stockage
volumineux (datawarehouse, bases OLAP). Le principal intérêt d'un système
décisionnel est d'offrir au décideur une vision transversale de l'entreprise intégrant
toutes ses dimensions.

Source : La construction du datawarehouse, du datamart au dataweb; Jean-François


Goglin; Nouvelles Technologies Informatiques; Ed. HERMES.

1.3 Le décisionnel au sein du système d'information

-4-
Système d'Information Décisionnel et Datawarehouse
On peut parler de décisionnel lorsque les données de production sont valorisées en
informations. Cette valorisation est effective dès que l'on sort du monde de la
production.

2 Le Datawarehouse

Le Datawarehouse est dorénavant, non seulement une réalité au sein des grandes
entreprises, mais aussi un marché pour un nombre croissant d'acteurs : intégrateurs,
éditeurs de SGBD ou d'outils spécialisés. Disposer d'une offre dans le domaine
décisionnel devient une condition sine qua non pour les acteurs du monde
informatique, notamment avec la montée en puissance de l'informatique stratégique,
enjeu d'actualité. Car, les sociétés les mieux positionnées sur ce marché bénéficient
d'une image forte dans le domaine des applications critiques de l'entreprise. Au
couple infocentre-EIS des années 1980 succède une offre décisionnelle qui s'adapte
aux nouvelles règles du jeu de l'informatique d'entreprise, et qui en révèle les
profondes mutations : système départemental intégré dans l'architecture globale du
système d'information, outil d'interrogation aisément pris en main par les utilisateurs,
baisse des prix...

2.1 Présentation et objectif

Le datawarehouse est un entrepôt de données. Il s'agit d'un stockage intermédiaire


des données issues des applications de production, dans lesquelles les utilisateurs
finaux puisent avec des outils de restitution et d'analyse.

Voici une définition énoncée par Bill Inmon.

«Un datawarehouse est une collection de données thématiques, intégrées, non


volatiles et historisées pour la prise de décisions».

Orientées sujet

Le datawarehouse est organisé autour des sujets majeurs et des métiers de


l'entreprise. Les données sont organisées par thème. L'intérêt de cette organisation
-5-
Système d'Information Décisionnel et Datawarehouse
réside dans le fait qu'il devient possible de réaliser des analyses sur des sujets
transversaux aux structures fonctionnelles et organisationnelles de l'entreprise. Cette
orientation permet également de faire des analyses par itération, sujet après sujet.

L'intégration dans une structure unique est indispensable pour éviter aux données
concernées par plusieurs sujet d'être dupliqué. Cependant dans la pratique il existe
également des datamarts. Le datawarehouse est fragmenté en plusieurs bases qui
supportent l'orientation sujet.

Données intégrées

Un datawarehouse est un projet d'entreprise. Il concerne les différents services et


métiers de l'entreprise. Avant d'être intégrées dans le datawarehouse, les données
doivent êtres mises en forme et unifiées afin d'avoir un état cohérent. L'intégration
nécessite une forte normalisation, une bonne gestion des référentiels et de la
cohérence, une parfaite maîtrise de la sémantique et des règles de gestion
s'appliquant aux données manipulées. C'est ainsi que l'on pourra donner une bonne
vision de l'entreprise via l'utilisation d'indicateurs.

Données historisées

L'historisation est nécessaire pour suivre dans le temps l'évolution des différentes
valeurs des indicateurs à analyser. Ainsi, un référentiel temps doit être associé aux
données afin de permettre l'identification dans la durée de valeurs précises.

Données non volatiles

Afin de conserver la traçabilité des informations et des décisions prises, les


informations stockées au sein du datawarehouse ne peuvent pas être supprimées.
Une requête lancée à différentes dates sur les mêmes données doit toujours
retourner les mêmes résultats. Une donnée introduite dans le datawarehouse ne
pourra donc plus être supprimée ni même modifiée. Dans le cas présent les données
ne sont pas volatiles.

-6-
Système d'Information Décisionnel et Datawarehouse

Figure : Schéma de principe d'un datawarehouse (source Jean-François Goglin)

Le datawarehouse est donc une sorte de point focal stockant en un point unique
toute l'information utile provenant des systèmes de production et des sources
externes. Avant d'être intégré dans le datawarehouse l'information doit être extraite
des bases propriétaires et «nettoyée». Ensuite, elle doit être mise en forme de
manière à devenir compréhensible par l'utilisateur final.

2.2 La structure du datawarehouse

Figure : La structure du datawarehouse (source EDS-Prométhéus)

-7-
Système d'Information Décisionnel et Datawarehouse
Un datawarehouse peut se structurer en quatre classes de données, organisées
selon un axe historique et un axe de synthèse.

Les données détaillées

Elles reflètent les événements les plus récents. Les intégrations régulières des
données issues des systèmes de production vont habituellement être réalisées à ce
niveau.

Les données agrégées

Elles correspondent à des éléments d’analyse représentatifs des besoins utilisateurs.


Elles constituent déjà un résultat d’analyse et une synthèse de l’information contenue
dans le système décisionnel, et doivent être facilement accessibles et
compréhensibles.

Les métadonnées

Très souvent les données à fédérer dans le datawarehouse proviennent de sources


très hétérogènes. Cela rend indispensable la présence d'un dictionnaire unique qui
sait gérer l'ensemble des fonctions du datawarehouse. Cette cohérence du
dictionnaire est décrite au sein des métadonnées du dictionnaire du datawarehouse.

Les métadonnées constituent l'ensemble des données qui décrivent des règles ou
process attachés à d'autres données. Ces dernières constituent la finalité du
système d'information.

Les données historisés

Chaque nouvelle insertion de données provenant du système de production ne


détruit pas les anciennes valeurs, mais créée une nouvelle occurrence de la donnée.

3 Les éléments du système d'information décisionnel

-8-
Système d'Information Décisionnel et Datawarehouse
3.1 Système d'alimentation / ETL

3.2.1 Principes et objectifs

Le système d'alimentation à pour but de transformer les données primaires (par


exemple issues des systèmes de production) en informations stockées dans le
Datawarehouse. Pour cela il est nécessaire de réaliser les fonctions suivantes :

- Recherche et identification des données


- Contrôle de qualité (épuration et validation)
- Extraction
- Transport
- Chargement

Figure : Le système d'alimentation

La phase d'identification et d'épuration des données consiste à définir et identifier la


donnée la plus pertinente en fonction de sa source.

La phase de transformation regroupe les opérations de mise au format nécessaires


des données, de calcul des données secondaires et de fusion ou d'éclatement des
informations composites.

Enfin la phase de chargement à pour rôle de stocker les informations de manière


correcte dans les tables de faits du datawarehouse.

3.3 Système de diffusion et de présentation

-9-
Système d'Information Décisionnel et Datawarehouse
3.3.1 Principes et objectifs

C'est l'élément le plus important pour l'utilisateur car il correspond à la partie visible
du système. Quelles que soient les solutions retenues, elles doivent être simples à
utiliser et être compatibles avec les outils bureautiques existants. Désormais les
applications doivent être multimédias et communicantes. Il est relativement facile de
fournir des photographies ou des dessins techniques des produits de l'entreprise.

La restitution peut donc intervenir avec des modalités différentes. Avant d'examiner
les EIS / SIAD nous allons brièvement nous intéresser aux requêteurs.

3.3.2 Reqêteurs

Un requêteur permet à l'utilisateur final d'accéder aux données de l'entreprise de


manière autonome, dans un langage proche de celui de son métier. Ces outils
peuvent nécessiter la connaissance de la structure de la base que l'on interroge.

Différentes générations d'outils se sont succédées sur le marché. Si au départ ils


étaient de simples outils d'interrogation graphique, ils tendent désormais à s'orienter
vers les métiers des utilisateurs pour permettre une utilisation plus intuitive. Les
premières solutions nécessitaient la connaissance de la structure le la base de
données et même parfois du langage SQL. Aujourd'hui ces éléments sont de plus en
plus transparent pour l'utilisateur final. La facilité d'utilisation des outils s'est accrue
ainsi que leurs coûts de mise en place et de maintenance.

3.3.3 EIS (Executive Information System) et SIAD (Système Interactif d'Aide à la


Décision)

Un EIS (Executive Information System) est un outil de visualisation et de navigation


dans les données permettant de constituer des tableaux de bord. Il est constitué
d'outils qui permettent aux différents niveaux de management d'accéder aux
informations essentielles de leur organisation, de les analyser et de les présenter de
façon élaborée. Ces outils sont dotés d'une interface graphique très conviviale et très
esthétique.

L'utilisateur final ne peut visualiser que les informations initialement prévues par le
concepteur du tableau de bord. Il ne permet pas de poser une question qui n'a pas
été prévu dès le départ.

Un SIAD (Système Interactif d'Aide à la Décision) est un outil d'analyse et de


modélisation des données de l'entreprise qui permet de créer des représentations
- 10 -
Système d'Information Décisionnel et Datawarehouse
multidimensionnelles de l'information.

Source : La construction du datawarehouse, du datamart au dataweb; Jean-François


Goglin; Nouvelles Technologies Informatiques; Ed. HERMES.

Ces deux familles d'outils sont généralement orientées métiers et bénéficient de


fonctions de représentation avancées. Ils intègrent une couche spécifique qui permet
de masquer le modèle physique de construction de la base de données. Ceci permet
à l'utilisateur de retrouver des notions qu'il connaît et sait manipuler.

Figure : Représentation métier

4 Le marché du décisionnel

En 1997, les dépenses françaises dans le domaine de l'aide à la décision ont


augmenté de 41,2 %. Largement supérieure à celle de la dépense informatique,
cette progression illustre, selon le cabinet PAC, la maturité croissante des
- 11 -
Système d'Information Décisionnel et Datawarehouse
entreprises hexagonales dans ce secteur. Elle succède à leurs hésitations des
années quatre-vingt, alors qu'étaient disponibles des offres d'infocentres et d'EIS. La
vague devrait se poursuivre puisque Philippe Audrain, directeur des marchés
logiciels et services du cabinet, estime que «la dépense totale atteindra 7 milliards de
francs en 2001, contre 2,4 milliards en 1997».

Selon ce consultant, ce réveil a de multiples raisons : accroissement du volume


d'informations à traiter pour piloter les activités de l'entreprise, disponibilité de
technologies adaptées pour l'exploration (datamining), l'interrogation (requêteurs),
l'alimentation et l'extraction (middleware, etc.) et solutions puissantes pour le
stockage des données (moteurs OLAP, cubes). Sans oublier l'explosion du Web, qui
démocratise l'accès aux applications décisionnelles et rend possible la connexion
simultanée de milliers de postes clients légers. Selon PAC, 10 % des requêtes sur
les datawarehouses et autres datamarts s'effectueront en 2002 par Internet. Pour
l'heure, c'est aux infrastructures que vont les investissements des entreprises. Ces
dernières ont consacré plus de la moitié de leurs dépenses au service (1,4 milliards
de francs, + 40 % en 1997). Le reste est allé aux progiciels (625 millions de francs)
avec une concentration sur les outils (alimentation, extraction, moteurs) devant les
progiciels systèmes (250 millions environ) et les progiciels applicatifs (125 millions).
Ce dernier segment devrait connaître la progression la plus intéressante, avec une
croissance annuelle moyenne de 48 % selon PAC. De quoi remettre en cause le
classement des éditeurs, et les premières places de spécialistes comme
BusinessObjects ou Cognos

Conclusion

Le datawarehouse permet au décideur de travailler dans un environnement


informationnel, référencé, homogène et historisé. Cette technique l’affranchit des
problèmes liés à l’hétérogénéité des systèmes informatiques et à l’hétérogénéité des
différentes définitions de données issues de l’historique de l’organisation.
- 12 -
Système d'Information Décisionnel et Datawarehouse
Les applications décisionnelles permettent ensuite d’extraire du datawarehouse, une
connaissance partielle de l’activité de l'entreprise selon les axes qui préoccupent le
décideur à un instant donné.

Les années à venir vont très certainement apporter de nombreuses modifications à


ce schéma. Internet notamment vient changer la donne. Un concept va fusionner le
datawarehouse et le Web : il s'agit du dataweb.

Le dataweb contient l'idée d'un accès à une base de données universelle quelle que
soit la plate-forme d'hébergement, sa localisation ou le format de données. Il devient
aujourd'hui essentiel d'avoir accès aux données internes à l'entreprise, mais aussi
aux données externes provenant par exemple de l'Internet. Le dataweb sera
accessible à partir d'une application disponible sur toutes les machines, comme un
navigateur Internet. L'objectif est ici d'augmenter la qualité des décisions en
augmentant la qualité de l'information à la base.

De plus l'accès au dataweb sera possible à partir de n'importe où dans le monde. A


partir d'un ordinateur portable l'utilisateur pourra travailler comme il le fait dans son
bureau.

- 13 -