Vous êtes sur la page 1sur 7

Informatique décisionnelle

Sauter à la navigationSauter à la recherche

Certaines informations figurant dans cet article ou cette section devraient être mieux
reliées aux sources mentionnées dans les sections « Bibliographie », « Sources » ou
« Liens externes » (juin 2017).

Améliorez sa vérifiabilité en les associant par des références à l'aide d'appels de notes.

Pour les articles homonymes, voir BI et DSS.


L’informatique décisionnelle (en anglais business intelligence (BI)1 ou decision support
system (DSS)) est l'informatique à l'usage des décideurs et des dirigeants d'entreprises. Elle
désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser
et restituer les données, matérielles ou immatérielles, d'une entreprise en vue d'offrir une aide à
la décision et de permettre à un décideur d’avoir une vue d’ensemble de l’activité traitée.
Ce type d’application repose sur une architecture commune dont les bases théoriques viennent
principalement de R. Kimball, B. Inmon et D. Linstedt.

1. Les données opérationnelles sont extraites périodiquement de sources


hétérogènes : fichiers plats, fichiers Excel, base de données (DB2, Oracle, SQL Server,
etc.), service web, données massives et stockées dans un entrepôt de données.
2. Les données sont restructurées, enrichies, agrégées, reformatées, nomenclaturées pour
être présentées à l'utilisateur sous une forme sémantique (vues métiers ayant du sens)
qui permet aux décideurs d'interagir avec les données sans avoir à connaître leur
structure de stockage physique, de schémas en étoile qui permettent de répartir les faits
et mesures selon des dimensions hiérarchisées, de rapports pré-préparés
paramétrables, de tableaux de bords plus synthétiques et interactifs.
3. Ces données sont livrées aux divers domaines fonctionnels (direction stratégique,
finance, production, comptabilité, ressources humaines, etc.) à travers un système de
sécurité ou de datamart spécialisés à des fins de consultations, d'analyse, d'alertes
prédéfinies, d'exploration de données, etc.
L’informatique décisionnelle s’insère dans l’architecture plus large d’un système
d'information mais n'est pas un concept concurrent du management du système d'information. Au
même titre que le management relève de la sociologie et de l'économie, la gestion par
l'informatique est constitutive de deux domaines radicalement différents que sont
le management et l'informatique. Afin d'enrichir le concept avec ces deux modes de pensées, il
est possible d'envisager un versant orienté ingénierie de l'informatique portant le nom
d'informatique décisionnelle, et un autre versant servant plus particulièrement les approches de
gestion appelé management du système d'information.
Le terme anglais de business intelligence (BI) peut porter confusion avec l'intelligence
économique (IE). La BI diffère de l'IE sur trois points :

 la BI travaille sur des informations internes à l'entreprise, alors que l'IE exploite des
informations externes à l'entreprise ;
 la BI exploite des informations structurées, gérées dans des entrepôts de données, alors que
l'IE se fonde sur des informations non structurées ;
 la BI fournit surtout une vision du passé alors que l'IE est tournée vers l'avenir.
Sommaire

 1Enjeux de l'informatique décisionnelle


 2Du tableau à l'hypercube
o 2.1Tableau
o 2.2Cube
o 2.3Hypercube
o 2.4Navigation dans un hypercube
o 2.5Précautions à prendre
 3Fonctions essentielles de l'informatique décisionnelle
o 3.1Fonction de collecte
o 3.2Fonction d'intégration
o 3.3Fonction de diffusion (ou distribution)
o 3.4Fonction présentation
o 3.5Fonction administration
 4Projet décisionnel
o 4.1Rappel de la chaîne de la valeur décisionnelle
 4.1.1Phase de recueil des exigences
 4.1.2Phase de conception et de choix technique
 5Acteurs open source
 6Acteurs propriétaires
 7Notes et références
 8Voir aussi
o 8.1Articles connexes
o 8.2Bibliographie

Enjeux de l'informatique décisionnelle[modifier | modifier le code]


Actuellement, les données applicatives métier sont stockées dans une (ou plusieurs) base(s) de
données relationnelle(s) ou non relationnelles.
Ces données sont extraites, transformées et chargées dans un entrepôt de
données généralement par un outil de type ETL (Extract-Transform-Load) .
Un entrepôt de données peut prendre la forme d’un data warehouse ou d’un datamart. En règle
générale, le data warehouse globalise toutes les données applicatives de l’entreprise, tandis que
les datamarts (généralement alimentés depuis les données du data warehouse) sont des sous-
ensembles d’informations concernant un métier particulier de l’entreprise (marketing, risque,
contrôle de gestion…), des usages spécifiques (analyse, reporting...), ou encore répondent à des
exigences ou contraintes particulières (cloisonnement des données, volumétrie...). Le
terme comptoir de données ou magasin de données est aussi utilisé pour désigner un
datamart.
Les entrepôts de données permettent de produire des rapports qui répondent à la question « Que
s’est-il passé ? », mais ils peuvent être également conçus pour répondre à la question analytique
« Pourquoi est-ce que cela s’est passé ? » et à la question pronostique « Que va-t-il se
passer ? ». Dans un contexte opérationnel, ils répondent également à la question « Que se
passe-t-il en ce moment ? », voire dans le cas d’une solution d’entrepôt de données actif « Que
devrait-il se passer ? ».
Le reporting est probablement l'application la plus utilisée encore aujourd'hui de l’informatique
décisionnelle, il permet aux gestionnaires :

 de sélectionner des données relatives à telle période, telle production, tel secteur de
clientèle, etc.
 de trier, regrouper ou répartir ces données selon les critères de leur choix
 de réaliser divers calculs (totaux, moyennes, écarts, comparatif d'une période à l'autre…)
 de présenter les résultats d’une manière synthétique ou détaillée, le plus souvent graphique
selon leurs besoins ou les attentes des dirigeants de l’entreprise
Les programmes utilisés pour le reporting permettent bien sûr de reproduire de période en
période les mêmes sélections et les mêmes traitements et de faire varier certains critères pour
affiner l’analyse. Mais le reporting n'est pas à proprement parler une application d'aide à la
décision. L'avenir appartient plutôt aux instruments de type tableau de bord équipés de fonctions
d'analyses multidimensionnelles de type Olap. Fonction OLAP qui peut être obtenue de
différentes façons par exemple via une base de données relationnelle R-OLAP, ou
multidimensionnelle M-OLAP, voire aussi en H-OLAP.
Les datamart et/ou les datawarehouses peuvent ainsi permettre via l'OLAP l’analyse très
approfondie de l’activité de l’entreprise, grâce à des statistiques recoupant des informations
relatives à des activités apparemment très différentes ou très éloignées les unes des autres, mais
dont l’étude fait souvent apparaître des dysfonctionnements, des corrélations ou des possibilités
d’améliorations très sensibles.
L'interopérabilité entre les systèmes d'entrepôt de données, les applications informatiques ou
de gestion de contenu, et les systèmes de reporting est réalisée grâce à une gestion
des métadonnées.

Du tableau à l'hypercube[modifier | modifier le code]


L'informatique décisionnelle s'attache à mesurer :

 un certain nombre d'indicateurs ou de mesures (que l'on appelle aussi les faits ou
les métriques)
 restitués selon les axes d'analyse (que l'on appelle aussi les dimensions)
Tableau[modifier | modifier le code]
Par exemple, on peut vouloir mesurer :

 Trois indicateurs : le chiffre d'affaires, le nombre de ventes, le montant de taxes pour les
ventes de produits
 selon un premier axe, l'axe temps : par année, par trimestre, par mois
 et selon un second axe, l'axe produits : famille de produits, gamme de produits, référence
produit
On obtient ainsi un tableau à deux entrées :

 par exemple en lignes : la nomenclature produits à 3 niveaux (famille, gamme, référence)


 et en colonnes : les années, décomposées en trimestres, décomposés en mois
 avec au croisement des lignes et colonnes, pour chaque cellule : le chiffre d'affaires, le
montant de taxes et le nombre de ventes
À titre d'illustration, les tableaux croisés des principaux tableurs permettent de construire ce type
de tableau de bord depuis une base de données.
Cube[modifier | modifier le code]
Si l'on s'intéresse à un troisième axe d'analyse :

 par exemple, la répartition géographique : par pays, par régions, par magasins
On obtient une dimension de plus et on passe ainsi au cube.
Les tableaux croisés dynamiques d'Excel permettent de représenter ce type de cube avec le
champ "page". Il représente les données agrégées pour chaque niveau hiérarchique et pour
chaque dimension.
Hypercube[modifier | modifier le code]
Si l'on s'intéresse à un axe d'analyse supplémentaire :

 par exemple, la segmentation des clients : par catégorie, par profession


On obtient alors un cube à plus de 3 dimensions, appelé hypercube.
Le terme cube est souvent utilisé en lieu et place d' hypercube.
Navigation dans un hypercube[modifier | modifier le code]
Les outils du monde décisionnel offrent des possibilités de « navigation » dans les différentes
dimensions du cube ou de l'hypercube :

 le drill down ou le forage avant : c'est la possibilité de « zoomer » sur une dimension (par
exemple d'éclater les années en 4 trimestres pour avoir une vision plus fine, ou de passer du
pays aux différentes régions)
 le drill up ou le forage arrière (aussi appelé "roll-up") : c'est l'opération inverse qui permet
d'« agréger » les composantes de l'un des axes (par exemple de regrouper les mois en
trimestre, ou de totaliser les différentes régions pour avoir le total par pays)
 le slice and dice, aussi appelé "dice down" (que l'on peut traduire par « hacher menu », c'est-
à-dire couper en lamelles puis en dés) : c'est une opération plus complexe qui entraîne une
permutation des axes d'analyse (par exemple, on peut vouloir remplacer une vue par
pays/régions par une nouvelle vue par familles et gammes de produits)
 le drill through : lorsqu'on ne dispose que de données agrégées (indicateurs totalisés), le drill
through permet d'accéder au détail élémentaire des informations (chaque vente de chaque
produit à chaque client dans chaque magasin)
Précautions à prendre[modifier | modifier le code]
Chacune de ces vues partielles du cube se traduit finalement, soit par un tableau à double
entrée (tri croisé), soit par un graphique le plus souvent bidimensionnel.
Ainsi, bien que la navigation dans le cube soit multidimensionnelle, le décideur n’a pas, en réalité,
accès à une synthèse, mais à une multitude de tris croisés ou de vues bidimensionnelles dont
l’exploration, longue et fastidieuse, est parfois court-circuitée faute de temps. Cela peut conduire
à de coûteuses erreurs de décision.
Aussi peut-il être utile d’associer à cette démarche une iconographie des corrélations, qui permet
une vue d’ensemble réellement multidimensionnelle, débarrassée des redondances.

Fonctions essentielles de l'informatique


décisionnelle[modifier | modifier le code]
Un système d'information décisionnel (SID) doit être capable d'assurer quatre fonctions
fondamentales : la collecte, l'intégration, la diffusion et la présentation des données. À ces quatre
fonctions s'ajoute une fonction d'administration, soit le contrôle du SID lui-même.
Fonction de collecte[modifier | modifier le code]
La fonction collecte (parfois appelée datapumping) recouvre l'ensemble des tâches consistant à
détecter, sélectionner, extraire et filtrer les données brutes issues des environnements pertinents
compte tenu du périmètre couvert par le SID. Comme il est fréquent que les sources
de données internes et/ou externes soient hétérogènes — tant sur le plan technique que sur le
plan sémantique — cette fonction est la plus délicate à mettre en place dans un système
décisionnel complexe. Elle s'appuie notamment sur des outils d'ETL (extract-transform-load pour
extraction-transformation-chargement).
Les données sources qui alimentent le SID sont issues des systèmes transactionnels de
production, le plus souvent sous forme :
 d'éléments issus de l'enregistrement de flux : compte-rendu d'événement ou compte-rendu
d'opération . C'est le constat au fil du temps des opérations (achats, ventes, écritures
comptables…), le film de l'activité quotidienne, en tous cas régulière, de l'entreprise
 d'éléments reflétant une situation à un moment donné : compte-rendu d'inventaire ou
compte-rendu de stock. C'est l'image photo prise à un instant donné (une fin de période par
exemple : mois, trimestre…) de données caractérisant un stock. Par exemple : le stock des
clients, des contrats, des commandes, des encours…
La fonction de collecte joue également, au besoin, un rôle de recodage. Une donnée représentée
différemment d'une source à une autre impose le choix d'une représentation unique et donc
d'une mise en équivalence utile pour les futures analyses.
Fonction d'intégration[modifier | modifier le code]
La fonction d'intégration consiste à concentrer les données collectées dans un espace unifié,
dont le socle informatique essentiel est l'entrepôt de données. Élément central du dispositif, il
permet aux applications décisionnelles de masquer la diversité de l'origine des données et de
bénéficier d'une source d'information commune, homogène, normalisée et fiable, au sein d'un
système unique et si possible normalisé.
Au passage les données sont épurées ou transformées par :

 un filtrage et une validation des données en vue du maintien de la cohérence d'ensemble :


les valeurs acceptées par les filtres de la fonction de collecte mais susceptibles d'introduire
des incohérences de référentiel par rapport aux autres données doivent être soit rejetées,
soit intégrées avec un statut spécial
 une synchronisation : s'il y a nécessité d'intégrer en même temps ou à la même « date de
valeur » des événements reçus ou constatés de manière décalée ou déphasée
 une certification : pour rapprocher les données de l'entrepôt des autres systèmes « légaux »
de l'entreprise comme la comptabilité ou les déclarations réglementaires)
C'est également dans cette fonction que sont effectués éventuellement les calculs et les
agrégations (cumuls) communs à l'ensemble du projet.
La fonction d'intégration est généralement assurée par la gestion de métadonnées, qui assurent
l'interopérabilité entre toutes les ressources informatiques, qu'il s'agisse de données structurées
(bases de données accédées par des progiciels ou applications), ou des données non
structurées (documents et autres ressources non structurées, manipulés par les systèmes de
gestion de contenu).
Fonction de diffusion (ou distribution)[modifier | modifier le code]
La fonction de diffusion met les données à la disposition des utilisateurs, selon des schémas
correspondant aux profils ou aux métiers de chacun, sachant que l'accès direct à l'entrepôt de
données ne correspond généralement pas aux besoins spécifiques d'un décideur ou d'un
analyste. L'objectif prioritaire est à ce titre de segmenter les données en contextes
informationnels fortement cohérents, simples à utiliser et correspondant à une activité
décisionnelle particulière. Alors qu'un entrepôt de données peut héberger des centaines ou des
milliers de variables ou indicateurs, un contexte de diffusion raisonnable n'en présente que
quelques dizaines au maximum. Chaque contexte peut correspondre à un datamart, bien qu'il n'y
ait pas de règles générales concernant le stockage physique. Très souvent, un contexte de
diffusion est multidimensionnel, c'est-à-dire modélisable sous la forme d'un hypercube; il peut
alors être mis à disposition à l'aide d'un outil OLAP.
Les différents contextes d'un même système décisionnel n'ont pas tous besoin du même niveau
de détail. De nombreux agrégats ou cumuls, n'intéressent que certaines applications et n'ont
donc pas lieu d'être gérés en tant qu'agrégats communs par la fonction d'intégration : La gestion
de ce type de spécificité peut être prise en charge par la fonction de diffusion. Ces agrégats
pouvant au choix, être stockés de manière persistante ou calculés dynamiquement à la
demande.
À ce stade et lorsqu'il s'agit de concevoir un système de reporting, trois niveaux de
questionnement doivent être soulevés :

 À qui s'adresse le rapport spécialisé ? : choix des indicateurs à présenter, choix de la mise
en page
 Par quel trajet ? : circuit de diffusion type « workflow » pour les personnes ou circuits de
transmission « télécoms » pour les moyens
 Selon quel agenda ? : diffusion routinière ou déclenchée sur événement prédéfini
Fonction présentation[modifier | modifier le code]
Cette quatrième fonction, la plus visible pour l'utilisateur, régit les conditions d'accès de
l'utilisateur aux informations, dans le cadre d'une interface Homme-machine déterminé (IHM).
Elle assure le contrôle d'accès et le fonctionnement du poste de travail, la prise en charge des
requêtes, la visualisation des résultats sous une forme ou une autre. Elle utilise toutes les
techniques de communication possibles : outils bureautiques, requêteurs et générateurs d'états
spécialisés, infrastructure web, télécommunications mobiles, etc.
Fonction administration[modifier | modifier le code]
C'est la fonction transversale qui supervise la bonne exécution de toutes les autres. Elle pilote le
processus de mise à jour des données, la documentation sur les données (les méta-données),
la sécurité, les sauvegardes, et la gestion des incidents.

Projet décisionnel[modifier | modifier le code]


Dans une entreprise, le volume de données traitées croît rapidement avec le temps. Ces
données peuvent provenir des fournisseurs, des clients, de l’environnement, etc. Cette quantité
de données augmente en fonction du secteur et de l'activité de l’entreprise. Par exemple, dans
la grande distribution, les quantités de données collectées chaque jour sont énormes (notamment
lorsque les magasins collectent les tickets des caisses).
L'entreprise dispose de plusieurs options pour traiter ce flux de données :

 les données anciennes sont effacées et l'entreprise ne conserve que les données actives ou
un historique récent
 les données sont stockées dans une base et l'entreprise n'envisage pas d'usage immédiat
 les données sont stockées au fur et à mesure qu’elles arrivent de manière cohérente pour
qu’elles soient exploitables directement
Le projet décisionnel correspond à cette dernière option. Il s’agit de traiter les données et de les
stocker de manière cohérente au fur et à mesure qu’elles se présentent. C’est pour cela que le
projet décisionnel est un projet sans limite dans le temps. C'est-à-dire que dès que l’entreprise
commence ce projet, elle ne s’arrête pas (sauf cas exceptionnel). Wal-Mart (une chaîne de
la grande distribution) est l’une des entreprises qui stockent le plus de données (elle a multiplié
par 100 ses données en quelques années) et va atteindre dans les années à
venir[Quand ?] le pétaoctet (1 000 téraoctets).
Pour mener à bien ces projets décisionnels, il existe une multitude d'outils, chacun étant plus ou
moins adapté à la taille de l'entreprise, à la structure des données existantes et au type d'analyse
désiré.
Rappel de la chaîne de la valeur décisionnelle[modifier | modifier le code]

 Des SGBD relationnels et d'autres systèmes qui contiennent les données d'exploitation.
 Un ETL extrait les données pertinentes et les charge dans l'ODS du datawarehouse
 Les données sont structurées dans le datawarehouse 2
 Des datamarts qui exploitent une technologie X-OLAP sont mis à jour à partir
du datawarehouse
 Des rapports sont générés sur ces données
Phase de recueil des exigences[modifier | modifier le code]
Article détaillé : gestion des exigences.
Trois domaines doivent être particulièrement documentés :

1. le type d'information dont l'utilisateur des rapports a besoin


2. le type de restitution (ergonomie, fréquence, vitesse de restitution)
3. le système technique existant : technologies utilisées
Phase de conception et de choix technique[modifier | modifier le code]

 En fonction des exigences recueillies, quels sont les éléments de la chaîne de la valeur
décisionnelle qui doivent être implémentés ?
 Doit-on seulement créer un rapport sur un cube OLAP existant ?
 Construire toute la chaîne ?
 Quelles sont précisément les données que l'on doit manipuler ?
Cela conduit au choix de technologies précises et à un modèle particulier.