Vous êtes sur la page 1sur 37

Savoir, pour prvoir, afin de pouvoir.

Auguste Comte

Prvoir lavenir, cest le dterminer.


Auteur inconnu

Systme dinformation dcisionnel : quoi cela sert-il ?

Dans lentreprise le systme dinformation (SI) a pour objectif de faciliter ltablissement et


la mise en uvre de la stratgie, en particulier de concrtement supporter la ralisation des
activits. Il est construit partir des exigences des mtiers, des processus dfinis par
lentreprise, et il est constitu de lensemble des moyens (humains, logiciels, matriels)
utiliss pour collecter, stocker, traiter et communiquer les informations.
Il est dusage de distinguer trois types diffrents de SI, les systmes supportant la conception
des produits (calcul numrique, CAO, ...), les systmes industriels (conduite de machines,
contrle de process industriel, ...) et les systmes de gestion. Ces derniers couvrent toutes les
activits de gestion du fonctionnement de lentreprise (marketing, vente, achat, production,
logistique, finance, ressources humaines, R&D). Pour des raisons techniques, qui existent
toujours en partie aujourdhui, les systmes dinformation de gestion ont t historiquement
structurs en deux sous systmes : lun dit oprationnel qui prend en charge la ralisation des
oprations au jour le jour, et lautre dit dcisionnel qui fournit des informations pour dfinir
la stratgie, piloter les oprations et analyser les rsultats.
Un systme dcisionnel est donc avant tout un moyen qui a pour but de faciliter la dfinition
et la mise en uvre de stratgies gagnantes. Mais il ne sagit pas de dfinir une stratgie une
fois pout toute, mais dtre mme de continuellement sadapter son environnement, et de
le faire plus vite que ses concurrents. Pour cela il convient de bien comprendre son
environnement, dajuster ses interactions avec lui en faisant les meilleurs choix de cibles et
dactions. Concrtement le chemin suivre peut tre caractris par les quatre objectifs

CCB

Michel Bruley

1/37

suivants : comprendre son environnement, se focaliser sur des cibles, aligner son
organisation et mettre en uvre les plans dactions ncessaires.
Un systme dcisionnel va en particulier aider au pilotage des plans dactions (prvision,
planification, suivi), lapprentissage (acquisition de savoir faire, de connaissances, de
comptences) et la ralisation dinnovations incrmentales (adaptation du modle
daffaires : produits/services, organisation, etc. ). Les systmes dcisionnels traditionnels
permettent de faire lanalyse des activits dj ralises et den tirer des enseignements pour
les activits futures, pour cela ils utilisent des donnes plus ou moins rcentes (au mieux
mises jour quotidiennement). Les systmes dcisionnels plus avancs grent des donnes
plus fraches (certaines sont mises jour en quasi temps rel), automatisent des dcisions et
supportent en temps rel des oprations (centre dappels, web par exemple).

CCB

Michel Bruley

2/37

Du pilotage stratgique lintelligence conomique


Le pilotage stratgique beaucoup de monde en parle, mais peu dentreprises savent
rellement en tirer parti. Elles ny voient trop souvent quune version amliore des bons
vieux tableaux de bord. Ce faisant elles oublient lapport majeur du pilotage stratgique qui
est de mobiliser lnergie collective dans le cadre dun processus dapprentissage continu de
son environnement.
Mais comment parler dnergie collective quand on voit telle entreprise vanter les mrites de
son nouveau systme dinformation, reposant sur 17 objectifs stratgiques et une quarantaine
dindicateurs, qui sont analyss par les cinquante cadres dirigeants gravitant autour de la
direction gnrale. Pourquoi cinquante personnes seulement, alors que cette vision et ces
objectifs stratgiques devraient tre partags par lensemble de lentreprise ?
Lexprience montre que si les entreprises sont aujourdhui en mesure de dfinir leur vision
et leurs objectifs stratgiques, elles ont en revanche toujours autant de mal les mettre en
uvre et les diffuser dans lensemble de leurs quipes. Au mieux parvient-on mobiliser la
direction gnrale, le marketing et les forces commerciales, par nature plus sensibles leur
environnement. Mais par exemple les quipes de production sont encore trop souvent mises
lcart. Pourquoi ? Parce que les entreprises sont toujours trs cloisonnes. Parce que
chaque service interprte les objectifs stratgiques en fonction de sa culture et de ses propres
intrts. Parce que lempilement des structures et des systmes dinformations complique la
mobilisation de lensemble de leffectif, autour dobjectifs globaux.
Or, les nouveaux outils de BI facilitent la mise au point dindicateurs fdrant toutes les
couches de lentreprise. La vision stratgique de la direction gnrale doit en effet tre
diffuse et dcline dans tous les services de lentreprise : il sagit de fixer chacun des
objectifs qui lui parlent . Parce quun chef dquipe sur une chane de montage se sentira
infiniment plus concern par un objectif de rduction des dlais de mise en route de la chane
ou par un ratio de dfauts, que par un objectif daccroissement de part de march au plan
mondial.
Le vritable enjeu du pilotage stratgique consiste donc dcliner une vision globale en une
batterie de tableaux de bord pertinents : chaque tableau de bord tant un affinage de
lobjectif gnral adapt aux ralits de chaque quipe. La mise au point de ces tableaux de
bord repose sur un systme dcisionnel performant, permettant dexploiter conjointement
lensemble des informations internes lentreprise, des informations issues des veilles
technologique, commerciale et socitale, ainsi que du benchmarking, de faon mettre au
point des tableaux de bord prospectifs et vritablement orients vers lamlioration de la
performance sur un march donn.
Pour tre efficaces, ces outils de gestion de la performance doivent concerner le plus de gens
possible. Par exemple le systme de pilotage stratgique du Rseau de Distribution dun
Grand Constructeur Automobile mobilise ainsi plus de 2 500 salaris autour dune batterie
de 2 000 indicateurs. Dans une grande entreprise, un bon pilotage stratgique doit fdrer
plusieurs milliers de collaborateurs autour dautant dindicateurs ( raison dune dizaine
dindicateurs au maximum par quipe, et dune cinquantaine pour la direction gnrale).

CCB

Michel Bruley

3/37

Dans ces conditions et sil est port par une direction gnrale et des contrleurs de gestion
motivs, le pilotage stratgique peut devenir un thme aussi porteur et novateur pour les
entreprises que lont t ceux de la qualit totale et de la gestion des relations client.

Besoins et tendances en matire de dcisionnel dans un contexte de globalisation


Le march du dcisionnel continue se porter merveille. La raison fondamentale du
maintien dune haute demande tient la capacit de la BI rpondre aux besoins des
directions gnrales daujourdhui.
Dans les grandes entreprises les directions gnrales poursuivent principalement trois
objectifs. Premirement globaliser les activits, c'est--dire concrtement dfinir une
stratgie globale, assurer lunit de sa mise en uvre par toute lentreprise qui doit
manuvrer comme un seul homme, et piloter lensemble au plus prs sans dlai.
Deuximement optimiser les processus, cest--dire se focaliser sur les lments cls du
mtier de lentreprise (cration de loffre, production, commercialisation et gestion des
ressources), avec concrtement la fin des approches par fonction au profit dune intgration
des visions (commerciales, financires, ), pour optimiser la valeur ajoute prvue dans le
cadre de la stratgie. Troisimement rationaliser les moyens, c'est--dire les dimensionner,
les localiser en fonction des objectifs stratgiques, avec concrtement un dveloppement du
travail en rseaux mondiaux et la fin des baronnies, des potentats locaux et des degrs de
libert des filiales.
Plus prcisment si lon prend le domaine financier dune entreprise il sagit de matriser et
dharmoniser les pratiques travers toutes les filiales (par exemple la socit NCR est
prsente dans 130 pays), dacclrer la publication des rsultats (souvent actuellement il faut
de 5 8 jours ; la nouvelle cible est de 2 jours), de rduire les cots de la fonction financire
(actuellement souvent > 1% du chiffre daffaires alors que la nouvelle cible est denviron
0,5%), de rduire les encours clients, de rduire les stocks, etc. Dans les entreprises qui
globalisent leurs activits, tous les domaines Marketing/Ventes, Production, Gestion des
Ressources, R&D font lobjet des mmes approches de redfinition des objectifs, des
organisations et des moyens.
En terme de systme dcisionnel pour rpondre aux besoins actuels des grandes entreprises
dcrits ci-dessus, il convient comme il a t vu au chapitre prcdent dtre mme de : 1)
quiper de plus en plus dutilisateurs diffrents (Directions, Experts en analyse de donnes,
Analystes dune fonction, Responsables oprationnels, Oprationnels, ). 2) intgrer les
donnes dans un entrept de donnes dentreprise (EDW) : intgrer les ODS, consolider les
Data Marts, assurer via lEDW la qualit des donnes. 3) traiter de plus en plus de donnes :
taille des disques, puissance des systmes, ETL & ELT, EDW et mise en place de Data
Marts logiques. 4) intgrer du support dcisionnel dans la gestion des oprations (rendre
lentrept de donnes actif ADW) : multiplication des scorings, dveloppement de services
internet (SOA). 5) intgrer dans une architecture dentreprise les diffrents outils de la BI
(Oracle, IBM, Microsoft, SAP, SAS, ). 6) dvelopper de nouvelles applications de
gestion du client (Calcul de la valeur client, compte dexploitation Client en BtoC, ), de
gestion des produits (par exemple problmatique des garanties : matrise aval et amont de la
vie des produits), etc.

CCB

Michel Bruley

4/37

Concrtement pour les grandes entreprises cela veut dire que leur systme dcisionnel doit :
tre disponible 24h sur 24, 7 jours sur 7, 52 semaines par an ; alimenter en donnes de
qualit des milliers dutilisateurs (actuellement ~12 % des effectifs dune grande entreprise
sont dots de moyens daide la dcision) ; stocker souvent des dizaines de tras de
donnes, mises jour pour certaines dentre elles en quasi temps rel par rapport
loprationnel, intgres dans un gisement fond sur un modle normalis coupl avec de
multiples modles en toiles ; rpondre aux besoins de lensemble des domaines fonctionnels
de lentreprise, en autorisant simultanment les activits de reporting, des requtes ad hoc, de
lolap, de lanalyse de donnes qui manipulent des tras de donnes utiles et autorisent des
vues logiques complexes (>15 jointures).
La valeur dun systme dcisionnel pour une entreprise est dtermine par sa capacit aider
tre plus agile et pour cela dans de nombreux domaines de laide la dcision la vitesse est
primordiale : vitesse dacquisition, danalyse et daction. A ce jeu il sagit de rduire le plus
possible les latences entre loccurrence dun vnement mtier, la capture des donnes
correspondantes, la mise en cohrence et en perspective, la production dune information et
laction. Lexprience montre que seule une architecture de systme dcisionnel fonde sur
un gisement centralis de donnes dtailles dentreprise peut permettre de rpondre ce
dfi.
Au jeu de la globalisation, une entreprise quipe dune bonne solution dcisionnelle a un
avantage certain et pour cela son systme doit tre architectur de faon garantir les
performances court terme, lvolutivit, la prennit des investissements, une matrise des
cots et des risques.

Etre dans le vent, cest une ambition de feuille morte : parlez mtier
En tant que responsable Marketing je suis bien plac pour savoir que le vocabulaire suit des
modes et vieilli vite. Infocentre, EIS, SIAD, CPM, Scorecarding, sont autant de mots qui se
priment et ne permettent plus de correctement dcrire les pratiques et les projets des
entreprises daujourdhui. Lutilisation de donnes historiques se dveloppe dans lentreprise
en surfant sur la loi de Moore. Il y a quelques annes la presse publiait rgulirement des
listes dentreprises qui avaient un entrept de donnes de plus dun Tra, aujourdhui
certaines entreprises ont dj des entrepts de donnes de plus dun Pta.
Ce dveloppement effrn vient du fait que les entreprises ont dcouvert que la premire
condition de la conduite intelligence des affaires, cest davoir de la mmoire, que les
dcisions essentielles pour la vie des organisations se prennent tous les niveaux des
structures, et que linformation dautant plus de pertinence quelle colle lvnement
mtier et quil convient donc de la capturer, de la mettre en cohrence, en perspective et de
la dlivrer la vitesse grand V. Exit donc tous les systmes au rythme batch et aux donnes
agrges, tous ses data marts optimiss qui sont obsoltes le jour de leur recette.
La problmatique daujourdhui se formule de la faon suivante : comment mettre
disposition des oprationnels, des planificateurs, des managers et des stratges des
diffrentes fonctions de lentreprise des informations de qualit qui concernent leur activit,
en rpondant leurs besoins de volume de donnes stocker, de fracheur, de possibilit de
traitement (production dindicateurs, ralisation danalyses ad hoc et de simulation, ) et de
disponibilit. Face ces besoins, les entreprises ont gnralement multiplis les systmes et

CCB

Michel Bruley

5/37

mis en place des moyens spcifiques, disparates et souvent incohrents pour faciliter la
dtermination et le pilotage des stratgies ; pour dfinir les objectifs, les moyens et les
budgets ; pour planifier et suivre les oprations (marketing, commercial, production, ) ;
pour saider dans lexcution des tches oprationnelles et notamment dans les interactions
avec les partenaires de lentreprise en particulier les clients et les fournisseurs.
Les bons objectifs se fixer sont en premier de crer une vue consistante des donnes
travers lentreprise, puis de mettre en place des moyens qui permettent dobtenir plus
rapidement des rponses aux questions mtiers. Pour cela il convient de construire un
entrept de donnes dynamique qui enregistre les vnements mtier au fur et mesure
quils sont mis par les applications oprationnelles, et qui les met disposition pour
supporter les dcisions oprationnelles, de pilotage, de management ou de stratgie.
Si nous prenons le processus de la relation avec les clients, le volume des vnements
grer pour une grande banque se chiffre en centaines de millions dinteractions par an, avec
par exemple pour une grande banque franaise : 100 millions de contacts en agence, 100
millions de sessions aux distributeurs ou guichets automatiques, 40 millions de visites
internet, 20 millions daccs au serveur vocal, 5 millions de contacts au centre dappels. Une
bonne gestion de ces vnements et de leur historique doit permettre une plus grande
efficacit de la force de vente, du marketing en particulier par une meilleure connaissance
des clients et une interaction multi-canal plus cohrente.
Pour en revenir au vocabulaire qui vieilli et pour viter dans lavenir de nous tromper de
vocabulaire, je conseille de ne pas suivre la mode de la BI ou mme dutiliser les mots de la
BI. Il convient de parler de donnes, dapplications mtier et concrtement par exemple dans
le secteur de la distribution : dassortiment, de stock, de fournisseur ou encore de faon plus
fine de la suppression dun article, des affinits produits, des ventes perdues toutes choses
qui se traquent travers les vnements que les systmes oprationnels grent.

Illustration 7

CCB

Michel Bruley

6/37

L'entrept de donnes un des outils de l'intelligence conomique


Matriser linformation est plus que jamais un moteur de comptitivit pour lentreprise,
mais aussi pour les Etats. Dans le cadre de la mondialisation et du passage dune logique
doptimisation de la production une logique dinnovation, la puissance dune entreprise ou
dun Etat est lie la matrise de toute la chane d'information, pour les trois raisons
principales dcrites ci-dessous.
Les modes de consommation ont volu. Nous sommes passs dun march de masse une
production diversifie qui cherche rpondre avec finesse la demande et ce dans toutes les
branches dactivit (industrie, assurance, etc.). Aujourdhui le client nest plus face
lentreprise, il pntre dans lentreprise. Autrefois, la clientle tait disponible, en position
dattente, la concurrence tant limite, voire nulle. Aujourdhui on est lcoute du client
dans une posture proactive.
Le march est devenu concurrentiel aprs des annes de cloisonnement par lEtat nation,
particulirement en France, pays dont 70 % des changes extrieurs concernaient en 1970
uniquement son vieil empire colonial. Aujourdhui, prs de 70 % des changes extrieurs
franais ont lieu au sein de lEurope. Globalement nous sommes passs en 40 ans dun
march protg un march ouvert.
Le progrs technique sacclre et justifie une meilleure matrise de linformation. Les
investissements immatriels (logiciels, brevets, etc.) ont largement pris le pas sur les
investissements matriels. Ils constituent un facteur essentiel du dveloppement de la
concurrence.
Cette exigence de matrise de linformation, nous amne dvelopper lapproche de
lIntelligence Economique. Il sagit la fois dun mode de pense linformation doit tre
cre et valorise et dun mode daction linformation doit tre partage et utilise bon
escient. La pratique de lintelligence conomique sappuie sur quatre ides fondamentales.
La matrise des connaissances : connatre et protger. Lidentit dune entreprise tient plus
son savoir et son savoir-faire qu son produit. Souvent, elle est potentiellement capable de
faire autre chose, en basant sa comptitivit davantage sur ce quelle sait faire que sur ce
quelle fait dj. Enrichir le systme en place nest pas simple et il convient de faire une
distinction entre protection de linformation stratgique et culture du secret. Dans
lentreprise, beaucoup trop dinformations sont classes "top secret". Il est important de
hirarchiser le niveau de confidentialit afin de ne pas touffer la communication
indispensable au dveloppement de lentreprise, voire sa survie.
La comprhension des opportunits, des risques et des menaces. La fonction marketing et la
veille permettent didentifier des opportunits de march, mais aussi des opportunits
capitalistiques , surtout en priode de concentration. Le risque peut provenir de
lobsolescence des savoir-faire ou dune mauvaise gestion des comptences. Les menaces
la corruption, le piratage, la copie, lespionnage et toute tentative de dstabilisation ne sont
fatales que si le concurrent peut identifier des objectifs clairs.
La coordination des acteurs et des activits. Cette coordination est ralise en interne, en
sensibilisant le personnel aux orientations de lentreprise, mais aussi en externe, par la
constitution dun rseau de fournisseurs, de clients, de centres de recherche, etc. Lentreprise

CCB

Michel Bruley

7/37

n'existe pas seule. 50 % des entreprises innovantes, avec un taux de croissance annuel
suprieur 15 %, ont au moins trois vrais partenaires stratgiques.
La stratgie dinfluence. Il sagit de la capacit matriser son environnement. Et cela nest
pas uniquement la porte des grandes entreprises : mme une petite structure peut
influencer les directives europennes, via la reprsentation locale. Si un maire ne souhaite
pas quune usine de cinquante personnes ferme ses portes, il en parle au conseiller rgional,
qui en parle au dput, qui en parle au ministre, etc. Mais le mieux reste encore danticiper,
de reprer les rseaux d'influence, les allis potentiels. Tous les salaris sont videmment
concerns.
Dans sa dimension Information , lIntelligence Economique sappuie sur des techniques
de veille (technologique, commerciale, ), de renseignement, de benchmarking, de gestion
des performances et des connaissances. La veille technologique, qui surveille le march pour
en dtecter les signaux faibles et les signaux forts dvolution. Le benchmarking, qui
consiste voir et comparer les solutions des divers concurrents. Le renseignement, cest-dire la capacit faire merger linformation confidentielle (appel doffres, nouvelle
technologie, etc.). Le knowledge management, savoir se connatre soi-mme, identifier
linformation matriser, celle partager et celle protger.
Dans sa dimension Action , lIntelligence Economique sappuie sur des techniques
dinfluence, de lobbying, de communication, de recrutement, de gestion des comptences,
des informations et de la confidentialit.
Dun point de vue technologique, lIntelligence Economique utilise les moyens
dinformation et de communication daujourdhui : gestion de documents, data & text
mining, moteur de recherche, business intelligence, intra/extra/internet et entrept de
donnes.
Tous ces outils sont excellents lorsque linformation se met au service de la stratgie et il
sagit donc en particulier de savoir intgrer des donnes en provenance de sources trs
varies :
Les fournisseurs dinformation : Presse, librairies, bibliothques, banques de donnes,
centres dinformation,
Les nouveaux rseaux : Internet,
Les institutions : Administration, organisations internationales, associations, centres de
recherche, instituts, fondations, universits,
Les groupes partenaires : Sous-traitants, fournisseurs, clients, concurrents, groupements
professionnels, financiers,
Les consultants et experts : Ecoles dingnieurs, universitaires, experts, centres
techniques, consultants, bureaux dtudes,
Les manifestations : Colloques, salons, voyages dtudes,
Les rseaux personnels : Clubs, collgues, confrres,
Les sources fortuites : Train, avion, la rue, les stagiaires,
Les sources internes : encore faut-il ne pas les oublier.
Mais attention la lgalit de vos approches.
En conclusion, le moyen le plus sr de conforter sa comptitivit au niveau mondial est
certainement de transformer son organisation, en systme dintelligence conomique, en

CCB

Michel Bruley

8/37

associant largement ses employs, ses partenaires sous la bannire du chef dentreprise, et en
mettant en place les moyens technologiques ncessaires pour accueillir et traiter
linformation, c'est--dire un entrept de donnes dentreprise.

La BI en trois tapes de bon sens : partez lentement pour aller vite


Alors que les entreprises grent dimmenses quantits de donnes, les experts informatiques
ne cessent de chanter les louanges du concept de la Business Intelligence (BI). Avoir un
accs rapide une comprhension toujours plus pointue des clients, des oprations et des
dangers qui menacent, est effectivement une perspective extrmement sduisante. Sous la
pression des demandes constantes de rduction des cots, de diminution des risques, de prise
en compte des exigences lgales et damlioration des bnfices, les responsables mtier
sont particulirement attirs par les possibilits offertes par la BI.
Le dfi est de se rendre dun point un autre et les nombreuses pierres dachoppement
potentielles peuvent rendre le voyage particulirement difficile. Certains ont chou en
essayant den faire trop dun coup, en voulant que toutes les donnes de leur entreprise
soient disponibles immdiatement pour un large ventail dinterrogations potentielles. Cela
reprsente un investissement norme en temps, en ressources et ces entreprises doivent se
battre pour simultanment absorber les cots, mettre en place et produire une valeur.
Dautres se sont montrs trop prudents avec des investissements insuffisants et des progrs
trop lents. Au final une valeur ajoute trop faible, de sorte que souvent certains utilisateurs
finissent par penser quils peuvent obtenir de meilleurs rsultats en entretenant leur propre
stock priv de donnes pour rsoudre leurs problmes spcifiques, et alors il ny a
pratiquement pas davantages pour lensemble de lorganisation tirer dun tel
environnement de BI. Une autre erreur frquente des organisations informatiques est de se
concentrer sur une rduction forcene du volume des donnes, plutt que sur le
dveloppement dune comprhension dtaille de la faon dont les utilisateurs vont pouvoir
exploiter les donnes et produire une vritable plus-value commerciale. Ici aussi les
utilisateurs mtier dus finissent par dpendre plus que jamais de solutions de BI artisanales
et disparates pour faire face lvolution de leurs propres besoins. Enfin dans tout les cas,
quand les utilisateurs napprcient pas leur travail, les informaticiens se sentent dprcis et
sous-employs.
Evidemment ces exemples ne sont pas les scnarios que de nombreux promoteurs de la BI
dentreprise ont en tte lorsquils voquent leur vision. Cependant quelques entreprises ont
russi minutieusement planifier pour leur domaine BI un parcours de bon sens et
dployer un environnement puissant et pertinent. Les meilleures pratiques de construction
dun environnement de BI ont vu le jour tant partir de russites que dimplmentations
imparfaites.
Deux principes essentiels
1) Il faut tablir un dialogue fort et continu avec un langage commun entre les mtiers et les
informaticiens. Bien trop souvent les utilisateurs et les informaticiens qui construisent
lenvironnement de BI vivent dans des mondes totalement diffrents, peine conscients des
besoins ou des processus de lautre. Soit il y a trop peu de canaux de communication, soit ils
ne parlent tout simplement pas la mme langue et se dbattent pour faire comprendre
leurs besoins lautre.

CCB

Michel Bruley

9/37

2) La cration dun environnement de BI doit se faire tape par tape. Pour viter den faire
trop ou trop peu, les entreprises doivent dabord se concentrer sur les projets prioritaires,
dont la russite peut faciliter ladhsion des utilisateurs et ouvrir les apptits pour les projets
suivants. En principe, ces premiers projets doivent rpondre lun des deux critres
suivants : permettre dobtenir une rentabilit rapide des investissements ou avoir une
signification politique importante pour lorganisation. Quoi quil en soit la dmarche sera
la mme : capitaliser sur une russite.
Trois tapes pour garantir un niveau dadoption optimal et un maximum de valeur ajoute
Premire tape : La direction en collaboration avec linformatique dveloppe des hypothses
sur les meilleures possibilits de production de valeur ajoute au sein de lorganisation, dans
lesquelles la BI peut jouer un rle. Lide est que le processus de construction de la BI doit
tre ancr sur la question stratgique la plus urgente pour lorganisation. Pour une Banque
par exemple, cela peut vouloir dire rduire de 25% le taux de clients perdus, ou dvelopper
de 10% les apports de fonds propres sur les prts immobiliers et rduire les hypothques, les
taux de dfaut de remboursement des prts au logement de 10%. Une fois que la direction a
identifi les moteurs commerciaux, elle na aucun mal identifier les utilisateurs cls : des
responsables de marketing et des analystes, aux reprsentants des services client et autres
gestionnaires de relations.
Seconde tape : Clarifier et dvelopper les hypothses en organisant des sances de travail
avec les utilisateurs du domaine. Dans cette tape, la direction et linformatique organisent
une srie de runions avec les utilisateurs concerns afin de tester et daffiner les hypothses
originelles. Les runions se concentrent dabord sur la comprhension des buts et objectifs
des utilisateurs. Par exemple les utilisateurs peuvent dire que dans le but damliorer les
activits de prts immobiliers, ils ont besoin davoir un profil de tous les dtenteurs de prts
actuels qui ne sont pas en dfaut de paiement, mais qui ont galement dautres produits de
dpt et de prt. Il peut sagir dun problme de non rglement de carte de crdit ou de
dcouvert sur un compte chque sur lequel ils viennent dinterrompre leur ordre de virement
automatique par exemple, et qui indiquerait un dfaut potentiel de rglement des mensualits
de leur crdit immobilier. A partir de l les utilisateurs et les informaticiens peuvent formuler
des questions commerciales cls. Puis explorer de quelles donnes lorganisation dispose-telle dj, et de quelles donnes a-t-elle besoin pour rpondre ces questions commerciales ?
Dans quel dlai linformation doit-elle tre disponible pour tre efficace ? Des applications
sont-elles en place pour que ce soit ralisable ? Ce processus permet aux deux groupes de
comprendre linformation existante, les carences des applications et de dcider sils
disposent de moyens suffisants pour rduire ces carences. Cela permet galement aux deux
groupes de comprendre leurs difficults et leurs capacits rciproques, de polariser le
dialogue sur lusage final et la valeur de linformation. Enfin les deux groupes doivent
considrer ces runions comme une plateforme partir de laquelle ils peuvent tendre leur
premire ide dautres opportunits damlioration. Les informaticiens peuvent dire par
exemple quils peuvent galement fournir un historique client plus dtaill et des
informations sur le profil des clients dans un dlai approchant le temps rel. La question
alors est, cela reprsente-t-il une valeur ajoute sur la faon dont le groupe Prts immobiliers
utilise linformation sur un dpt automatique interrompu, par exemple ? Est-ce que le fait
quun client na jamais enregistr de dfaut de paiement sur sa carte de crdit peut tre
utile ? Grce ce dialogue les relations prennent de la valeur, linformatique et le
commercial sengagent dans un processus conjoint avec un objectif partag. Ce processus et

CCB

Michel Bruley

10/37

la reconnaissance des problmes de lautre contribuent rduire le foss qui spare les
deux parties.
Troisime tape : construire et tester le modle. Une fois que les besoins et les capacits
effectives sont clairs, que le projet est dfini, les informaticiens doivent sappuyer sur les
lignes directrices mtier pour construire lenvironnement BI pour ce projet particulier. La
premire tche consiste relier les questions mtier aux donnes requises et aux applications
sources des donnes. Les socits ont intrt organiser leurs donnes au sein dun modle
logique appropri calqu sur le mode de fonctionnement du secteur concern, pas
uniquement sur la structure organisationnelle actuelle. Ceci permet de faciliter la
transformation des donnes en information commerciale utile. A partir de l le systme peut
faire le lien entre des questions mtier (par exemple : quel dtenteur de prt immobilier a
interrompu un dpt automatique ?), et tout un ventail dopportunits damliorations
mtier spcifiques (rduction des dfauts de paiement, amlioration de la fidlisation des
dtenteurs de dpts de fonds et/ou de prt de grande valeur, augmentation des ventes
croises sur valeur hypothcaire), qui sont lies aux buts et objectifs originaux que la
direction avait dfinis (dvelopper de 10% lunit dapport de fonds propres sur les prts
immobiliers et rduire les hypothques et les taux de dfaut de remboursement des prts au
logement du mme montant). Quand cela est appropri les socits peuvent modliser
limpact commercial anticip de cette dmarche, en analysant la combinaison de croissance
des revenus, la rduction des cots et/ou la diminution des risques susceptibles de se
produire. Ceci contribue dterminer les priorits des opportunits commerciales
garantissant ainsi un dploiement plus efficace des ressources.
Cependant la Banque doit dcider si la construction dun tel modle ne risque pas de ralentir
le projet dans son ensemble. Au lieu dun processus de modlisation certaines banques
peuvent prfrer lancer des projets pilotes prliminaires sur des marchs slectionns et
tester les rsultats obtenus avant de dvelopper cette ide lchelle globale. La focalisation
combine de linformatique et des mtiers sur un modle dfinitif de donnes dentreprise
intgres permet de rduire le nombre des systmes temporaires, qui augmentent les cots
cumuls et gnrent des donnes redondantes dans des silos isols.
Un certain nombre dorganisations de pointe ont russi grce cette approche pour trois
raisons simples : lensemble du processus est ancr dans des objectifs stratgiques ; il sagit
dune approche qui facilite le dialogue continu entre linformatique et les utilisateurs ; il
sagit dune approche qui amliore grandement les acquis organisationnels. Les avantages
sont considrables, dabord le dialogue permet gnralement aux projets de se dvelopper
au-del de lide originale dexploiter le potentiel de la BI ; ensuite en progressant de
russite en russite les entreprises crent un modle qui saffine en permanence et permet
une amlioration constante ; enfin tout ceci stimule lenthousiasme pour un dveloppement
continu de lenvironnement BI en dmontrant clairement que les besoins des utilisateurs sont
effectivement satisfaits. Au final les entreprises peuvent concrtiser la vision dun
environnement BI pertinent fonctionnant de manire optimale.

CCB

Michel Bruley

11/37

CCB

Michel Bruley

12/37

Approches analytiques de pointe, data mining ou fouille de donnes

Le data mining, la fouille de donnes ou toutes les approches analytiques de pointe


reprsentent les formes les plus ambitieuses de lInformatique Dcisionnelle. Les techniques
sous jacentes sont issues des Statistiques ou de lIntelligence Artificielle, et certaines comme
les Rseaux de Neurones, les Arbres de Dcision, les Rseaux Baysiens ou la Logique
Inductive furent dveloppes il y a plusieurs dcennies dans des contextes trs diffrents.
Attention il ne sagit pas de techniques informatiques, mais de processus de recherche
automatique dinformation dans un grand volume de donnes en mettant en uvre toute
technique approprie.
Le postulat fondamental de ces approches est que dans toute base de donnes enregistrant les
vnements dun processus conomique, les donnes ne sont pas distribues au hasard. Bien
que ces donnes soient simplement constates, le plus souvent collectes des fins purement
oprationnelles, on suppose quelles ont t gnres par une ralit en grande partie
dterministe, mais selon des processus que gnralement on ne connat pas. Les approches
analytiques cherchent mettre en vidence, dcrire et permettre de reconstruire les effets de
ces processus. Cette action didentification des effets dun processus partir de donnes se
caractrise par la construction dun modle, ensemble de rgles, dquations, de formules qui
rendent compte de la distribution des donnes dans la base.

Illustration 8
Construire mthodiquement un modle des donnes dont on dispose sur un objet de gestion,
est un saut important sur le chemin de la connaissance et de la dcision. Au lieu de
gigaoctets de donnes brutes, le dcideur dispose alors dune vue interprtable de son sujet
dtude. Mais attention ne pas se laisser piger par la mtaphore lie lexpression data
mining qui suggre que les donnes (data) ne seraient quun amoncellement de dbris, que
lon creuse (mining) la recherche de la ppite. Elle fait croire que le data mining rejette une
grande proportion des donnes disponibles, pour ne conserver quune petite partie

CCB

Michel Bruley

13/37

particulirement significative. Or ce nest pas exactement le cas, dans llaboration dun


modle toutes les donnes sont prises en compte et traites sensiblement sur un pied
dgalit. Le modle est construit en fonction des rgularits (patterns) de lensemble des
donnes. Le succs de lanalyse se mesure sa capacit dtecter les rgularits fortement
significatives.
Dautre part pour certains, toutes ces approches analytiques de pointe, data mining ou fouille
de donnes ne seraient que de nouveaux noms branchs de la vnrable statistique. La
rponse est : oui, mais . Oui, car si vous faisons abstraction des techniques mises en
uvre, lobjectif est le mme : laboration et interprtation de modles de la ralit
construits partir dune description partielle de cette ralit par des donnes. Mais , car la
statistique traditionnelle ne rpond pas compltement aux attentes des utilisateurs potentiels.
Le progrs le plus attendu des nouvelles approches cest lindustrialisation des analyses,
alors que la statistique reste une activit artisanale, rserve un petit nombre de spcialistes
traitant avec beaucoup de soin un petit volume de donnes trs structures, et mettant en
uvre un savoir faire peu automatis. Or lambition des nouvelles approches cest damener
les biens faits de la statistique tous les responsables sans quils aient constamment recours
des statisticiens.
Cependant il ne faut pas se cacher, que la ralit est souvent compliqu, voire complexe, et
que les approches analytiques peuvent tre dlicate mettre en uvre et leurs rsultats
parfois ambigus ou incertains, mme si de nombreuses entreprises utilisent ces techniques
avec beaucoup de succs dans toutes les fonctions de lentreprise et en particulier dans les
domaines de la relation client, de la logistique, de la qualit.

Cinq mythes sur le data mining


De nombreuses entreprises florissantes ont dcouvert que les bruits qui circulent propos du
data mining ne se rsumaient finalement qu de simples mythes. Plutt que de cder ces
sirnes, ceux qui ont su voir plus loin y ont gagn un formidable avantage concurrentiel en
utilisant le data mining pour rsoudre des problmes d'entreprise complexes et voir
augmenter leur rentabilit.
Au fur et mesure que les compagnies de tlcommunications poursuivent ce petit plus
qui permettra de relancer le revenu moyen par utilisateur (ARPU) et d'amliorer la rentabilit
et l'efficacit de leurs oprations, le data mining et la transformation de donnes en
informations directement utilisables tendent se rpandre toujours plus largement. Il reste
nanmoins beaucoup faire. Sous la pression accrue de la concurrence et des contraintes
rglementaires, les compagnies de tlcommunications cherchent offrir un meilleur service
pour un cot rduit. Fournir un meilleur service ne se rsume pas offrir une qualit de
rseau optimale : cela implique aussi d'tre en mesure de comprendre rellement les besoins
des utilisateurs et d'y rpondre l'aide de services rentables. De mme, rduire les cots ne
signifie pas simplement diminuer les prix. Dans la conjoncture conomique actuelle, la
pression des tarifs agit souvent comme un catalyseur dclenchant lexamen des systmes,
des processus et des cots internes, ainsi que la recherche de l'excellence oprationnelle.
Offrir un service meilleur et plus rentable, d'une part, et atteindre l'excellence oprationnelle,
d'autre part, sont pour les entreprises deux objectifs pour lesquels la technologie du data
mining peut constituer un atout prcieux.

CCB

Michel Bruley

14/37

C'est d'ailleurs une technologie de data mining de pointe qui a convaincu les magasins WalMart installs la campagne de miser sur un type spcifique de Spam pour la saison de la
chasse. Allez-y. Souriez. Il n'empche que lopration Spamouflage avec des botes en tenue
de camouflage s'est rvle un norme succs. Au-del d'une ide simplement sduisante,
Spamouflage a aid Wal-Mart tirer des revenus supplmentaires de ses clients existants et a
dmontr quel point ce distributeur comprenait les gens qui il s'adresse.
Bien qutranger au monde des tlcommunications, cet exemple n'en reste pas moins
significatif de la faon dont des entreprises leaders sur leur march peuvent transformer des
donnes en informations, puis en actions et, au bout du compte, en bnfices.
Mais qu'est-ce donc que le data mining ?
Le data mining est un puissant outil d'analyse qui permet des responsables d'entreprises
daller plus loin que la simple description des comportements passs d'une clientle et de
prdire l'avenir. Il permet de dceler dans les comportements mystrieux des clients des
rgles qui les sous-tendent. Grce ces dcouvertes, il est possible d'augmenter les revenus,
de rduire les dpenses, d'identifier des opportunits commerciales et donc de bnficier
d'avantages concurrentiels certains.
Le dveloppement de mythes autour du data mining s'explique en partie par le fait que le
concept reste encore flou pour bien des gens. la base, le data mining se dfinit comme un
jeu de techniques mathmatiques complexes servant dcouvrir et interprter des schmas
jusqu'ici inconnus dans un ensemble de donnes dtailles. Depuis le milieu des annes
1980, priode partir de laquelle le data mining a commenc sortir du champ de la
recherche universitaire, mdicale et scientifique, ces techniques ont t appliques avec une
grande efficacit dans le domaine des tlcommunications, de la distribution, des banques,
des assurances, des transports et de l'htellerie.
La rputation d'outil analytique du data mining l'a souvent fait confondre avec la technique
de traitement analytique en ligne nomme OLAP. LOLAP est une technique analytique
prcieuse lorsqu'on l'applique l'analyse doprations commerciales afin d'en tirer une
perspective historique des vnements. Imaginons par exemple quun directeur du marketing
veuille comprendre pourquoi les ventes ont chut dans une rgion donne. Les outils
dOLAP lui permettent d'interroger la base selon de multiples critres, qu'il s'agisse des
ventes par segment, par produit, par service ou de leur volution. En examinant l'historique
des donnes sous plusieurs angles, ce responsable sera en mesure d'identifier les causes
(point de vente, produits ou priode) qui ont pes sur les ventes.
Le data mining s'intresse un ordre de problmes diffrent. Il peut servir prdire des
vnements futurs, comme les ventes du mois suivant en fonction des promotions ou le type
de consommateur qui sera le plus sensible une vente promotionnelle. La faon dont un
certain nombre dentreprises lutilisent dj permet de dissiper les cinq grands mythes qui
planent sur le data mining.
Mythe numro 1 : Le data mining pourrait instantanment prdire l'avenir, la manire
dune boule de cristal
Le data mining n'est ni une boule de cristal ni une technologie capable de faire apparatre des
rponses comme par magie en appuyant sur un bouton. C'est un processus qui comporte

CCB

Michel Bruley

15/37

plusieurs tapes : dfinition du problme de l'entreprise, exploration et prparation des


donnes, dveloppement dun modle et dploiement des connaissances obtenues. En
gnral, les entreprises consacrent l'essentiel du temps ncessaire pr-traiter et prparer
les donnes afin d'obtenir des Donnes nettoyes, cohrentes et convenablement combines
pour fournir les renseignements fiables qu'elles en attendent. La qualit des donnes est au
cur du data mining et un data mining russi exige des donnes refltant fidlement l'activit
de l'entreprise. Dans le cas des tlcommunications, les oprateurs doivent comprendre que
la puissance du data mining rside dans sa capacit relever des dfis spcifiques de nature
prdictive ou descriptive. Il peut s'agir de : segmenter la clientle, prdire la propension des
clients acheter (ou changer de prestataire), dtecter la fraude, augmenter l'efficacit de
l'organisation (par exemple en optimisant l'assurance de revenus et les performances rseau).
Les entreprises de tlcommunications qui comprennent comment fonctionne le processus en
retirent des rsultats indniables. Tel oprateur europen de tlphonie mobile connat par
exemple la valeur de ses clients. Pas seulement les revenus qu'il peut en tirer, mais leur
valeur elle-mme.
Les revenus et les cots sont calculs pour chaque client, les programmes de marketing et de
GRC (gestion de la relation client) sont ensuite labors en fonction de la rentabilit de ces
clients. Telle compagnie de tlcommunication sud-amricaine anticipe et intervient pour
empcher le dpart de clients valeur leve en reprant les schmas qui conduisent la
perte de clientle, sappuyant pour cela sur lanalyse des mesures d'utilisation, d'achat et de
qualit de services. Tel autre oprateur europen de tlphonie mobile a utilis le data
mining pour analyser le risque de churn (tendance du consommateur changer de
prestataire), afin de prendre des mesures proactives cibles visant identifier les clients et
les segments ayant la plus forte propension au churn. Arm de cette information, l'oprateur
a lanc des campagnes de marketing cibles qui lui ont permis de rduire de 50 % le taux de
churn sur les segments concerns. En parallle, la compagnie a bnfici dun taux
d'augmentation de 30 % au cours de la campagne marketing, amliorant du mme coup la
satisfaction des clients et par consquent leur dure de fidlit. Mais le data mining peut aller
bien plus loin qu'une simple analyse du comportement de la clientle. Un des principaux
oprateurs aux USA utilise le data mining pour amliorer les performances de son rseau,
sans avoir dpenser des millions de dollars pour actualiser son infrastructure rseau
existante. Grce une surveillance constante des rgles de performances et une analyse
permanente de l'historique de l'utilisation des composants et des lignes principales,
compltes par des mesures rgulires de l'activit de son rseau, cet oprateur peut veiller
ce que les appels soient achemins en utilisant la capacit disponible. Ces efforts lui
permettent d'enregistrer une baisse des dfauts de service et des interruptions techniques et,
paralllement, une hausse du nombre d'appels russis passs sur son rseau. Non seulement
le degr de satisfaction des utilisateurs augmente, mais l'oprateur est aussi en mesure de
fournir la qualit et la disponibilit de service exiges (et mesures) par les instances de
rgulation.
Mythe n 2 : le data mining ne serait pas encore viable pour des applications professionnelles
Le data mining est une technologie viable et ses rsultats professionnels sont hautement
priss. Ceux qui propagent le mythe en question sont en gnral les mmes qui se trouvent
contraints dexpliquer pourquoi ils n'utilisent toujours pas cet outil. Leur discours s'articule
autour de deux arguments lis. D'aprs le premier : Il est impossible d'utiliser efficacement
de grandes bases de donnes . Quant au second, il stipule que : Le data mining ne peut

CCB

Michel Bruley

16/37

pas s'effectuer dans le moteur de lentrept de donnes . Ces deux points ont certes t vrais
une certaine poque. Mais noublions pas qu'il a longtemps t vrai aussi que les avions ne
pouvaient pas quitter le sol.
Rpondons simultanment ces deux arguments. Les bases de donnes sont aujourd'hui
tellement vastes, que les entreprises craignent que l'architecture informatique supplmentaire
ncessaire aux projets de data mining n'entrane d'normes cots, et que le traitement des
donnes exig pour chaque projet ne soit trop long. C'est oublier que certaines des bases de
donnes modernes utilisent dsormais une technologie de traitement en parallle, qui
autorise lextraction de donnes au sein de la base. Lextraction de donnes dans la base
permet aux entreprises de supprimer les dplacements de donnes, dexploiter les
performances du traitement en parallle, de rduire la redondance des donnes et d'annuler
les cots de cration et de maintenance d'une base de donnes distincte et redondante ddie
au data mining. La combinaison de lextraction des donnes dans la base de donnes et du
traitement en parallle donne une technologie de data mining parfaitement viable.
La vraie question ne concerne donc pas la viabilit de la technologie du data mining mais
consisterait plutt se demander : " Comment le data mining peut-il m'aider amliorer
lactivit de mon entreprise ? " Dans le secteur des tlcoms, le data mining est une pratique
dsormais prouve qui a donn de vrais rsultats avec un retour sur investissement rapide
dans de nombreux secteurs, notamment la relation client, la gestion des campagnes de
marketing, la mesure de la valeur client, la gestion financire ou l'optimisation de l'assurance
de revenus et des performances rseau, pour n'en citer que quelques-uns.
Mythe n 3 : le data mining exigerait une base de donnes distincte et ddie
A en croire les prestataires de data mining, il serait indispensable de disposer d'outils
onreux et ddis (base de donnes, data mart ou serveur analytique) pour mettre en place
cette technique. Ils invoquent pour cela la ncessit d'extraire les donnes sous un format
propritaire pour un traitement efficace. Or, non seulement ces data marts sont coteux
l'achat et la maintenance, mais ils exigent que les donnes soient extraites pour chaque
projet distinct de data mining, ce qui reprsente une procdure coteuse et fortement
consommatrice de temps.
Heureusement, les progrs raliss dans le domaine des bases de donnes n'exigent plus
d'effectuer le data mining dans un data mart distinct. En ralit, pour une opration de data
mining efficace, il faut pouvoir disposer d'un entrept de donnes l'chelle de l'entreprise,
ce qui, au regard du cot d'investissement total, se rvle considrablement moins cher que
d'utiliser des data mart distincts.
Voici pourquoi. Au fur et mesure que les socits mettent en place des projets de data
mining dans l'ensemble de l'entreprise, le nombre d'utilisateurs exploitant les modles de
data mining ne cesse de crotre, de mme que les besoins d'accs de larges infrastructures
de donnes. Un entrept de donnes d'entreprise d'avant-garde ne se contente pas de stocker
efficacement l'ensemble des donnes de l'entreprise et de rendre largement inutiles d'autres
data marts ou d'autres entrepts. Il constitue galement les fondations idales pour des
projets de data mining, en fournissant un rpertoire de donnes unique l'chelle de
l'entreprise, capable d'offrir une vision cohrente et actualise de la clientle. En outre,
l'intgration d'extensions de data mining au sein de l'entrept de donnes permet
l'entreprise de raliser deux types d'conomies supplmentaires. Tout d'abord, il n'est plus

CCB

Michel Bruley

17/37

ncessaire d'acheter et d'assurer la maintenance de matriel supplmentaire uniquement


ddi au data mining. Ensuite, les entreprises voient se rduire la ncessit deffectuer un vaet-vient de donnes depuis et vers l'entrept pour raliser les projets de data mining, ce qui,
nous l'avons vu, est une opration gourmande en travail et en ressources.
Par exemple, l'un des plus grands oprateurs de tlphonie mobile aux USA utilise un EDW
(Enterprise Data Warehouse, entrept de donnes d'entreprise) centralis pour fournir des
informations une large gamme d'applications commerciales, depuis l'attention la clientle
jusqu'au marketing. Il n'en a pourtant pas toujours t ainsi. Cet oprateur, desservant de
nombreux marchs rgionaux, a t conduit tablir diffrents data marts rgionaux. Obtenir
une vue holistique des informations l'chelle de l'entreprise tait devenu pour le moins
difficile. Les prises de dcision souffraient de labsence de donnes ou dinformations
cohrentes, ce qui affectait le moral d'une quipe qui ne pouvait pas visualiser le fruit de son
travail.
En transfrant le tout vers un EDW centralis, cet oprateur a pu constater des rsultats
immdiats. Les donnes taient devenues cohrentes, les dcisions pouvaient tre prises en
toute scurit, avec l'assurance que les donnes reposaient sur des fondations saines. En
termes de performances, le nouvel EDW dlivrait des informations cohrentes presque 90 %
plus vite qu'avec l'ancienne approche par data marts fragments. Lorsquil est ncessaire
danalyser de grandes quantits de donnes, de tels gains de performances font la diffrence
entre tre prsent le premier sur un march en se fiant son seul instinct, et sy prsenter en
sachant que les dcisions prises l'ont t sur la base d'informations tires du comportement
rel des clients.

Mythe n 4 : il faudrait tre polytechnicien pour faire du data mining


Certains estiment que le data mining est une technologie si complexe qu'il faut au moins
trois polytechniciens pour la matriser : un spcialiste en statistiques ou en mthodes
quantitatives, un commercial fin connaisseur de la clientle et un informaticien.
La vrit oblige dire que bien des projets russis ont t mens bien sans l'aide d'un seul
de ces polytechniciens. On peut citer l'exemple d'une socit sud-amricaine de
tlcommunications qui a russi reprer des changements dans le comportement de ses
clients, ce qui lui a permis de conserver 98 % de ses clients valeur leve en pleine priode
de drgulation. Ce succs est mettre au crdit d'une quipe multidisciplinaire travaillant en
collaboration.
Le data mining demande un effort de collaboration de la part d'un personnel qualifi dans
trois domaines. Les commerciaux doivent guider le projet en crant une srie de questions
commerciales spcifiques, puis interprter les rsultats obtenus. Les concepteurs de modles
analytiques, forms aux techniques, aux statistiques et aux outils du data mining, doivent
construire un modle fiable. Les informaticiens doivent apporter leurs comptences dans le
traitement et la comprhension des donnes, ainsi que leur indispensable soutien technique.
Mythe n 5 : le data mining serait rserv aux grandes entreprises disposant d'un large
volume de donnes client

CCB

Michel Bruley

18/37

La ralit est que toute entreprise, quelle que soit sa taille, possdant des donnes qui
refltent avec prcision son activit o sa clientle peut s'en servir pour construire des
modles et en tirer des informations prcieuses sur ses dfis commerciaux majeurs. Le
volume des donnes clients d'une socit n'a jamais t en cause.
Par exemple, un oprateur de taille moyenne de tlphonie mobile dans la rgion
Asie/Pacifique se trouvait confront un problme de fraude. Il a fait appel une base de
donnes centralise pour analyser plus vite lhistorique dtaill de ses appels et pour mieux
comprendre le comportement de sa base client. La dtection des utilisations et des
abonnements frauduleux n'a ainsi pris que quelques jours au lieu de plusieurs mois et
l'oprateur a pu constater une diminution des pertes dues la fraude de 60 %. l'heure o
les oprateurs subissent une pression croissante les poussant augmenter leur nombre
d'abonns et amliorer le revenu moyen par utilisateur, la possibilit d'agir positivement
sur le bilan sans avoir conqurir de nouveaux abonns ni augmenter lARPU a eu des
consquences bnfiques notables sur les performances financires de l'oprateur en
question. Bien quil ait d crer la base de donnes pour traiter spcifiquement son problme
de fraude, l'oprateur en a rapidement tir bien d'autres profits. Les conomies ralises
grce aux oprations informatiques et l'intgration des systmes ont permis de raccourcir
les cycles de dveloppement d'applications en exploitant les donnes provenant de l'entrept
de donnes, et de rduire les cots de 30 50 %. Une fois ces bnfices constats, des
dpartements de plus en plus nombreux se sont mis utiliser la base de donnes, permettant
ainsi l'accs rapide aux informations commerciales stratgiques et de promptes prises de
dcisions dans des domaines tels que le churn, les activations quotidiennes et les flux de
revenus. Les utilisateurs ont pu constater que des informations qui n'taient auparavant
accessibles qu'au bout de plusieurs semaines ou plusieurs mois taient dsormais accessibles
de faon quotidienne.
Profitez-en
En conclusion : le data mining n'est plus aujourd'hui ni lent, ni coteux ni d'utilisation trop
complexe. La technologie et le savoir-faire commercial existent et permettent de mettre en
place un processus efficace et conome. Des compagnies de tlcommunications de tailles
diverses font partie des entreprises qui ont dcid de mettre les vieux mythes l'preuve et
de prouver que le data mining est un processus essentiel pour pouvoir prosprer dans un
univers professionnel domin par une concurrence froce et par l'obsession du client.

En analyse de donnes comme en cuisine, la russite se joue en grande partie


avec les ingrdients
Tout cuisinier sait que la russite d'un chef-d'uvre culinaire, comme des macarons, rside
en grande partie dans les ingrdients. Il est difficile de prparer un excellent repas si les
ingrdients sont mauvais ou si leur combinaison n'est pas adquate. Il en va de mme pour
l'analyse de donnes. Si les donnes sont incompltes, inexactes ou sans rapport avec le
problme rsoudre, il sera difficile, voir impossible, de crer un modle. Par exemple, si le
modle de calcul de la valeur des clients attribue un faible score certains clients rentables
car les transactions en ligne ou les commandes spciales ne sont pas prises en compte, il y a
le risque de perdre certains des meilleurs clients. Lefficacit dun modle d'analyse de
donnes est donc directement proportionnelle la qualit des donnes. En d'autres termes,
ont ne peut pas faire de bons macarons avec de mauvais ingrdients.

CCB

Michel Bruley

19/37

L'analyse de donnes exploite des algorithmes de statistiques et d'apprentissage automatique


pour trouver des informations qui peuvent contribuer rsoudre les problmes quotidiens
que rencontrent les entreprises. Lorsque les utilisateurs font de l'analyse de donnes, ils
mettent en uvre en gnral des algorithmes mathmatiques tels que des rseaux
neuronaux, des arbres de dcision et d'autres techniques statistiques complexes qui servent
rechercher des tendances dans les donnes. S'il est vrai que ces algorithmes sont une partie
importante de l'analyse de donnes, il convient de noter que ces outils recherchent des
tendances dans n'importe quelles donnes, quelle que soit les capacits de ces dernires
reprsenter les comportements et les tendances que lon essaye de modliser. Pour cette
raison, la prparation des donnes est l'une des tapes les plus critiques dans l'analyse de
donnes et pourtant, il s'agit souvent de l'une des tapes les plus ngliges.
La premire tape dans la prparation des donnes consiste recueillir les donnes relatives
au problme rsoudre. Si un utilisateur possde un entrept de donnes d'entreprise, le
processus est considrablement simplifi. Au contraire, si les donnes sont stockes en
divers endroits, il faut explorer plusieurs sources afin d'identifier les donnes disponibles
pour rsoudre le problme. Ds que les donnes qui doivent tre analyses sont dfinies, il
convient de les intgrer, les valuer et ventuellement les transformer pour sassurer qu'elles
sont valides d'un point de vue conceptuel, cohrentes et statistiquement analysables. Par
exemple, si les donnes proviennent de diffrentes sources, il faudra rsoudre de nombreux
problmes de formats et de dfinitions.
Mme si un utilisateur a la chance d'avoir un entrept de donnes dentreprise, il est possible
que les donnes qu'il contient ne conviennent pas en ltat pour lanalyse envisage. Il est
indispensable alors disoler et de prparer les donnes pour le modle. Cela signifie quil
faut travailler en collaboration avec les analystes et les experts en donnes afin de dfinir les
lments qui sont ncessaire pour raliser le modle. Il est primordial, pour chaque variable,
de dfinir sil faut utiliser toutes les donnes ou uniquement un sous-ensemble. Il convient
aussi de dfinir une stratgie pour traiter les valeurs aberrantes (donnes hors norme) ou
ventuellement dvelopper quand mme un modle reposant sur ces valeurs. Par exemple, si
lobjectif est de prvoir les taux de frquentation et les revenus de rencontres sportives, il
faut certainement liminer les chiffres de frquentations anormales dues des vnements
particuliers, grve des transports, etc. Au contraire dans le cas de la dtection de fraudes, il
peut-tre pertinent de se concentrer sur certaines valeurs aberrantes car elles sont peut-tre la
reprsentation de transactions frauduleuses.
Une fois que les donnes sont slectionnes, il convient de les analyser l'aide de techniques
de statistiques descriptives et de visualisation pour identifier les problmes de qualit et
mieux comprendre les caractristiques des donnes. Des problmes de qualit des donnes
peuvent tre mis en lumire, tels que des valeurs manquantes qui peuvent nuire l'intgrit
de n'importe quel modle d'analyse. Il faut alors compenser et corriger les problmes
identifis. Ainsi, s'il manque des donnes, il faut dterminer la meilleure mthode pour
abandonner ou remplacer ces valeurs manquantes. Certaines techniques d'analyse de donnes
permettent destimer les valeurs manquantes sur la base d'autres valeurs mesures.
Il existe de nombreuses techniques qui peuvent tre employes pour obtenir de meilleurs
modles. Il s'agit par exemple de crer des variables "drives", de remplacer des valeurs
manquantes ou dutiliser des techniques d'agrgation ou de rduction des donnes. Il peut
tre ncessaire de rechercher les meilleurs agrgats ou de nouvelles variables analytiques

CCB

Michel Bruley

20/37

pour construire un modle optimum. Par exemple, dans le cadre de la prparation des
donnes relatives aux clients en vue d'un programme de marketing pour un nouveau prt, le
rapport endettement/revenu peut tre un indicateur mieux adapt que le seul revenu ou le
seul endettement.
Enfin, les donnes doivent tre transformes dans un format adapt aux algorithmes
d'analyse. De nombreux algorithmes d'analyse de donnes requirent la transformation des
donnes de classification (non numriques) en donnes numriques ou la rduction de cellesci dans une plage particulire. Certains algorithmes et techniques statistiques ncessitent
galement que les donnes numriques possdent des proprits spcifiques qui n'existent
peut-tre pas dans les donnes avant la transformation. Pour ces variables, il faudra peut-tre
les encoder nouveau ou les transformer pour produire les variables adquates pour les
techniques d'analyse de donnes. Ainsi la valeur des donnes est directement proportionnelle
au temps et au soin consacr leur prparation en vue de rgler un problme analytique
particulier. A l'instar de ce que dirait un ptissier, la qualit du rsultat final dpend en
grande partie des ingrdients.
Comme il l'a t dit plus haut, la prparation des donnes est un processus qui peut prendre
du temps. En fait, les spcialistes de l'analyse de donnes qui comprennent l'importance de la
prparation peuvent passer jusqu 70 pour cent de l'ensemble du processus d'analyse,
l'tude et au prtraitement des donnes. Ils agissent ainsi du fait du caractre ncessairement
itratif de la prparation des donnes. Lors de l'tude et du traitement pralable, l'analyste
ralise des expriences avec les donnes. Il examine les relations entre les variables et ceci
peut ncessiter plusieurs itrations de requtes ad hoc ou d'autres analyses sur un volume
important de donnes. Jusqu'il y a peu cette prparation tait difficile car la majorit des
outils d'analyse de donnes ne fournissait pas les fonctions ncessaires pour effectuer avec
efficacit l'tude et le traitement de large volume de donnes, et ceci tait un inconvnient
majeur pour les spcialistes de l'analyse de donnes.
Les personnes qui savent que ces tches de prparation des donnes sont ncessaires et trs
utiles, mettent en uvre des moyens techniques compliqus, comme l'analyse de grands
volumes de donnes. La majorit d'entre elles prpare les donnes directement dans les bases
afin d'viter de devoir dplacer de grands volumes de donnes vers un serveur ou un poste de
travail ddi lanalyse de donnes. Cette mthode a fait ses preuves et les spcialistes de
l'analyse de donnes ont souvent utiliss des programmes SQL quils ont fait spcifiquement
dvelopps ou bien ils ont appris eux-mmes le langage SQL. Ceci tant dit, l'on observe une
volution nette en la matire vu les progrs raliss dans les technologies de gestion de
donnes.
Il existe dsormais des alternatives aux programmes SQL dvelopps manuellement pour
la prparation des donnes. De nouvelles solutions telles que les technologies de gnration
SQL au sein des bases de donnes permettent de raliser la prparation des donnes
directement au sein de la base d'une entreprise. Au lieu de dplacer les donnes vers l'outil,
des solutions du type Analytical Data Set Generator (Gnrateur de jeux de donnes
analytiques) permettent de placer les fonctions ncessaires et les traitements directement au
sein dune base de donnes. Ces solutions acclrent non seulement l'analyse grce
lutilisation du moteur de base de donnes qui prend en charge toutes les fonctions d'analyse,
mais ils offrent galement des fonctions qui facilitent et dans certains cas automatisent des
tches de prtraitement des donnes. Les fonctions dexploration de donnes sont

CCB

Michel Bruley

21/37

particulirement efficaces au niveau du profilage des donnes grce une intelligence


intgre qui analyse et transforme les donnes.
Les modules de cration de variables et de transformation de variables au sein dun ADS
Generator favorisent le recours aux meilleures pratiques en matire de prparation des
donnes. Les interfaces conviviales permettent d'analyser rapidement et efficacement les
donnes de plusieurs tables. Les rsultats de ces analyses sont prsents dans des tableaux et
des graphiques faciles interprter. Cela signifie que l'tude et le prtraitement des donnes,
qui ncessitaient des semaines de travail, peuvent tre dsormais raliss en quelques jours,
voire en quelques heures. Cela reviendrait pouvoir prparer de meilleurs macarons en un
temps record peut-tre mme en quelques minutes. Le plus grand des ptissiers serait
combl.
Les technologies de prparation des donnes telles que lADS Generator font que l'tude et
le prtraitement des donnes ne prennent plus autant de temps que par le pass. Au contraire,
grce ces nouvelles technologies, la prparation des donnes est devenue beaucoup plus
simple, plus facile et plus rentable. Pensez-y la prochaine fois que vous mangerez un
macaron.

Fouille de Donnes : une dmarche en cinq tapes !


Pour mettre en place une approche de fouille de donnes, il ne sagit pas uniquement de
choisir la bonne technique statistique. Il faut bien plus quune bonne technique statistique.
Les spcialistes dvelopp un cadre formel de fouille de donnes qui couvre en particulier
deux activits primordiales de ce type dapproche : la gestion de projet et le transfert des
connaissances. La fouille de donnes doit tre organise selon cinq tapes conscutives :
identification des problmes de lactivit, prparation de larchitecture, prparation des
donnes, analyse et livraison des connaissances.
Durant la premire tape, il convient didentifier, de prciser et de qualifier les questions
pour la fouille de donnes. Il sagit didentifier aussi la meilleure dmarche mettre en
uvre pour rpondre aux questions sachant quil existe de nombreuses techniques danalyse
commerciale, et que parmi celles-ci la fouille de donnes est celle qui ncessite le moins de
ressources. Il faut se poser les questions suivantes pour dfinir si la fouille de donnes
convient : Les rponses aux questions ncessitent-elles la comprhension de relations
complexes entre plusieurs variables ? Y a t il des questions pr requises auxquelles il faut
rpondre ? Quelles sont-elles ? Les rponses aux questions ncessitent-elles des dductions
relatives un phnomne ou lavenir ? Les rponses dcriront-elles des phnomnes
complexes ? Quel est le niveau de technologie requis pour grer la complexit des rponses
aux questions ?
Durant la prparation de larchitecture, il convient dtudier les aspects techniques de la
dmarche et dlaborer un plan. Par exemple, il faut envisager et planifier les implications
techniques de lajout dun modle danalyse et de nouvelles infrastructures larchitecture
logicielle et matrielle actuelle. Il faut aussi identifier les logiciels danalyse qui conviennent
pour rpondre aux questions dfinies, fixer les rapports entre les modles danalyse et
dautres applications, identifier le besoin dautres technologies, mettre en lumire les
contraintes et les limites au niveau de linfrastructure, dcrire les caractristiques de
lenvironnement de production requis pour utiliser et maintenir les modles analytiques, et

CCB

Michel Bruley

22/37

enfin dfinir tous les problmes de transport de donnes entre le modle analytique et les
environnements de production.
Lors de la prparation des donnes, il faut en outre identifier, extraire et valider de grands
chantillons de donnes, les dplacer dans lenvironnement danalyse, tester leur pertinences
par rapport aux problmes rsoudre et enfin dvelopper, affiner les modles prliminaires
afin de garantir des rsultats encore plus solides.
La prparation des donnes nest pas une tche insignifiante. Elle reprsente en gnral 70%
du dlai. Les entreprises qui ont dj nettoy et transform leurs donnes dans un entrept
ont une longueur davance, mais il leur reste quand mme du travail. En effet, les seuils de
qualit des donnes pour la fouille de donnes sont bien plus levs que ceux pour les
utilisations habituelles dun entrept de donnes. Par exemple, il est ncessaire de passer les
donnes en revue la recherche des valeurs nulles qui sont inacceptables dans le cadre de
certaines techniques danalyse. Une fois que les valeurs nulles sont connues, il faut dcider
soit de remplacer ces valeurs nulles par des valeurs raisonnables et utiles ou soit tout
simplement de supprimer les enregistrements correspondants. Il faut valuer galement le
caractre variable de chaque lment pour sassurer que les donnes ont suffisamment
chang pour garantir des infrences fiables et valides. Enfin, alors que les premires
informations slectionnes sont mieux connues il faut explorer dautres donnes qui
pourraient venir les complter. Il nest pas rare de tester de grands chantillons de donnes
avant de trouver la slection de donnes pertinentes pour rpondre aux objectifs et aux
critres de qualit.
Ensuite il convient de passer la phase danalyse qui recouvre le dveloppement, lessai et la
validation des modles analytiques. La modlisation analytique marque le dbut des choses
srieuses et la fin de cette tape les rponses aux questions que se posait lentreprise sont
donnes et documentes. Lorsquil a t vrifi que le modle fournit des rsultats valides et
utiles, lapplication pour les utilisateurs peut tre dveloppe afin que les modles puissent
tre intgrs dans les processus habituels de lentreprise. A ce stade il convient dorganiser
plusieurs sances de formation pendant la livraison des connaissances destines ceux qui
utiliseront, entretiendront et rafrachiront les modles.
La dure moyenne dun premier projet de fouille de donnes est de trois mois (4 semaines
pour certains et 6 mois pour dautres). La complexit des problmes, les exigences au niveau
de larchitecture et des technologies, limportance de la prparation des donnes, la
complexit des analyses et lampleur du transfert de connaissances influencent la dure dun
projet de fouille de donnes.
Tant tout les cas il est impratif de trs bien dfinir le problme rsoudre et de sassurer
que la fouille de donnes est la solution la plus adapte. Les questions les mieux traites
grce la fouille de donnes sont celles qui cherchent expliquer un phnomne
relativement complexe ou qui ont une infrence sur des vnements ou un comportement
futur. Les questions qui ncessitent une synthse ou une simple description laide de
quelques variables sont traites plus efficacement avec les techniques traditionnelles de
prises de dcision et les statistiques descriptives.
Pour les projets de fouille de donnes, il convient de slectionner des individus qui sont
curieux, qui font preuve dune capacit de rflexion analytique et qui ont dexcellentes
aptitudes en technologies de linformation. Un diplme en statistiques ou en mathmatiques

CCB

Michel Bruley

23/37

appliques est souhaitable, mais pas toujours indispensable. Dautre part, une participation
active des experts de lactivit et des utilisateurs des rsultats de la fouille de donnes est
critique pour la russite de ce type de projet. Les individus qui ont travaill en tant
quanalystes dentrept de donnes ou qui ont assur la liaison entre les spcialistes de
lactivit et les spcialistes des technologies de linformation possdent de nombreuses
aptitudes au niveau de la rsolution de problmes, et jouissent de lexprience ncessaire
pour assurer la russite des projets de fouille de donnes. Les collaborateurs expriments
qui ont dvelopp des entrepts de donnes et qui connaissent leur utilisation complexe sont
dexcellents candidats, car ils connaissent dj le sens que revt lentrept de donnes pour
lentreprise et le pourquoi et le comment des lments dvelopps. Lapprentissage des
techniques analytiques et statistiques requises pour un projet de fouille de donnes particulier
prend bien moins de temps que la comprhension en profondeur du contenu et de la logique
de la base de donnes.
Enfin dun point de vue technique, il est prfrable de raliser les qualifications, les examens
et les analyses des donnes au sein de lentrept de donnes autant que possible. Comme
cela a t dit plus haut, lidentification de donnes pertinentes et dexcellente qualit occupe
la plus grande partie du temps. Cela sexplique pour deux raisons : tout dabord, lorsque des
donnes ne satisfont pas aux critres de qualit, il faut revenir dans la base de donnes afin
dy rechercher dautres lments valuer. Plus vous en apprenez sur les donnes, plus vous
dcouvrez de nouvelles options et de nouveaux points de vue qui peuvent requrir un
raffinement de lapproche analytique et la slection dautres donnes. Globalement ce
processus implique de nombreuses itrations et tout cela est facilit si les oprations se font
au sein de lentrept de donnes..

Fouille de Donnes : les biens faits des approches en laboratoire !


Tous ceux qui envisagent la fouille de donnes un certain moment partagent une mme
caractristique, ils sinterrogent sur de nombreux points et notamment sur lintrt dune
telle approche. Vu que gnralement nous apprenons grce aux exemples, la plupart de ces
interrogations portent sur ce que font les autres spcialistes de la fouille de donnes : quels
problmes rsolvent-ils laide des technologies de fouille de donnes ? Comment sy
prennent-ils ? Combien de temps leur faut-il ? En retirent-ils quelque chose ? Dans le but
daider les entreprises qui tudient la valeur de la fouille de donnes, des socits de conseil
ont mis sur pied des laboratoires de fouille de donnes. Ils offrent aux entreprises le cadre,
les conseils et les outils pour tester la fouille de donnes et raliser des projets pilote avant de
mettre en uvre leurs propres solutions.
Par exemple, il sagit de se focaliser sur une ou deux questions spcifiques relatives au
comportement des clients et en particulier pouvoir les catgoriser. Ainsi, une grande banque
internationale voulait contrler les cots gnrs par ses clients lorsquils utilisaient les
distributeurs automatiques dautres banques. La socit voulait obtenir une rponse pour
chacune des quatre questions suivantes : Quest-ce qui constitue une utilisation excessive par
le client des distributeurs automatiques de la concurrence ? Quels sont les clients qui
gnrent des cots excessifs par lutilisation des distributeurs automatiques de la
concurrence ? Quelle est la valeur quils reprsentent pour notre banque ? A quoi devonsnous prter attention lorsque nous utilisons ces rsultats ?

CCB

Michel Bruley

24/37

La premire dcouverte fut que 10% des clients de la banque gnraient 90% des cots des
distributeurs automatiques. Cette constatation aurait peut-tre pu tre faite laide de
moyens traditionnels. Cependant, grce la fouille de donnes, il a pu tre mis en vidence
le fait que sur les 10% des clients qui gnraient les cots, 80% taient des clients de faible
valeur. Ensuite laide de plusieurs techniques de fouille de donnes permettant de prendre
en compte de multiples variables, il a t possible de comprendre la valeur potentielle de
chacun des clients de faible valeur et quantifier le concept d utilisation excessive . La
fouille de donnes a galement permis de rpondre la question logique suivante que devait
se poser la banque : fallait-il revoir le service offert ces 80% de clients de faible valeur ?
Lanalyse montrer quenviron 30% de ces clients de faible valeur taient des clients fort
potentiel, savoir : des tudiants. Ce ntait certes pas une dcouverte surprenante mais elle
aurait t difficilement ralisable sans lanalyse de multiples variables.
La dcouverte la plus intressante ralise dans le cadre de la rsolution du problme du cot
des distributeurs automatiques fut quun concurrent ciblait les campus universitaires en vue
dy installer de nouveaux distributeurs automatiques. Aucune autre banque ne dveloppait
dactions sur les campus et celle-ci jouissait dune prsence quasiment exclusive. Grce
cette exprience en fouille de donnes, la banque pu rpondre ses questions initiales. Mais
ce qui est encore plus important, cest quelle fut en mesure de dcouvrir la stratgie dun
concurrent.
Lintrt suscit par la fouille de donnes varie en fonction des secteurs. Il semblerait que le
marketing et les finances marquent le plus dintrt pour la fouille de donnes. Les
spcialistes du marketing doivent matriser le retour sur investissement de leurs oprations et
pour cela, ils cherchent cibler les campagnes sur les clients les plus susceptibles dacheter
un produit ou un service particulier. Les dpartements financiers sont intresss par la
possibilit daligner le cot des services sur les revenus (ou les revenus potentiels) tirs dun
client ou dun segment de clients. Parmi les principales priorits de ces groupes, citons la
comprhension et la rduction de lattrition.
Exemple dun cas classique de modlisation des rponses marketing. Une entreprise de
tlcommunication obtenait un taux de retour de 0,5% sur ses campagnes marketing. Elle
souhaitait dcouvrir les clients les plus susceptibles dacheter des services groups. Cette
entreprise envisageait le dveloppement de capacits en matire de fouille de donnes mais
elle voulait dabord voir comment la fouille de donnes fonctionnait. Avec laide dune
socit spcialise, un modle de propension lachat a t cr afin daider lentreprise
prvoir les services qui, une fois groups, seraient susceptibles dtre achets par des clients
particuliers. Le dploiement du modle dans un territoire de vente test sest traduit par une
augmentation dun facteur 10 des ventes de services groups. Ces rsultats dmontrrent
lexactitude des prvisions du modle et convainquirent lentreprise de lefficacit de la
fouille de donnes. Les rsultats de ce test restreint furent tels que lentreprise a depuis lors
appliqu le modle au niveau national. Lentreprise a galement suffisamment appris sur les
procdures de fouille de donnes que la socit spcialise utilise, et a suffisamment
dvelopp ses aptitudes au niveau des outils danalyse quelle dveloppe aujourdhui ses
modles de manire indpendante.

CCB

Michel Bruley

25/37

Faire son Data Mining directement dans son Entrept de Donnes


Le Data Mining est une puissante technique d'analyse qui par exemple permet des
responsables d'entreprises daller plus loin que la simple description des comportements
passs d'une clientle et de prdire l'avenir. Il permet de dceler dans les comportements
mystrieux des clients des rgles qui les sous-tendent. Grce ces dcouvertes, il est
possible d'augmenter les revenus, de rduire les dpenses, d'identifier des opportunits
commerciales et donc de bnficier d'avantages concurrentiels certains.
Mais en croire certains fournisseurs de solutions et de prestations de data mining, il serait
indispensable de disposer d'outils ddis (base de donnes, data mart ou serveur analytique)
pour faire du data mining. Ils invoquent pour cela la ncessit d'extraire les donnes sous un
format propritaire pour raliser des traitements efficaces. Or, non seulement ces moyens
spcialiss sont onreux mettre en place et maintenir, mais ils exigent que les donnes
soient extraites pour chaque projet distinct de data mining, ce qui reprsente une procdure
coteuse et fortement consommatrice de temps. Heureusement, les progrs raliss dans le
domaine des bases de donnes n'exigent plus d'effectuer le data mining dans des data marts
distincts. En ralit, pour une opration de data mining efficace, il suffit de sappuyer sur son
entrept de donnes, ce qui, au regard du cot d'investissement total, se rvle
considrablement moins cher que d'utiliser des moyens spcifiques.

Illustration 9
Au fur et mesure que les socits mettent en place des EDW (Enterprise Data Warehouse,
entrept de donnes d'entreprise) et couvrent l'ensemble des besoins dcisionnels des
diffrentes divisions et fonctions de lentreprise, le nombre d'utilisateurs exploitant des
modles de data mining ne cesse de crotre. En effet un EDW bien architectur ne se
contente pas de stocker efficacement l'ensemble des donnes historiques, il rend inutiles
d'autres data marts ou d'autres moyens spcialiss de stockage. Un EDW constitue la
fondation idale pour des projets de data mining, en fournissant un rpertoire de donnes
unique l'chelle de l'entreprise, capable d'offrir une vision cohrente et actualise des
activits. En outre, l'intgration de fonctionnalits de data mining au sein de lEDW permet

CCB

Michel Bruley

26/37

l'entreprise de raliser deux types d'conomies supplmentaires. Tout d'abord, il n'est plus
ncessaire d'acheter et d'assurer la maintenance dun matriel complmentaire uniquement
ddi au data mining ; ensuite les entreprises ne sont plus obliges deffectuer un va-et-vient
de donnes depuis et vers l'entrept pour raliser les projets de data mining, ce qui, nous
l'avons vu plus haut, est une opration gourmande en temps et en ressources.
A titre dexemple, l'un des plus grands oprateurs de tlphonie mobile aux USA utilise
aujourdhui un EDW pour fournir des informations une large gamme d'applications
commerciales et marketing. Cet oprateur, desservant de nombreux marchs rgionaux, avait
t conduit tablir diffrents data marts rgionaux, et obtenir une vue densemble des
informations l'chelle de l'entreprise tait devenu particulirement difficile. Les prises de
dcision souffraient de labsence de donnes ou dinformations cohrentes, ce qui affectait
les performances et le moral des quipes qui ne pouvaient pas anticiper et mesurer le fruit de
leur travail. En transfrant toutes ses donnes vers un EDW, cet oprateur a pu constater des
rsultats immdiats. Les donnes taient mises en cohrence, les dcisions pouvaient tre
prises en toute scurit, avec l'assurance que les donnes reposaient sur des fondations
saines. En termes defficacit, le nouvel EDW dlivre des informations dune meilleure
qualit 90% plus vite qu'avec l'ancienne approche par data marts. Lorsquil est ncessaire
danalyser de grandes quantits de donnes, de tels gains permettent de faire la diffrence sur
le march.

Fouille de Donnes et PMML : vers une extraction de donnes plus rapide, plus
facile et moins coteuse
Si une socit perd 25 millions de dollars par mois, lextraction des donnes peut prendre un
caractre trs urgent. Cest ce quendurent de nombreuses grosses socits de
tlcommunications sans fil elles subissent un taux de rotation moyen du secteur de 2,4%,
ce qui se traduit par une perte mensuelle de plusieurs centaines de clients. Avec un revenu
mensuel moyen de 45 par client, ces dfections cotent plus de 250 millions d par an aux
grosses socits. Lextraction des donnes permet aux fournisseurs de tlcommunications
sans fil dattnuer ces pertes. En appliquant des mthodes danalyse avances ce problme,
un fournisseur peut collecter des informations, des prvisions, des descriptions, des notations
et des profils. Grce tout cela, le prestataire de services peut prvoir quels clients sont les
plus susceptibles de lui tre infidle et prendre les mesures appropries pour lutter contre
lattrition. En outre, comme les clients ne partent pas tous pour les mmes raisons,
lextraction de donnes permet aux fournisseurs de tlcommunications sans fil de faire des
offres et de proposer des promotions personnalises aux clients concerns.
Cependant de nombreux analystes utilisent encore une approche traditionnelle dextraction
de donnes laide de serveurs analytiques. Cette approche exploite les nombreux outils
analytiques dun serveur ddi qui permettent un haut niveau de flexibilit. Mais
lvolutivit face un volume croissant de donnes nest pas au rendez-vous. Ce manque
dvolutivit et de rapidit vient du fait que les modles dextraction de donnes ne peuvent
pas tourner assez vite pour rpondre aux besoins de lentreprise, et par consquent que les
informations commerciales ne peuvent pas tre mises la disposition des reprsentants des
services clients ou de la direction. Prenons lexemple de notre hypothtique fournisseur de
communications sans fil le temps quil finisse danalyser ses donnes historiques son client
est dj parti.

CCB

Michel Bruley

27/37

La capacit extraire et analyser les modles qui se cachent sous des montagnes de
donnes peut permettre aux organisations de mieux comprendre le comportement de leurs
clients, les tendances de leurs marchs et donc de tirer profit de leurs informations.
Ladoption dune norme qui vient de faire son apparition le PMML ou Predictive Model
Markup Language, sous XML, peut nettement faciliter les choses. Cette norme ouverte
utilise pour dcrire des modles statistiques et dextraction de donnes, permet de dfinir
puis de partager des modles prdictifs entre applications. Cest le rsultat du travail du Data
Mining Group, un consortium dditeurs de logiciels fond en 1998 afin de dvelopper des
normes dextraction de donnes.
La charte PMML consiste permettre une application de produire un modle et une autre
application dutiliser ce modle simplement en lisant le fichier de donnes PMML. Un
modle dvelopp laide dun outil dextraction peut ensuite tre dploy ou exploit sur la
totalit dun entrept de donnes. Mais le PMML a ses faiblesses, surtout quand il sagit de
prparer des donnes brutes en vue danalyse. Avec le PMML, les modles ne sont pas
appliqus directement sur les donnes dtailles de lentrept de donnes, mais sur un jeu
spcialis de donnes slectionnes pour leur valeur prdictive. Elles sont nettoyes ou
transformes, prtes tre traites par les modles analytiques. Le PMML permet certaines
transformations de donnes pour des algorithmes spcifiques. Il est toutefois insuffisant
quand il sagit de grer des processus complexes de nettoyage, de transformation et
dagrgation de toutes les donnes slectionnes pour analyse. Le PMML part du principe
que la prparation pralable des donnes a dj t effectue.
Cependant, si nous examinons le processus de modlisation analytique, il apparat que plus
de 70% du travail rside dans les tapes dexploration et de prparation. Au cours de la
phase dexploration, lanalyste recherche les donnes prsentant des structures rptitives ou
des anomalies. Parmi les techniques les plus couramment utilises, on compte les statistiques
descriptives et la visualisation. Lexploration de donnes est itrative, cest une tche pour
laquelle les donnes sont sollicites de manire intensive et quil est prfrable deffectuer
directement dans la base de donnes. Le prtraitement des donnes comprend la cration du
meilleur modle analytique au moyen de la construction dun jeu de donnes analytiques par
la cration de variables prdictives. Lanalyste remplace les donnes manquantes ou non
valides, et convertit les donnes sous un format adapt aux outils analytiques par exemple,
en remplaant labrviation alphabtique dun tat par une valeur numrique pour le
traitement. La phase de construction, de test et de validation de lextraction de donnes est
particulirement intensive pour les units centrales. Un environnement dextraction de
donnes ouvert permet aux analystes dutiliser leurs outils dextraction de donnes de
prdilection, tout en effectuant les tches lourdes de manipulation des donnes directement
dans la base de donnes.
Dans sa version actuelle le PMML ncessite un coup de pouce. Celui-ci se concrtise sous la
forme doutils qui peuvent tre utiliss pour construire les jeux de donnes analytiques. Ces
outils ont la capacit dexplorer, de nettoyer, de transformer et dagrger des donnes
hautement normalises au sein dun entrept de donnes sous une forme acceptable par un
ventail doutils analytiques.
Des jeux de donnes analytiques permettent dexplorer et dassembler les donnes requises
et de les exploiter laide des outils de modlisation aux normes de votre entreprise. Il sagit
de construire des modles compatibles avec le PMML et de lancer le modle dans la base de
donnes en renvoyant le PMML un consommateur de PMML. Ce qui signifie que les

CCB

Michel Bruley

28/37

activits de dploiement de modles peuvent tre effectues directement partir de la base


de donnes plutt que de devoir tre transfres vers un serveur ddi.
Cette approche permet dexcuter un modle sur toutes les donnes et pas uniquement sur un
sous-groupe. Par exemple, si le fournisseur de tlcommunications sans fil mentionn plus
tt ne pouvait excuter son modle que sur un chantillon de sa clientle, disons sur celle
dont les contrats ont expir, il ne pourrait pas voir les autres sous-groupes de sa clientle
potentiellement insatisfaits. Sil peut consulter la totalit de sa base de donnes, le prestataire
de services peut reprer tous les secteurs de son activit menacs dun taux dattrition
important quelle quen soit la raison.
Ajoutons galement que le fait dexcuter des modles une seule fois par trimestre cause
du cot lev de lextraction de donnes est le meilleur moyen dobtenir des informations
errones. En combinant les capacits du PMML avec un jeu de donnes analytiques, il est
possible dexcuter des modles plus frquemment et de continuer exploiter la totalit du
contenu dun entrept de donnes. Au lieu de transfrer les donnes vers les outils qui
rsident sur un serveur analytique, la mthode du jeu de donnes analytiques permet de grer
les fonctions et les traitements ncessaires directement dans la base de donnes. Les tapes
dexploration et de prtraitement des donnes, qui prenaient plusieurs semaines aux quipes
dextraction, peuvent maintenant se faire en quelques jours voire quelques heures.

Comment choisir un outil dexploration de donnes


Pour slectionner un outil analytique beaucoup dentreprise se contente de prendre loutil
que leurs spcialistes de lexploration de donnes connaissent dj. Cela peut paratre
surprenant, mais comme la grande majorit des personnes qui ont suivi un troisime cycle
ont d utiliser des outils danalyse de SAS Institute ou de SPSS Inc. cette voie est trs
souvent suivie, et cela confirme le principe que dans la nature cest toujours la voie de la
facilit qui prdomine. Cependant pour ceux qui ne veulent pas procder ainsi les quatre
critres suivants devraient faire partie de toute valuation doutils : profondeur de la
technique danalyse, largeur de la technique danalyse, fonctions de traitement des donnes
et facilit dutilisation. (la profondeur fait rfrence la qualit et la fiabilit de chaque
technique danalyse, tandis que la largeur fait rfrence au nombre de techniques danalyse
prises en charge par loutil.)
Il existe de nombreux candidats potentiels sur le march, mais seule une douzaine dentre
eux font rellement ce quils prtendent tre capables de raliser. Lvaluation de la qualit
des algorithmes dissimuls sous les propos marketing requiert une grande exprience en
statistique. Si vous ne disposez pas de cette exprience en interne, il est conseill dengager
un consultant indpendant spcialis dans lanalyse et lexploration de donnes pour vous
aider valuer et rduire le choix des outils. Pour en revenir vos besoins, un outil peut
parfaitement convenir sil traite une ou deux tches danalyse en profondeur, en complexit
et deux ou trois autres superficiellement, pour autant que la profondeur de chaque technique
corresponde la profondeur de lanalyse ncessaire la rsolution de vos problmes. Les
outils danalyse cotent cher et il faut un certain temps avant dapprendre les utiliser
efficacement. Il se peut quune entreprise sache quelle a besoin de tout un ensemble doutils
mais il est prfrable de choisir au dbut un outil qui offre les principales fonctions requises,
dapprendre sen servir correctement et dy ajouter par la suite des fonctions spciales au
fil de lvolution des besoins en exploration de donnes.

CCB

Michel Bruley

29/37

Les deux plus grands soucis lis aux donnes portent sur le volume et la manipulation.
Chaque outil possde une limite de volume. Il est important de voir si cette limite nest pas
trop basse. Si cest le cas, cela signifie que loutil a t conu en tant que moteur danalyse
pour de petits volumes de donnes et non pour lexploration de donnes. La possibilit de
traiter de grands volumes est une exigence rcente et de plus en plus prsente. De nombreux
outils sur le march ont t dvelopps avant lmergence de ces nouvelles exigences au
niveau des volumes et ils nont pas encore mis jour leurs capacits. En plus du volume, la
facilit des manipulations et des transformations des donnes est un facteur important
prendre en considration si vous souhaitez que la prparation des donnes soit efficace et
bien gre. On ninsistera jamais assez sur limportance de dcouvrir et de tester les
caractristiques de chaque donne, jusqu ce que lon soit certain de possder les bons
lments et que lon connaisse toutes leurs caractristiques. En rgle gnrale, la qualit des
rsultats est directement proportionnelle au nombre ditrations prises en charge par loutil.
En manire de facilit dutilisation, comme pour bien dautres choses, plus un outil est
complexe, plus lapprentissage prendra du temps. Il se peut que loutil avec linterface
utilisateur la plus simple et la plus intuitive permettent vos spcialistes de lexploration de
donnes dtre oprationnels trs rapidement, mais il peut galement trs vite atteindre ses
limites face la complexit croissante de lexploration de donnes. Comme je lai dj dit, la
slection de loutil sophistiqu que vos spcialistes de lexploration de donnes connaissent
dj a ses avantages. La phase dapprentissage est raccourcie et il est fort probable quun tel
outil offre une profondeur et une largeur bien plus grande quun outil linterface plus
simple. Une autre stratgie consiste tablir un partenariat avec une personne qui connat
loutil le plus complexe et qui sait comment raliser des explorations de donnes jusqu ce
que votre quipe interne ait acquis les comptences de base pour utiliser cet outil en toute
confiance. Cest ce genre de transfert de comptence qui attire de nombreuses entreprises
aux laboratoires danalyse de donnes de socits de services spcialises.
Alors que les diteurs des outils qui font la course en tte continuent dajouter rgulirement
des fonctions dexploration de donnes et des techniques sophistiques, lexploration de
donnes est de plus en plus efficacement utilise dans le cadre de nombreux processus en
particulier dans les domaines de la commercialisation et de la production. Lamlioration
continue des outils permet une meilleure exploitation des entrepts de donnes, si bien que
lexploration de donnes attire un nombre croissant dadeptes. Et ce nombre croissant
dutilisateurs aux ides diverses va faire que lexploration de donnes deviendra de plus en
plus une discipline qui renforcera la qualit de la prise de dcision en entreprise.

CCB

Michel Bruley

30/37

Propos sur lanalyse


Lanalyse est un processus structur de construction, traitement et production
dinformations. Linformation, est la fois matire premire et produit gnr. La pertinence
de lanalyse dpend en partie de la qualit et parfois de la quantit des informations prisent
en compte. Mais par-dessus tout lanalyse ncessite une srieuse dose de rigueur (dmarche
mthodique). Cependant il ne faut pas tomber dans un excs de rigueur, dans des analyses
trop pointillistes interdisant une vue densemble et amenant ne pouvoir conclure, ou
quavec des propositions prcises mais trs limites, en refusant celles qui seraient globale
mais imparfaitement vraies.
Lanalyste ne doit pas se laisser submerger de donnes multiples, disparates, contradictoires
parfois, et savoir identifier les informations cruciales, synthtiques, bien construites et
suffisamment fiables. Cependant il faut avoir conscience que les donnes chiffres et plus
encore montaires, mme lorsquelles sont fausses avec prcision - exemple comptabilit
analytique avec critres de rpartition obsoltes -, tendent simposer aux donnes
qualitatives, qui pourraient ntre quapproximativement exactes. Les informations
compltes, fines, certaines et rtrospectives sont gnralement plus valorises, que des
informations partielles, agrges, incertaines, tournes vers le futur.
Suivant leur (d)formation dorigine, les analystes ont tendance accorder trop de poids
certains facteurs. Les conomistes privilgient les variables denvironnement au dtriment de
celles dorganisation ou de gestion. Les responsables des ressources humaines voient trs
systmatiquement les causes fondamentales des difficults, dans les jeux des acteurs, les
blocages internes ou les qualifications des individus. Enfin les financiers cdent
rgulirement aux dlices de lanalyse des flux de fonds, du bilan et du compte de rsultat,
pour y rechercher des dsquilibres qui ne font que traduire des dysfonctionnements
stratgiques, organisationnels ou de gestion. Cependant, lun des dfis majeurs pour les
analystes consiste viter les cueils dans les raisonnements : multiplication des perceptions,
parcellisation des perceptions, parpillement analytique, diversion-distraction et
approfondissement du faux problme.
Sil doit se mfier de lui-mme, lanalyste doit faire preuve de prudence lgard des
personnes et des groupes avec lesquels il est en relation. Lanalyste peut se laisser prendre en
otage par une direction qui cherche plus faire entriner son point de vue qu obtenir des
conclusions neutres. Lanalyse peut tre un alibi, une caution morale pour lgitimer certaines
dcisions douloureuses. La lucidit de lanalyste, son aptitude dcouvrir les buts cachs
ventuels assigns son intervention, sont essentiels la russite de sa mission. Dun point
de vue dontologique, les conclusions dun analyste nont pas tre infodes aux intrts
de celui qui les a demandes, mais se doivent de servir en priorit lentreprise dans son
ensemble. Lanalyste peut tre confront des processus de dsinformation, soit en
provenance des sources extrieures, soit mme au sein de lentreprise. Sans tomber dans la
paranoa, il convient donc que lanalyste garde sa lucidit et fasse des recoupements.
Enfin, probablement on pourrait appliquer aux analystes en gnral, la boutade qui dit : Si
vous voulez cinq avis sur un problme conomique, faites discuter quatre conomistes .

CCB

Michel Bruley

31/37

Mthode et stratgie de rsolution de problme


Pour rsoudre un problme il est prfrable de procder avec mthode. Il existe diverses
dmarches plus ou moins labores de gestion des dcisions comme par exemple les
mthodes ESPRIT (Enonc, Situation, Problmatique, Rsolution, Information,
Terminaison) ou PORAS (Problme, Objectifs, Rsolution, Articulation, Suite). Quoi quil
en soit, au cur de toutes ces approches se trouve linformation et dans le cas de problme
de gestion dans lentreprise daujourdhui, le plus souvent le recours des moyens
informatiques dont certains spcifiquement conus pour cela les entrepts de donnes.

Illustration - 10
Lutilisation de donnes et leur transformation en information se fait toutes les tapes de
ces mthodes pour poser le problme rsoudre, pour lanalyser, pour dterminer des
solutions et enfin pour envisager des dcisions, leurs consquences et les contrles a
posteriori possibles. Transformer des donnes en information est un savoir faire qui ncessite
des comptences, une rigueur, cela implique de se situer par rapport des rfrences, de
rajouter du spculatif, du subjectif. Par exemple un problme nexiste pas en soi, mais pour
soi, cest une question de perception qui sera diffrente selon les personnes, les entreprises.
Pour poser correctement un problme il convient donc de disposer dinformations sur la
situation et ses diffrentes composantes (acteur, vnement, milieu, perception, projection).
Laction de runir, de traiter, dorganiser des informations relatives un problme de gestion
peut tre facilite par des moyens daide la dcision, mais quelle que soit laide apporte,
les tches raliser ne sont pas triviales. Il sagit en effet de slectionner les bonnes donnes,
dtre mme de les analyser, de les relativiser, de dterminer des mesures, de les relier
des variables dactions, de les partager avec les acteurs concerns. Sans parler des capacits
de discernement de causes, de consquences, de contradictions, ni celles de se rfrer des
principes ou des thories, ou de faire des hypothses. Dans cet ensemble de tches il
convient en particulier davoir conscience que la plupart du temps il est rellement difficile
de dterminer des mesures pertinentes.

CCB

Michel Bruley

32/37

Pour passer de linformation la solution, il faut gnrer des solutions possibles, ce qui
ncessite dtre la fois rationnel et cratif. Ici encore il existe des mthodes comme celle de
la recherche oprationnelle par exemple qui se fonde sur des modles, des mesures et des
critres doptimisation ou toutes les mthodes de crativit qui favorisent la production
dides. Il convient de prendre en compte le problme prsent, terme, les forces dinertie,
les tendances lourdes. Au final il sagit de savoir combiner des variables dactions (outil,
mode opratoire, information, communication, formation).
Si les tapes voques ci-dessus peuvent tre parfois compliques, celle de la dcision est
trs souvent complexe. Il sagit de prendre en compte des critres de choix, des vnements
incertains, des interventions possibles dautres acteurs, des consquences attendues, des
mesures prventives, de les scnariser et darrter un choix. Ici encore il y a des mthodes,
des thories qui peuvent aider notamment en fonction du type dunivers (dtermin,
probabiliste, incertain, concurrentiel) dans lequel le choix doit tre opr. Par exemple la
thorie des jeux modlise le comportement dun agent face des situations de choix dans
lesquelles dautres agents rationnels interagissent.
Au final une bonne rsolution de problme se caractrisera par les qualits suivantes :
conomie de moyens, globalit (apprhension de lensemble du problme), dpassement de
frontire, persvrance, prfrence pour les approches connues. En termes de structure il
convient pour les sujets lourds, comme par exemple la dfinition de lvolution dun systme
dinformation, de mettre en place diffrents types de groupes spcialiss pour agir, pour
informer, pour guider. Par exemple pour guider il faut sappuyer sur des personnes
diffrentes pour fixer des objectifs, dfinir des mthodes, contrler les rsultats.
Les socits de services ont lhabitude daccompagner leurs clients dans la rsolution de
leurs problmes de systmes dcisionnels, que ce soit pour rationnaliser leurs moyens, pour
y intgrer de nouvelles donnes ou pour exploiter sous de nouveaux angles les donnes
historiques quils ont dj. Elles savent que dans les grandes entreprises il faut vouloir
fortement les changements pour quils arrivent et que vouloir est insuffisant. Cest pourquoi,
outre les mthodes, le savoir faire de leurs consultants, lorganisation de contacts entre leurs
clients, ils proposent des modles de rfrences qui permettent de se guider, de
communiquer, de stimuler la crativit et globalement de gagner beaucoup de temps.

Analyse de donnes, information et stratgie : le modle militaire !


Faire de linformation une source de la comptitivit, cest lobjectif que les fournisseurs de
solutions dcisionnelles proposent aux plus grandes entreprises mondiales travers la mise
en uvre de ses solutions dinfrastructure de gestion et danalyses de donnes. Les entrepts
de donnes facilitent la comprhension du pass et du prsent, lanticipation du futur, la
ralisation des actions et la capitalisation des connaissances. Dans le contexte de
mondialisation qui est le notre aujourdhui, les entrepts de donnes bouleversent nos
habitudes de management, nos stratgies, nos besoins en comptences et nos capacits
nous adapter un monde complexe en perptuelle volution. Il faut se rappeler la phrase de
Darwin Ce ne sont pas les espces les plus fortes qui survivent, ni les plus intelligentes
mais celles qui sont les plus mme de sadapter aux changements .

CCB

Michel Bruley

33/37

La premire application des systmes dcisionnels a t laide aux dcisions stratgiques. En


effet, la stratgie qui tait d'abord l'art de la guerre, tend dsormais son application la
plupart des activits humaines et notamment aux entreprises. Information et stratgie sont
troitement lies car c'est partir de la connaissance de la situation que l'action peut tre
dcide. Autrefois nous nous appuyions sur une logique en trois volets : stratgie/ mise en
uvre/ bilan. Aujourd'hui, la logique est plus cyclique : stratgie/ test/ rvaluation
ncessaire/ amnagement de la stratgie/ test/ etc. car comme la dit un gnral amricain
lors de la dernire guerre dIrak aucun plan ne survit au contact de lennemi .
L'information que nous prenons en compte dans le processus d'laboration d'une stratgie est
trop souvent l'information que nous avons nous-mmes slectionne, cest--dire celle qui
peut servir notre stratgie. Pour ce motif, il est essentiel de sparer le donneur d'information
du dcideur. Il faut dans lentreprise prendre comme modle la sphre militaire, o l'on s'est
toujours efforc de sparer la responsabilit de l'information de celle de l'action. Sur un
navire de guerre, par exemple, il existe d'un ct un officier spcifiquement charg de
recueillir et de traiter toutes les informations, et de l'autre des "metteurs en uvre". Leurs
fonctions respectives sont tout fait exclusives, et cette dissociation est essentielle pour
garantir une objectivit au niveau stratgique.
En stratgie, il faut appliquer des mthodes pour assurer une objectivit dans la prise de
dcision, mais force est de constater que les dcideurs ont tendance privilgier une
perception intuitive des situations aux dpens des informations objectives. Dans les coles de
guerre on enseigne ainsi des mthodes qui prennent en compte la situation, les objectifs et les
modes d'actions des allis comme des adversaires et amnent croiser ces donnes.
L'exercice est souvent fastidieux mais trs profitable. L'information est indispensable dans
l'laboration d'une stratgie, mais certaines donnes sont difficilement quantifiables, par
exemple comment valuer la rsistance potentielle d'un concurrent ? Comment quantifier sa
dtermination ? De plus il faut se mfier de lintox et les veilleurs (technique, march,
concurrence) doivent se rappeler la phrase de Sun Tzu tout lart de la guerre est fond sur
la duperie . Linformation est souvent un mlange de donnes quantitatives & qualitatives,
et il est souvent difficile den obtenir une cohrence. Cest en fait le niveau de culture des
co-dcideurs et le dialogue quils ont instaurs qui permettent cette cohrence.
Aujourd'hui, l'on tend concentrer de nombreux systmes au sein de systmes d'information
uniques, et de plus on tend intgrer le dcisionnel et loprationnel. Dans le monde
militaire ce phnomne existe aussi depuis quelques temps, par exemple le porte-avions
Charles de Gaulle, est un modle du genre, il dispose dj d'un systme qui fonctionne en
temps rel et qui est trs structurant pour lorganisation du navire. En matire de
commandement (management), tout ceci nest pas sans inconvnient, car si l'on peut voir en
temps rel depuis les quartiers gnraux (directions gnrales) laction sur le terrain, on
prend le risque d'une trop grande ingrence des chelons suprieurs. Or le manque de
connaissance des ralits du terrain (les systmes apprhendent toujours partiellement la
ralit) rend toute intervention de ce type dangereuse. Ceci explique le dveloppement de la
rflexion sur le Pilotage Stratgique dans les entreprises et la recherche de solutions
(Balanced Scorecard, Businesss Activity Monotoring par exemple).

Dcision, aide la dcision : un monde complexe

CCB

Michel Bruley

34/37

Depuis quelques annes, rgulirement des tudes sont ralises sur la prise de dcision dans
les grandes entreprises et constatent que les interviews disent devoir prendre de plus en plus
de dcision pour mener leur stratgie de gestion globalise. Comme au mme moment les
responsables cherchent tre le plus rationnel possible et tout aborder de faon
scientifique, les fournisseurs de solutions se voient un bel avenir dautant plus que pour le
moment lessentiel de leur activit se fait encore sur la mise en place de gisement de
donnes, ce qui leur laisse un large domaine de dveloppement dans la multiplication des
applications de support aux dcisions.
Le support quune entreprise attend dun systme dinformation pour saider dans une prise
de dcisions est fonction du niveau et du type de dcision concern. Les gourous du
management saccordent pour distinguer quatre niveaux de dcision pour les entreprises. Les
dcisions stratgiques dfinissent les relations de lentreprise avec son environnement (choix
des activits, des marchs, des filires technologiques), elles fixent des axes et des politiques
pour le long terme. Les dcisions dorganisation dfinissent les structures, les processus, les
systmes dinformation (mtier, mission, dlgation, responsabilit, moyens) elles fixent le
cadre de travail dans une perspective de moyen terme. Les dcisions de gestion dfinissent
pour le court terme la direction et la performance attendue (objectifs, ressources, contrle).
Enfin les dcisions oprationnelles sintressent au fonctionnement quotidien tant au niveau
de la supervision que de lexcution.
Les dcisions des diffrents niveaux peuvent tre de diffrents types. Il y a les dcisions non
structures, uniques, non routinires, ou lincertitude est grande qui requiert beaucoup de
jugement et prsente des risques. A loppos il y a les dcisions structures, rptitives,
routinires, aux procdures dfinies qui laissent peu de place lincertitude. Entre les deux il
y a les dcisions semi-structures ou quelques facteurs introduisent des risques.
Face une dcision un responsable peut adopter diffrents comportements comme ne pas
dcider, sen remettre au hasard, agir puis rflchir, se fier son intuition, rflchir en solo,
analyser des chiffres, se tourner vers un tiers, opter pour le collectif et enfin faire comme tout
le monde. Quil travaille seul ou pas, en utilisant des moyens ou non, sil ne sabstient pas, il
passe par quatre phases dcisionnelles. Une phase dinstruction avec collecte dinformation
pour identifier le problme, les opportunits et dfinir ce qui peut faire une diffrence. Une
phase de conception pour trouver, modliser des options, dfinir et valuer les solutions. Une
phase de slection de la ligne de conduite adopter par comparaison des choix et prvisions
des rsultats. Enfin une phase de mise en application et dvaluation des rsultats.
Dans ce contexte rapidement esquiss et sans rentrer dans les dimensions fonctionnelles ou
sectorielles, il est facile de comprendre que pour rpondre ces besoins il ne peut pas exister
de solution universelle. Mme le gisement de donnes dtailles que les fournisseurs de base
de donnes affectionnent tant nest pas lunique source des informations de certains
dcideurs. Les entrepts de donnes grent des informations blanches issues des activits
historiques des comptiteurs dun march, mais dans certains cas il est ncessaire de
sappuyer sur des donnes plus ou moins grises issues de la veille, de lintelligence
conomique ou du renseignement. Par exemple, dans le cadre dune ngociation le fait de
disposer de renseignements prcis sur les interlocuteurs cls peut tre un atout dcisif.
Il faut tre humble, le domaine du dcisionnel est particulirement complexe beaucoup plus
que celui de la gestion administrative des activits qui est couvert par les progiciels de

CCB

Michel Bruley

35/37

gestion intgrs par exemple. Une grande entreprise ne saurait couvrir ses besoins en
sappuyant sur les solutions dun seul diteur.

Au del de la Dcision, l'Action


Le systme dinformation dcisionnel des dirigeants et des collaborateurs dune entreprise, a
pour objet de permettre de rassembler et danalyser des donnes concernant le pass, le
prsent et le futur, de faon faciliter le suivi et la comprhension dtaille de
lenvironnement, des rsultats, des acteurs internes ou externes, notamment les clients, pour
optimiser les dcisions stratgiques et la conduite des oprations.
Pour quune entreprise obtienne un avantage sur la concurrence, il convient quelle mobilise
de nombreux acteurs dans le cycle qui mne de la donne laction. En effet un avantage
significatif sobtient par la mise en uvre dactions permettant la ralisation profitable dune
opportunit : opportunit + action = avantage. Lopportunit elle mme est le produit dune
information et dune dcision : information + dcision = opportunit. Dans ce cycle,
diffrents acteurs (statisticiens, analystes mtier, responsables dactivit, collaborateurs en
charge des clients, des fournisseurs), sont impliqus aux diffrentes tapes qui voient la
naissance des opportunits et leur ralisation.
Si la qualit dun systme dinformation dcisionnel permet desprer le succs, il est certain
que celui-ci ne sobtient pas de faon mcanique. Les paragraphes ci-dessous prsentent de
faon rsume, quelques ides mditer sur le cycle : Donnes Informations Dcisions Actions.
Il est fondamental de bien sparer les donnes et l'information
Entre la donne et l'information, au sens gnral du terme, il y a ncessairement un ou
plusieurs mdiateurs qui organisent, choisissent, rapprochent certaines donnes, dcident
d'en abandonner d'autres, pour pouvoir en tirer une sorte de synthse d'un niveau plus
labor que ses lments constitutifs de base. Au final le travail de l'analyste est de dgager
des faits, de les replacer dans une perspective, de les pondrer les uns par rapport aux autres,
de les rendre clairs et comprhensibles : faits plus commentaires donnent alors linformation.
Transformer les donnes en information est un mtier qui ncessite des comptences, une
morale pour passer de la donne l'information, car cela implique d'y ajouter du subjectif, du
spculatif. Les informations utiles la dcision sont la plupart du temps extrieures
l'entreprise (clients, concurrence), et l'utilisateur doit cerner les informations dont il a besoin,
or on entend souvent les utilisateurs se plaindre de ne pas avoir la "bonne" information.
Souvent cela vient du fait que les dfinitions employes ne correspondent pas leurs visions
personnelles.
Une information n'a pour raison d'tre que d'aboutir une dcision qui souvent se traduit en
action
Les passages de la donne l'information et de l'information la dcision supposent une
suite d'actions volontaires, rflchies, intelligentes. Les mots information et dcision sont
tellement multiformes qu'ils peuvent avoir des sens contraires : une information peut tre une
dsinformation, et une absence de dcision faire office de dcision. Dcider est diffrent de

CCB

Michel Bruley

36/37

ratifier, c'est aussi crer et imaginer. Dcision peut dire fixation de rgles, tant entendu que
l'application d'une rgle ne suppose aucune prise de dcision, mais par contre ne pas
appliquer une rgle est une dcision. Souvent le contenu d'une dcision sert d'information
pour prendre une autre dcision, on constate qu'il y a un rseau de dcisions, avec des liens
de dpendance et des liens pour information et pour action. Enfin, force est de constater que
de nombreuses actions ne sont pas la suite dun acte de dcision.
La matrise de l'information est source de pouvoir
Les utilisateurs cherchent des systmes leur mesure et quils matrisent. Ceci induit le
risque de voir apparatre dans l'entreprise de multiples systmes, non ncessairement
cohrents entre eux, voire redondants. Les directions gnrales souhaitent des systmes qui
supportent en priorit leurs initiatives stratgiques et assurent la cohrence densemble de
lentreprise. Ceci conduit mettre en place des systmes qui visent partager les
informations entre les diffrents utilisateurs.
Les informaticiens veulent btir des systmes qui rpondent tous les besoins, qu'ils soient
exprims ou non. L'intention est louable, mais certainement un peu utopique, car les activits
et les besoins dune entreprise sont par essence volutifs. Cependant suivant linfrastructure
mise en place (systmes indpendants ou systme dentreprise), il est plus ou moins facile de
concilier personnalisation, performance, cohrence et volution.

CCB

Michel Bruley

37/37

Vous aimerez peut-être aussi