Vous êtes sur la page 1sur 36

ENSSIB

Ecole Nationale Suprieure des


Sciences de l'Information et des Bibliothques

DEA en

SCIENCES DE L'INFORMATION ET DE LA COMMUNICATION


Option "Systmes d'information documentaire"

Note de synthse bibliographique

OUTILS DE VEILLE STRATEGIQUE :


essai de typologie

Vronique HENRY

Mars 1998

OUTILS DE VEILLE STRATEGIQUE : essai de typologie

Rsum

Dans ce travail de synthse, nous nous sommes interrog sur les outils utilisables
pour mettre en oeuvre le processus de veille stratgique. Si nombre d'entre eux

proviennent du monde de la documentation, d'autres plus spcifiques se dveloppent


depuis quelques temps. Nous en proposons une typologie par catgories.
Mots-cles

veille stratgique - intelligence conomique - bibliomtrie - veille technologique Limites : cette synthses de recherches bibliographiques prsente des outils

informatiques utilisables dans un processus de veille stratgique. Elle ne prtend pas


tre exhaustive, mais tente de cerner les principales catgories que

distinguer.

l'on peut

Abstract
We have looked for strategic monitoring tools. Some of them come from libraries

informatics systems, but others more specifics are now in developpement. We

propose to classify them.

Keywords (choosed by author)

competitive intelligence - information technology strategies - technology monotoring


strategic information scanning system - competitive information system

Limits : this document doesn't make an exhaustive list of business intelligence


tools. It just tries to perceive the different existing categories.

SOMMAIRE

INTRODUCTION......................................................................................................... 4
METHODOLOGIE DE RECHERCHE : LES SOURCES D'INFORMATION SUR
LES OUTILS DE VEILLE. .......................................................................................... 6
Les enseignants : .....................................................................................................6
Internet :..................................................................................................................7
Recherches documentaires : ...................................................................................8
Autres contacts........................................................................................................9
Acquisition des documents :....................................................................................9

LES OUTILS DE VEILLE STRATGIQUE..............................................................10


Avant propos :........................................................................................................10
Introduction ...........................................................................................................12
Vocabulaire :.........................................................................................................12

1. EN AMONT :........................................................................................................16
2. LA COLLECTE D'INFORMATIONS....................................................................16
LOGICIELS DE COMMUNICATION .......................................................................16
LOGICIELS et PROGICIELS DOCUMENTAIRES...................................................16
LA RECHERCHE SUR INTERNET .........................................................................17
LES MOTEURS DE RECHERCHE et FEDERATEURS DE BASES.........................18
LOGICIELS DE FORMATAGE ET MEMORISATION.............................................20

3. TRAITEMENT DU CORPUS RECUEILLI ............................................................20


OUTILS BIBLIOMETRIQUES ................................................................................21
CARTOGRAPHIE ET ARBRES DE CONNAISSANCE ............................................23
ANALYSE LINGUISTIQUE.....................................................................................26

4. ANALYSE.............................................................................................................27
5. DIFFUSION ET CONSULTATION .......................................................................28
6. OUTILS "MULTICATEGORIES" (SYSTEMES)...................................................29

CONCLUSION ..........................................................................................................31
BIBLIOGRAPHIE ET ADRESSES WEB.................................................................33

"Intelligence is actionable information".


B. HOHHOF

INTRODUCTION
Alors que les entreprises sont constamment pousses par une comptition accrue,

l'information a pris une valeur si importante que savoir l'utiliser avec pertinence est
une gageure de russite. C'est ce que l'on appelle l'intelligence conomique, terme

gnrique qui englobe les notions de veille stratgique, commerciale, technologique,

financire, ou industrielle. Activit de l'entreprise part entire, elle ncessite une


bonne organisation afin de dboucher sur une
participer au processus d'innovation.

vritable aide la dcision et

Si le concept d'intelligence conomique n'est pas si rcent que a,

son

dveloppement concret en France et en Europe date de la fin des annes 80. Les
entreprises ont maintenant pris conscience de l'importance d'intgrer cette activit de
veille, mais la mise en oeuvre du processus n'est pas toujours facile.

En effet, l'intelligence conomique recouvre toute une srie d'actions continues,

permettant de recouper mthodiquement les renseignements importants, dfinir les


informations rechercher en priorit, les sources pertinentes cibler et les acteurs
chargs de les mobiliser [DURA93]. D'autre part, l'analyse ralise ncessite souvent
de s'intresser une grande quantit d'information.

"Le systme d'information qui en dcoule repose sur la comptence des


hommes et des experts, mais aussi sur un support informatique trs
organis, dcentralis, menant linformation sur le bureau des
utilisateurs par un rseau adquat." [DOU93]

Ainsi, ce sont des personnes et des outils, essentiellement informatiques, qui vont

mettre en oeuvre les diffrentes tapes de l'intelligence conomique. Cependant, en


1990, une tude mene par le CERSI [DESJ90] informait d'un certain "manque d'outils

pour traiter, synthtiser et exploiter l'information afin d'en maximiser l'utilisation et d'en
faciliter la circulation" et d'un "rapport flou et des frontires indtermines entre veille
et documentation."

Rcemment, en 1997, une enqute sur la veille stratgique [ROIR97] faisait ressortir

du ct britannique, comme du ct franais d'ailleurs, un manque d'outils et de

mthodes pour le traitement et l'optimisation de l'information collecte. Certaines

entreprises, surtout les grandes, ont un service de veille quip, alors que d'autres
(souvent les PME/PMI) s'adressent volontiers des agences spcialises.

Mais depuis quelques temps de nombreux outils sont dvelopps (des logiciels

essentiellement), par des universits ou des entreprises franaises, et couvrent une


grande partie du processus de veille.

Il semble important d'expliquer rapidement quelles sont les diffrentes tapes de ce

processus, avant de faire une liste des outils existants, car chacune d'elles vont

correspondre des matriels, des logiciels spcifiques. La plupart des spcialistes de


l'intelligence conomique reconnaissent au moins trois tapes dans le processus : la

collecte, le traitement et la diffusion de l'information [MADA97]. Certains l'largissent


en y incluant par exemple l'expression des besoins [OBER97], la mise en forme et la

mmorisation de l'information [JAKO88]. De faon plus exhaustive H. Lesca [LESC97]


ajoute aux tapes intellectuelles de ce processus :

La dfinition de lorientation de la veille technologique pour lentreprise ;


La formation des "traqueurs" d'information ;

La transformation des signaux faibles en information utile et signifiante ;

L'intgration des informations ainsi recueillies dans un processus dcisionnel.


Nous verrons donc, dans l'analyse des informations que nous avons collectes,
quels outils il est possible d'associer ces moments forts du cycle de veille.

Le travail qui fait l'objet de cette synthse est en quelques sorte une "veille sur la
veille", que nous avons initie afin de donner des bases ncessaire la mise en
place ou l'amlioration d'un processus d'intelligence conomique.

Avant de prsenter la synthse de notre travail et la bibliographie qui s'y rapporte,

nous dcrirons les tapes successives de collecte de l'information.

"To provide maximum benefit to a decision-maker,

intelligence

information must be relevant, delivered quickly, and presented in a way


that facilitates rapid comprehension." [HOHH94]

METHODOLOGIE DE RECHERCHE :
les sources d'information sur les outils de veille.
Avant de commencer toute recherche d'information, il a t ncessaire de prciser

minutieusement le sujet. En effet, il est essentiel de cerner le thme, et donc le

vocabulaire qui sera employ. Que recherche-t-on ? Une liste d'outils informatiques
utiliss et/ou utilisables pour la recherche, le traitement et la diffusion de l'information

stratgique et technique1. Cette liste sera donc divisible en catgories d'outils, et les
sources devraient nous permettre d'apprcier la valeur de chacun d'eux.

Dans un premier temps, nous avons rpertoris les sources qui, intuitivement,
semblaient utiles pour trouver de l'information sur les outils de veille :

les priodiques, surtout ceux spcialiss sur les nouvelles technologies ;


les magazines dinformatique et les publicits qu'on y trouve ;
les rpertoires des associations, des diteurs ;

les documents glans sur les salons, les congrs... ;

les dmonstrations de produits, ou des contacts avec des centres de recherche,


des fabricants, des revendeurs ;

les comptes rendus de missions des collgues de travail 2 ;

les enseignants (universits et coles), en France et ltranger ;


les responsables de veille dautres entreprises ou organismes ;
les banques de donnes spcialises ;

sur Internet : serveurs commerciaux et spcialiss, les labos de recherche


publics ou privs ; les news et autres services de diffusion de linformation ;

les professionnels de la veille (cabinets, agences prives ou publiques...) ;

les listes de diffusion (notamment celles provenant de ltranger, par exemple des
ambassades).

Ces diffrentes sources ont toutes t utilises, mais certaines se sont rvles

beaucoup plus fructueuses que d'autres. La recherche s'est faite par tapes en
fonction des rsultats dj trouvs, afin d'affiner ou d'ouvrir un domaine particulier.
Ainsi, des sources ont t sollicites plusieurs fois (ex : internet).
Les enseignants :

Ce sont des enseignants chercheurs de l'universit de Lyon I et de Grenoble II, ainsi

que des intervenants extrieurs, qui nous ont donn les premires informations et les
Nous verrons que des outils correspondants d'autres tapes de la veille ont
galement t reprs.
2
En effet cette recherche a t effectue dans le cadre d'un stage au sein d'un service
de veille technologique au CNET de Grenoble (Centre National d'Etudes des
Tlcommunications).
1

contacts prendre : des cours sur les systmes d'information, la bibliomtrie ou la

recherche sur internet ; des noms d'associations, d'organismes ou de spcialistes


effectuant des recherches dans le domaine ; des sites web consulter ; des articles

lire ; des dmonstrations de logiciels ; etc. En effet, dans le domaine des outils de

veille, un nombre assez restreint d'acteurs jouent un rle important. Ce sont en

particulier des organismes d'tat et des laboratoires universitaires, qui ont initi

ensemble le dveloppement de ce secteur en France. Donc, suite ces rencontres


avec les enseignants, nous avons effectu des recherches prcises pour connatre
les dveloppements actuellement en cours et les synthses crites.
Internet :
C'est sur

le web que nous avons trouv les informations sur

les principaux

organismes franais et trangers conseills par les enseignants, entre autre :

le CRRM, Centre de Recherche Rtrospective de Marseille (crrm.univ-mrs.fr) ;


l'IRIT, Institut de Recherche d'Information Technologique (atlas.irit.fr) ;
la SFBA, Socit Franaise de Bibliomtrie Applique
(crrm.univ-mrs.fr/sfba/sfba.html) ;

la SCIP, Society of Competitive Intelligence Professionals (www.scip.org) ;


l'ECAM, Centre Europen de Mathmatiques Appliques d'IBM
(www.fr.ibm.com/france/ecam/ecam) ;

l'IEP de Lyon (http://iep.univ-lyon2.fr/SE71/Veille/agents.htm) ;

l'INIST, Institut National de l'Information Scientifique et Technique (www.inist.fr).

Ces sites ont t soigneusement analyss, dans le but de reprer des informations

sur des outils de veille.

Le site du CRRM prsente, outre les activits gnrales de recherche sur la

bibliomtrie, un outil dvelopp dans ce laboratoire. Chaque partie du logiciel est

prsente en dtail. La SFBA est rattache au CRRM, et les

prsentations de

colloques figurent dans le mme site. Aprs lecture des textes du dernier colloque, il
s'est avr qu'aucun outil nouveau notre connaissance n'tait prsent.

Le site de l'IRIT propose un outil assez diffrent de celui du CRRM, et une srie
d'autres outils couvrant d'autres tapes de la veille.

Autre source intressante : le site du CEVEIL (Centre d'Expertise et de Veille

Inforoutes et Langues, au Qubec). Il prsente en particulier les travaux d'tudiants

de l'Ecole de Bibliothconomie et des Sciences de l'Information de l'Universit de


Montral, o l'on retrouve des synthses sur le thme des
l'information [CEIV96].

technologies de

Une recherche a galement t effectue avec les moteurs de recherche par mots-

cls et les mtamoteurs, surtout partir des noms des outils que nous voulions
analyser plus en dtail. Ces recherches ont t la plupart du temps fructueuses et

nous ont permis d'atteindre les sites des concepteurs ou des distributeurs de ces

produits.

Par contre la recherche "exploratoire" avec des termes comme "veille technologique"

ou "intelligence conomique" n'a pas vraiment permis de trouver de nouveaux outils

par rapport ceux dj en notre connaissance.


Recherches documentaires :

A la Bibliothque de l'ENSSIB, l'interrogation du catalogue en ligne a permis de trouver


36 documents pertinents sur

la veille technologique (avec galement des

informations plus spcifiques l'informatique documentaire et internet).


Nous avons interrog les CD-ROMs suivants :

- Docthse : 19 rponses, dont 3 retenues.


- Lisa : 37 rponses, dont 4 retenues.

Nous avons consult les priodiques suivants :


Sur Internet :

- Internet Professionnel
- Internet Research
- Plante Internet

Sur l'informatique :

- 01 Informatique

- Informatique professionnelle
- Monde informatique

Sur les technologies :

- Technologies internationales

- Vigie (Multimdia et inforoutes, Informatique applique)

La lecture d'articles sur le thme de la veille, ou des

rubriques prsentant de

nouveaux produits a enrichi nos connaissances sur le domaine.

A la Bibliothque de l'Universit Lyon1 nous avons consult des priodiques et une


thse (micro-fiche).

A la Bibliothque du CNET de Grenoble, nous avons galement procd une

interrogation du catalogue, et avons pu ainsi consulter, outre les priodiques


spcialiss, quelques ouvrages gnraux sur la veille.

Nous avons fait une recherche sur Tlthse (interface Minitel), mais sans trouver

d'information nouvelle. Par contre, l'interrogation de Pascal a t fructueuse : plus de


1000 articles rpondaient l'interrogation par les termes "veille stratgique", "veille
technologique", "bibliomtrie" et "intelligence conomique". Les

rponses se

recoupant parfois, et tant par ailleurs dj connues souvent, nous n'avons

conserv qu'une dizaine de rfrences.

Par ailleurs, la consultation des catalogues accessibles par le Web ont permis de
reprer entre autre une thse pertinente.
Autres contacts
Enfin des

recherche :

contact de professionnels nous ont

beaucoup apport dans cette

des laboratoires de recherche (pour des explications sur les outils dvelopps),
des distributeurs d'outils de veille (entre autre pour des dmonstrations),

des responsables de services de veille dans d'autres entreprises (pour les


systmes mis en place et les outils utiliss).

Acquisition des documents :


Nous avons pu consulter une

bonne partie des

documents cits dans les

bibliothques (ENSSIB, Lyon1 et CNET), mais galement en les imprimant directement

partir du web. Pour les autres articles ou thses non disponibles sur place, nous
avons utilis le prt inter-bibliothques.

Pour cette recherche, nous pouvons conclure que


principales nous ont

t apportes par des

les informations

spcialistes ou des

enseignants, et que les documents rcuprs par une recherche


documentaire plus classique n'ont fait que complter et confirmer ces

derniers.

Les OUTILS de veille stratgique


Avant propos :

Afin de couvrir les diffrentes tapes du processus de veille, de nombreux outils


informatiques peuvent tre utiliss. Il ne faut cependant pas les confondre avec

10

les mthodes appliquer, car ils ne constituent qu'un apport, un gain de temps et
d'efficacit3.

Nous ne nous attacherons pas lister le matriel informatique de base ncessaire

l'acquisition et l'installation de ces logiciels. Cependant il faut noter que les


connexions aux rseaux, l'accs des bases de donnes, le support de logiciels
assez volumineux et la quantit d'informations traites demande une capacit

mmoire importante (il est videmment ncessaire d'avoir une bonne capacit de

stockage de l'information recueillies).

Nous n'avons conserv ici que les outils utilisables dans le cadre d'une activit de
veille stratgique. Les outils spcifiques de "datawarehouse", lis la notion

d'informatique dcisionnelle, ne sont pas cits, bien qu'ils concernent la gestion et


la diffusion de l'information dans l'entreprise. Seuls certains de ces logiciels
trouvent une application dans un processus de veille stratgique.

Les outils prsents sont essentiellement franais, pour deux raisons. D'une part,

les laboratoires franais ont fait preuve de dynamisme dans le dveloppement


d'outils dans des domaines comme la bibliomtrie par exemple, et sont l'origine

de la plupart des logiciels existants. D'autre part, la spcificit du domaine

(traitement d'un corpus de donnes qui sont le plus souvent textuelles) nous

amne penser que les outils francophones sont plus adapts notre langue car

ils en respectent la logique. Bien sr, la plupart permettent de travailler sur un


corpus de textes en anglais, la langue la plus courante dans les diffrents

domaines de recherche. Seuls quelques "incontournables" dvelopps


l'tranger (comme les moteurs de recherche) sont donc ajouts la liste. Mais il

faut savoir que de nombreux pays ont entam des recherches sur le domaine

(datamining et bibliomtrie).

Il est vident que nous n'avons pas pu tester tous les outils que nous dcrivons.
Les informations recueillies proviennent souvent des socits qui les

ont

produites, et de ce fait sont toujours trs "optimistes" quant l'efficacit de leur

produit. Cependant, de nombreux articles de presse nous ont permis d'apporter un


minimum de critique certains de ces outils.

Enfin le classement que nous proposons est assez subjectif, dans la mesure o la
plupart de ces outils n'ont pas qu'une seule et unique fonctionnalit. Nous avons

choisi de faire ressortir celle qui les caractrise le mieux.

L'utilisation de moyens informatiques pour rechercher l'information stratgique n'est


pas non plus incompatible avec la collecte de documents papier ou de donnes
informelles, recueillis lors de salons, de visites, etc.
3

11

Introduction

Lors du colloque IDT93, B. Ragot affirmait que, malgr les systmes complexes et
automatique d'analyse existant, "les machines, mme les

plus sophistiques",

taient "encore et pour longtemps dnues d'imagination" [RAGO93]. Quelques


annes plus tard, la liste des outils informatiques de recherche, de traitement, et

d'analyse de l'information n'a cess de crotre. S'il est vident que la machine ne
remplacera pas l'homme dans le jugement final de pertinence accord une

information, les logiciels disponibles effectuent un tri considrable sur la masse

croissante de documents, et constituent une aide non ngligeable pour la fois


gagner du temps et faire ressortir l'essentiel.

Alors que jusqu' prsent on utilisait essentiellement une panoplie d'outils venus tout

droit du monde de la documentation, on trouve maintenant des logiciels ou progiciels

vritablement ddis l'intelligence conomique. Ces outils intgrent plusieurs tapes


du processus de veille stratgique, gnralement le traitement et l'analyse de

l'information (aspects linguistiques et bibliomtriques). Cependant, certains auteurs

sont tents de rduire les outils de veille stratgique ces logiciels infomtriques. Or,
si l'on reprend les tapes du processus de veille, tel que prsent par H. Lesca (voir

p. 5 introduction), et qu'on essaie d'y rattacher les outils actuellement disponibles sur

le march, nous nous rendons compte que certaines des tapes ne sont pas encore

vraiment "outilles" (par exemple l'identification des signaux faibles et l'intgration des
informations traites dans un processus de dcision) [LESC97]. Mais il semble

difficilement envisageable de tout vouloir automatiser, certaines


intellectuelles ne pouvant se passer de l'intervention d'experts.

oprations

Lorsqu'on parle d'analyse automatise de l'information recueillie, il faut distinguer

deux sources qui induisent deux types de traitements : les banques de donnes
bibliographiques fournissent des documents structurs en champs, alors que

d'autres sources apportent des documents plein texte. Dans le premier cas les outils

bibliomtriques s'appliquent parfaitement au tri, la comparaison et au regroupement


des donnes, alors que dans le second cas il faudra utiliser des techniques

statistico-linguistiques pour analyser le texte dans son ensemble.

De mme, en fonction des besoins d'information (d'exploration, de prospective, de


structuration...) on n'appliquera pas tout fait les mme traitements [ROUS97].
Vocabulaire :

Un vocabulaire particulier aux notions de veille stratgique et d'intelligence


conomique s'est dvelopp paralllement ces

concepts. Souvent issus de

l'anglais, ces termes recouvrent certaines parties du processus, et donc les outils
qui y correspondent. Attention cependant aux traductions littrales, il existe des
nuances dont il faut tenir compte.

12

Moteur / m tamoteur

Les moteurs de recherche sont bien connus des utilisateurs du Web. Il faut

distinguer ceux qui fonctionnent par mots-cls et ceux qui fonctionnent par thmes

(qui se

dveloppent actuellement

d'ailleurs).

Les

mtamoteurs

interrogent

simultanment plusieurs moteurs dans leur syntaxe, et ddoublonnent les rsultats

finaux.

Agent intelligent

En plein essor pour la recherche de donnes sur internet, les agents intelligents sont

actifs en permanence, en traitement de fond, et rapatrient rgulirement les rsultats


de leur travail. Ils "voyagent" dans le rseau de faon autonome, toujours actifs
mme quand on teint son ordinateur, et rapatrient le rsultat de leur recherche

lorsqu'on le rallume. Leur but est d'extraire en temps rel l'information utile au sein

d'une masse de donnes rparties sur des milliers de serveurs, en la filtrant de

faon automatique, suivant des critres choisis par l'utilisateur [GAZE98]. Comme

l'analyse linguistique reste dlicate, rares sont les moteurs qui soient immdiatement

oprationnels. Ils sont donc dots d'une facult d'apprentissage : par rapport ce

que l'on dcide de garder sur une prcdente recherche, en observant les sites

favoris des caches du navigateur, etc. Ils ont galement une fonction de
ddoublonnage et de vrification permanente de la validit des liens.
Les grands moteurs de recherche utilisent des

agents intelligents (Topic par

exemple), mais il existe aussi des outils moins puissants tldchargeables sur le net
moindre cot.
Endogne

L'information qui n'apparat que grce la comparaison ou l'association de donnes


contenues dans des champs ou des documents diffrents est dite endogne. A

opposer l'information exogne.


Infomtrie

Adopt en 1987 par l'IFD (International Federation of Documentation), ce terme

dsigne l'ensemble des activits mtriques relatives l'information, couvrant aussi

bien la bibliomtrie que la scientomtrie [NOYE95].


Bibliomtrie ("bibliographie / mesure")
Notion apparue dans les annes 70,

la bibliomtrie est une

application des

mathmatiques au domaine de l'information et de la documentation 4. De plus en plus


applique au domaine de la veille stratgique, la bibliomtrie est

un systme
"

d'analyse dynamique permettant de positionner les sujets et les techniques"


Auparavant, partir des annes 30, on parlait surtout de scientomtrie (tude
quantitative de la science et de la technologie). On peut maintenant la dfinir comme
tant la bibliomtrie spcialise au domaine de l'IST.
4

13

[DOU90]. On utilise entre autres les statistiques, les probabilits, les systmes

experts pour recenser, trier et analyser automatiquement un corpus de donnes

pouvant tre trs volumineux. Ces mthodes sont en particulier efficaces sur des

rfrences bibliographiques, qui sont des documents bien structurs. Les outils

bibliomtriques vont pouvoir mettre en vidence les mots-cls et les liens qu'ils

entretiennent entre eux, mais aussi les filiations entre auteurs (en mesurant les

citations), les thmes et l'intensit des

recherche.

collaborations entre les laboratoires de

Ces outils utilisent des techniques d'indexation automatique pour lister les mots-cls
du corpus de documents. Puis seuls les termes porteurs de sens sont conservs

grce l'analyse linguistique et morpho-syntaxique, la lemmatisation (mthode qui


consiste simplifier leur forme canonique les verbes, adjectifs et autres

substantifs). L'tape suivante consiste alors regroupes les mots-cls pour

constituer des agrgats (clusters) avec des liens plus ou moins forts. D'autres

techniques travaillent sur les nuages de donnes (mthode multidimensionnelle) pour

permettre au veilleur d'analyser les rapports entre elles et suivre leurs volutions. On
peu alors, par recoupement, "mettre en vidence des informations stratgiques

comme les sujets de recherche mergeant sur un thme donn, la composition des
quipes dexperts qui collaborent sur un sujet particulier, les experts les plus
importants, les organismes phares, etc. (...) La qualit des rsultats obtenus dans

ce type de travail dpend d'une complmentarit forte entre le spcialiste des

logiciels utiliss et les experts du domaine tudi, capables d'interprter par

exemple les signaux perus sur des cartes" [THIL97a].


cartographie
A

partir

d'un corpus

donn, les logiciels bibliomtriques produisent

une

reprsentation graphique mettant en vidence les relations hirarchiques entre les


termes (classification), les positionnant les uns par rapport aux autres (calculs de

densit, de centralit). La visualisation graphique facilite l'interprtation et l'analyse


des donnes. Peu de logiciels ne font que de la cartographie, en gnral cette

application se retrouve dans les outils bibliomtriques et des systmes plus complets.
datawarehouse

Littralement "entrept de donnes", le datawarehouse est en fait le stockage et la


mise disposition des donnes de l'entreprise. Des outils permettent d'interroger, de

visualiser et d'analyser ces bases ainsi constitues.


datamining

Outil complmentaire au datawarehouse, le datamining est un procd interactif,


coupl au systme d'information dcisionnel de l'organisation, permettant d'expliquer

des rsultats, de corrler des vnements, de prvoir des comportements ou de


14

confirmer des hypothses. Les outils de datamining utilisent entre autres les
techniques des arbres de dcision et les rseaux de neurones [GAZE98].

15

1. EN AMONT :
Avant de se lancer dans une activit de veille, il est important de dfinir les besoins

de l'entreprise, les bases ventuellement existantes, et de comprendre ce que sont

des informations caractre stratgique. Le CERAG (laboratoire de recherche de

l'Ecole Suprieure des Affaires Grenoble) a dvelopp ces dernires annes un

ensemble d'outils informatiques permettant de couvrir ces tapes de la veille.


On notera en particulier les prototypes suivants [LESC97] :

- Pour mesurer l'intrt de la mise en place d'une veille stratgique et identifier les

besoins de l'entreprise : PERTINENCE ;

- Pour identifier les acteurs concerns par la veille : CIBLE, systme d'aide au
raisonnement interactif ;

- Pour mesurer l'existant et la capacit d'une entreprise dvelopper l'activit de


veille : FENNEC. Compos d'une base de connaissance, d'une base de faits, et d'un

moteur d'infrence, le logiciel permet de faire un diagnostic prcis avant d'initier ou


d'amliorer une activit de veille ;

- Pour sensibiliser les acteurs (traqueurs ou pas) : SENTINEL et OASIS, didacticiels

qui proposent des "cours" thoriques (les rfrences principales de la veille) et des
exercices pratiques de traque de l'information.

2. LA COLLECTE D'INFORMATIONS
L'tape de collecte d'information implique le plus souvent une recherche sur des

sources lectroniques (banques de donnes, internet...)5. Les diffrents moteurs et

logiciels de recherche permettent de collecter des informations structures ou plein

texte, et il faut ensuite compiler ces documents dans une base de donnes pour
passer l'tape du traitement.

LOGICIELS DE COMMUNICATION

Ces logiciels permettent l'extraction des informations dans des bases. On citera par
exemple XTALK (Crosstalk Communication), INFOLOG (I + K), COM 2400 (La
Commande Electronique), KXCOM (Kortex) ou DIALOGLINK (Dialog) [CAST94].

LOGICIELS et PROGICIELS DOCUMENTAIRES

Pour grer des donnes textuelles, les logiciels et progiciels documentaires


permettent de crer des interfaces d'interrogation spcifiques, et de diffuser les
En effet, plus de 90 % de l'information est aujourd'hui disponible sous forme
lectronique.
5

16

documents suivant diffrents modes (de plus en plus souvent par le biais d'une
interface web). Ils sont trs adapts aux bases internes de l'entreprise.
LA RECHERCHE SUR INTERNET

On ne compte plus aujourd'hui les outils proposs gratuitement sur internet.


Sur le Web plusieurs catgories peuvent cependant tre dfinies6 :

les moteurs de recherche par mots-cl


les moteurs thmatiques
les annuaires
les

mtamoteurs

similtanment)

(intgrateurs

complexes

lancent

plusieurs

moteurs

les agents intelligents (voir p. 12) : distinguer des robots des moteurs de

recherche, les agents intelligents permettent de faire un premier tri. On notera par

exemple :

- AUTONOMY (requte en langage naturel ; tient compte des

rsultats

slectionns par l'utilisateur ; capable de communiquer avec d'autres agents


ayant les mmes centre d'intrt).

- FIREFLY (intgr My Yahoo -recherche avec profils utilisateurs ; met en

relation des utilisateurs partageant les mmes centre d'intrt).

- JANGO (spcialis dans la recherche de prix proposs sur les sites Web ;
affiche les rsultats au fur et mesure).

D'autres logiciels sont utiles pour effectuer la recherche et le tri de l'information sur
internet. DIGOUT4U par exemple (www.arisem.com) reformule la requte pose en
langage naturel et utilise les

moteurs de recherche sur plusieurs niveaux de

profondeur des liens. Il procde ensuite une analyse smantique des pages

rcupres pour hirarchiser les documents par degr de pertinence. A noter :


Digout4U est capable d'effectuer la recherche indiffremment en franais et en

anglais.

Sur les groupes de news et les listes de diffusion, l'analyse des messages
qui circulent se rvle souvent fructueuse et permet de faire apparatre des
domaines d'intrt mergeants. L'un des outils les plus connus est DEJA NEWS.

Proposant de nombreuses options de recherche, cet outil permet de visualiser une


liste sous plusieurs angles, de retrouver des informations sur
messages ( quelles listes ils

les auteurs des

appartiennent, le nombre de messages qu'ils

Pour une liste complte et commente d'outils de recherche sur Internet :


http://www.adbs.fr/adbs/viepro/sinfoint/lardy/chap4.htm [LARD97]
6

17

envoient...), et donc de trouver la fois des rponses et des contacts utiles


[OBER97].

Toujours dans cette catgorie d'outils, on notera MECIA (socit Inforama


International), qui est

un logiciel permettant d'observer en continu un flux de

messages par rapport des profils (par mots-cls) ; quant L4U (dveloppement de
Taiga), il filtre les informations dans plusieurs langues [LESC97].

Rapatriement de sites : certains logiciels permettent de rapatrier tout ou partie

d'un site pour en exploiter le contenu hors ligne 7. Cette fonction peut aussi tre une
des options des moteurs de recherche.

Outils de reprage de modification d'un site :


Par

exemple

Net

AttachePro

(www.tympani.com)

ou

Tierra

Highlight

(www.tierra.com). Cette fonction fait aussi souvent partie d'outils plus complets de

recherche et de traitement de l'information.

LES MOTEURS DE RECHERCHE et FEDERATEURS DE BASES

Les grands fabricants de ces moteurs utiliss par de nombreux logiciels sont Verity

et Fulcrum. Mais d'autres spcialistes de la documentation dveloppent galement


des outils puissants.

VERITY dveloppe une gamme de produits destine aux applications de recherche

d'informations dans l'entreprise, sur Internet et autres sources (bases de donnes,


CD-ROM).

TOPIC est un systme intelligent de recherche documentaire en texte intgral


permettant de constituer des bases de connaissance. L'interrogation peut se faire

soit en texte libre, soit au moyen de concepts existant dans la base, et la diffusion

par messagerie offre un rapport personnalis en fonction du profil d'intrt de


l'utilisateur. Trs utile pour la recherche d'informations cibles, le moteur Topic est
utilis par de nombreux fournisseurs de GED (Adobe, Lotus, Siemens, etc). Topic

offre toute une famille de produits de recherche, de filtrage, d'extraction et

d'analyse d'information. Pour l'activit de veille, on peut citer le WebSearcher, un

serveur qui comprend un module de recherche intgr, et les Topic Agents.

INTELLISERV, autre outil de Verity, permet d'effectuer des recherches dans des

sources d'information htrognes contenues dans un serveur interne, et de

surveiller automatiquement certains sujets par une

technologie de push. Les

On en trouvera galement une liste l'adresse suivante :


http://www.adbs.fr/adbs/viepro/sinfoint/lardy/aspirat.htm.
7

18

documents sont transmis par ordre de pertinence, et un rsum automatique est


fourni pour chacun. La diffusion aux utilisateurs peut se faire par le web, par
messagerie ou par tlcopie [GAZE98].

FULCRUM : la socit canadienne Fulcrum Technologies est

diteurs de logiciels de recherche d'informations pour l'entreprise.

un des principaux

On retiendra en particulier Knowledge Network, une gamme modulaire de logiciels


centre sur une architecture web. Elle comprend un moteur de recherche

documentaire capable d'intgrer des informations issues de plusieurs types de


sources.

L'information est

prsente

sous

la forme d'une

arborescence

personnalise regroupant les documents en fonction de leur contenu. Knowledge

Network utilise la recherche en langage naturel et l'analyse morpho-syntaxique


[GAZE98].

KNOWLEDGE BROKERS 8 : Dvelopp par le Xerox Research Center Europe et en

utilisation pilote sur

des sites europens, il s'agit d'une suite de logiciels qui

composent un outils de recherche d'information sur Internet et sur des bases de

donnes, une "plate-forme de mdiation" entre l'utilisateur final et des sources

diverses. Les Knowledge Brokers permettent d'interroger simultanment des

sources htrognes, avec une mme quation ; les rsultats composeront un


documents unique, dont le format sera utilisable quelles que soient les sources qui

auront servi sa cration.

Littralement "Courtiers de connaissance".


19

La plupart de ces outils reposent dsormais sur une adquation entre les
algorithmes statistiques et la linguistique [CAHI97]. Par exemple la socit

franaise ERLI, spcialise en informatique linguistique, vient d'adapter


Knowledge Network des technologies de traitement de l'information :
Information Retriever (requte en langage naturel) et Terminology
Manager (ajoute des

connaissances la base de connaissances

linguistique personnalisable). Des accords de coopration ont galement

t passs avec Verity pour complter le traitement smantique de Topic.

LOGICIELS DE FORMATAGE ET MEMORISATION


Si les donnes collectes doivent faire l'objet d'un reformatage pour permettre le
traitement, on pourra utiliser des logiciels spcifiques (si cette fonction n'est pas dj

incluse dans les outils de recherche). Exemple : INFOTRANS (I + K), F2F (Frankia),

FILTER (Information Automation LTD) ou REFWRITER (JSA LTD) [CAST94].

De la mme faon, s'il faut mmoriser les donnes dans des fichiers internes, on
pourra choisir entre les diffrents types de systmes de gestion des bases de
donnes (SGBD) et les gestionnaires lectroniques de documents (GED).

3. TRAITEMENT DU CORPUS RECUEILLI


Une fois la base de connaissance constitue, il est ncessaire d'appliquer un certain

nombre de traitements pour faire un tri, classer et reprsenter de faon simple le


corpus d'informations (en particulier les donnes en provenance d'internet, souvent

volumineuses et de formats divers). C'est ici qu'interviennent les outils d'analyse

statistique, bibliomtriques et cartographiques. Notre but n'est pas d'entrer dans les

dtails de fonctionnement de ces logiciels, mais de prsenter les finalits des plus
connus.

20

OUTILS BIBLIOMETRIQUES

DATAVIEW, dvelopp par le CRRM (Centre de Recherche Rtrospective de


Marseille ; http://crrm.univ-mrs.fr/commercial/software/dataview/dataview.html)

Les concepteurs de Dataview sont partis du constat suivant : dans le traitement

bibliomtrique, peu de processus sont entirement automatiss, sauf deux tapes : la


collecte (logiciels de communication) et l'analyse des donnes (logiciels statistiques,

avec une prsentation graphique des donnes numriques). Le problme est de

pouvoir traiter non seulement les donnes numriques, mais aussi les donnes

textuelles, avec un mme outil. Quelques recherches sont en cours 9, mais souvent

ces outils sont limits dans un traitement spcifique. Par contre, Dataview a t

dvelopp dans l'optique de pouvoir traiter automatiquement les donnes textuelles

comme les donnes numriques, et d'offrir plusieurs types d'analyses. Le schma

suivant10 explique la dmarche de Dataview : un langage de recherche sur des

sources varies et htrognes, le reformatage des donnes avec limination des


doublons, le traitement bibliomtrique, puis l'analyse statistique (avec plusieurs types
de reprsentations graphiques).

10

Dont : Brookes, PatStat + , Patent trend analysis, Leximappe


http://crrm.univ-mrs.fr/commercial/software/dataview/fig1.gif
21

L'avantage de Dataview est de pouvoir apporter, dans un processus de


veille stratgique, des lments dterminants de type : suivi des

technologies de concurrence, volution des

tendances, tat

de

l'environnement technologique, mise en place de systmes d'alerte, etc.

Cependant, d'autres mthodes complmentaires (outils statistiques


infographiques) doivent tre utilises si l'on veut se servir efficacement
de Dataview [OBER97].

TETRALOGIE dvelopp par l'IRIT (Institut Rgional d'Information Technologique,

Toulouse). Il s'agit en fait d'un ensemble d'outils intgrs qui recherche des sites web
pertinents, retrouve les noms des chercheurs les plus actifs dans un domaine et met
ainsi en vidence des collges invisibles.

Ttralogie fait partie du systme ATLAS, dvelopp sous l'impulsion d'organismes


d'tat (CEDOCAR11

en particulier) et la SFBA12 dans le but

de favoriser le

dveloppement de la veille technologique. C'est donc le maillon d'une chane de


logiciels qui comportent :

- des outils raliss par le CRRM et le CEDOCAR : techniques d'acquisitions de

donnes et procds statistiques prliminaires.

- l'INIST : laboration de programmes qui incorporent les mthodes d'extraction

d'informations des textes libres et les moyens de formatage des donnes


(Neurodoc).

Le logiciel est aliment par des banques de donnes bibliographiques, textuelles ou

factuelles. Il utilise les diffrentes mthodes d'analyses des donnes (ACP, AFC,

CAH etc.) et des techniques spcifiques de visualisation (2D 4D, animation


interactive ou automatique) 13.

Voici par exemple le rsultat d'une recherche croise (noms d'experts, sujets de
recherches, travaux...) sur des bases bibliographiques. La carte est obtenue en
appliquant une AFC (analyse factorielle de correspondance) sur une matrice
rcapitulant les donnes [http://atlas.irit.fr/petitexemple.html].

On voit clairement apparatre des groupes qui travaillent et collaborent sur un

mme sujet de recherche. Cette carte met aussi en vidence les noeuds, c'est-dire les experts qui sont au centre d'un rseau.

11
12
13

Centre de Documention de l'Armement


Socit Franaise de Bibliomtrie Applique
Voir pour plus de dtails la page http://atlas.irit.fr/analyse.html
22

Ce type de reprsentation, minutieusement manipul et analys, pourrait mettre en


vidence des sujets de recherche mergents (information endogne, c'est--dire
difficilement dcelable)14.

L'ADIT15 utilise Ttralogie dans son processus de recherche et d'analyse


de l'information. Le logiciel permet d'identifier dans un premier temps les
rseaux de collaboration et leur organisation, dtermine leurs travaux,

leur volution dans le temps, etc. Aprs que des experts aient examin

ces rsultats, des thmes trs prcis de surveillance sont dfinis, et une
recherche automatique est lance avec TOPIC afin de programmer une

veille en continu [THIL97a].

CARTOGRAPHIE ET ARBRES DE CONNAISSANCE

Des logiciels de bibliomtrie ou de traitement intgrent souvent la cartographie leur

outil (Pricls, Ttralogie, Dataview...). Mais quelques logiciels sont ddis cette
fonction, dans le but de faire merger du sens une grande masse de donnes16 :

NEURONAV + : classe par thme un ensemble de documents indexs dtenus au


sein de l'entreprise et synthtise ces informations sous forme de cartes. Il offre de

plus un environnement d'exploration des documents par navigation entre les motscls, les documents et les thmes. La visualisation graphique met en vidence
l'importance de chaque thme dans le corpus. Il est possible d'effectuer une

comparaison entre plusieurs cartes, de modifier l'indexation et de rduire la masse


des documents analyss.

Cependant, certains spcialistes pensent que Ttralogie ne peut tre utilis pour
traquer des signaux faibles [LESC97].
15
Agence pour la Diffusion de l'Information Technologique
16
On retrouve dans cette catgorie les logiciels d'analyse de donnes qualitative et
quantitative, qui offrent une prsentation graphique des traitements [COUE96].
14

23

Ce logiciel est par exemple trs utile pour se familiariser avec un fonds
documentaire [GAZE98].

SEMIOMAP (Laboratoire de smiotique informatique du Ple universitaire Lonard de

Vinci - www.semio.com) : ce logiciel indexe l'ensemble des pages web existantes,


et sur cette base fournit une sorte de carte smantique sous la forme de diagramme
prsentant des agrgats statistiques [NAJM97]. Le traitement du volume de donnes

est trs rapide. Les concepts dpendants de l'quation de recherche sont

reprsents comme des noeuds,qui sont lis entre eux pour former des clusters

(rseaux de concepts). Les noeuds les plus "profonds" sont encadrs, et un


systme Search Trail permet de garder le cheminement de la recherche. La fonction

Zoom permet quant elle de refaire une recherche plus pointue sur des noeuds
slectionns. Enfin le bouton Web Pages donne un accs direct aux pages
concernant le concept.

Le module Semioscan identifie sur la carte les modifications date donne.


Cet outil s'appuie essentiellement sur

un traitement statistique de la

proximit entre les mots du texte [GAZE98].

SAMPLER (Socit Cisi) : ce logiciel analyse un corpus de texte en procdant une

extraction automatique des termes et en faisant une reprsentation graphique du

lexique ainsi form. Des clusters mettent en vidence des liens plus ou moins forts

entre les mots (des co-occurences) et font ressortir des domaines mergents. Ce
logiciel peut aussi tre utilis comme une
[GAZE98].

aide la reformulation documentaire

Ce logiciel est utilis par l'ADIT, en combinaison avec Ttralogie.

U-MAP (Socit TRIVIUM - www.umap.com) : le logiciel permet de paramtrer une


requte (franais / anglais), de slectionner des sources, et de rapatrier les pages

web slectionnes. L'interface conviviale permet alors de "travailler" hors ligne sur la
masse des documents sans les ouvrir. Cette phase pralable permet d'liminer

l'inutile, en changeant souvent de point de vue pour s'intresser tantt l'ensemble,

tantt aux dtails. Umap dresse ensuite une cartographie du corpus, en mettant en
24

vidence les liens entre les mots, et en offrant des outils de simulation d'hypothses,

d'exploration des singularits, etc [CAHI97].

Exemple de carte produite pour le mot "Java".

Autre outil dvelopp par Trivium : le logiciel GINGO construit, partir d'une masse
assez importante d'informations, des "arbres de technologie", c'est--dire permettant
de suivre l'volution technique d'un secteur.

INFOSCAN (http://www.MachinaSapiens.qc.ca/machina/) :

C'est un logiciel de filtrage et de visualisation de l'information issue du courrier

lectronique et des News. InfoScan travaille partir d'un corpus constitu de


documents en format texte [LARD97].

25

ANALYSE LINGUISTIQUE

Les documents collects peuvent subir une indexation permettant un traitement


ultrieur. A cette fin, des outils d'analyse syntaxique, linguistique et smantique sont

intgrs des logiciels puissants de recherche documentaire.

SPIRIT : logiciel dvelopp par le Commissariat l'Energie Atomique, Spirit fait une

indexation automatique la fois statistique et linguistique, l'aide d'un dictionnaire,


d'un analyseur morpho-syntaxique, et d'un module de reformulation des requtes

(multilingue ; traite le langage naturel) ; il repre dans les bases de donnes les
variations de vocabulaire (nouveaux termes ou disparitions). Les rsultats sont
prsents par classe de pertinence en indiquant les units lexicales slectionnes.

Spirit-Sense est le module smantique qui intervient entre la phase d'analyse

syntaxique et la reformulation. Les ides contenues dans les documents sont


extraites automatiquement et associes des concepts.

Spirit est par exemple intgr Pricls (p. 28).

TAIGA (Traitement Automatis de l'Information Gopolitique d'Actualit). Outil de

recherche smantique des informations. Comme son nom l'indique, TAIGA est ddi

au traitement et l'analyse des informations gopolitiques et d'actualit. L'indexation


se fait par thmes, et non par mots-cls. Comme Topic, Taiga permet d'effectuer les
interrogations en texte libre ou suivant des thmes classs de faon arborescente.

Taiga fonctionne dans plusieurs langues, et est expert en smantique et en


linguistique. Il transforme les textes depuis n'importe quelle langue dans un langage
pivot qui regroupe les terminologies autour de champs smantiques.

Complexe d'utilisation, mais trs rapide (il traite 1 milliard de caractres

par seconde), TAIGA est utile pour la collecte des informations de


potentiel disponibles dans des sources formelles [LESC97].

TEXT MINING : Dvelopp par l'ECAM (Centre Europen de Mathmatiques

Appliques d'IBM), le Text Mining est un ensemble de mthodes mathmatiques et


linguistiques permettant de traiter les donnes pour les structurer et les analyser.
Deux produits d'IBM intressent particulirement la veille stratgique :

- TKS (Text Knowledge Server), solution d'analyse de bases documentaires de

sources diverses. TKS fonctionne avec des modules de prparation des donnes
(formatage, filtrage), de traitements linguistiques, classificatoires, statistiques,

d'exportation, de rapport et de visualisation des rsultats.

- TECHNOLOGY WATCH, version allge de TKS, travaille uniquement sur des textes

indexs et des donnes codes, mais n'inclue pas l'analyse linguistique et les

modules de recherche sur Internet. Technology Watch permet de faire une analyse

automatique d'information bibliographique.

26

Ce logiciel est particulirement adapt au traitement de la littrature


scientifique et technique en provenance des bases de donnes externes
mais aussi internes. [IBM98]

- Dans la gamme des outils dvelopps par IBM, on peut galement citer CRI, qui est
un outil ddi l'analyse de corpus de presse, de discours, de campagnes

publicitaires, de rsultats d'enqutes d'opinion, etc [GAZE98].

LEXIMAPPE : programme dbut au dbut des annes 80 par le Centre de Sociologie


de lEcole des Mines de Paris et le SERPIA (INIST) et class dans les outils de

clustrisation. Leximappe fonctionne avec la mthode de mots associs. Il indexe

automatiquement et repre le flux des mots (nouveaux, qui disparaissent ou qui

voluent), en gageant que "lassociation entre les termes dindexation rende visible

la trame dun domaine de recherche" [POLA93]. Mais des tests montrent que si l'on

peut effectivement identifier des lments intressants avec Leximappe, les signaux

faibles restent difficilement identifiables [MAUR96].

SPHINX LEXICA (socit Sphinx Dveloppement) : C'est un logiciel de traitement du

langage naturel. A partir de grammaires, de dictionnaires et par l'analyse syntaxique,


Sphinx Lexica procde une analyse morphologique (lemmatisation) puis une

analyse syntaxique. Il est possible de sortir une topographie du corpus et une carte

qui met en vidence les "grappes" de concepts accrochs un mot stratgique.

4. ANALYSE
Une fois le corpus trait, l'analyse fine des documents importants permettra de mettre
en vidence les signaux forts et surtout les

signaux faibles, et d'adopter des

mthodes permettant de les recouper afin de leur donner du sens. C'est une tape

stratgiquement importante, o l'intervention humaine est absolument


ncessaire. Quelques outils peuvent cependant servir de support ce travail.

Par exemple PUZZLE : ce prototype dvelopp par l'ESA [GUIL94] permet de traiter

les signaux faibles (regroupement des informations parses, fragmentaires) dans le


but de leur donner du sens. Le logiciel comporte plusieurs modules :

saisie d'informations ( l'aide d'une fiche signaltique ; attribution d'un degr de


fiabilit et d'importance) et mmorisation dans une base ACCESS ;

construction de la requte (slection des termes dans une


prdfinie) et interrogation de la base ;

liste de critres

structuration des informations sous forme de puzzle (graphe form de noeuds qui
sont les informations issues de la slection) ;

gestion des informations et des fichiers. [LESC97]

27

5. DIFFUSION et CONSULTATION
L'tape de la diffusion est essentielle car l'information doit alors pouvoir devenir
dcisionnelle.

A part la diffusion orale ou sur support papier, on peut choisir entre plusieurs modes

de mise disposition de l'information stratgique. Il faudra auparavant cibler les


diffrents publics concerns, et synthtiser l'information (par exemple sous forme de

lettre, de note, de page Web, etc. -il existe des outils pour cette phase, par exemple

Isiman, de la socit Keyword).

Le courrier lectronique est bien sr l'outil le plus rapide pour envoyer cette

information, mais on peut aussi opter pour les groupes de communication ou les
forums sur Internet. Mais attention la confidentialit. A ce niveau, il peut tre utile
d'avoir recours aux logiciels de cryptographie.

Il est galement possible d'utiliser, pour un certain type de public, les logiciels de

push pour la diffusion d'informations dj synthtises et stockes dans une ou


plusieurs bases internes.

On peut les diviser en trois catgories [RINA97] :

- push gnrique : chaque utilisateur slectionne les sites pour lesquels il veut
obtenir des mises jour automatiques. Exemple : Pointcast.

- push avec filtrage : les profils des utilisateurs sont stocks sur le serveur,

qui collecte les informations internes et externes, et les distribue en fonction


de la demande. Exemples : Castanet (Marimba), Backweb, Intermind.

- push avec publication et abonnement : les administrateurs crent des profils

utilisateurs ; les mises jour sont transmises automatiquement. Exemple :

Tibco.

28

Le choix de ces diffrentes techniques repose en fait sur les mthodes

de diffusion que l'on souhaite mettre en place dans l'entreprise. Certains


abonnements

permettent

de

recevoir

l'information

par

courrier

lectronique (par exemple une revue de presse), la prsentation la plus


courante tant une fentre qui se substitue l'conomiseur d'cran et
affiche les dpches [ANDR98].

6. OUTILS "MULTICATEGORIES" (SYSTEMES)


L'volution de l'intelligence conomique se dirige vers le dveloppement d'outils
intgrant plusieurs fonction, couvrant plusieurs tapes du processus de veille :
collecte, traitement et diffusion de l'information. En voici quelques exemples :

PERICLES (www.datops.com) En fonction d'un profil (dans le sens de "thme"), le

logiciel lance plusieurs agents simples d'une dure de vie prdfinie ( l'aide de l'outil
de recherche MetaSearch). Les sources peuvent tre de tout type (internet, bases

de donnes internes, texte, etc.). Datops a cr la notion d'InfoWarning, qui dtecte


les termes rattachs ceux de la requte. Les rsultats sont analyss
statistiquement afin de produire des cartes, des graphiques, et mettre ainsi en avant

les thmes dominant et les volutions. Il est alors possible, partir de la carte de
connaissance ("carte smantique"), d'affiner la recherche en ne slectionnant
qu'une partie des termes.

Exemple de carte de connaissance produite par Pricls, o l'on voir bien les
termes qui "rayonnent" autour d'un thme central de recherche.

29

Ce type de logiciel, s'il permet de visualiser sans problme les thmes


dominants (l'information "triviale"), ne fait pas ressortir assez clairement

les ples "marginaux", qui sont souvent des termes mergents dans un

domaine, donc des "signaux faibles" en veille technologique. Cependant,


l'avantage de Pricls est de pouvoir suivre l'volution d'une recherche
dans le temps.

IM4U (Intranet Miner For You, socit Arisem - www.arisem.com) : il s'agit d'un

"systme de veille automatise" combinant une triple dimension (push, recherche


documentaire et analyse smantique). IM4U recherche l'information dans le fonds

documentaire interne et sur internet. L'utilisateur peut recevoir par courrier

lectronique les rsultats de son profil de veille qui seront stocks sur l'intranet et
deviendront disponible pour les autres utilisateurs.

APERTO LIBRO (www.inforama.fr/al1.htm): dvelopp par Inforama International,

socit de conseil en veille et intelligence conomique, c'est un ensemble complet

d'outils et de services permettant de collecter, indexer, rechercher, organiser et trier


l'information utile. Ce systme comprend entre autre un moteur de recherche

smantique (NOEMIC98, nouvelle version de Taiga) et un logiciel gestionnaire de

connaissances (Wincite).

La base de donne constitue peut tre vue sous plusieurs angles ; le croisement
des critres permet d'obtenir des fiches de renseignements, et les fonctions

statistiques prsentent des vues graphiques de la recherche. Les donnes brutes


ainsi collectes sont filtres en fonction des paramtres entrs par Wincite.

30

CONCLUSION
Les diffrentes catgories d'outils utilisables dans le domaine de l'intelligence

conomique mettent en vidence le long processus permettant l'information

d'obtenir une vritable valeur ajoute et ainsi devenir stratgique pour l'entreprise. Il
est donc trs important de bien choisir l'enchanement de ces divers outils pour
optimiser cette activit. Cependant, il faut se souvenir qu'en aucun cas le traitement
automatique ne remplace l'intervention humaine. En effet, les experts "sont seuls

juges en matire d'analyse de contenu et de synthse : les logiciels n'auront servi

qu' leur faciliter le travail. Seule l'expertise humaine permet d'tablir vritablement

la nature et les retombes stratgiques de l'information mise en vidence par


l'ensemble des traitements" [THIL98].

Pour certaines entreprises, la recherche d'informations stratgiques se limite la


constitution rgulire de dossiers couvrant un thme donn. Pour d'autres, la simple
analyse de ce qui a t fait ne suffit pas.

Lors de la conception d'un systme de veille, il faut tenir compte des public

concerns, et des diffrents types de surveillance mettre en oeuvre [CAST94]. Par


exemple, on peut dfinir deux types de traitements :

un premier assez simple, qui recouvre la collecte (tldchargement de


documents par exemple), le reformatage, la mmorisation et la diffusion des
informations.

un second plus complexe, qui inclue un traitement linguistique et statistique (outils


bibliomtriques), pour des volumes importants.

De mme, les oprations de surveillance peuvent tre de trois ordre :

rgulire, c'est dire de fond (ex.: recherche sur les brevets, sur des bases de
donnes spcifiques...)

besoin immdiat : dossier sur un thme prcis

renseignement informel : fiches techniques des produits de la concurrence,


tudes de march, etc.

31

A chacune de ces tapes correspond un ou des traitements particuliers.

C'est pour ces raisons que le systme mis en place doit tre souple et offrir la
possibilit d'tre utilis globalement ou par modules. Certains outils pourront tre

manipuls directement par les utilisateurs (les traqueurs par exemple), d'autres le

seront par des spcialistes (ex. les outils bibliomtriques).

On peut aussi se poser le problme des diffrents corps de mtiers intervenant dans
le processus de veille : documentalistes, informaticiens, spcialistes de bibliomtrie,

experts, etc. Or "faire collaborer tous les mtiers n'est pas facile", d'o la ncessit

de mettre en place un systme bien "orchestr" par un mdiateur, qui donne accs
tout ou partie des outils et des mthodes disponibles [THIL97b].

D'autre part, lors de la mise en place d'un systme de veille stratgique, il est

important d'valuer au pralable l'usage et la valeur de l'information pour les

utilisateur [WERN98]. A quel(s) type(s) de public s'adresse-t-on ? Quels sont leurs

besoins respectifs ? L'acquisition et le dveloppement de technologies adaptes

sera fonction de la rponse ces questions.

"La veille technologique est un processus cyclique" [DESV92]. Pour respecter ce


processus, l'idal est que

les outils utiliss soient intgrs un systme

complmentaire, modulaire et souple. Bien articules avec le travail des experts, ces

technologies peuvent contribuer au bon dveloppement de l'intelligence conomique


de l'entreprise.

32

BIBLIOGRAPHIE et ADRESSES WEB


[ANDR98]
"Recherche d'information : le push fait l'actualit"
ANDRIEU O.
Technologies Internationales n40 dcembre-janvier 1998, p. 3-6

[ARON97]
"L'info, nerf de la guerre" - Dossier Intelligence Economique
ARON Patrice et PETIT Catherine
Le Monde Informatique n731 29 aot 1997

[BONN97]
"Comment faire de la veille online"
BONNET C. et MACARY J.F.

Internet Professionnel n11 juillet 1997, p. 72-75

[BOUQ95]
"Systme de veille stratgique au service de la recherche et de l'innovation de
l'entreprise :
principes-outils-application"
BOUQUET Valrie
Thse de doctorat - Universit Aix Marseille 3, 1995

[CAHI97]
"Choisir un outil de recherche textuelle"
CAHIER J.P.
Le Monde Informatique n737 10 octobre 1997

[CAST94]
"Conception et installation d'un systme de veille technologique : application au
domaine ptrolier"
CASTANO Eric
Thse de doctorat - Universit Aix Marseille, 1994

[CEIV98]
"Centre d'Expertise et de Veille Inforoutes et Langues"
http://www.ceveil.qc.ca, 1998

[CHAN98]
"Les agents intelligents aident l'internaute faire le tri des informations"
CHANIA Emmanuel
01 Informatique n1487 27 fvrier 1998, p. 19

[COUE96]
"Les logiciels d'analyse de contenu"
COUEPEL Yann

http://www.ceveil.qc.ca/traitem/couepel/intro.htm, 1996

[CRON94]
"The internet and competitive intelligence : a survey of current practice"
CRONIN B, OVERFELT K. FOURCHEREAUX K et al.
International Journal of Information management vol. 14 n3 1994, p. 204-222

[CVTC98]
Club Veille Technologique et Concurrentielle
http://www.cpod.com/cvtc, 1998

[DESJ90]
"Veille technologique : revue de littrature et tude de terrain"
DESJARDIN-BOURSIER R., MAYERE A., MUET F. et SALAUN J.M
CERCI, ENSB, Villeurbanne, 1990

[DESV92]
"La veille technologique : l'information scientifique, technique et industrielle"
DESVALS H. et DOU H.
Dunod, Paris, 1992

33

[DOU93]
"La veille technologique"
DOU Henri, HASSANALY Parina, QUONIAM Luc et LA TELA Albert
Les cahiers du Leran - Sciences de la Socit n29 mai 1993, p. 213-216

[DURA93]
"Pour une approche intelligente de l'intelligence stratgique"
DURAND Thomas, de BRABANT Charles et GOMEZ Emmanuel
IDT93

[GAZE98]
"Ss@me"
Marianne GAZEAU Consultants
http://www.opensesame.tm.fr, 1998

[GUER98]
"Soyez plus productifs avec Internet"
GUERIN Ccile et MAHE Thierry

Industries et Techniques n789 janvier 1998 p. 50-57

[GUIL94]
"Guide de l'utilisateur Puzzle"
GUILLAUME P. et NEGRE C.

Travail DESS MSIO, ESA, Grenoble, 1994

[HOHH94]
"Developping information systems for competitive intelligence support"
HOHHOF B.
Lybrary Trends vol. 43 n2 1994, p. 226-238

[IBM98]
"Data et Text Mining"
ECAM (Centre Europen de Mathmatiques Appliques d'IBM)
http://www.fr.ibm.com/france/ecam/expert.htm, 1998

[IRIT95]
"Veille stratgique, scientifique et technologique : textes des communications"
Colloque IRIT-PERIOMIP
Institut de Recherche en Informatique de Toulouse, Toulouse, 1995

[JAKO92]
"Exemples comments de veille technologique"
JAKOBIAK F.
Editions d'Organisation, Paris, 1992

[JEAN97]
"Intelligence conomique : la guerre de l'information est dclare"
JEANNE Franois
Le Monde Informatique n705 janvier 1997

[LARD97]
"Recherche d'information sur l'internet : outils et mthodes"
LARDY Jean-Pierre
ADBS Editions, 1997
http://www.adbs.fr/adbs/viepro/sinfoint/lardy/risi.htm

[LESC97]
"Des outils au service de la veille stratgique"
LESCA Humbert et ROUIBAH K.

Systmes d'information et management n2 vol. 2 1997, p. 101-132

[MAUR96]
"Les logiciels de clusterisation : un aperu de leur utilisation"
MAURO Sylvia
http://www.ceveil.qc.ca/traitem/mauros/intro.htm, 1996

[NAJM97]
"Des outils la porte de l'entreprise"
NAJMAN M.
Le Monde Informatique n705 janvier 1997

34

[NOYE95]
"Bibliomtrie, scientomtrie, infomtrie"
NOYER Jean-Max (sous la direction de)

http://www.info.unicaen.fr/bnum/jelec/Solaris/d02/index.html, 1995

[OBER97]
"L'internet et l'intelligence conomique - mthode de veille conomique par l'internet"
OBERSON Philippe
Editions d'Organisation, Paris, 1997

[PAST98]
"Introduction la bibliomtrie"
Bibliothque de l'Institut PASTEUR

http://www.pasteur.fr/units/biblio/Metrie/index.html, 1998

[POLA93]
"Analyse stratgique de l'information scientifique et technique - construction de clusters
de mots-cls"
POLANCO Xavier
Les cahiers du Leran - Sciences de la Socit n29 mai 1993, p. 111-126

[PRAX97]
"Les nouvelles technologies au service de l'intelligence collective"
PRAX J.Y et al.
IDT 97, p. 102-106

[REMI98]
"Forum europen 97 de l'intelligence conomique"
REMIZE Michel
Archimag n110 dcembre janvier 1998, p. 21-22

[REYN90]
"Le dveloppement de l'entreprise par la veille technologique"
REYNE Maurice
Herms, Paris, 1990

[RINA97]
"Technologies, services, stratgies, rglementation"
RINAUDO J.
Internet et services online 31 mars 1997

[ROIR97]
"Enqute sur la veille stratgique dans les entreprises britanniques"
ROIRON Lucile et LESCA Humbert
Technologies Internationales n32 mars 1997, p. 40-43

[ROST93]
"Veille technologique et bibliomtrie : concept, outils, applications"
ROSTAING Herv
Thse de doctorat - Universit Aix Marseille 3, 1993

[ROUS97]
"Veille et informatique : des besoins aux solutions"
ROUSSEAU-HANS Franoise et THIL Jrme
Technologies Internationales n39 novembre 1997, p. 33-36

[SCHW96]
"Competitive intelligence primer"
SCHWARTZWALDER R.
Database 19 (4) Aug/sept 1996, p. 89-91

[SFBA95]
"Les systmes d'information labore - Journes organises par la SFBA"
Socit Franaise de Bibliomtrie Applique
SFBA, Ile Rousse, 1995

[THIL98]
"Une mthode nouvelle pour cartographier des cooprations"
THIL Jrme
Technologies Internationales n41 fvrier 1998, p. 25-31

35

[THIL97a]
"Veille stratgique : un systme analyse les rseaux de collaboration"
THIL Jrme
Technologies Internationales n32 mars 1997, p. 26-31

[THIL97b]
"Veille et informatique : optez pour un mdiateur"
THIL Jrme
Technologies Internationales n34 mars 1997, p. 33-36

[WERN98]
"Une approche conomique de l'information"
WERNER E.

Technologies Internationales n40 dcembre-janvier 1998, p. 39-40

Ainsi que de nombreux documents publicitaires ou de prsentation des outils, obtenus


par l'intermdiaire de collgues de travail ou des fournisseurs.

36

Vous aimerez peut-être aussi