Académique Documents
Professionnel Documents
Culture Documents
Veille et Intelligence
stratgique
Jean-Pierre Descls
LaLIC
Universit de Paris-Sorbonne
Terminologie
Intelligence
Intelligence = capacit apprhender les
interrelations entre les faits disponibles de
manire guider laction vers un but dsir.
Relier des vnements pour leur donner du
sens
Luhn (1958) (chez IBM) : Business
Intelligence System
CompetitiveIntelligence (Michel Porter, 1980)
=> Surveillance, Veille, Intelligence
Intelligence stratgique
Intelligence stratgique (IS) est dfinie comme un
processus formalis de recherche, collecte et
traitement dinformations, de diffusions des
connaissances utiles au management stratgique.
Elle a pour mission danticiper les menaces et les
opportunits de lenvironnement (fonction
anticipative), de proposer et de mener des actions
(fonction proactive), dans le but daider la prise de
dcision stratgique et damliorer la comptitivit et
la performance de lorganisation.
Elle ncessite une structure organisationnelle en
rseaux, des moyens humains, techniques et
financiers.
Veille
La veille doit aller jusqu signaler les
impacts de tel ou tel vnement
dtect.
Elle devient intelligente ds lors quelle
produit des recommandations, elle
prconise, elle fait des prescriptions
lutilisateur destinataire, a fortiori
lorsquelle les met en uvre.
Intgration dans le
processus de
Dcision stratgique
Proactivit
Intelligence stratgique
Veille stratgique
Surveillance
Globalit
Temps
Daprs Corine Cohen, Veille et intelligence stratgiques,
Herms, 2004
1. Observation
Rseau dobservateurs
Recherche et collecte
dinformations
Diffusion
2. Analyse
et synthse
Rseau danalystes
(experts)
Traitement
Utilisation
3. Dcision
Rseau de dcideurs
Rseaux dans la veille technologique
Surveillance, Veille
Surveillance
Veille
Information
Dcision
Informations ?
Dsinformation
En fait, pour le nophyte, sur Internet, il
est quasiment impossible de bien distinguer
le bon du mauvais.
Outre la dsinformation volontaire pratique
par certains sites envers les technologies
concurrentes, il est frquent de trouver des
sites Web dont l'information n'est pas
actualise, voire des liens hypertextes non
valides.
Certaines informations sont lances comme
des leurres (tromper les concurrents).
Recherche dinformations
par indexation et
moteurs de recherche
Sources dinformations
Presse
Ouvrages
Mdias
CD ROM
Brevets
Etudes prives, publiques
Sources lgales
Internet
Rapports danalystes financiers
Rapports annuels
Intranet
10
Suspecte
peu sre
digne de foi
risque derreur
subjective
digne de foi
Valeur
de
linformation
----
Inutile
Utile loccasion
Intressante
Prioritaire et
importante
++++
Analyse de linformation
Performances
Maturit
Dclin
Dveloppement
Emergence
Temps
Courbe en S (Foster, 1986)
11
Rupture technologique
Performances
Technologie 2
Technologie 1
Temps
12
Outils de traitement
1. Mthodes fondes sur les statistiques :
- Visualisation graphique des informations
- Techniques dindexation
- Moteurs de recherche avec requtes
2. Mthodes classiques fondes sur la linguistique
- Morphologie + syntaxe + smantique => grosses ressources => cot
3. Mthodes danalyse smantique (smantique des mots, rseaux
smantiques, synonymie)
4. Mthodes appuyes par des ontologies des domaines
5. Mthodes fondes sur des relations discursives, par exploration
contextuelle avec des moteurs de recherche;
13
C1
DIF 1
Extraction
des
informations
pertinentes
D1
Utilisateur
C2
D2
DIF 2
C3
Masse de
documents
tlchargs
Classer
Catgoriser
Synthtiser
Diffuser
Retrouver
Exploiter
14
Mthodes classiques
vs nouvelles
Les mthodes classiques de recherche dinformations
dans des bases documentaires restent assez mal adaptes
une recherche dans un rseau ouvert comme Internet.
Un rseau dinformations (Internet ou des intranets) nest
pas un systme documentaire statique et ferm (systmes
documentaires, bases de donnes), il est dynamique, ouvert;
il contient en gnral un trs grand nombre de documents
dans des formats diffrents.
La recherche doit tre plus interactive et oriente vers les
besoins multiples des utilisateurs.
Requtes
Systme
de
recherche
Utilisateur
Rponses
15
La fouille et la synthse
doivent tre orientes vers
des destinataires
On ne rsume pas de la mme faon un rapport technique
portant sur lidentification dune nouvelle molcule,
selon que lon destine ce rsum :
la direction gnrale pour justifier des crdits dpenss
service financier sollicit pour des dveloppement ;
un laboratoire destin exploiter cette molcule ;
aux juristes chargs de protger la dcouverte par un brevet ;
des journalistes susceptibles de diffuser linformation ;
aux tudiants de premire anne
que lon souhaite orienter vers un nouveau secteur
16
La fouille smantique de
textes
La prise en compte, ds la modlisation, des utilisateurs
a conduit progressivement une conception largie
du rsum synthtique.
Il sagit maintenant de proposer des systmes informatiques
capables de fouiller les textes, avec des critres smantiques,
avec des points de vue diffrents,
les contenus des textes.
=> Constituer automatiquement des fiches de synthse
17
Participation interactive de
lutilisateur
Si le rsum statique sur support papier est identique pour
tous les utilisateurs,
la fouille smantique de textes rclame une participation
interactive de lutilisateur,
en lui donnant un accs une plate-forme informatique
susceptible de laider la construction de sa propre synthse;
lutilisateur fera alors appel un ou plusieurs agents qui
raliseront diffrentes tches dextraction guides par les
objectifs.
Base de
documents
tlchargs
Texte extrait
Rsum statique
Utilisateur 3
Utilisateur 3
18
Fiches
Extraits 1
(dfinitions)
Utilisateur 2
Fiches
Extraits 2
(rsultats)
Point de vue 1
Base de
documents
tlchargs
Point de vue 2
Point de vue 3
Utilisateur 3
Fiches
(citations)
Extraits 3
Utilisateur
Aide la
reformulation
Requte
Document 1
Requte reformule
automatiquement
Moteur de
recherche
______
___
Document 2
__
__
____
19
Utilisateur
1
Requte initiale
2
Requte reformule
automatiquement
Documents
Rapatris
supposs
pertinents
5
3
Plate-forme
EXCOM
Extraits
significatifs
des documents
rapatris
Rsums
des documents
rapatris
les plus
pertinents
Stockage
des rsums
20
Deuxime cours
VIGITEXT
21
Dmarche de VIGITEXT
Point de vue
de fouille : analyse des brevets
Corpus 1
Rsums de brevets
Marqueurs
linguistiques
extraits
Notions
+ marqueurs
enrichissement
Corpus 2
Textes de brevets
Enrichissement des
marqueurs
Carte smantique
de la notion
valuation
Corpus 3
Textes de brevets
Stabilisation de
la carte smantique
22
Choix du sujet
Choix des sources
laboration de requtes pertinentes adaptes aux
sources
4. Rcupration des donnes
5. Formatage des donnes
6. Analyses statistiques sur les donnes structures
7. Exploitation des rsultats danalyser
8. Mise en commun des rsultats des analyse
automatiques et humaines des documents
9. Identification des sous-thmes, de sujets pertinents,
plan gnral de ltude
10. Ralisation de ltude de veille
Recherche
dinformations prcises
Besoins en analyses
interactives
organisation
23
Analyses interactives
- reformulation de requtes pour rechercher des
informations plus prcises
- Regrouper des mots, des informations afin de
classer des documents
Base de documents
Requte
Reformulation
dune requte
cartographie
Documents extraits
Aperu gnral
Etonnement
24
25
/maintien/ : maintain
/effet caus/ : caused by
/identification/ : identify
/destruction/ : killing
/contrle/ : controlling
/analyse/ : study
/mesure/ : quantify
/nouveaut/ : new
/amlioration/
Liste des indicateurs :
to improve, to enhance, to ameliorate, to
correct, to raise, improvement, amelioration,
correction
Exemples typiques :
improves* physical fitness
Similarity vegetable quality may be
enhanced*
26
/production/
Indicateurs :
To produce, to createn to develop, to synthesize, to form, to
design, to compose, to construct, to yield, to generate, to
manufacture, to derive, synthsis, construct, production,
creation, yield form, generation, manufacture.
Exemples typiques :
*produce* virus resistant plants using genetic engineering
techniques
*construct* a uniform distribution of individual particles over a
very small target area
/ effet caus/
Indicateurs :
To cause, to provoke, to induce, to result in, to give
rise, to bring about
Exemple typique :
*causing* a substantial loss of AAA1
gene prod activities
27
Agent humain
/analyse/
/mesure/
/utilisation/
/contrle/
/identification/
Ensemble
des modification
/amlioration/
/augmentation/
/dtrioration/
/diminution/
/changement/
Rsistance
/rsistance/
Destruction
Maintien
/destruction/
Cration
/production/
/effet caus/
/maintien/
/nouveaut/
Liens dantonymie
daprs Bndicte Goujon, 1998, p. 212
Lien smantique
Modifications
/modification qualitative/
/dtrioration/
/amlioration/
/Modification quantitative/
/diminution/
/changement/
/augmentation/
deteriorate
improve
decrease
increase
change
damage
enhance
minimize
augment
transform
degrade
ameliorate
reduce
enlarge
modify
28
Modalit
Achever de
Influencer
Finir de
Terminer de
Changer
Moduler
Continuer
Poursuivre
Continuer
Commencer
Possibilit de ralisation
dmarrer
amorcer
Tenter de
Essayer de
Tcher de
faciliter
Cration / annihilation
Arrter dentretenir
Entretenir
Crer
Maintenir
Perptuer
laisser faire
Aider
amliorer
Arrter de
cesser
gner
Tolrer
respecter
empcher
Entraver
altrer
viter
Empcher
dbloquer
Librer,
Dbloquer
bloquer
Brider
barrer
Provoquer
Conduire
annihiler
Annuler
liminer
Pousser
Encourager
Pousser
Sopposer
Contrecarrer
Sopposer
Corniformes anthropomorphiss
Figures complexes
Gravures rupestres
Figures anthropomorphes
Figures simples
O2%
Rticuls
anthropomorphiss
29
Comment introduire
plus de smantique dans
les recherches dinformations ?
30
Quelles smantiques ?
Smantique des mots (des lexies)
Smantique du grammatical (morphmes grammaticaux)
Smantique de la phrase
smantique vri-conditionnelle (de la rfrence)
smantique interprtative
Smantique cognitive
Smantique discursive (du texte)
31
Quelles techniques
smantiques ?
Smantique des smes :
- une combinaison boolennes de smes est la signification dun mot
Smantique logique :
- une formule logique interprtes dans un ensemble exprime la rfrence dune
phrase (exemples phrases avec quantificateurs)
Smantique cognitive :
- un schme smantico-cognitif reprsente la signification dune phrase
Smantique discursive :
- un texte possde une structure qui contribue sa signification
=> Faut-il avoir recours la pragmatique et aux ontologies des
domaines ?
Faut-il ncessairement
sappuyer pralablement sur des
dcoupages syntaxiques ?
Beaucoup de textes (rapports techniques, notes
administratives, textes juridiques) ne respectent pas toujours
une syntaxe norme.
Les analyseurs syntaxiques automatiques chouent car ils
narrivent pas couvrir ce genre de documents => faire des
analyseurs robustes .
Certains analyseurs syntaxiques sont consommateurs de
ressources qui doivent couvrir la globalit de la langue.
32
Paradigme du TAL :
Syntaxe => Smantique
Reprsentation smantique du texte
Analyseur smantique
Analyseur morpho-syntaxique
TEXTE
TEXTE balis
33
Rgle dexploration
contextuelle
Signification de U
V1
V2 V3
Unit U
W1 W2
34
Plate-forme EXCOM
1/ Rsumer les textes
2/ Identifier les changements
de thmatiques dans un texte
3/ Recherches dinformations
sur la Toile
processus
Texte T
dextraction
dinformations
pertinentes
selon
diffrents
points de vue
35
2/ Identifier des
changements de
thmatiques dans un Texte
Quelques Indices linguistiques :
En ce qui concerne les impts, je
voudrais
Mais, pour les abattements fiscaux ,
il faut
CT1
Au cours des temps gologiques,
le niveau absolu des mers fluctue en fonction du climat et de lactivit des dorsales
ocaniques
CT2
En priode de haut niveau marin,
les mers stendent largement sur les continents et les eaux se rchauffent.,
car la surface qui capte le rayonnement solaire est grande.
Le plancton prolifre : les sdiments marins contiennent de la matire
organique qui se transforment en hydrocarbures.
CT3
En priode de bas niveau marin,
les mers rgressent et le lit des fleuves se creuse partir de leu embouchure.
Cette rosion accumule des sables sur les fonds marins : ils y forment des
roches poreuses qui pourront stocker les hydrocarbures..
Les prospections ptrolires sont facilites lorsque lon connat prcisment la succession de ces
diffrentes priodes. Toutefois, si lon sait bien dterminer lage des diffrentes couches de dpts
sdimentaires, on ignore trop souvent quelle profondeur elles sont formes.
36
3/ Rechercher des
informations
sur le Web
Problmes :
1) Les moteurs actuels ramnent trop dinformations,
donc ils sont difficilement utilisables => bruit.
2) On ne matrise pas assez la faon dont elles ont t
slectionnes ;
3) On a un aperu trop sommaire des documents
ramens : sont-ils pertinents ?
4) Le travail de tri est laiss lutilisateur
Utilisateur
Requte
WEB
Moteur de
recherche
Document 1
Document 2
Document 3
Document 4
Document 5
Document 6
Document 7
Document 8
Document 9
Document 10
.
37
Qui a rencontr
Qui ? O ? Quand ?
Texte
TITRE : Alfred Sirven a dclar avoir dispos dappuis pour
chapper la justice (Le Mondes / 05.03.01/13h15)
Dtenu la maison darrt de la Sant depuis le 7 fvrier,
lancien directeur des affaires gnrales dElf Aquitaine, a
protest, dans une dclaration prononce le 1er mars, contre
les conditions de son retour en France et celles du procs de
laffaire Dumas, dont il est lun des prvenus, et qui doit
reprendre le 12 mars. Convoqu par Renaud Van Ruymbeke, il
a t entendu hors la prsence des juges Eva Joly et Laurence
Vichnievsky. ()
38
Le 1er mars
a dclar
, lancien directeur
Des affaires gnrales
DElf Aquitaine,
Alfred
Proteste contre
Les conditions de son
Retour en France et ()
procs
Convoqu par
Renaud
Van Ruymbeke
Entendu par
hors la prsence
Dumas
Le 12 mars
Eva Joly
Laurence
Vichnievsky
Lun des
prvenus
39
Stratgies de recherche
1. Augmenter automatiquement les requtes par une
prcision accrue ;
2. Ramener des documents plus pertinents en moins grand
nombre
3. Donner des extraits pertinents en rapport avec la requte
4. Revenir aux documents pertinents
5. Utiliser plusieurs moteurs de recherche
6. Slectionner en synthtisant les rponses
40
Annotation smantique
automatique
=> enrichissement du texte
partir du texte luilui-mme
pour des traitements
opratoires
41
Applications de lannotation
42
hypothse
Remarques
conclusives
EC pour
la notion 1
Mon hypothse
est
EC pour
la notion 1.1.
Le prsent
article
a pour but de
Les principaux
rsultats
de ltude sont :
Pour conclure,
nous dirons que
EC pour
la notion 1.1.
Machine Indexer
selon
des points de vue
BASE
de TEXTES
ANNOTES
automatiquement
selon
des points
de vue
EC pour
la notion 1.1.
Questions poses
sous forme de
relations smantiques
(relations
smantiques
discursives)
SRI
TEXTES
ANNOTES
manuellement
(travail coopratif)
Textes
indexs
selon
des points
de vue
linguistiques
Rponses
sous forme
de segments
textuels
43
TAO
Questions
quivalentes
poses
en coren
EXCOM
+ SRI
en coren
Base de
documents
en coren
Traduction
des rponses
Traduction
Automatique
des rponses
en franais
TAO
44