Vous êtes sur la page 1sur 44

IHEC, Tunis, 17 avril 2007

Veille et Intelligence
stratgique
Jean-Pierre Descls
LaLIC
Universit de Paris-Sorbonne

Dfinition et enjeux de la veille


technologique

La veille stratgique est l'activit qui comprend la


collecte, l'analyse, la mise en forme et la diffusion de
l'information et cela dans le but de :
- Dtecter des signes de changements.
- Fournir les moyens de dcider.

C'est un systme d'aide la dcision qui observe et


analyse l'environnement de l'organisme pour en
dduire les menaces et les opportunits de
dveloppement.

Surveillance, Veille, Intelligence


1. Scanning (balayage) (F.J. Aguilar,
1967)
2. Problme de la dtection des
signaux faibles : I. Ansoff (1975)
3. Veille Technologique (1970)
4. Emergence des systmes
dintelligence (1950, 1958, 1967 )

Terminologie

Veille et Intelligence stratgique


Surveillance, Scanning (balayage),
Vigilance, Competitive Intelligence ,
Veille stratgique, conomique
Intelligence conomique
Intelligence conomique et stratgique
Intelligence

Intelligence
Intelligence = capacit apprhender les
interrelations entre les faits disponibles de
manire guider laction vers un but dsir.
Relier des vnements pour leur donner du
sens
Luhn (1958) (chez IBM) : Business
Intelligence System
CompetitiveIntelligence (Michel Porter, 1980)
=> Surveillance, Veille, Intelligence

Intelligence stratgique
Intelligence stratgique (IS) est dfinie comme un
processus formalis de recherche, collecte et
traitement dinformations, de diffusions des
connaissances utiles au management stratgique.
Elle a pour mission danticiper les menaces et les
opportunits de lenvironnement (fonction
anticipative), de proposer et de mener des actions
(fonction proactive), dans le but daider la prise de
dcision stratgique et damliorer la comptitivit et
la performance de lorganisation.
Elle ncessite une structure organisationnelle en
rseaux, des moyens humains, techniques et
financiers.

Veille
La veille doit aller jusqu signaler les
impacts de tel ou tel vnement
dtect.
Elle devient intelligente ds lors quelle
produit des recommandations, elle
prconise, elle fait des prescriptions
lutilisateur destinataire, a fortiori
lorsquelle les met en uvre.

Intgration dans le
processus de
Dcision stratgique

Proactivit

Intelligence stratgique

Veille stratgique

Surveillance

Globalit

Temps
Daprs Corine Cohen, Veille et intelligence stratgiques,
Herms, 2004

1. Observation

Rseau dobservateurs

Recherche et collecte
dinformations

Diffusion

2. Analyse
et synthse

Rseau danalystes
(experts)

Traitement

Utilisation

3. Dcision
Rseau de dcideurs
Rseaux dans la veille technologique

Surveillance, Veille
Surveillance
Veille

Information

Dcision

1. Dtermination des besoins en information


2. Recherche et collecte des informations
3. Traitement de linformation (analyse, synthse, mise en forme,
visualisation)
4. Stockage de linformation
5. Diffusion de linformation
6. Utilisation de linformation

Veille sur internet


Dcouvrir de nouveaux acteurs potentiels
sur le march.
Mieux connatre son environnement
technologique.
=> Grce cette dmarche, l'organisme pourra
dsormais :
Mieux se positionner dans son
environnement.
Disposer de scnarios de repositionnement
en fonction des tendances repres.

Informations ?

Trois types dinformations


L'information blanche : Publique et accessible, ne
fait l'objet d'aucune scurisation particulire
=> Recherche "classique" avec les outils grand
public.
L'information grise : Ne fait pas l'objet de publicit,
mais on peut la trouver de manire indirecte ou
dtourne ; Information sensible d'accs lgal
=> Techniques avances de recherche et de
traitement de l'information, groupe de discussion,
liste de diffusion
L'information noire : Fait l'objet d'une haute
scurisation
=>Relve de l'espionnage industriel-

Dsinformation
En fait, pour le nophyte, sur Internet, il
est quasiment impossible de bien distinguer
le bon du mauvais.
Outre la dsinformation volontaire pratique
par certains sites envers les technologies
concurrentes, il est frquent de trouver des
sites Web dont l'information n'est pas
actualise, voire des liens hypertextes non
valides.
Certaines informations sont lances comme
des leurres (tromper les concurrents).

Informations sur une socit : sur sa structure, sur


ces produits, etc.
Thmes de recherche d'un laboratoire universitaire.
Prcisions sur les normes et le cadre lgislatif d'un
pays.
Renseignements sur une personne ou un groupe de
personne.
Donnes statistiques.
Communiqus de presse.
Rapports annuels.
Informations promotionnelles.
Photographies de produits et quipements.
Dictionnaires ou lexiques, encyclopdies.
Catalogues d'diteurs ou de librairies.
Des informations financires sur un pays, une
socit, etc.
Des articles de presses.

Recherche dinformations
par indexation et
moteurs de recherche

Qualits des informations

1. Sources et crdibilit : Identification des auteurs, comit ditorial, cible du


site, qualit de la langue, publicit, partenariat

2. Contenu : Citations des sources originales, structuration des informations,


distinction nette entre le contenu et la publicit, exhaustivit, mise jour

3. Liens hypertextes: Pertinence des liens, slection, validit

4. Design et navigation : Lisibilit du texte, facilit de navigation, ncessit de


logiciels spcifiques pour visualiser le contenu, rapidit de chargement des
illustrations

5. Accessibilit : Prsence dans les principaux rpertoires et moteurs, adresse


intuitive

6. Confidentialit et interactivit : Protection des donnes personnelles,


rtroactions

Sources dinformations

Presse
Ouvrages
Mdias
CD ROM
Brevets
Etudes prives, publiques
Sources lgales
Internet
Rapports danalystes financiers
Rapports annuels
Intranet

10

Valeur des informations collectes


Valeur
de la source

Suspecte

peu sre

digne de foi
risque derreur
subjective

digne de foi

Valeur
de
linformation
----

Inutile

Utile loccasion

Intressante

Prioritaire et
importante

++++

Analyse de linformation
Performances

Maturit

Dclin

Dveloppement

Emergence
Temps
Courbe en S (Foster, 1986)

11

Rupture technologique
Performances

Technologie 2

Technologie 1

Temps

Traitement pour lanalyse et


la synthse

12

Outils de traitement
1. Mthodes fondes sur les statistiques :
- Visualisation graphique des informations
- Techniques dindexation
- Moteurs de recherche avec requtes
2. Mthodes classiques fondes sur la linguistique
- Morphologie + syntaxe + smantique => grosses ressources => cot
3. Mthodes danalyse smantique (smantique des mots, rseaux
smantiques, synonymie)
4. Mthodes appuyes par des ontologies des domaines
5. Mthodes fondes sur des relations discursives, par exploration
contextuelle avec des moteurs de recherche;

Evaluation des logiciels


Logiciels danalyse textuelle (moteurs de
recherche et outils de visualisation).
La formulation de requtes dans une
dmarche de veille ne semble pas pertinente
puisque le veilleur ne connat pas a priori
linformation utile (pour lui) qui est noye
dans un ensemble de textes.
Les approches statistiques qui produisent
des cartes smantiques ne conviennent pas
car linformation stratgique nest pas
toujours une information frquente.

13

Extraire des informations

les chercher, les trouver et les extraire de la masse des


documents produits et accessibles (tlchargs)
les classer et les catgoriser,
les synthtiser,
les diffuser,
les retrouver pour leur exploitation....

C1
DIF 1
Extraction
des
informations
pertinentes

D1
Utilisateur

C2

D2

DIF 2

C3
Masse de
documents
tlchargs

Classer
Catgoriser

Synthtiser

Diffuser

Retrouver
Exploiter

14

Mthodes classiques
vs nouvelles
Les mthodes classiques de recherche dinformations
dans des bases documentaires restent assez mal adaptes
une recherche dans un rseau ouvert comme Internet.
Un rseau dinformations (Internet ou des intranets) nest
pas un systme documentaire statique et ferm (systmes
documentaires, bases de donnes), il est dynamique, ouvert;
il contient en gnral un trs grand nombre de documents
dans des formats diffrents.
La recherche doit tre plus interactive et oriente vers les
besoins multiples des utilisateurs.

Mthodes classiques dans


des systmes documentaires
Base
Documentaire
=
Systme ferm
relativement
statique

Requtes
Systme
de
recherche

Utilisateur
Rponses

BUT : retrouver toutes les informations,


liminer le bruit et le silence;
silence
critres de validation : prcision / rappel
Mthodes : indexation, mots cls

15

La fouille et la synthse
doivent tre orientes vers
des destinataires
On ne rsume pas de la mme faon un rapport technique
portant sur lidentification dune nouvelle molcule,
selon que lon destine ce rsum :
la direction gnrale pour justifier des crdits dpenss
service financier sollicit pour des dveloppement ;
un laboratoire destin exploiter cette molcule ;
aux juristes chargs de protger la dcouverte par un brevet ;
des journalistes susceptibles de diffuser linformation ;
aux tudiants de premire anne
que lon souhaite orienter vers un nouveau secteur

Synthse des informations


pertinentes
Disposer de presque tous les documents sur un sujet donn serait de
bien peu dutilit dans la mesure o lon serait, paralllement, incapable
den synthtiser rapidement les contenus.
Diffuser les mmes informations dans toutes les directions, sans
slection, amne une vritable pollution informative qui risque de laisser
finalement les destinataires relativement peu informs.

trop dinformations = information nulle .

un trop grand bruit tue linformation utile... .


Pour tre bien inform, il faut donc tre capable de slectionner , en
temps utile, les bonnes informations .

16

Pertinence dune information ?


Une information est pertinente lorsque
ou elle vient confirmer dautres informations dj connues ;
ou elle est nouvelle dans un domaine dj explor ;
et elle est diffuse un destinataire adquat

THESE (linguistique et communication) :


Une information pertinente dans un document textuel est
indique par des marqueurs linguistiques identifiables par un
destinataire

La fouille smantique de
textes
La prise en compte, ds la modlisation, des utilisateurs
a conduit progressivement une conception largie
du rsum synthtique.
Il sagit maintenant de proposer des systmes informatiques
capables de fouiller les textes, avec des critres smantiques,
avec des points de vue diffrents,
les contenus des textes.
=> Constituer automatiquement des fiches de synthse

17

Participation interactive de
lutilisateur
Si le rsum statique sur support papier est identique pour
tous les utilisateurs,
la fouille smantique de textes rclame une participation
interactive de lutilisateur,
en lui donnant un accs une plate-forme informatique
susceptible de laider la construction de sa propre synthse;
lutilisateur fera alors appel un ou plusieurs agents qui
raliseront diffrentes tches dextraction guides par les
objectifs.

Rsum statique = identique


pour tous les utilisateurs
Utilisateur 1

Base de
documents
tlchargs

Texte extrait
Rsum statique

Utilisateur 3

Utilisateur 3

18

Synthses dynamiques : chaque utilisateur


construit son rsum en fonction des
ses intentions
Utilisateur 1

Fiches
Extraits 1

(dfinitions)

Utilisateur 2

Fiches
Extraits 2

(rsultats)

Point de vue 1

Base de
documents
tlchargs

Point de vue 2

Point de vue 3

Utilisateur 3

Fiches
(citations)
Extraits 3

Utilisateur
Aide la
reformulation

Requte
Document 1

Requte reformule
automatiquement
Moteur de
recherche

______
___
Document 2

__
__

____

19

Utilisateur

1
Requte initiale
2

Requte reformule
automatiquement

Documents
Rapatris
supposs
pertinents

5
3
Plate-forme
EXCOM

Extraits
significatifs
des documents
rapatris

Rsums
des documents
rapatris
les plus
pertinents

Stockage
des rsums

Exemples de recherches dinformations


Un documentaliste sera proccup par une extraction automatique des
dclarations, plus ou moins rcentes, de telle personnalit sur laquelle il est
charg de prparer un dossier de presse ;
Un patron de laboratoire,
laboratoire press par le temps, cherchera connatre
rapidement les mthodes exprimentales employes dans lidentification
dune molcule en exploitant une base darticles publis dans des revues
spcialises ;
Un chercheur en sciences sociales dsirera relever comment diffrents
auteurs ont apprhend un mme terme ;
Un conomiste voudra rechercher les commentaires textuels relatifs un
diagramme qui prsente lvolution compare du chmage dans divers
pays ;
Un tudiant en sciences politiques cherchera rassembler trs rapidement
certaines informations pertinentes pour dvelopper et appuyer son
expos

20

Premier cours : 24 octobre 2007

Deuxime cours

VIGITEXT

21

Dmarche de VIGITEXT
Point de vue
de fouille : analyse des brevets

Corpus 1
Rsums de brevets

Marqueurs
linguistiques
extraits

Notions
+ marqueurs

enrichissement
Corpus 2
Textes de brevets

Enrichissement des
marqueurs

Carte smantique
de la notion

valuation
Corpus 3
Textes de brevets

Stabilisation de
la carte smantique

Analyse de la dmarche des


veilleurs

Que cherche un veilleur ?


Quelles informations ?
Quelles rponses ?
Les logiciels sont-ils satisfaisants ?

22

Etapes de la ralisation de ltude


(plantes transgniques)
1.
2.
3.

Choix du sujet
Choix des sources
laboration de requtes pertinentes adaptes aux
sources
4. Rcupration des donnes
5. Formatage des donnes
6. Analyses statistiques sur les donnes structures
7. Exploitation des rsultats danalyser
8. Mise en commun des rsultats des analyse
automatiques et humaines des documents
9. Identification des sous-thmes, de sujets pertinents,
plan gnral de ltude
10. Ralisation de ltude de veille

Analyse des besoins


Aperu gnral
Besoins en
analyses automatiques
Etonnement

Recherche
dinformations prcises
Besoins en analyses
interactives
organisation

23

Besoins des veilleurs


Analyses automatiques
Informations sur le contenu global des documents
Rsultats bruts qui peuvent tonner ; lextraction dun
mot na aucune valeur.

Analyses interactives
- reformulation de requtes pour rechercher des
informations plus prcises
- Regrouper des mots, des informations afin de
classer des documents

Base de documents

Requte

Reformulation
dune requte

cartographie

Documents extraits

Aperu gnral

Etonnement

Recherche dinformations prcises

24

Satisfaction de besoins complexes :


exemple de plan de satisfaction pour les veilleurs

Notions de veille (1)

/ changement/ : modify, alter


/amlioration/ : enhanced, improve
/augmentation/ : increased
/production/ : produce, producing
/rsistance/ : defend a gainst, resistance to
/utilisation/ : useful for, used for
/dtermiration/ : degrade
/diminution/ : reduce

25

Notions de veille (2)

/maintien/ : maintain
/effet caus/ : caused by
/identification/ : identify
/destruction/ : killing
/contrle/ : controlling
/analyse/ : study
/mesure/ : quantify
/nouveaut/ : new

/amlioration/
Liste des indicateurs :
to improve, to enhance, to ameliorate, to
correct, to raise, improvement, amelioration,
correction
Exemples typiques :
improves* physical fitness
Similarity vegetable quality may be
enhanced*

26

/production/
Indicateurs :
To produce, to createn to develop, to synthesize, to form, to
design, to compose, to construct, to yield, to generate, to
manufacture, to derive, synthsis, construct, production,
creation, yield form, generation, manufacture.
Exemples typiques :
*produce* virus resistant plants using genetic engineering
techniques
*construct* a uniform distribution of individual particles over a
very small target area

/ effet caus/
Indicateurs :
To cause, to provoke, to induce, to result in, to give
rise, to bring about

Exemple typique :
*causing* a substantial loss of AAA1
gene prod activities

27

Agent humain

/analyse/
/mesure/

/utilisation/
/contrle/

/identification/

Ensemble
des modification

/amlioration/
/augmentation/

/dtrioration/

/diminution/

/changement/

Rsistance
/rsistance/

Destruction
Maintien

/destruction/

Cration

/production/

/effet caus/

/maintien/

/nouveaut/

Liens dantonymie
daprs Bndicte Goujon, 1998, p. 212

Lien smantique

Modifications

/modification qualitative/

/dtrioration/

/amlioration/

/Modification quantitative/

/diminution/

/changement/

/augmentation/

deteriorate

improve

decrease

increase

change

damage

enhance

minimize

augment

transform

degrade

ameliorate

reduce

enlarge

modify

daprs D. Garcia, 1997, cit par B. Goujon, 1998, p. 213

28

Causalit prcisant leffet produit (daprs D. Garcia)


Influence

Modalit
Achever de

Influencer

Finir de
Terminer de

Changer
Moduler

Continuer
Poursuivre
Continuer

Commencer

Possibilit de ralisation

dmarrer
amorcer

Tenter de
Essayer de
Tcher de

faciliter

Cration / annihilation

Arrter dentretenir
Entretenir
Crer

Maintenir
Perptuer

laisser faire

Aider
amliorer

Arrter de
cesser

gner

Tolrer
respecter

empcher

Entraver
altrer

viter
Empcher

dbloquer
Librer,
Dbloquer

bloquer
Brider
barrer

Provoquer
Conduire

annihiler
Annuler
liminer

Pousser
Encourager
Pousser

Sopposer
Contrecarrer
Sopposer

Corniformes anthropomorphiss

Figures complexes

Gravures rupestres

Figures anthropomorphes

Figures simples

O2%

Rticuls
anthropomorphiss

Cartographie obtenue par SEEK-Java


(daprs F. Le Priol)

29

Quelques lments bibliographiques


Franois Jakobiak, Linformation scientifique et
technique, PUF, 1995
Franois Jakobiak, H. Dou, 1992, De linformation
documentaire la veille technologique pour lentreprise.
Enjeux aspects gnraux et dfinitions , La veille
technologique, 1992, pp. 1-45
Daniella Garcia, Analyse automatique des textes pour
lorganisation causale des actions. Ralisation, du
systme informatique COATIS, Thse de doctorat,
Universit de Paris-Sorbonne, 1998.
Bndicte Goujon, Utilisation de lexploration
contextuelle pour laide la veille technologique.
Ralisation du systme informatique VIGITEXT, Thse
de doctorat, Universit de Paris-Sorbonne, 1998.

Comment introduire
plus de smantique dans
les recherches dinformations ?

30

Introduire plus de smantique ?


Les mthodes numriques (rseaux de neurones formels,
mthodes statistiques, mthodes probabilistes, N-grammes,
automates markoviens ) sont utilises dans la fouille. Elles
ne sont pas suffisantes.
Introduire plus de smantique dans la recherche des
informations pertinentes est devenue une ncessit.
Pour introduire plus de smantique dans les fouille de
textes, il devient urgent dlaborer une smantique plus
discursive o le texte entier est segment, reprsent et
structur en thmes cohrents et homognes .

Quelles smantiques ?
Smantique des mots (des lexies)
Smantique du grammatical (morphmes grammaticaux)
Smantique de la phrase
smantique vri-conditionnelle (de la rfrence)
smantique interprtative
Smantique cognitive
Smantique discursive (du texte)

31

Quelles techniques
smantiques ?
Smantique des smes :
- une combinaison boolennes de smes est la signification dun mot
Smantique logique :
- une formule logique interprtes dans un ensemble exprime la rfrence dune
phrase (exemples phrases avec quantificateurs)
Smantique cognitive :
- un schme smantico-cognitif reprsente la signification dune phrase
Smantique discursive :
- un texte possde une structure qui contribue sa signification
=> Faut-il avoir recours la pragmatique et aux ontologies des
domaines ?

Faut-il ncessairement
sappuyer pralablement sur des
dcoupages syntaxiques ?
Beaucoup de textes (rapports techniques, notes
administratives, textes juridiques) ne respectent pas toujours
une syntaxe norme.
Les analyseurs syntaxiques automatiques chouent car ils
narrivent pas couvrir ce genre de documents => faire des
analyseurs robustes .
Certains analyseurs syntaxiques sont consommateurs de
ressources qui doivent couvrir la globalit de la langue.

32

Paradigme du TAL :
Syntaxe => Smantique
Reprsentation smantique du texte
Analyseur smantique

Reprsentation morpho-syntaxique du texte

Analyseur morpho-syntaxique

TEXTE

Peut-on faire de la smantique sans


syntaxe ?

Reprsentation discursive du texte

Systme dexploration contextuelle

TEXTE balis

33

Une nouvelle technique :


lExploration contextuelle

Rgle dexploration
contextuelle
Signification de U

V1

V2 V3

Unit U

Contexte avec units non


contigus

W1 W2

Contexte avec units non


contigus

Lunit U est analyse dans le contexte discontinu


V1 , V2, V3 ; ; W1, W2

34

Plate-forme EXCOM
1/ Rsumer les textes
2/ Identifier les changements
de thmatiques dans un texte
3/ Recherches dinformations
sur la Toile

1/ Extraire des informations par des


annotations smantiques
Texte T

processus

Texte T

dextraction
dinformations
pertinentes
selon
diffrents
points de vue

35

2/ Identifier des
changements de
thmatiques dans un Texte
Quelques Indices linguistiques :
En ce qui concerne les impts, je
voudrais
Mais, pour les abattements fiscaux ,
il faut

CT1
Au cours des temps gologiques,
le niveau absolu des mers fluctue en fonction du climat et de lactivit des dorsales
ocaniques

CT2
En priode de haut niveau marin,
les mers stendent largement sur les continents et les eaux se rchauffent.,
car la surface qui capte le rayonnement solaire est grande.
Le plancton prolifre : les sdiments marins contiennent de la matire
organique qui se transforment en hydrocarbures.

CT3
En priode de bas niveau marin,
les mers rgressent et le lit des fleuves se creuse partir de leu embouchure.
Cette rosion accumule des sables sur les fonds marins : ils y forment des
roches poreuses qui pourront stocker les hydrocarbures..

Les prospections ptrolires sont facilites lorsque lon connat prcisment la succession de ces
diffrentes priodes. Toutefois, si lon sait bien dterminer lage des diffrentes couches de dpts
sdimentaires, on ignore trop souvent quelle profondeur elles sont formes.

36

3/ Rechercher des
informations
sur le Web
Problmes :
1) Les moteurs actuels ramnent trop dinformations,
donc ils sont difficilement utilisables => bruit.
2) On ne matrise pas assez la faon dont elles ont t
slectionnes ;
3) On a un aperu trop sommaire des documents
ramens : sont-ils pertinents ?
4) Le travail de tri est laiss lutilisateur

Utilisateur

Requte
WEB
Moteur de
recherche

Document 1
Document 2
Document 3
Document 4
Document 5
Document 6
Document 7
Document 8
Document 9
Document 10
.

37

Recherche assiste intelligente


dinformations sur la Toile
Identification smantique des vnements et
des lieux saillants dans des documents
textuels (Web) ;
Construire des rseaux dvnements
localiss dans des lieux ;
Rpondre des questions comme :
Qui est qui ?
Qui est o ?
O cela a-t-il eu lieu ?

Qui a rencontr
Qui ? O ? Quand ?
Texte
TITRE : Alfred Sirven a dclar avoir dispos dappuis pour
chapper la justice (Le Mondes / 05.03.01/13h15)
Dtenu la maison darrt de la Sant depuis le 7 fvrier,
lancien directeur des affaires gnrales dElf Aquitaine, a
protest, dans une dclaration prononce le 1er mars, contre
les conditions de son retour en France et celles du procs de
laffaire Dumas, dont il est lun des prvenus, et qui doit
reprendre le 12 mars. Convoqu par Renaud Van Ruymbeke, il
a t entendu hors la prsence des juges Eva Joly et Laurence
Vichnievsky. ()

38

avoir dispos dappuis ()


Traitement du titre
Dans une dclaration
prononce

Le 1er mars

a dclar
, lancien directeur
Des affaires gnrales
DElf Aquitaine,

Alfred

Proteste contre
Les conditions de son
Retour en France et ()
procs

Convoqu par

Renaud
Van Ruymbeke

Entendu par
hors la prsence

Dumas

Le 12 mars

Eva Joly
Laurence
Vichnievsky

Lun des
prvenus

Aider les utilisateurs


reformuler sa requte en fonction de
ses intentions (points de vue)
Lutilisateur a un certain point de vue pour chercher des
informations
CAUSE dun phnomne
DEFINITION dun terme
extraire les COMMENTAIRES dune srie de diagrammes
CITATION effectue par une personnalit
QUI a rencontr QUI ? OU ? QUAND ?
Quelles sont les TRANSACTIONS entre compagnies
Qui DIRIGE telle entreprise ? QUI est QUOI ?

39

Lutilisateur na pas en tte


les expressions gnrales
relatives lobjet de sa
requte
Expressions de la CAUSE ?
Expressions des CITATIONS ?
Expressions de la CITATION ?

Stratgies de recherche
1. Augmenter automatiquement les requtes par une
prcision accrue ;
2. Ramener des documents plus pertinents en moins grand
nombre
3. Donner des extraits pertinents en rapport avec la requte
4. Revenir aux documents pertinents
5. Utiliser plusieurs moteurs de recherche
6. Slectionner en synthtisant les rponses

40

Importance des expressions


discursives
1) Beaucoup dexpressions discursives structurent un
texte ;
2) Identifier automatiquement ces expressions, cest

dcouvrir la structure discursive du texte ;

tre capable dattribuer des tiquettes discursives


annotations automatiques - des phrases
(propositions, paragraphes) ;

extraire les units discursives en fonction des points


de vue adopts

crer des liens intra-texte et hyper-textes .

Annotation smantique
automatique
=> enrichissement du texte
partir du texte luilui-mme
pour des traitements
opratoires

41

Termes linguistiques vs Relations


smantiques

Les SRI actuels exploitent essentiellement des rseaux de termes


(nominaux) qui dsignent des entits =>
- les thsaurus, rseaux smantiques statiques;
- les ontologies des domaines sous forme de rseaux statiques;
- les liens privilgis avec lapproche documentaire;
- groupes IA- terminologie ;
- poids des syntagmes nominaux (identification des lexies);
- peu de smantique verbale (domaines des actions dynamiques )

Or, une langue nest pas un systme de nomenclature !


(Ferdinand de Saussure : Cours de linguistique gnrale)

la conception des documentalistes, des terminologues (Ecole de Vienne)


, ce qui bloque la conception des SRI actuels (et du Web-smantique).

En effet, une langue est constitue par des

systmes de mises en relations smantiques


exprimes par des verbes, des prpositions, des connecteurs, des
marqueurs grammaticaux

Applications de lannotation

Fouille smantique de textes selon des points de vue;


Synthses automatiques de documents textuels avec filtrage
dans des fiches;
Structuration des connaissances et constructions dOntologies
partir de textes;
Articulations entre textes et images: annoter les images par
des annotations textuelles;
Bibliomtrie avance par catgorisation (positive, ngative )
de citations
Ordonnancement temporel des vnements dans une
narration;
Spcifications informatiques partir de textes

42

Carte smantique (en intension)


de lannonce thmatique
objectifs
Rsultats

hypothse
Remarques
conclusives

EC pour
la notion 1

Mon hypothse
est

EC pour
la notion 1.1.

Le prsent
article
a pour but de

Les principaux
rsultats
de ltude sont :

Pour conclure,
nous dirons que

EC pour
la notion 1.1.

Machine Indexer
selon
des points de vue
BASE
de TEXTES
ANNOTES
automatiquement
selon
des points
de vue

EC pour
la notion 1.1.

Questions poses
sous forme de
relations smantiques

(relations
smantiques
discursives)

SRI

TEXTES
ANNOTES
manuellement
(travail coopratif)

Textes
indexs
selon
des points
de vue
linguistiques

Rponses
sous forme
de segments
textuels

43

Accs multilingue aux


informations
de documents multilingues
1. Pouvoir interroger dans une langue une base de textes (annots)
dans une autre langue
2. Exploiter des informations et des connaissances exprimes
dans diffrentes langues.

Une Application : linterrogation


multilingue
Questions
poses
en franais
selon
un point de vue

TAO

Questions
quivalentes
poses
en coren

EXCOM
+ SRI
en coren

Base de
documents
en coren

Traduction
des rponses

Traduction
Automatique
des rponses
en franais

TAO

Rponses par des


segments textuels
en coren

44