Vous êtes sur la page 1sur 227

L'ANNOTATION POUR LA

RECHERCHE D'INFORMATION
DANS LE CONTEXTE
D'INTELLIGENCE ECONOMIQUE

Thse pour l'obtention du Doctorat de


l'Universit Nancy 2
Lidentification des informations pertinentes est donc l'un des problmes majeurs auxquels doit faire face aujourd'hui le
chercheur d'information. Comment peut-on identifier l'information comme pertinente parmi la masse d'informations disponibles ?

Mots cls
Typologie de l'information, Document, Annotation, Processus de dcision, Recherche,
Traitement de l'information, Cration, Stockage, Cycle de l'information, Smantique,
Ontologie, Web, Modlisation
16/02/2007
Auteur :
Charles Abiodun Robert
L'analyse, l'opinion et/ou la recherche reposent sur l'utilisation de sources thiquement fiables mais l'exhaustivit et l'exactitude ne peuvent
tre garantie. Sauf mention contraire, les projections ou autres informations ne sont valables qu' la date de la publication du document, et
sont ds lors sujettes volution ou amendement dans le temps.
Le contenu de ces documents et/ou tudes n'a, en aucune manire, vocation indiquer ou garantir des volutions futures. Le contenu de cet
article nengage la responsabilit que de ses auteurs, il ne reflte pas ncessairement les opinions du(des) employeur(s), la politique ou
lopinion dun organisme quelconque, y compris celui de gouvernements, dadministrations ou de ministres pouvant tres concerns pas ces
informations. Et, les erreurs ventuelles relvent de lentire responsabilit des seuls auteurs.
Les droits patrimoniaux de ce document et/ou tude appartiennent leur(s) auteur(s), voire un organisme auquel les sources auraient pu tre
empruntes.
Toute utilisation, diffusion, citation ou reproduction, en totalit ou en partie, de ce document et/ou tude ne peut se faire sans la permission
expresse du(es) rdacteur(s) et du propritaire des droits patrimoniaux.

Base de Connaissance AEGE : http://www.bdc.aege.fr

Ecole doctorale Langages, Temps, Socits

Lannotation pour la recherche


dinformation dans le contexte
dintelligence conomique

tel-00131856, version 1 - 19 Feb 2007

THESE
Prsente et soutenue publiquement le 16 fvrier 2007

pour l'obtention du
Doctorat de l'Universit Nancy 2
(Spcialit Sciences de l'information et de la communication)
par

Charles Abiodun ROBERT


President de Jury : Mr. Mohamed HASSOUN : Professeur lENSSIB (Lyon)
Composition du jury
Rapporteurs :
Mr. Philippe DUMAS : Profeseur lUniversit de Toulon
Mr. Lad BOUSIDI : Professeur lUniversite Jean Moulin, Lyon 3

Examinateurs :
Mr. Mohamed HASSOUN : Professeur lENSSIB (Lyon)
Mr. Amos DAVID : Professeur de Sciences l'Universit de Nancy 2
(Directeur de thse).
Mme. Odile THIERY : Professeur l'Universit de Nancy 2
Mr. Louis-Philippe LAPREVOTE : Professeur l'Universit de Nancy 2.
Laboratoire Lorrain de Recherche en Informatique et ses Applications | UMR 7503

Ddi :

tel-00131856, version 1 - 19 Feb 2007

La prsence de Makapangyarihang
La mmoire de Victoria Abike Robert
Lavenir de Guillaume,
et John Robert

Remerciements

Mes remerciements vont en tout premier lieu au Professeur Amos DAVID, mon
directeur de thse, qui m'a accueilli au sein de son quipe, pour la confiance qu'il m'a
accorde et les conseils qu'il m'a apports durant ces annes de recherche.
Je remercie les rapporteurs, Professeur Philippe DUMAS et Professeur Lad
BOUZIDI de mavoir fait lhonneur de rapporter cette thse, ainsi que pour lintrt
quils ont manifest lgard de mon travail et des remarques enrichissantes quils
mont formules.

tel-00131856, version 1 - 19 Feb 2007

Je remercie Professeur Odile THIERY pour les conseils, les corrections et les
remarques aviss quelle a su me prodiguer.
Mes remerciements vont aussi au Professeur Louis-Philippe LAPREVOTE et
Professeur Mohamed HASSOUN pour la disponibilit dont ils ont su faire preuve.
Je remercie le Dr. Adenike OSOFISAN pour le soutien administratif auprs de
University of Ibadan, Nigria et l'intrt qu'il a manifest pour mes travaux et l'aide
qu'il m'a accorde.
Je tiens remercier Hanene MAGHREBI pour sa disponibilit dans les moments
difficiles. Mes remerciements aussi Marie KNIPPER, Mr. Nobert MARCINIAK,
Mr. Jos PEREIRA et Mme Myriam BEYAERT pour leur soutien dans la relecture
du mmoire.
Je tiens galement remercier ma famille et mes amis pour leur aide et leur soutien
dans les nombreux moments de doute qui jalonnent invitablement un travail de
longue haleine comme celui-ci.
Merci enfin tout particulirement mes enfants pour leur soutien infatigable.

tel-00131856, version 1 - 19 Feb 2007

Tables de matires
1. Les pincipaux concepts de notre tude ..............................................................19
1.1.
Comment dfinir linformation ?...................................................................19
1.1.1.
Linformation en tant que processus .........................................................22
1.1.2.
L'information en tant qu'objet....................................................................22
1.1.3.
Typologie des informations .......................................................................23
1.1.3.1.
L'information BLANCHE .....................................................................24
1.1.3.2.
Linformation GRISE ............................................................................26
1.1.3.3.
L'information NOIRE ............................................................................27
1.1.4.
Le document ..............................................................................................28
1.1.4.1.
Les dfinitions spcifiques dun document ...........................................28
1.1.4.2.
Dfinition d'un document selon sa cration ..........................................29
1.1.4.3.
Dfinition d'un document selon son utilisation .....................................30
1.1.5.
Lannotation...............................................................................................31
1.2.
Lintelligence et sciences de l'information et de la communication (SIC) ....35
1.2.1.1.
Lintelligence concurrentielle (competitive/ business intelligence) ......38
1.2.1.2.
Lespionnage..........................................................................................40
1.2.2.
Lintelligence conomique ........................................................................41
1.2.2.1.
LIE en France .......................................................................................43
1.2.2.2.
Les acteurs dans le processus de dIE....................................................44
1.2.2.2.1. Le dcideur ............................................................................................45
1.2.2.2.2. Le veilleur ..............................................................................................50
1.2.3.
Le processus de lIE...................................................................................52
1.2.3.1.
Dfinition du problme dcisionnel.......................................................54
1.2.3.2.
Transformation du problme dcisionnel en problme de recherche
dinformation .............................................................................................................55
1.2.3.3.
Collecte dinformations pertinentes.......................................................57
1.2.3.4.
Validation des informations...................................................................58
1.2.3.5.
Traitement des informations ..................................................................58
1.2.3.6.
Interprtation des indicateurs.................................................................60
1.2.3.7.
Dcision .................................................................................................60
1.2.4.
Lintelligence militaire C4ISTAR et lIE..................................................62
1.2.5.
Processus dcisionnels...............................................................................64
1.2.6.
Les systmes informatiss lis aux processus de dcision ........................65
1.2.6.1.
Les systmes d'aide la dcision (SIAD)..............................................67
1.2.6.2.
Systme dInformation Excutifs (SIE).................................................68
1.2.6.3.
Les systmes d'aide la dcision de groupe.........................................69
1.2.6.4.
Le traitement analytique en ligne (OLAP) ............................................70
1.2.7.
Lintelligence et lannotation.....................................................................71
1.2.8.
Les problmatiques lies la recherche et au traitement de linformation72

tel-00131856, version 1 - 19 Feb 2007

Chapitre 2...................................................................................................................73
2. tat de lart sur lannotation ..............................................................................73
2.1.
Lannotation dans le domaine de SIC............................................................73
2.1.1.
Les sciences de linformation et de la communication..............................73
2.1.2.
La communication .....................................................................................75
2.1.3.
La communication et la recheche de linformation ...................................76
2.1.4.
La recherche dinformation .......................................................................78
2.1.5.
Lannotation comme un moyen de communication ..................................79
2.1.5.1.
Lannotation comme un moyen de communication dun groupe ..........80
2.1.5.2.
Lannotation et la cycle communicationnelles ......................................81
2.1.5.2.1. La cration dune annotation .................................................................81
2.1.5.2.2. Les annotations continues......................................................................82
2.1.5.3.
Le cycle informationnel et lagrgation dexprience ...........................84
2.1.5.3.1. Le partage des expriences partir dun seul document .......................85
2.1.5.3.2. Le partage des expriences partir de plusieurs documents ................91
2.1.5.4.
La dsinformation, la propagande et lannotation .................................92
2.1.5.5.
Les outils dannotation et les outils de communication.........................93
2.1.6.
Le concept et les processus dannotations .................................................94
2.1.7.
Lannotation dans le processus de recherche de linformation..................95
2.2.
Cration et stockage dannotation..................................................................97
2.2.1.
XML : la base de spcifications des annotations.......................................97
2.2.2.
Resource Desciption Framework (RDF) .................................................100
2.2.3.
Les projets sur lannotations ....................................................................100
2.2.3.1.
ANOTEA .............................................................................................102
2.2.3.2.
Microsoft Common Annotation Framework (CAF)............................104
2.2.3.3.
Extensible MultiModal Annotation Language (EMMA) ....................105
2.2.3.4.
Linguistic Annotation Framework (LAF)............................................107
2.2.4.
Les modles dannotation existants ........................................................109
2.2.4.1.
Modle fond sur lorganisation du contenu .......................................109
2.2.4.1.1. Modle smantique ..............................................................................109
2.2.4.1.2. Modle ontologique .............................................................................110
2.2.4.1.3. Les problmes lis aux modles organisationneles .............................112
2.2.4.1.4. Quelques langages d'organisation de contenus....................................112
2.2.4.2.
Modles fonds sur les modes de cration dannotation .....................117
2.2.4.2.1. Les annotations automatiques..............................................................117
2.2.4.2.2. Annotation semi-automatique..............................................................119
2.2.4.2.3. Annotation manuelle............................................................................121
2.2.4.3.
Annotation dans les technologies du Web...........................................121
2.2.4.3.1. Les dispositions du Web ......................................................................122
2.2.4.3.2. Prsentation dinformation ..................................................................123
2.2.4.3.3. Stockage d'information ........................................................................125
2.2.4.3.4. Partage dinformation ..........................................................................127
2.2.4.4.
Problmes lis aux outils dannotation sur le Web..............................128
2.2.5.
Les outils dannotations spcifiques et leurs spcificits ........................131
2.2.5.1.
Grants...................................................................................................131
2.2.5.2.
One-Thousand Words (OTW) .............................................................132
2.2.5.3.
AMAYA ..............................................................................................133

tel-00131856, version 1 - 19 Feb 2007

2.2.5.4.
Lannotation GeoMedia.......................................................................135
2.2.5.5.
CoNote .................................................................................................136
2.2.6.
Lintegration des annotations dans les documents ..................................137
2.2.6.1.
Lem emplacements des annotations dans un document ......................137
2.2.6.2.
Les annotations non-intgres sur les documents................................137
2.3.
Utilisation et intgration dannotation dans le processus dIE ....................139
2.3.1.
Un regard sur annotation par son utilisation............................................139
2.3.1.1.
Annotation pour la classification .........................................................139
2.3.1.2.
Annotation pour la structuration ..........................................................140
2.3.1.3.
Le public dans lutilisation ..................................................................140
2.3.1.3.1. Annotation pour un groupe dutilisateur..............................................140
2.3.1.3.2. Annotation pour un usage personnel ...................................................141
2.3.2.
Annotation et indexation..........................................................................141
2.3.2.1.
Annotation hors du contexte ................................................................142
2.3.2.2.
Langage dannotation ..........................................................................142
2.3.2.2.1. Rgle graphique ...................................................................................142
2.3.2.2.2. Rgle orale ...........................................................................................143
2.3.2.2.3. Rgle crite : explicite ou code ..........................................................143
2.3.3.
Fonctionnement dannotation sur un document ......................................143
2.3.4.
Granularit dannotation ..........................................................................144
2.3.4.1.
Les valeurs dannotation et leurs granularits .....................................145
2.3.4.2.
Granularit du documents et type des annotations ..............................146
2.4.
Conclusion ...................................................................................................146

Chapitre 3.................................................................................................................147
3. Proposition pour la modlisation et la ralisation d'un systme d'annotation
pour lIE...................................................................................................................147
3.1.
Schma gnral d'un systme d'annotation..................................................147
3.2.
Notre choix des parametres d'une annotation: Le modle AMIE................149
3.3.
Notre choix des types de document possible pour une annotation ............152
3.4.
La modlisation du systme d'annotation ....................................................155
3.4.1.
Caractristiques fonctionnelles du systme .............................................155
3.4.2.
Schma Entit-Association et relationnel pour les donnes du systme .156
3.5.
Schma fonctionnel du systme I-AMIE.....................................................159
3.5.1.
Le dveloppement du systme avec la technologie Internet...................163
3.5.2.
L'implantation du systme I-AMIE au LORIA .......................................165
3.5.2.1.
Les composants logiciels du systme I-AMIE ....................................167
3.5.2.2.
Les interfaces .......................................................................................171
3.5.3.
Consultations des annotations existantes.................................................178
3.5.3.1.
Affichage des annotations....................................................................178
3.5.3.2.
Accs et interrogation de base dannotation ........................................179
3.5.3.2.1. Explorer ...............................................................................................179

tel-00131856, version 1 - 19 Feb 2007

3.5.3.2.2. Interroger .............................................................................................180


3.5.3.2.3. Analyser ...............................................................................................185
3.5.4.
Diverse .....................................................................................................186
3.5.4.1.
Alimentation de la base de document ..................................................186
3.5.4.2.
Filtration des documents affichs ........................................................187
3.5.4.3.
Recherche Plus.....................................................................................187
3.6.
Domaines dapplication du systme I-AMIE ..............................................188
3.6.1.
Application des annotations dans un contexte dIE.................................188
3.6.2.
Application dans le domaine bibliographique .........................................191
3.6.3.
Application dans le domaine d'administration juridique .........................191
3.6.4.
Gestion de dveloppement Open Source ...........................................192
3.6.5.
Application dans les travaux de ressources ouvertes...............................193
3.6.5.1.
WIKI ....................................................................................................193
3.6.5.2.
DELICIOUS ........................................................................................194
3.6.5.3.
Flickr....................................................................................................195
3.6.6.
Application globale..................................................................................197
3.7.
Le test et lanalyse du systme I-AMIE ......................................................197

Chapitre 4.................................................................................................................199
4. Conclusions gnrale .......................................................................................199
4.1.
Conclusion ...................................................................................................199
4.2.
Perspectives .................................................................................................202

Table des Figures

tel-00131856, version 1 - 19 Feb 2007

Figure 1.1 : Lintelligence implique plusieurs processus ..........................................37


Figure 1.2 : Architecture dun systme dintelligence conomique ..........................41
Figure 1.3 : Les tapes de recherche dinformation...................................................66
Figure 1.4 : Interface dun system de SAD (LEXSYS 2.3).......................................68
Figure 2.1 : Un chercheur dinformation communique pour rduire une barrire ...77
Figure 2.2 : Un extrait du trait Europen de 1951 ...................................................81
Figure 2.3 : La cration dannotation .......................................................................82
Figure 2.4 : Lannotation continue ............................................................................84
Figure 2.5 : Partage dannotation en mode modr ...................................................86
Figure 2.6 : Partage dannotation en symbiotique .....................................................87
Figure 2.7 : Partage dannotation en propagation......................................................88
Figure 2.8 : Partage en mode de transition ................................................................89
Figure 2.9 : Partage en mode mixte ..........................................................................90
Figure 2.10 : Le mise en correspondance des annotateurs et des documents...........91
Figure 2.11 : Lannotation par rapport au SRI et IE.................................................95
Figure 2.12 : Larchitecture generale de cadre dANNOTEA.................................102
Figure 2.13 : Le cadre dannotation EMMA ..........................................................106
Figure 2.14 : Un exemple de dpt smantique .....................................................110
Figure 2.15 : La table priodique est un exemple dorganisation ontologique........111
Figure 2.16 : Indexation dans Topic maps...............................................................116
Figure 2.17 : Un exmple dannotation base sur le format (GOA) .........................124
Figure 2.18 : Un exemple d'annotation partage dans le systme dinformations
LEXSYS ..................................................................................................................128
Figure 2.19 : Une fentre de cration d'annotation par GrAnt ................................131
Figure 2.20 : Copie d'cran d'annotation d'une image sur OTW .............................133
Figure 2:21 : Interface of AMAYA 9.3 sur www.loria.fr/news sans les cadres......135
Figure 2 :22 : Copie d'ecran de CoNote..................................................................136

Figure 3.1 : Annotation sur un document primaire..................................................153


Figure 3.2 : Annotation sur un document secondaire ..............................................154
Figure 3.3 : Annotation sur des annotations ............................................................155
Figure 3.4: Schma Entit-Association de notre systme d'annotation...................157
Figure 3.5 : Graphe de relation de la collection de relations ...................................159
Figure 3.6 : Reprsentation du systme I-AMIE .....................................................160
Figure 3.7 : Prsentation de larchitecture 3-tiers....................................................164
Figure 3.8: Les interactions entre les composants du systme I-AIME ..................166
Figure 3.9 : Les composants logiciels de I-AMIE...................................................168

tel-00131856, version 1 - 19 Feb 2007

Figure 3 .10 : Utilisation de systme I-AMIE pour la recherche dinformation .....170


Figure 3.11: Schma fonctionnel dI-AMIE............................................................172
Figure 3.12 : Ecran de login ....................................................................................173
Figure 3.13: Prsentation de systme dannotation .................................................173
Figure 3.14 : Ecran de cration d'un nouvel utilisateur ...........................................174
Figure 3.15 : Interface de cration dannotation......................................................175
Figure 3.16 : Premier cran dans la cration d'annotation.......................................176
Figure 3.17 : Zone de cration d'annotation ............................................................177
Figure 3.18 : Ecran de liste des annotations dans la base ........................................178
Figure 3.19 : Interface pour explorer le contenu de la base....................................179
Figure 3.20 : Interface pour slection une variable a explor..................................180
Figure 3.21 : Interface de recherche des livres de biblotheque duniversit Nancy 2
.................................................................................................................................180
Figure 3.22 : Un essai comparable aux autres systmes de recherche dinformation
.................................................................................................................................181
Figure 3.23 : Interface de spcification dune interrogation....................................182
Figure 3.24 : Interface dinterrogation pour choisir les variables a croiser.............183
Figure 3.25 : Exemple de rsultat dune interrogation utilisant OU ..................184
Figure 3.26 : Interface pour saisir les textes a analyser dans la base.................185
Figure 3.27 : Interface pour alimenter la base de document....................................186
Figure 3.28 : Interface pour spcifier les paramtres de filtration...........................187
Figure 3.29 : Recherche dinformation avec annotation..........................................188
Figure 4.1 : La mise en correspondance des sujets avec les utilisateurs et les
annotations ...............................................................................................................205

tel-00131856, version 1 - 19 Feb 2007

Liste des Tableaux


Tableau 1.1 : Les dfinitions de l'information blanche..............................................25
Tableau 1.2 : Les dfinitions de linformation grise.................................................26
Tableau 1.3 : Les dfinitions de l'information noire..................................................27
Tableau 1.4 : Analogies autour des actions du dcideur et veilleur (Kislin et al, 2003)
...................................................................................................................................51
Tableau 1.5 : Table de processus de lIE selon quipe SITE ....................................54
Tableau 1.6 : Table de comparaison entre lIE et lintelligence militaire .................64
Tableau 2.1 : La dfinition de la communication (Alex Mucchielli, 1998) ..............76
Tableau 2.2 : Table de comparisons des outils communicationnels sur internet.......94
Tableau 2.3: Les proprits dune annotation en format RDF pour ANNOTEA....103
Tableau 2.4 : Les couleurs des annotations en GENOTATOR ...............................119
Tableau 2.5 : La table des systmes dannotation spcifiques ................................125
Tableau 2.6 : Tableau des fichiers dans le stockage des informations ....................126
Tableau 3.1 : Tableau comparatif des outils existants .............................................149
Tableau 3.2 : Signification des colonnes de lcran 3.18 ........................................179
Tableau 3.3 : Les autres oprateurs qui ne sont pas utiliss ....................................184
Tableau 3.4 : Synthse des exploitation des annotations dans le contexte dIE......190

10

11

tel-00131856, version 1 - 19 Feb 2007

12

tel-00131856, version 1 - 19 Feb 2007

Introduction gnrale
On considre que le sicle de l'information est lre qui suit lge industriel. Cest
la priode partir de laquelle le mouvement de linformation est devenu plus rapide
que le mouvement physique des matriels physiques. Plus spcifiquement, il s'agit
des annes 80 ou 90 et au-del. On pourrait dire qu'il na rellement commenc que
pendant la dernire moiti du XIXe sicle, par l'invention du tlphone et de la
tlgraphie. Il est souvent dsign comme la priode post-industrielle.

tel-00131856, version 1 - 19 Feb 2007

Cette priode est domine par la convergence de plusieurs dispositifs de traitement


de l'information et de mthodes de transformations diverses de cette dernire.
L'accs l'information, et sa gestion, devient un problme en raison des dispositifs
et des mthodes htrognes ou non compatibles, utiliss pour la traiter.
Lhtrognit de linformation est souvent due la diversit des quipements
utiliss :

tlvision par satellite, tlphone, tlphones mobiles, raccordements

grande vitesse, Voix sur Protocole Internet (VOIP),

micro-ordinateurs,

radio,

Internet sur les mdias. Ou encore la diversit des moyens : rayons laser, ondes
radio, lectricit, lectromagntisme et infrarouges.
Ce sicle de l'information est caractris par l'explosion de l'information. La
disponibilit de l'information n'est plus rellement en cause; Est-ce que le vrai
problme est li comment (re)trouver des informations pertinentes et
appropries ?
Lindentification des informations pertinentes est donc l'un des problmes majeurs
auxquel doit faire face aujourd'hui le chercheur d'information. Comment peut-on
identifier l'information comme pertinente parmi la masse d'informations disponibles ?
C'est la question importante.
Les informations pertinentes sont souvent trouves dans un tat contestable, qui
demandera un traitement ultrieur. (Dubois et al, 1997) ont identifi huit situations

13

diffrentes d'informations incertaines. Elles se discernent sous les qualificatifs


suivants :
x

ambigu : quand l'information fournie ne donne pas un claircissement de


son contenu,

brute : - une partie de l'information a besoin dun traitement approfondi,


affin-,

biaise : - les informations sont systmatiquement polarises pour donner


une orientation particulire,

incomplte : quand il manque linformation une partie ncessaire pour

tel-00131856, version 1 - 19 Feb 2007

caractriser correctement une situation spcifique,


x

imprcise : son contenu ne correspond pas au standard de prcision attendu,

incertaine : linformation est compromise, en raison de la source,

incohrente : linformation contredit une ou plusieurs autres informations,

redondante : quand linformation est livre sous plusieurs formes

Toutes les informations ne sont donc pas forcment utiles et, en particulier dans le
domaine communicationnel, on se doit de ne retenir que celles

du type

" pertinentes et sans constestation".


Afin d'accder aux informations pertinentes sous une forme acceptable, nous avons
alors besoin de les traiter.
Une des manires de traiter l'information pertinente est lapplication du concepts et
doutils d'annotations. Lobjectif de ces outils et concepts dannotation est
daugmenter non seulement la possibilit d'accs l'information pertinente mais
galement d'aider la rduction des difformits.
Dans le cadre de notre tude, nous nous somme pos les questions suivantes :
a. La recherche de l'information, pralable une prise de dcision, peut-elle tre
renforce par des outils dannotation ?
Des informations pertinentes restent souvent hors de porte de l'utilisateur
quand les mthodes d'organisation de l'information ne sont pas bonnes ou que

14

les algorithmes de recherche sont inadapts. Mais dans certains cas, cette
difficult peut tre lie un manque d'adquation entre les mots employs dans
la base dinformation et les mots utiliss par lutilisateur pour les retrouver.

Par exemple, dans une base bibliographique, des champs comme auteur, date
de publication, titre sont utiliss pour dcrire les informations que l'on va
trouver dans la base. Comment trouver des informations ne sont pas spcifies
par ces attributs ? Par exemple, comment trouver le pays dorigine ou les intrts
personnels de lauteur dune publication ? Pouvons-nous tendre la recherche

tel-00131856, version 1 - 19 Feb 2007

en dehors de ces critres ?

Est-ce que lintgration dune base dannotations pourra produire un meilleur


rsultat en terme de pertinence et en terme de prise en compte des spcifits des
utilisateurs ?
Ainsi le classement des informations bibliographiques dans une bibliothque
nest pas fond sur les terminologies utilises par des experts dans leurs
domaines spcifiques mais il est labor sur la terminologie propre aux
bibliothcaires.
Ne serait-il pas intressant d'utiliser les commentaires d'un expert dans un
domaine donn pour classer les publications spcifiques ce domaine ? Le
guidage et les propositions de cet expert, plutt que les rfrences
bibliographiques formelles, ne donneraient-il pas une meilleure apprhension de
lintrt de l'ouvrage ?
b. Peut-on guider, par un modle appropri, le processus d'annotation qui peut
soutenir la recherche dinformation ?
Les annotations libres, -ou les modles d'annotation existants- , qui ajoutent
certes une information, ne sont pas toujours appropries. Nous supputons que
l'utilisation d'annotations prdtermines par un modle peut, elle, favoriser une
recherche dinformation plus efficiente. Quel serait ce modle ?

15

c. Comment les informations annotes peuvent-elles tre collectes pour aider la


prise de dcision ?
Six mthodes sont utilises en gnral pour la collecte de linformation, selon

tel-00131856, version 1 - 19 Feb 2007

Harvard Family Research Project (Harvard, 2004).


i.

Les enqutes et questionnaires,

ii.

Les entretiens et la constitution de groupes spcifiques,

iii.

Les observations,

iv.

Les revues de documents,

v.

Les tests et valuations,

vi.

Les revues de sources secondaires.

Y-a-t-il une mthode pour collecter des annotations utiles ?


Pouvons-nouvons combiner certaines de ces mthodes ? Ou slectioner entre
ces propositions ? Est-il possible d'laborer nous-mmes une mthode plus
efficace dans la collecte d'annotations ?
d. Comment l'information annote peut-elles tre utilise pour la prise de dcision ?
Utiliserons-nous l'information annote telle quelle, ou une partie des annotations
doit-elle tre davantage traite ?
Que devons-nous faire pour que les annotations restent exploitables ?
Y a-t-il des paramtres particuliers qui puissent les valider pour la prise de
dcision ?
Nous pensons en effet que lannotation devrait contribuer la transformation de
linformation collecte en des informations valeur ajoute qui seront plus adaptes
pour la prise de dcision ce qui constitue notre hypothse pour la thse.
Ce travail a pour objectif de proposer un modle dannotation dans la recherche
dinformations, utiles une prise de dcision.

16

Le but et l'intrt de l'annotation sont bien l'interprtation de l'information et la


transmission d'une connaissance complmentaire. Elle dvoile donc une
proccupation, ou un problme, et parfois rsout ce problme. Pour chaque
annotation communique, il y a mise en vidence du jugement de son crateur.
Dans le cadre de ce travail nous orienterons notre rflexion sur les annotations
d'informations vers le domaine de l'Intelligence Economique (Concept que nous
dfinirons en son temps).
Des concepts directement connexes cet objectif doivent tre pris en compte, et
dfinis : l'information, les documents, lannotation, le dcideur, le veilleur,
lintelligence et l'Intelligence Economique, et enfin la communication. Cest
tel-00131856, version 1 - 19 Feb 2007

pourquoi le chapitre 1 prsente les principaux concepts de notre tude.

Dans le chapitre 2, nous prsentons les travaux qui ont t effectus dans le domaine
d'annotation. Nous avons prsenterons les caractristiques et les spcificits de
l'annotation par rapport les sciences de l'information et de la communication.

Le chapitre 3 est consacr la conception d'un modle d'annotation AMIE dans le


processus dintelligence conomique. Nous prsentons galement comment un
systme I-AMIE fond sur ce modle a t dvelopp. Nous montrons l'application
de ce modle dans lIE en exposant quelques cas particulier.

Dans le chapitre 4 nous prsenterons la conclusion et les perspectives lies ce


travail.

17

18

tel-00131856, version 1 - 19 Feb 2007

1.1.

CChapitre 1
Dans le domaine professionnel, nos mthodes de transmission et d'tude des
rsultats de la recherche datent de plusieurs gnrations et ne conviennent plus
du tout de nos jours1.
Vannevar Bush - As We May Think
The Atlantic Monthly, July 1945

1. Les pincipaux concepts de notre tude


1.1.

Comment dfinir linformation ?

En raison de la nature dynamique de linformation, il subsiste nombre de problmes


tel-00131856, version 1 - 19 Feb 2007

concernant sa caractrisation, sa dfinition, sa transmission, sa reprsentation et son


formatage.

Diffrentes

dfinitions

peuvent

tre

donnes

pour

le

terme

information , selon leur contexte dutilisation.


Shannon (Shannon, 1948, page 2) dfinit linformation comme : la mesure de
corrlation entre deux objets alatoires (variable, fonctions, vnements, etc.).
Cette information est transmise par un canal de communication l'aide d'un signal.
Cette dfinition permet de faire apparatre les lments importants de la notion
d'information qui sont :
x

l'information elle-mme,

le signal transmetteur,

l'metteur et le rcepteur.

Linformation est la signification humaine attribue aux donnes par les moyens
des chartes spcifies employs dans leur reprsentation (National, 1996)
Linformation est les faits et connaissances dduits des donnes 2 (Dicofr.com)

Professionally our methods of transmitting and reviewing the results of research are generations
old and by now are totally inadequate for their purpose
2
http://www.dicofr.com/cgi-bin/n.pl/dicofr/definition/20010101002600

19

Linformation est llment de connaissance susceptible d'tre reprsent l'aide


de conventions pour tre conserv, trait ou communiqu3 (Futura-Sciences)
Dans luvre de Robert (Reix, 1969, page 4),
Linformation apparat comme le moyen et lobjet de la communication. Tout ce
qui peut se reprsenter, scrire, se dire pour tre communiqu entre hommes ou
entre machines constitue de linformation

Remarquons que pour nous, linformation est un moyen mais galement un objet.
Le grand Larousse de la langue Franaise (1996) dfinit linformation par rapport
cinq domaines :
tel-00131856, version 1 - 19 Feb 2007

Action : Linformation est laction dinformer, de se mettre au courant


dvnement

Etat : Linformation est une nouvelle, un renseignement que lon


communique ou que lon obtient

Connaissance : Linformation est un ensemble de connaissances acquises


sur quelquun ou sur quelque chose

Contenu : Linformation est le contenu proprement dit des messages


transmis

Contenant : Linformation est un signal par lequel un systme donne


connaissance de sa position un autre.

Selon ODLIS (Online Dictionary of Library and Information Science)4, les informations
sont : les donnes prsentes en forme aisment comprhensible, auxquelles une
signification a t attribue dans un contexte dutilisation. Dans un sens plus
dynamique, l'information est le message transmis par l'utilisation d'un moyen de
communication ou dexpression. Un message spcifique peut tre informatif ou pas ;
il dpend en partie de la perception subjective de la personne qui va le recevoir.
Selon Le Coadic (Le Coadic, 1994), linformation est une connaissance inscrite
3
4

http://www.futura-sciences.com/comprendre/g/definition-information_552.php
http://lu.com/odlis/odlis_i.cfm (08/04/2003)

20

(enregistre) sous forme crite (imprime ou numrise), orale ou audiovisuelle.


Linformation comporte un lment de sens. Cest une signification transmise un
tre conscient par le moyen dun message inscrit sur un support spatio-temporel :
imprim, signal lectrique, onde sonore, etc. Cette inscription est faite grce un
systme de signe (le langage), le signe tant un lment du langage qui associe un
signifiant un signifi : signe alphabtique, signe de ponctuation etc. Le but de
linformation reste lapprhension de sens ou dtres dans leur signification, c'est-dire le reste de la connaissance ; la transmission du support, de la structure en tant
le moyen.

tel-00131856, version 1 - 19 Feb 2007

Selon le dictionnaire wikipedia, L'information au sens commun est le moyen pour


un individu de connatre son environnement.
On qualifie l'information comme toute donne pertinente que le systme nerveux
central est capable d'interprter pour se construire une reprsentation du monde et
pour interagir correctement avec lui. L'information, dans ce sens, est base sur des
stimuli sensoriels vhiculs par les nerfs, qui aboutissent diffrentes formes de
perception.
Au regard de ces dfinitions, le mot information signifie donc deux choses : une
action et un objet. Il a pour racines le verbe informare signifiant ainsi une action,
lacte

dinformer ,

et

le

substantif

informatio,

la

connaissance

communique
Selon le travail de Watzlawick, (Watzlawick 1999, page10) une information est le
rsultat final de la perception et de la transmission ; il y a des canaux de
communication impliqus dans la transmission de linformation. Les canaux de
communication peuvent tre oraux, crits, par images, gestuels, parls,
cinmatographiques, par toucher, etc .

Ainsi, dans un processus de

communication trois lments sont impliqus : linformation, la communication et


les canaux de communication.

21

1.1.1. Linformation en tant que processus


Les dfinitions ci-dessus impliquent que l'information doit tre cre par les
hommes la base dune donne, re-vrifiable, pour tre comprise explicitement (et
pas simplement perue) par le public travers des sens simples.
La comprhension doit tre obtenue sans forcment laide dun outil spcial. Sans la
participation active des hommes, nous ne pouvons pas avoir de l'information.
L'homme doit traiter les donnes existantes et attribuer une signification

tel-00131856, version 1 - 19 Feb 2007

spcifique avant quelles deviennent information.


Linformation doit tre communique. Nous dirons que l'information est l'acte de
l'homme donnant une signification spcifique aux donnes, par ses activits de
transformation et la communication de cette interprtation. Cest seulement quand
cette interprtation spcifique est communique et comprise par le rcepteur que
nous pouvons dire quil y a information.
Lacte de traitement (transformation) de donnes est forcment impliqu dans la
production dinformation.
Le traitement implique un ou plusieurs outils. L'outil peut tre un quipement,
comme l'ordinateur, ou nos sens de perception, comme les mains, la bouche. Le plus
important cest quil y ait un genre de reformulation, de remise en ordre, de
changement ou de regroupement des lments initiaux (les donnes). La
reformulation est faite pour atteindre un objectif prconu. L'objectif peut tre
nonc ou non.

1.1.2. L'information en tant qu'objet


Trois entits diffrentes se trouvent entre la source dun message et sa destination :
lmetteur, le canal de la transmission, et le rcepteur. L'information est le
message transmis travers un canal, sur un sujet spcifique, destin un rcepteur.

22

Le rcepteur prvu peut recevoir un message diffrent de ce qu'il est cens recevoir.
La diffrence entre message transmis et message reu peut tre due plusieurs
facteurs tels que :
(a) le bruit dans le canal de transmission
(b) l'erreur dans l'metteur ou/et le rcepteur.
Nous ne pouvons pas dire qu'il y a transmission d'information tant que cette dernire
ne sera pas reue et comprise par le rcepteur. Si le rcepteur ne peut pas dcoder le

tel-00131856, version 1 - 19 Feb 2007

message envoy, il n'y a videmment pas transmission dinformation.


Les modalits impliques dans la transmission et le codage dun message sont hors
de notre tude, de mme que la problmatique de la transmission.
Nous admettons que l'metteur et le rcepteur dun message sont daccord sur la
modalit de transmission de l'information (cela en termes de codage de linformation,
et non pas en termes de canal de transmission.)

1.1.3. Typologie des informations


Diffrentes typologies ont t utilises pour classer les informations, fondes sur les
utilisations et les attentions spcifiques. Nous reconnaissons que notre numration
des types dinformations n'est pas exhaustive. Plusieurs critres sont utiliss pour les
identifier.
Quelques typologies sont fondes sur les sources dinformations ; certaines
considrent le mdium utilis pour communiquer l'information ; celle-ci peut tre
notamment communique par l'utilisation du papier, de signaux lectriques, du
magntisme, de l'onde radio et du rayon laser, d'autres considrent le moyen de
traitement de l'information. L'information peut tre traite automatiquement, par le
canal dappareils lectroniques (ordinateur, data logger, etc), ou bien de faon
manuelle.

23

Une autre typologie distingue le public vis (cible prive ou cible publique). Elle
peut se fonder sur la date de production (information actuelle ou ancienne). Nous
pouvons mme avoir une typologie fonde sur lutilisation de linformation :
tactique ou

stratgique, offensive ou dfensive, gnrique ou spcifique, etc.

L'utilisation peut videmment prendre des aspects diffrents selon le contexte.


Pour nous la typologie la plus signifiante est celle qui sappuie sur le contrle
daccs l'information. Nous nous sommes intresss cette typologie car l'accs
l'information est lune des tapes les plus importantes dans la recherche

tel-00131856, version 1 - 19 Feb 2007

d'informations avant une prise de dcision.


La prise de dcision repose donc sur l'accs l'information. C'est pourquoi nous
retenons la classification des informations en information blanche, information
grise, information noire, classement mtaphorique qui va tre clairci ci-dessous.

1.1.3.1. L'information BLANCHE


Plusieurs dfinitions ont t donnes sur les informations blanches. Parmi les
dfinitions, nous en prsentons quelques-unes dans le tableau 1.1 ci-dessous.
Nous considrerons que les informations blanches sont les informations dont laccs
et le stockage sont lgaux.

24

Dfinition

Rfrence

Acquise lgalement, facilement, gratuitement ou

http://www.zeknowledge.com/veille_information_sav

faible cot, ayant peu de porte stratgique

oir.htm (23/04/2006)

Aisment et licitement accessible

https://www.escpeap.net/~gtilab/new/materials/ci_3_les_diffrent_stype
s_dinformation.ppt (23/04/2006)

C'est l'information directement et librement accessible http://www.surfandbiz.com/web/veille/ (23/04/2006)

tel-00131856, version 1 - 19 Feb 2007

Information accessible facilement et de manire licite, http://www.abcpresse.com/content/view/31/32/


et disponible pour tous

(23/04/2006)

L'information publique et accessible librement, sans

http://www.yves-

scurisation (et souvent sans scurit),

simony.net/article.php3?id_article=85 (23/04/2006)

Ne fait pas l'objet de publicit, mais on peut la trouver http://www.decisionnel.net/veille/index.htm


de manire indirecte ou dtourne - Information

(23/04/2006)

sensible d'accs lgal


Quand elle va dans le sens de ce que "tout le monde

http://www.mmt-fr.org/article109.html (23/04/2006)

dit" : elle est vidente et sert conforter notre opinion


globale.
Information aisment et licitement accessible.

http://www.doubleveille.net/terminologie_veille.htm
(23/04/2006)

Ce que chacun peut voir et recueillir. Information

http://www.01net.com/article/220682.html

ouverte (90 % du total). Information publique

(23/04/2006)

Tableau 1.1 : Les dfinitions de l'information blanche

25

1.1.3.2. Linformation GRISE


Les diffrentes dfinitions de linformation grise sont prsentes dans le tableau
1.2 :
Dfinition

Rfrence

Linformation acquise de faon limite, cible privilgie des

http://www.zeknowledge.com/veille_infor

veilleurs ayant une porte stratgique leve et en dernier lieu

mation_savoir.htm (23/04/2006)

d'information
Licitement accessible, mais caractrise par des difficults dans

https://www.escp-

la connaissance de son existence ou de son accs

eap.net/~gtilab/new/materials/ci_3_les_dif

tel-00131856, version 1 - 19 Feb 2007

frent_stypes_dinformation.ppt
(23/04/2006)
C'est l'information directement et librement accessible

http://www.surfandbiz.com/web/veille/
(23/04/2006)

Il s'agit de l'information que l'on peut acqurir de manire

http://www.surfandbiz.com/web/veille/

indirecte ou dtourne, mais d'accs lgal

(23/04/2006)

Linformation accessible de manire licite mais avec certaines

http://www.abcpresse.com/content/view/3

difficults dans sa recherche

1/32/ (23/04/2006)

L'information peu rfrence, sans publicit ni autopromotion,

http://www.yvessimony.net/article.php3?id_article=85
(23/04/2006)

Publique et accessible, ne fait l'objet d'aucune scurisation

http://www.decisionnel.net/veille/index.ht

particulire

m (23/04/2006)

Quand elle apporte des nuances, soumettant votre sagacit des http://www.mmt-fr.org/article109.html
donnes moins videntes et un regard particulier.
Information licitement accessible, mais caractrise par des

http://www.doubleveille.net/terminologie_

difficults dans la connaissance de son existence ou de son accs. veille.htm (23/04/2006)


- Ce qui rsulte de l' accouchement de l'esprit .

http://www.01net.com/article/220682.html

- Par le traitement de l'information (confidences).

(23/04/2006)

- Par l'habilet de l'accoucheur.


- Ce qui peut tre immoral sans tre illgal. Information
sensible (% croissant).
De l'ouvert au ferm.

Tableau 1.2 : Les dfinitions de linformation grise

26

1.1.3.3. L'information NOIRE


Les diffrentes dfinitions de linformation noire sont prsentes dans le tableau
1.3 :
Dfinition

Rfrence

Information acquise illgalement, information de grande

http://www.zeknowledge.com/veille_informati

valeur...qui peut avoir une trs forte porte stratgique

on_savoir.htm (23/04/2006)

A diffusion restreinte et son accs ou son usage est

https://www.escp-

explicitement protg

eap.net/~gtilab/new/materials/ci_3_les_diffrent

tel-00131856, version 1 - 19 Feb 2007

_stypes_dinformation.ppt (23/04/2006)
C'est celle obtenue de manire illgale par l'espionnage

http://www.surfandbiz.com/web/veille/

industriel.

(23/04/2006)

Information dont la diffusion est limite, avec un accs et un

http://www.abcpresse.com/content/view/31/32/

usage restreints voire interdits

(23/04/2006)

Information faisant preuve d'un haut niveau de scurisation

http://www.yves-

(ncessit de mots de passe, par exemple) et rserve

simony.net/article.php3?id_article=85

certaines catgories de personnes bien prcises

(23/04/2006)

Fait l'objet d'une haute scurisation - Relve de l'espionnage http://www.decisionnel.net/veille/index.htm


industriel

(23/04/2006)

Est linformation qui drange, elle est connue des seuls

http://www.mmt-fr.org/article109.html

initis et na souvent que peu de validit tellement elle est

(23/04/2006)

soumise des biais de slection. Mais elle est aussi parfois


annonciatrice des vrits de demain : cest donc une
information trs forte valeur stratgique.
Information diffusion restreinte et dont l'accs ou l'usage

http://www.doubleveille.net/terminologie_veill

est explicitement protg.

e.htm (23/04/2006)

Ce qui est protg par la loi ou le contrat et rserv aux

http://www.01net.com/article/220682.html

personnes autorises. Information ferme (10 % du

(23/04/2006)

total). Information secrte.

Tableau 1.3 : Les dfinitions de l'information noire.

27

Aprs avoir parcouru les concepts qui encadrent la notion d'information il nous faut
clairer plus prcisment le support essentiel de ladite information, c'est--dire le
document.

1.1.4. Le document
C'est l l'un des mots-cls de notre tude, qui nous rapproche du thme propos,
l'annotation

du document dans le processus dintelligence conomique.

L'information est contenue dans un document.

Plusieurs dfinitions du mot

tel-00131856, version 1 - 19 Feb 2007

"document" ont t donnes ; certaines d'entre elles

dans la perspective d'une

discipline particulire. Par exemple un documentaliste,

reconnat comme

documents : tous les objets auxquels les techniques de la documentation


pourraient tre appliques (Buckland, 1998).
Selon la dfinition tablie par une agence de la Ligue des Nations, l'Institut
International pour la Coopration Intellectuelle, en collaboration avec l'Union
Franaise des Organismes de Documentation, un document, c'est : Toute base de
connaissances, fixe matriellement, susceptible d'tre utilise pour consultation,
tude ou preuve. Exemples : manuscrits, imprims, reprsentations graphiques ou
figures, objets de collections, etc. (Bringay et al 2003).

1.1.4.1. Les dfinitions spcifiques dun document


Selon lencyclopdie en ligne (wikipdia), un document est dfini comme tant
"le support physique d'une information. Le support physique est un matriel qui peut
tenir l'information. Il est considr comme physique dans la mesure o il peut tre
peru par un ou plusieurs de nos sens."
A partir de cette dfinition, une conception ou une notion ne peut tre dfinie
comme un document, parce que le monde extrieur ne peut pas saisir une conception

28

ou une notion. Une notion est tout dabord contenue, et elle reste, dans le cerveau de
celui qui la imagine. En avanche, une notion extriorise peut devenir un
document la condition d'tre transmise. En dautres termes, c'est la transmission
d'une notion travers un moyen physique qui lui donne sa qualit de document.
Nous appliquerons cette transformation (de notion en document) dans le cadre de
notre travail :
Un crateur de document, - l'auteur-, conoit une notion ou une conception dans son
cerveau. Cette dernire devient document quand elle est

transmise un public

potentiel, travers un support physique.

tel-00131856, version 1 - 19 Feb 2007

En bref, nous pouvons dfinir un document comme une ide ou un concept


exprims sur un support.
Il est clair qu'un document est fortement ancr dans le processus de communication.
Le document contient linformation- informatio-, et linformation -informare- est
l'acte de transmission dun ou de plusieurs messages entre lmetteur et le rcepteur
(cf. 1.3.1)

1.1.4.2. Dfinition d'un document selon sa cration


Dans sa reprsentation la plus gnrale, un document est une trace de l'activit
humaine (Prie, 1999, page 23).
Cest cette considration que nous retenons dans notre travail. Dun certain point de
vue cest leffort intellectuel humain pour reprsenter des faits, des connaissances et
des savoir-faire.
De ce point de vue, les traces de lactivit humaine peuvent inclure des sources
diverses, comme des matriaux archologiques, des difices, des uvres
cinmatographiques, des manuscrits, des gravures, des monuments dart, etc.
L'annotation est, indubitablement, la trace d'une activit humaine. Elle tmoigne du
temps, de la prsence et de l'intrt d'un annotateur, dans un document (l'annotation),
pour un document donn (linformation).
Tous les documents possdent les caractristiques suivantes :

29

Ils se trouvent dans un conteneur ou transmis par un mdium,

Ils contiennent certaines informations,

Les informations dans un document sont codes selon un langage spcifique


(crits, graphiques, signes ou sons),

Le langage selon lequel les informations sont codes possde toutes les
caractristiques d'un langage humain (grammaire, syntaxe, smantique etc.),

La dure de vie d'un document est variable en fonction des caractristiques

tel-00131856, version 1 - 19 Feb 2007

du son conteneur ou du mdium de transmission.

1.1.4.3. Dfinition d'un document selon son utilisation


Etymologiquement, un document est ce qui sert enseigner 5.
Le sens originel n'a rien voir avec le format ni avec le support physique, mais avec
sa fonction. "Le lien entre document et connaissances existe d'emble de faon
claire "(Kolmayer et Pevrelong, 1999).
Un document est un objet construit afin de provoquer la transformation dans
l'tat d'esprit des utilisateurs qui le document est communiqu (Nicholas et al,
1996, page 3).
L'effet prvu du document sur ses publics potentiels prend une grande importance.
Si le document provoque une transformation de ltat de ses utilisateurs ,
alors notre tude est dune grande importance, car elle est fondamentalement fonde
sur la transmission de la connaissance par le moyen de lannotation. Nous nous
introduisons donc le concept dannotation dans la section suivante.

(document, dorigine latin est docere c.--d. enseigner)

30

1.1.5. Lannotation
Nous nous inspirons de certaines dfinitions pour proposer notre propre dfinition.

1.1.5.1. Dfinition gnrale du concept dannotation


Diffrentes dfinitions ont t donnes au terme dannotation. Ces dfinitions sont
des points de vue spcifiques, qui ne sont pas tout fait appropries notre tude.

tel-00131856, version 1 - 19 Feb 2007

Une annotation est une information graphique ou textuelle attache un document


et souvent place dans ce document (Desmontils et al, 2003, page 3).
Cette dfinition est certes valable, mais la relation entre lobjet de source et
lannotation nest pas claire. Or, pour nous, lassociation entre document source et
annotation est imprative. Sil ny a aucune association ou lien entre les deux, nous
ne pouvons pas parler dannotation. Lassociation doit tre nonce directement ou
indirectement.
Une annotation est une explication qui accompagne un texte dit le Petit Robert,
dictionnaire de la langue franaise.
Dans cette dfinition le mot accompagne est important, bien que formel, tant il est
vident que toute annotation, de fait, n'existe que se rapportant un texte source.
En revanche, comme on ne peut reconnatre au mot texte qu'un seul sens, cette
dfinition exclut les annotations appliques aux objets graphiques ou aux
sonorisations.
Les annotations sont Tous les objets associs dautres objets par une relation

31

(W3 Workgroup on Collaboration, Knowledge Representation and Automatability)6


Pour nous, tous les objets associs dautres objets par une relation nont pas
forcment une connotation d'annotation.
Et dabord, comment dfinir un objet ?
Dans le domaine de la science de linformation et de la communication, un objet est
la matire et la dsignation caractrisant le contenu d'un article . Dans ce cas,
le paragraphe dun article est associ au titre principal, mais le paragraphe dun
article nest pas forcment une annotation de son titre.

tel-00131856, version 1 - 19 Feb 2007

Selon le Grand Dictionnaire 7 , une annotation est un bref commentaire, une


explication d'un document ou de son contenu, ou mme une trs brve description,
habituellement ajout(e) en note aprs la rfrence bibliographique du document .
Cette dfinition est videmment intressante, mais nous parat un peu rductrice,
quant sa localisation ou son expression.
Les annotations sont les commentaires, les remarques, les suppressions, les
signets externes etc... qui peuvent tre attachs distance n'importe quel
document du Web ou une section de document du Web 8
Cette dfinition est encore plus rductrice puisque ne concernant que les documents
du Web

An annotation can be loosely defined as "any object that is associated with another object
by some relationship" http://www.w3.org/Collaboration/ (04/10/2005)
7
http://www.granddictionnaire.com/btml/fra/r_motclef/index800_1.asp (28-Mar-06)
8
Annotations are external comments, remarks, deletions, bookmarks etc. that can be
attached remotely to any Web document or a selected part of it. Annotations are external
comments, remarks, deletions, bookmarks etc. that can be attached remotely to any Web
document or a selected part of it . (http://annotest.w3.org/annotations).

32

1.1.5.2.

Dfinition du concept dannotation dans le cadre de ce

travail
Nous considrons lannotation comme une action et un objet.
Lannotation comme une action :
x

L'annotation est une interprtation dun objet exprim sur un document.


Linterprtation peut tre faite par le producteur de l'objet ou par une autre
personne.

C'est l'expression dune connaissance ou comprhension spcifique dun

tel-00131856, version 1 - 19 Feb 2007

document (document peut tre un concept exprim) sur le mme document.


Lannotation comme un objet :
x

Lannotation est un objet crit, oral ou graphique, habituellement attach


un document, fait pour influencer la perception de ses publics potentiels sur
un sujet particulier.

Le sujet de dpart est lannotation, qui est prdtermine par le contenu dun
document dorigine. La perception et linterprtation individuelle attribue au sujet
dun document sont subjectives. Cette subjectivit variant parfois avec le temps;
l'annotation peut tre volutive. La signification

des annotations faites sur un

document peut changer avec le temps.


Lvolution dun sujet dannotation de son sujet dorigine est une fonction
dinterprtation subsquente. Le sujet de notre tude porte sur cette volution.
Les annotations sur les document crits renvoient diverses entits : un ensemble de
documents, un seul document, un passage, une phrase, un terme, un mot, une image.
Les annotations dcrivent (rcapitulent le contenu important) et valuent (analysent)
la ressource sur la base des critres standards.
Une annotation n'est pas un rsum, ni un sommaire : les rsums et les sommaires,
habituellement dcrivent ou rcapitulent le contenu, mais ne l'valuent pas. Des

33

annotations sont destines valuer des livres, des sites Web, des articles, des
documents de gouvernement, des vidos ou d'autres types de document.

Les annotations peuvent prendre plusieurs formes, comme :


x

des icnes (pour dcrire des avis; en utilisant des toiles, des points
dinterrogation, d'exclamation...),

des symboles de liens (pour dcrire des associations, des relations entre
mots...),

des notes textuelles en marge, en bas de page ou en fin de document,

tel-00131856, version 1 - 19 Feb 2007

repres dans le texte par des icnes (numros, toiles...),


x

des mises en formes typographiques (surligner, italique...),

des redcoupages de texte laide daccolades, de numrotation de


passages...,

des images, des sons,

des concepts et leurs attributs (annotations smantiques)...

Cette numration laisse entendre que lannotation, sur un document, peut


s'exprimer avec un large ventail de possibilits.
Nous identifierons deux types d'annotations, cette dichotomie tant fonde sur
l'origine de l'annotation :
(a). Les annotations volontaires (ou dorigine intrieure). Elles sont les annotations
produites dinstinct par la personne-mme qui a cr le texte. Ce sont des remarques,
ou des corrections personnelles sur des documents et en un temps que l'auteur a
choisis. Ces annotations ne prsentent aucun caractre de contrainte, ni de crainte.
(b). Les annotations requises (ou dorigine extrieure). La crateur dannotation
est pri de sengager dans le processus dannotation; Lannotation est une rponse
une question. Le plus souvent dans les organisations, les annotateurs se trouvent
alors tre des tmoins lgaux. Ce groupe semble tre le plus important, en nombre,
dans la dichotomie prsente ici.

34

Afin de mieux apprecier limpact dannotation dans le processus dIE, nous etudions
de pres ce dernier dans la section suivante.

1.2. Lintelligence et sciences de l'information et de la


communication (SIC)
Nous pouvons distinguer plusieurs aspects dintelligence par affiliation aux sciences
de linformation et de la communication. La proprit de discernement et

tel-00131856, version 1 - 19 Feb 2007

d'valuation est le terme fondamental pour toutes les dispositions d'intelligence et


leurs applications (intelligence conomique, intelligence d'affaires, intelligence
militaire, espionnage etc).
On parle dintelligence lorsqu'il y a un problme rsoudre. Qu'est-ce donc
lintelligence ?
Lintelligence est dfinie comme la capacit d'acqurir et appliquer la
connaissance 9.
Selon le dictionnaire en ligne wikipedia : Lintelligence est la capacit de rsoudre
des problmes.

C'est l'ensemble des fonctions mentales ayant pour objet la

connaissance conceptuelle et rationnelle (Par opposition la sensation et


l'intuition). Aptitude comprendre et s'adapter facilement des situations
nouvelles.
Les extraits suivants sont tirs de Terminologie de neuropsychologie et de
neurologie du comportement disponible en ligne sur wikipdia.com
L'intelligence est la capacit dcouvrir un contexte nouveau, le comprendre et
ragir cette nouvelle situation de faon adapte. (Berube, 1991, page 2)
L'intelligence, c'est ce qui permet d'entendre une musique l o d'autres n'entendent
qu'un bruit.
9

http://www.thefreedictionary.com

35

L'intelligence, modele par le patrimoine gntique et par l'environnement culturel


et affectif, dpendrait d'un quilibre subtil entre un mode de traitement rapide des
informations et un mode lent d'analyse de ces donnes.
Facult de connatre, de comprendre et de s'adapter, facult d'abstraction et
d'anticipation ou encore intuition. Pour connatre, pour comprendre et pour
s'adapter, en un mot pour faire preuve d'intelligence, il faut que les perceptions et
les sensations que reoit le systme nerveux central aient un sens, c'est--dire que
les diffrents stimuli sensoriels soient associs, classs par les structures crbrales
ncessaires au traitement de l'information et mmoriss. Les tapes de ce traitement,

tel-00131856, version 1 - 19 Feb 2007

par exemple la rapidit de perception d'un stimulus, son stockage, son valuation
par rapport aux informations dj enregistres, son analyse et la raction qu'il
dclenche, sont des facteurs de l'intelligence.
Le terme "Intelligence" vient du latin intellegere , dont le prfixe inter (entre), et
le radical legere (lier) suggrent essentiellement l'aptitude relier des lments qui,
sans elle, resteraient spars.
Ainsi en est-il de la lecture, en tant qu'aptitude saisir le sens qui unit les mots, les
phrases, les paragraphes etc., au-del du simple dchiffrage discontinu, des termes
inscrits sur le papier.
C'est donc la capacit saisir (et savoir utiliser) des liens entre des lments
disparates. C'est savoir lire au sens le plus large (Lire les signes crits par l'homme,
mais aussi les signes inscrits dans la nature).
L'intelligence est lie la mmoire du pass pour produire une solution vrifiable
un problme du moment prsent, puis elle en magasine la solution trouve, en vue
dun usage futur.
Les tapes suivantes sont invariablement prsentes dans un processus dintelligence :
i.

chargement de la mmoire,

ii.

recherche dans la mmoire,

36

iii.

faire un choix, fond sur une certaine logique, entre les solutions qui ont
t recherches et

iv.

renvoi de la nouvelle solution choisie, pour tre archive son tour.

.
Processus
dcisionnelle

Entrept de
connaissance

tel-00131856, version 1 - 19 Feb 2007

Formulation
de solution
optimale
Problmatique
nouvelle

Figure 1.1 : Lintelligence implique plusieurs processus


Le processus d'intelligence n'est pas un processus intrinsquement continu. C'est un
processus spontan, qui est lanc en prsence dun problme non rsolu, dans les
conditions environnementales existantes et avec les ressources du moment prsent.
Le problme demande le rappel des acquis qui ont t stocks lors d'expriences
prcdentes.
Il se finit galement en stockant la nouvelle exprience acquise dans le mme
entrept de connaissance.
Ce systme d'intelligence apprhende un seul problme la fois, non pas deux
problmes simultanment, mme s'il est capable

de se rfrer des bases de

donnes htrognes pour rsoudre le problme en question.

37

Louvrage The Art of War (dans la langue chinoise: ; Hanyu Pinyin :


Sn Z Bng F ; littralement "La stratgie militaire de Sun Tzu") (Lionel, 1910) est
un trait militaire chinois crit durant le VIme sicle avant JC par Sun Tzu. Il a t
considr comme le premier travail dfinitif sur les stratgies et les tactiques
intelligentes.
Ce trait est une des bases des plus clbres pour apprendre la stratgie et il a eu une
influence majeure sur la planification militaire et les travaux sur l'intelligence.

tel-00131856, version 1 - 19 Feb 2007

Considrons donc des domaines importants dans lesquels l'intelligence est mise en
uvre et qui ont un rapport troit avec notre proccupation, l'information.
Pour mieux discerner, un peu plus loin, les donnes de l'intelligence conomique, il
semble utile de lui opposer d'autres usages de l'information, l'intelligence
concurrentielle et l'espionnage

1.2.1.1. Lintelligence concurrentielle (competitive/ business intelligence)


L'intelligence concurrentielle a t dfinie comme processus formalis, pourtant
sans interruption d'volution, par lequel l'quipe de gestion value l'volution de
son industrie et ses capacits, et le comportement de ses courants, et de ses
potentiels concurrents, pour aider maintenir ou dvelopper un avantage
concurrentiel (Prescott et Gibbons 1993).
Le projet dintelligence concurrentielle essaie de fournir un organisme intress
des informations prcises sur ses concurrents, ainsi quun plan pour l'usage, son
avantage, de cette information (Selon McGonagle et Vella, 1990).
Ici, l'ide centrale est que l'information est employe intelligemment pour l'analyse
du march, afin de devancer les concurrents sur un march commun.
L'un des prcurseurs dans ce domaine dfinit lintelligence comptitive comme suit :

38

L'intelligence comptitive - ou concurrentielle- est le processus qui permet


daugmenter sa comptitivit sur le march par une meilleure comprhension des
concurrents et des conditions de la concurrence. (SCIP, 2002) 10.
Dirk (Vriens, 2004, pg 15) considre que lintelligence comptitive est plus quun
processus. Il la examine dans quatre perspectives :
 Comme Produit : les informations sont pertinentes pour des objectifs
stratgiques.

tel-00131856, version 1 - 19 Feb 2007

 Comme Processus : Le cycle d'intelligence a t identifi dans quatre tapes,


la direction, la collection, l'analyse et la diffusion.
 Le But : Lintelligence comptitive est active pour livrer un outil efficient
dans l'objectif d'une dcision stratgique.
 La Diffrence : elle diffre de l'espionnage, de l'intelligence d'affaires et
d'autres genres d'intelligence et dtude de march.
Prior en (Vernon, 2005, Page 3) dfinit lintelligence daffaires (business
intelligence) ainsi :

L'intelligence d'affaires est n'importe quelle combinaison de donnes, d'information,


et de connaissance au sujet de l'environnement d'affaires dans lequel une entreprise
ralise ses affaires (au moment ncessaire), elle confrera un avantage
concurrentiel significatif qui leur permettra de prendre des dcisions intelligibles.
Selon lui, les oprations d'intelligence d'affaires permettront une organisation pour,
entre autres :

10

Prvoir et grer les risques

Chercher les opportunits et les nouveaux marchs ;

Competitive intelligence is the process of enhancing market place competitiveness

through greater understanding of a firms competitors and competitive environment

39

Agir avant des concurrents,

Innover,

Exploiter les faiblesses des concurrents,

Amliorer la planification et la prise de dcision.

La traduction dintelligence daffaires est souvent le traitement et linterprtation


dinformation. Par exemple, la dfinition suivante a t donne en 11:
Lintelligence

d'affaires

(Business

Intelligence)

ou

informatique

dcisionnelle englobe les solutions informatiques apportant une aide la dcision


avec, en bout de chane, rapports et tableaux de bord de suivis, la fois analytiques

tel-00131856, version 1 - 19 Feb 2007

et prospectifs.
Le but est de consolider les informations disponibles au sein des bases de donnes
de l'entreprise.

1.2.1.2. Lespionnage
L'espionnage est la pratique qui consiste surveiller les autres (tats ou autres
entits) afin dobtenir des informations pour son propre avantage, conomique,
politique ou militaire. La plupart des nations surveillent habituellement leurs
ennemis et leurs allis, bien qu'elles le nient. L'espionnage fait pour des buts
commerciaux est nomm espionnage industriel. Le dictionnaire Wikipdia en ligne
dfinit l'espionnage comme :
La rcolte de renseignements que le dtenteur peut lgalement dissimuler et se
rserver. L'espionnage est donc illgal et clandestin L'espionnage par un citoyen
de l'tat- cible, son propre Etat - est gnralement considr comme une forme de
trahison.

11

http://solutions.journaldunet.com/dossiers/pratique/business_intelligence

40

1.2.2. Lintelligence conomique


Le rapport de Martre (Martre, 1994) dfinit lintelligence conomique comme tant :
les actions coordonnes de recherche, de traitement et de distribution, en vue de
son exploitation, de linformation aux acteurs conomiques. Ces diverses actions
sont menes lgalement avec toutes les garanties de protection ncessaires la
protection du patrimoine de lentreprise...
Et selon C. Revelli (Revelli, 1998) cest le processus de collecte, de traitement et de
tel-00131856, version 1 - 19 Feb 2007

diffusion de linformation qui a pour objet la rduction de la part dincertitude dans


la prise de toute dcision stratgique.

UTILISATEURUTILISATEUR-ACTEUR
a: dcideur
b: veilleur
c: client

? (b)
Le monde de
linformation

? (a,b,c)
Base de
donnes

Demande

Slection

Mise en correspondance

Processus cognitif

? (a,c)

* Observation
* Abstraction lmentaire
* Symbolisation/raisonnement
* Crativit

Rsultats

Analyse

Information
valeur ajoute

? (a,c)
Interprtation

Dcision

Figure 1.2 : Architecture dun systme dintelligence conomique


Lextrait suivant vient des travaux de (Thiry et David, 2002). Nous prciserons
qui sont les acteurs dans les processus dans la section 1.4.2.2.

41

Le processus dIntelligence Economique (IE) repose en particulier sur lutilisation


de systmes dinformations stratgiques (SIS). Les systmes dinformations (SI)
existent depuis fort longtemps. Ils ont subi des volutions profondes, soit par le but
final de lutilisation du systme, soit par le type dinformation gre, soit par la
combinaison des deux. Cest ainsi que nous voyons apparatre la dclinaison du
terme SIS en systme dinformation stratgique (SI-S) et systme
d informations stratgiques (S-IS).
Afin de faciliter le processus de recherche dinformation dans les Systmes
d'Information (SI), les techniques de modlisation de lutilisateur ont t introduites.
Ces techniques sont adaptes la nature des besoins en information des utilisateurs.
tel-00131856, version 1 - 19 Feb 2007

Certains besoins sont plus stables que d'autres. Dans ce cas, des techniques de
filtrage de linformation sont proposes pour recevoir les nouvelles informations.
Dautres besoins sont dynamiques. Dans ce cas, des techniques de modlisation,
implicites ou explicites, sont proposes. Ces dernires peuvent tre globales, quand
il sagit de strotypage, ou individuelles.

La figure 1.2 montre limportance dun systme dinformation (SI) dans le processus
dIntelligence Economique. Suivons les flches :

Slection : Elle permet de constituer le Systme d'Information de lentreprise

qui peut tre (i) la base de donnes de production (celle qui permet lexploitation
courante de lorganisation), (ii) lensemble des informations support dun systme
de recherche dinformations (en documentation par exemple) ou (iii) un systme
dinformation stratgique reposant sur un entrept de donnes. Ce SI est constitu
partir de sources de donnes htrognes, laide dun filtrage de la ralit.
x

Mise en correspondance : La mise en correspondance permet tout type

dutilisateur daccder aux informations du SI. Deux principales mthodes daccs


linformation sont actuellement proposes aux utilisateurs : accs par exploration et
accs par requte. Lexploration est base sur la technique dhypertexte. Les
requtes sont exprimes laide doprateurs boolens. Le rsultat de la mise en
correspondance est un ensemble dinformations.

42

Analyse : Afin de donner de la valeur ajoute aux informations trouves, des

techniques danalyse sont appliques au rsultat. Par exemple, lassistante dun chef
de service que nous considrons comme un veilleur pourra tablir des tableaux de
bord pour son chef de service. Ainsi, les rapports fournis par lassistante, qui connat
bien les souhaits du patron, seront une bonne base de dcision.
x

Interprtation : Il sagit l de permettre au dcideur, ou en gnral au client

du systme, de prendre les bonnes dcisions. Lide est que le dcideur nest pas
forcment le client du systme. Ce peut tre, par exemple, un veilleur. On voit alors
tout lintrt de capturer des connaissances sur le dcideur et de les mettre dans les
mtas donns de lentrept afin de construire une base mtier spcifique un groupe
tel-00131856, version 1 - 19 Feb 2007

de dcideur ou mieux encore un dcideur particulier.


En rsum, notre centre dintrt porte sur lintgration du modle de lutilisateur
dans la conception dun S-IS ( systme , dInformation Stratgique ) que nous
pouvons considrer comme un systme dintelligence conomique (SIE). Le modle
de lutilisateur aura une application plus large que le filtrage de linformation. Il
sagit de proposer un SIE qui sadapte aux diffrents acteurs impliqus dans un
processus dIE.

1.2.2.1. LIE en France


En 1994, la France a form une commission de haut niveau sous le bureau du
Premier Ministre. La Commission tait dirige par Martre (Martre, 1994). Sa
mission tait d'tudier comment un nombre de pays trangers choisis intgraient
l'Information Economique qu'ils obtenaient de diverses sources, gouvernementales
et non gouvernementales. Parmi les pays tudis il y avait : le Japon, la Sude,
l'Allemagne, les Etats-Unis, et la Grande-Bretagne.
Lorsque la Commission a tudi les systmes que les diffrents pays dveloppaient
pour intgrer le commerce, l'intelligence et l'information de proprit industrielle,
avec l'information de source ouverte, elle a estim que la France tait bien en retard.
Elle conclut que la France, bien qu'elle possdt les composants dsirs, souffrait

43

d'un manque dattention et n'intgrait pas les activits et les sources d'informations
qui auraient pu -qui auraient d- dclencher une action nationale efficace (Joyal,
1996)
L'intelligence conomique a vu son champ substantiellement largi en juin 2003,
aprs la remise au Premier Ministre d'un rapport intitul intelligence conomique,
comptitivit et cohsion sociale par Bernard Carayon, dput (UMP) du Tarn Ce
dernier prsente les propositions de la Commission comme une politique publique
destine garantir la cohsion sociale en assurant le dveloppement conomique.

tel-00131856, version 1 - 19 Feb 2007

On trouvera ci-dessous une partie de la lettre du Premier Ministre, tire de


lappendice cette publication :
La comptition conomique mondiale contraint nos entreprises des efforts permanents
dinnovation de prospection, de qualit et de rentabilit. Pour conduire au mieux ces actions,
les acteurs conomiques ont besoin dune information fiable et prospective, et doivent
pouvoir se prmunir contre des accs non souhaits leurs propres donnes. Le concept
dintelligence conomique recouvre ces proccupations. Apparu en tant que tel dans les
pays anglo-saxons et au Japon, il y a plusieurs dcennies, force est de constater quil
noccupe pas encore en France une place digne des enjeux quil doit prendre en compte.

Pour ces raisons et parce que la France ne peut se permettre de ngliger un outil essentiel
sa performance conomique, jai dcid de vous confier une mission de rflexion et de
proposition sur ce thme. En consquence vous serez plac, en application des dispositions
de larticle I.O. 144 du code lectoral, en mission auprs du ministre de lintrieur, de la
scurit intrieure et des liberts locales compter du 1er janvier 2003 et pour une dure de
six mois.

1.2.2.2. Les acteurs dans le processus de dIE


Avant de prsenter le processus d'Intelligence Economique il nous faut connatre les
acteurs de ce processus. Il existe deux acteurs principaux : le veilleur et le dcideur.
Nous pouvons identifier d'autres acteurs ; cette identification tant fonde sur leurs
fonctions dans la rsolution des problmes dcisionnels.

44

1.2.2.2.1. Le dcideur
Dans le travail de (David et al, 2001), les auteurs donne une dfinition du dcideur
dans lenvironnement interne et externe de lentreprise comme :
celui qui est apte identifier et poser le problme rsoudre en termes denjeu,
de risque ou de menace qui pse sur lentreprise .
Une autre dfinition donne par (Schneider, 1996) repose galement sur le rle jou
par le dcideur dans son environnement. Ce dernier considre le dcideur comme
un acteur social. Il doit tre dcrit et trait comme un systme ouvert qui,
tel-00131856, version 1 - 19 Feb 2007

activement, saisit de l'information, qui la traite et qui agit. Il possde une certaine
indpendance cognitive .
En se fondant sur ces deux dfinitions nous considrons que le dcideur, est, parmi
les autres acteurs, l'observateur le mieux plac dans son environnement interne et
externe, et cest grce sa position quil est apte dtecter les signaux de
lenvironnement (Bouaka et al, 2002).
Ci-dessous, nous allons nous inspirer du modle du dcideur prsent par (Bouaka,
2002)

et

Thiery (Thiery et al, 2002), pour le montrer face un

problme

dcisionnel ; cette reprsentation jouera un rle trs important dans le dialogue entre
le veilleur et le dcideur dans le cadre de dcisions stratgiques.

1.2.2.2.1.1. Les paramtres lis au dcideur


Le dcideur est celui qui a identifi le problme. Sa version des faits est par
consquent fondamentale. Nous le considrons comme un producteur de
connaissances centres sur un problme dcisionnel. Il est capable de traduire le
problme en terme d'enjeu comme nous venons de lexpliquer dans la section
prcdente. Nous considrons que la premire dimension cl de l'explicitation d'un
problme dcisionnel est relative au dcideur du fait qu'il est le mieux plac pour
identifier l'mergence d'un problme dcisionnel. L'intrt port l'intgration du
profil de l'utilisateur dans les systmes d'informations est prsent par (Alloway,

45

1976). Il considre que l'volution de tout systme d'information concerne en


dernier ressort un individu pourvu d'un profil psychologique donn, confront un
problme prcis dans un contexte organisationnel dtermin, problme pour lequel il
(l'individu) a besoin d'lments de prise de dcision, ces lments tant perus au
travers d'un mode de reprsentation propre au dcideur . Ds lors, il convient
d'accorder une grande importance aux comportements individuels vis--vis de
l'information.
De ce fait, pour modliser le dcideur dans le contexte dexplicitation d'un problme
dcisionnel, nous avons retenu aprs la validation de nos propos les paramtres

tel-00131856, version 1 - 19 Feb 2007

suivants :

1.2.2.2.1.2. Le style cognitif


Le style cognitif peut tre dfini comme la faon propre chacun de percevoir et de
comprendre l'information reue face une nouvelle connaissance. Ce style influe sur
la manire dont le dcideur traite l'information reue de son environnement et la
manire de la communiquer une autre personne, entre autres, le veilleur.
Daprs (Hayes, 1998), Le style cognitif a une influence sur la faon dont les
individus scrutent leur environnement pour recueillir de linformation, sur la faon
dont ils organisent et interprtent cette information et sur la faon dont ils intgrent
leurs interprtations dans les modles mentaux qui guident leurs actions . Le style
cognitif est soit analytique, soit pragmatique.
Lintrt dintgrer des informations sur le style cognitif se manifeste surtout au
niveau de la prsentation, au dcideur, des rsultats de la recherche d'information.
Ces rsultats peuvent tre sous forme de dtails techniques, de donnes statistiques
et de graphiques, rapports, etc. Ces rsultats doivent tre prsents de manire ce
qu'ils soient comprhensibles par le dcideur et surtout ils doivent respecter le style
cognitif du dcideur.

46

1.2.2.2.1.3. Les traits de personnalit


La personnalit est dfinie par (Darmon, 1993) comme un ensemble de structures
cognitives au fil du temps par les individus pour faciliter lajustement aux
vnements, aux individus et aux dcisions .
Pour identifier les traits de personnalit d'un dcideur, en tant qu'individu, nous nous
sommes intresss tout d'abord aux travaux faits en psychologie sur l'identification
de la personnalit d'une personne. Ensuite nous avons identifi les principaux traits
qui caractrisent un dcideur l'aide des travaux de psychologie appliqus dans le

tel-00131856, version 1 - 19 Feb 2007

domaine de management, en particulier des ressources humaines.


Parmi les instruments les plus utiliss en psychologie, nous pouvons citer
lindicateur de personnalit de Myers et Briggs (Cauvin, 1994). Cet indicateur
permet d'analyser les types de personnalit en partant des quatre paires de
caractristiques suivantes :
x

la premire paire d'indicateurs est dtermine par rapport l'orientation de


l'nergie, il sagit de : Introverti/Extraverti,

la deuxime paire d'indicateurs est dtermine par rapport aux modes de


rception. Il s'agit de : Sensation/Intuition,

la troisime paire d'indicateurs est base sur les critres de dcisions. Il s'agit
de la Rflexion/sensibilit connue aussi sous le nom Pense/Sentiment,

la dernire paire d'indicateurs est identifie par rapport au style de vie de


l'individu. Il s'agit de: Jugement/perception.

Si on arrive faire une corrlation entre les diffrents types de personnalit, on peut
dtecter les potentialits de chaque personnalit et ses limites. L'objectif est de
combiner la fois le mental, l'motionnel et l'instinctif. Nous considrons que ceci
va permettre au veilleur d'adopter une communication correspondant la
personnalit du dcideur et d'laborer, partir de ces besoins spcifiques, les actions
informationnelles les plus adaptes.

47

1.2.2.2.1.4.

Les facteurs lis lorganisation

Par la modlisation de l'organisation nous cherchons identifier l'effet de


l'observation faite par le dcideur sur l'organisation. En effet, cette modlisation ne
prend pas en considration ni la taille ni l'activit de l'organisation. Nous
considrons donc les caractristiques de l'organisation comme tant un dterminant
prpondrant du comportement du dcideur l'gard d'un problme dcisionnel
identifi. En effet, nous mettons l'accent surtout sur toute entit qui a le potentiel
d'tre source d'enjeu, soit la source ou la cible d'une action de l'entreprise. Ces
caractristiques permettent d'avoir une ide de la complexit, l'incertitude et la
stabilit de l'vnement observ. En effet, nous considrons que tout vnement
tel-00131856, version 1 - 19 Feb 2007

observ peut tre dcompos en trois lments. Ces lments sont :


x

l'objet de l'environnement,

le signal mis par cet objet,

et enfin l'hypothse que nous pouvons dduire de la dtection de ce signal.

Notre propos est que l'observation d'un signal reste dpendante de l'enjeu que porte
cette observation, mme si cet enjeu est un peu flou au dbut de l'observation. En
effet le dcideur ne ragit que lorsqu'il se sent menac par l'apparition d'un problme
ou le risque de perdre une opportunit. Nous supposons que si le dcideur arrive
identifier les signaux en provenance de son environnement, on peut l'aider projeter
sa rflexion dans le temps et dterminer l'enjeu relatif cette observation. De ce fait,
la dimension de l'enjeu demeure une dimension fondamentale pour passer du niveau
de l'explicitation d'un problme dcisionnel au niveau du problme de recherche
d'information dont nous parlerons dans la section suivante. Par consquent, pour
russir cette tape (l'identification de l'enjeu), fondamentale dans le modle que nous
proposons, le dcideur et le veilleur s'engagent dans un processus d'adaptation et de
rtroaction afin de valider ou modifier les valeurs des paramtres de l'enjeu (objet,
signal, hypothse) identifi par le dcideur au dbut de ce processus. A ce niveau
deux cas peuvent se prsenter :

48

Si les valeurs des paramtres de l'enjeu restent identiques, le problme


dcisionnel ne change pas de nature, c'est la comprhension du problme qui
volue grce l'apparition des informations complmentaires.

Si une ou plusieurs valeurs des paramtres de l'enjeu sont modifies, le


problme dcisionnel change de nature et provoquera la dfinition d'un
nouveau problme dcisionnel.

Nous considrons aussi que le fait de comprendre la nature des influences qui nous
gouvernent peut nous aider affiner notre perception de l'enjeu et donc amliorer
notre perception du risque ainsi que notre performance. Nous considrons que la

tel-00131856, version 1 - 19 Feb 2007

perception de l'enjeu par le dcideur influence forcement sa propension rechercher


ou viter le risque. Or la notion de perception de l'enjeu n'est pas si simple, car le
dcideur peut faire appel des rfrences personnelles. C'est ce qui tait montr
dans la section concernant la modlisation du dcideur. Ds que l'on met une
hypothse, la plupart d'entre nous avons tendance retenir les informations qui vont
dans notre sens plutt que celles qui la contredisent. Par consquent, le processus de
recherche d'information doit prendre en considration cette hypothse mise par le
dcideur.

1.2.2.2.1.5. Les facteurs lis lenvironnement


Nous avons remarqu qu'en terme de gestion stratgique, l'environnement a connu
une analyse en terme d'opportunits et de menaces. Cette mthode d'analyse revient
(Porter, 1986) qui considre que la stratgie de l'entreprise peut tre conue en se
fondant sur la raction de celle-ci aux forces concurrentielles qui constituent son
environnement. En fait, c'est ce courant que se rattache la notion de veille. Aux
tats-Unis le courant de l'environmental scanning a t initi par (Ansoff,
1965), qui a voulu adapter la stratgie un environnement complexe et agit. Il
considre comme possible la surveillance des signaux faibles et la gestion de la
surprise. En nous fondant sur le modle de (Marinet, 1989), lui mme inspir du
modle de Porter, nous retenons ces forces concurrentielles comme des sous
environnements susceptibles d'affecter la dfinition d'un problme dcisionnel. Nous

49

adoptons galement le point de vue de (Bourgeois, 1980), qui propose de


dcomposer l'environnement en deux sous catgories :
- Lenvironnement immdiat qui affecte lorganisation de faon directe et qui
concernent les clients, les fournisseurs et les concurrents.
- Lenvironnement

gnral

qui

regroupe

lenvironnement

social,

lenvironnement conomique et lenvironnement politique.


L'importance de ce modle d'explicitation d'un problme dcisionnel (MEPD) se
manifeste essentiellement dans la traduction du problme dcisionnel en termes

tel-00131856, version 1 - 19 Feb 2007

d'enjeux, tout en tenant en considration le profil du demandeur de l'information et


les particularits du contexte. Il permet d'clairer, d'expliquer et de complter les
connaissances qu'a un dcideur propos d'un problme dcisionnel complexe.
Notre modle est transform par la suite en un formulaire de description dun
problme dcisionnel et une application a t dveloppe afin de faciliter la gestion
de ces formulaires (saisie, recherche, analyse).

En effet, lexploitation des

informations contenues dans le formulaire contribue dune part au niveau du premier


filtrage, en prcisant le contexte du problme et dautre part au niveau du deuxime
filtrage en donnant des informations sur le dcideur. En plus, nous considrons que
lanalyse de la base des formulaires va nous permettre de reprer certains cas
d'utilisation qui pourront tre compars avec ceux contenus dans l'ensemble de
traces qui constitue la base d'expriences. Ces derniers peuvent alors tre utiliss
pour prdire le comportement probable du dcideur.

1.2.2.2.2. Le veilleur
Le veilleur est le spcialiste qui est charge de collecter, analyser et diffuser
linformation en vue de rendre plus intelligible l'environnement interne et externe de
lentreprise (Kislin et David, 2003, p. 4).
Nous allons dans cette partie, nous inspirer du modle du veilleur prsent dans
(Kislin, 2002). Le dcideur, acteur social, fortement ancr dans lenvironnement

50

stratgique, saisit linformation, la traite et agit en vue de rsoudre des problmes


dcisionnels la fois interdpendants et intertemporels. Le dcideur

est auto-

organisateur et quifinal, cest--dire quil peut atteindre le mme objectif avec des
moyens diffrents. Dcider signifie agir et la dcision est laboutissant dune action
qui possde une finalit, une planification et une valuation.
Les principales fonctions du dcideur et du veilleur sont ainsi rsumes dans le
tableau et suivants :
Les fonctions du dcideur.

Les fonctions du veilleur.

[Ragir & Dcider]

[(re)Connatre & Veiller]


Collecter, analyser et diffuser l'information pour

tel-00131856, version 1 - 19 Feb 2007

x
x

Identifier les stratgies qui permettraient

rendre plus intelligible lenvironnement :

d'amliorer les performances de lentreprise.

recherche.

Oprer parmi ces stratgies des choix en


fonction

des caractristiques du secteur

dactivit, des

concurrents et

Allouer
humaines

des

x
ressources
aux

financires

actions

les

sources

dinformations

Suivre

les

volutions

des

flux

informationnels

et
x

spcifiques

Coordonner la DSI (Diffusion Slective de


lInformation)

engendres par la prise de dcision.


x

Slectionner
pertinentes

des

partenaires.
x

Dfinir les indicateurs, les objectifs de

Mesurer et assumer les consquences lies

Grer et alimenter le SBC (Systme Base


de Connaissance) de lentreprise.

la prise de dcision

Mtafonction : Traduire le problme dcisionnel en


problme de recherche dinformation
Ces paramtres dfinissent l'espace du problme

Ces paramtres dfinissent l'espace du problme de

dcisionnel mesur en terme denjeux.

recherche dinformation mesur en terme de


savoirs

Tableau 1.4 : Analogies autour des actions du dcideur et veilleur (Kislin et al, 2003)
Si nous mettons en regard les activits du dcideur et du veilleur, nous voyons des
similitudes autour des actions comme identifier (les signaux pour le dcideur, les
indicateurs pour le veilleur), slectionner (les stratgies, les sources), valuer (les
risques, les rsultats) et grer (les cots, les systmes dinformation). Ces actions se
fdrent autour de deux dynamiques :

51

Pour le veilleur de connatre les informations issues de lenvironnement mais


aussi de connatre les enjeux du dcideur,

Pour le dcideur de ragir suite aux signaux dtects mais aussi de ragir
suite aux informations restitues par le veilleur.

Deux systmes agissent comme des filtres la traduction du problme dcisionnel et


la mise en relation des deux environnements.
Le premier est le systme de prfrences du dcideur. Il est dfini en fonction de la
nature du problme dcisionnel, de la qualit des valuations, des contraintes
(Darses, 1994), du degr de libert, du temps, des croyances ou du style cognitif du
tel-00131856, version 1 - 19 Feb 2007

dcideur. Ces paramtres sont intgrs dans le modle du dcideur sous lintitul :
(CI) caractristiques individuelles par Bouaka et David, (Bouaka et al, 2003)
Le second est le systme de pertinence du veilleur. La recherche des informations
ncessaires la rsolution du problme informationnel doit pouvoir s'valuer en
quantit et en qualit. La qualit du traitement de l'information collecte dpend des
outils et mthodes utilises et svalue en terme de pertinence : fiabilit des sources,
recoupements et hirarchisation des informations, respect des dlais impartis,
lisibilit du document produit par le veilleur. L'information collecte est fiable et
pertinente pour le veilleur mais lest-elle galement pour le dcideur ? Une analyse
rtrospective permet

dvaluer quelles ont t les influences de linformation

transmise et den mesurer les impacts sur les consquences.

1.2.3. Le processus de lIE


Diffrentes coles de pense regardent les processus dans lintelligence conomique
suivant des perspectives diffrentes. Il y a ceux qui les regardent comme composers
de deux tapes notamment : la collecte dinformation et la prise de dcision. Les
autres les considrent en dtails. Dans le travail de (Dou et al, 1987), il propose de
analyser la littrature pour prendre des dcisions adaptes .

52

Le travail de Lveill (Lveille, 2000, p.50-58) distingue quatre tapes dans la veille
technologique. Les quatres tapes ne sont pas tout fait les tapes de veille mais
plutt des tapes dintelligence conomique. Les tapes proposes par (Lveill,
2000) sont :
x

lorientation (expression des besoins),

la Collecte (Identification des sources et organisation de la collecte),

lExploitation (Prtraitement, mmorisation, vrification, analyse et synthse) et


enfin,

la Diffusion.

tel-00131856, version 1 - 19 Feb 2007

Nous dirons que forcment, il y aura un dcideur qui dtermine lorientation ou les
besoins dcisionnels. Cest la dfinition de problme dcisionnel que le veilleur
traduit comme un problme de recherche de linformation. Si cest le cas, la
premire tape dorientation appartient au dcideur. Les trois tapes restantes
doivent tre attribues au veilleur. Dans ce cas, les quatre tapes peuvent tre lies
aux tapes de processus dintelligence conomique. Typiquement, une activit de
veille commence partir dune identification de problme dcisionnel qui ncessite
une solution. La solution est faite par la traduction du problme dcisionnel en un
problme de recherche dinformation pour le problme actuel. Nous dirons que les
activits dintelligence conomique sont lactivit de veille et la dcision.
Les tapes retenues par lquipe SITE dans les processus d'intelligence conomique
sont du nombre de sept. Ces processus ne sont pas indpendants ni exclusifs. Nous
croyons qu'ils sont des tapes qui aideront dans la rsolution dun problme
dcisionnel en contexte de l'intelligence conomique. Les sept tapes sont prsentes
dans (Knauf et David, 2004) et reproduis dans la Tableau 1.5 .

53

Phases Rle
1

3
4

tel-00131856, version 1 - 19 Feb 2007

5
6
7

Dfinition du problme
dcisionnel
Transformation du
problme dcisionnel en
un problme de recherche
dinformation
Identification des sources
pertinentes
Recherche des
informations pertinentes
Traitement - analyse des
informations
Interprtation
Dcision

Comptence

Acteur

Il connat lenvironnement dans lequel il travaille


Matrise son secteur - Dtecte les risques et menaces
pour son entreprise ou son service. Connat les enjeux
Stratgie mthodologique - Mise en place dindicateurs /
Tache analytique (comprhension de la demande, de
lenjeu et du contexte) / Tache oprationnelle / Tache
mthodologique
Identifie et value les sources dinformation et en assure
le suivi Slectionne les sources les plus adaptes la
demande
Extrait ponctuellement ou priodiquement les
informations Contrle les informations collectes
Traitement intellectuel des informations : analyse du
contenu Mise en forme plus labore des informations
sous forme de synthse, bibliographie, panorama de
presse
Relative la description du problme initial
Elle doit tre base sur les indicateurs mis en place avec
le veilleur

Dcideur
Veilleur

Veilleur
Veilleur
Veilleur

Dcideur
Dcideur

Tableau 1.5 : Table de processus de lIE selon quipe SITE

Nous commenterons chacune de ces tapes, et conclurons avec une note sur la faon
dont le processus dannotation peut s'appliquer certains d'entre elles.

1.2.3.1. Dfinition du problme dcisionnel


La dfinition dun problme peut avoir une signification diffrente selon le contexte.
Presque chaque domaine a sa propre dfinition de problme. Le concept de base
est la question de la transformation du problme donn en problme scientifique,
problme social, problme sychologique, religieux, historique, mdical, etc
que nous pourrons tudier et analyser. La dfinition du problme peut tre
considre comme la tche principale dun projet ou de la rsolution dun problme
dcisionnel.
Dans l'IE, notre vue est tout fait diffrente. Nous sommes concerns par la
dfinition de problme comme un processus spcifique dans les processus d'IE.

54

Plusieurs travaux lis la dfinition du problme dcisionnel ont t effectus dans


l'quipe de recherche SITE (Goria, 2006) (Bouaka, 2004).
Le travail de Bouaka est li lidentification du problme dcisionnel en termes
dobjet, de signal et dhypothse. Goria se fonde sur linterprtation de problmes
pour assurer la comprhension des questions poses.
La base de la dfinition du problme est le fait qu'un dcideur dcide qu'il y a un
problme. Ce qui peut tre problme pour un dcideur peut ne pas tre problme
pour un autre dcideur.

tel-00131856, version 1 - 19 Feb 2007

1.2.3.2. Transformation du problme dcisionnel en problme de


recherche dinformation
La traduction (Transformation) dun problme dcisionnel en un poblme de
recherche dinformation exige la coopration dun veilleur et d'un dcideur. Selon
(Kislin et al, 2003) la dfinition dun problme dcisionnel se traduit en termes
denjeu, et se projette en demande du veilleur dans le problme de recherche
dinformations stratgiques, dans le but de rsoudre un problme dcisionnel. Pour
tablir cette transformation, le veilleur doit accomplir les tches suivantes :
x

Une tche analytique, qui correspond la comprhension de la demandeenjeu-contexte et exige de dfinir les indicateurs qui lui permettront de
traduire lenjeu du problme dcisionnel en paramtres de recherche
dinformation. Cette tche ncessite d'avoir les comptences qui permettent
de comprendre lenjeu et l'objectf, et de pouvoir y "brancher"les paramtres
associs dans le monde de linformation.

Une tche mthodologique, qui rsume les critres de comptences de


traduction du problme dcisionnel en projet de recherche dinformations
(PRI), puis en problme(s) informationnel(s) (PI). En se servant des
paramtres identifis, le veilleur doit employer ses comptences en
mthodologie de recherche dinformation (et ventuellement du domaine
dtude) pour la collecte des informations pertinentes.

55

Il faut donc aussi que le veilleur ait des moyens par lesquels il pourra identifier
linformation demande.
x

Enfin, une tche oprationnelle, par laquelle le veilleur doit s'adapter au


mieux, et l'enjeu et au dcideur, pour dterminer la forme de prsentation
des informations. On peut rappeler ici

qu'il lui faut connatre les

caractristiques individuelles du dcideur.


C'est une prrogative du processus dintelligence conomique de pouvoir noncer
sans ambigut un problme dcisionnel car cela facilite sa transformation en
problme de recherche dinformation. Ceci entend, bien sr, qu'aucun des termes
tel-00131856, version 1 - 19 Feb 2007

utiliss dans la description de problme ne soit ambigu.


Dans cette tape de transformation de problme, plus que le problme dambigut,
le problme de spcificit est pris en compte. Goria (Goria, 2006, p.119-122) a
propos une manire de prsenter une requte de faon obtenir l'information
pertinente.

Pour nous, Je cherche information sur la voiture Peugeot 207,

fabrique en 2006 nest pas la mme requte que Je cherche information sur une
voiture Peugeot 207, fabrique en 2006 . Nous prfrons une requte comme Je
cherche une information sur la voiture Peugeot 207 rouge, fabrique Mulhouse en
2006 . Ce sont les requtes spcifiques qui peuvent avoir des solutions spcifiques.
Plus que lambigut et la spcificit se pose le problme de lobjectif. Lobjectif de
la recherche dinformation doit tre spcifi. Par exemple, une requte comme
Jaimerais trouver une universit technique pour mon fils Paris est admissible.
Lobjectif de recherche sur une universit est "pour mon fils ". Parce que, nous
pouvons avoir les universits techniques Paris "pour les filles."
Quand sont clarifis les problmes dambigit, de spcificit et dobjectif, nous
pouvons commencer ltape de recherche dinformation.

56

1.2.3.3. Collecte dinformations pertinentes


Deux mthodes de collecte de l'information ont t suggres par J. TREURNIET
(Treurniet, 2004, pages 2,3) : la collection passive et la collection active.
Nous ne nous attarderons pas sur la faon par laquelle l'information active est
collecte. En revanche, les considrations plus gnrales impliques dans la collecte
active d'informations sont des sujets dintrt pour nous. A savoir sont :
L'ethique : Quels sont les principes de base que nous devons respecter dans la
collecte de l'information ? Bien sr, les rgles impliquant les droits personnels

tel-00131856, version 1 - 19 Feb 2007

doivent tre respectes. Il faut noter que dans la collecte dinformations interentreprises ou la collecte d'informations internationales, plusieurs facteurs ne sont
pas dfinis.
La Source : La source des informations collecter concerne en fait la faon dont
elle est collecte. L'information issue d'Internet ne sera pas collecte de la mme
manire que celle qui provient dune source orale.
Mthodologies : Plusieurs mthodologies sont disponibles pour la collecte
d'informations. La mthode adopte par un individu dpend de plusieurs facteurs :
son "emplacement" social, les circonstances, le hasard etc. Certaines des mthodes
incluent des questionnaires, des observations et des prlvements (questionnaires,
observation, matriel).
Comme il est dit plus haut, nous ne nous attarderons pas sur ces mthodes.
Le type dinformation collecter : Selon le type d'information collecter la tche
demandera plus ou moins de prcautions et la rcolte en sera plus ou moins facile,
rendant plus alatoires les rponses "comment ? o ? et quand? " . L'information
lgale ne sera pas collecte de la mme manire que l'information sur des enfants ou
linformation caractre commercial.
Format : Le format dun document est troitement li avec le conteneur
dinformation. Du format de la source dinformation dpendra sa collecte. Les

57

informations de type texte n'ont videmment pas les mmes caractristiques que les
documents graphiques.
Utilisation : De l'utilisation prvue dune information dpendront les paramtres de
la collecte. Ceux-ci doivent tre dtermins en regard de l'utilisation propose ou
souhait : l'information sur le rseau d'autoroutes sert assez rarement
l'interprtation gologique de la mme autoroute ; sauf, bien sr, si des facteurs
gologiques taient inclus dans la collecte.

1.2.3.4. Validation des informations

tel-00131856, version 1 - 19 Feb 2007

La question de la validation de l'information soulve plusieurs questions.


L'origine des informations est le principal sujet de prudence, en particulier dans
cette re -et dans la sphre- de l'Internet. Plusieurs sites Internet sont si dynamiques
que l'information change constamment. Quelques autres sont obsoltes. D'autres
existent par intermittence, souvent pour des raisons techniques. Comment valider
l'information provenant de l'Internet ?
Un autre problme concernant la validation des informations est la question de la
cohrence. La cohrence dans la perspective de la source et la cohrence du ct de
l'utilisateur. Est-ce que les informations collectes resteront les mmes aprs une
premire collecte ?

L'auteur des informations changera-t-il compltement ou

modifiera-t-il ses informations ?


Les sources de l'information doivent tre valides.
Mais le transport des informations, c'est dire leur transmission jusqu'au dcideur,
doit aussi faire l'objet d'une grande rigueur, et contrle avec prudence.

1.2.3.5. Traitement des informations


Nous n'exposerons pas ici comment l'information est traite. La mthodologie et la
thorie de traitement de linformation sont un champ qui est li avec tant de
disciplines. Il implique des mtiers comme les statistiques, les mathmatiques, la
gomtrie, le calcul, l'analyse quantitative, lalgbre vectorielle et lanalyse

58

complexe. Il implique la chimie, la physique, la gographie, la gologie,


l'informatique et les autres sciences discrtes. Il implique galement les sciences
sociales et celles des arts littraires. Chaque discipline a sa propre thorie et
mthodologie pour le traitement de l'information.
Le traitement de l'information dpend de plusieurs facteurs et il est difficile
dannoncer le traitement d'une information quand le type d'information est inconnu.
Par exemple, une information multimdia ne sera pas traite de la mme manire
que des textes. Quand le type de l'information est connu, les utilisations de
l'information collecte sont un meilleur guide pour la faon dont il sera trait.

tel-00131856, version 1 - 19 Feb 2007

Les outils disponibles pour le traitement dinformation ont une importance


considrable, et d'abord, aujourd'hui, les outils informatiques et leurs logiciels ; mais
aussi les dispositifs de stockage, et les outils de prsentation : moniteurs, crans etc...
La connaissance et les expriences du spcialiste dans le domaine de l'information
sont un facteur qui influencera le traitement d'information.
La volont du dcideur influencera galement le traitement de l'information.

Calcul des indicateurs


Les indicateurs lis la recherche de l'information sont calculs sur les rsultats
obtenus. C'est l'utilisation indique qui dterminera si le but de la recherche de
linformation a t ralis ou pas.
Dans les processus de l'IE, les buts doivent tre noncs avant la recherche de
l'information.
On suppose que les objectifs dsigns au dbut dune recherche dinformations ne
changent pas en cours du processus. Selon le modle MEPD, un problme
dcisionnel est nonc comme un objet, qui mettra un signal ; le problme identifi
par le signal est li une ou plusieurs hypothses. Les hypothses doivent nous

59

guider dans les spcifications des indicateurs. Une hypothse peut donner naissance
un ou plusieurs indicateurs.
Prenons un exemple : nous voulons dcouvrir pourquoi il y a une baisse dans la
vente dun produit. Pour rsoudre ce problme, les ventes d'un produit peuvent tre
considres comme un objet tandis que la chute des ventes du produit est le signal
d'intrt (le problme). Une des hypothses que lon peut dduire est que le signal
(chute dans les ventes) est li aux produits alternatifs disponibles sur le march.
Les informations seront cherches, collectes, valides et traites sur la base des

tel-00131856, version 1 - 19 Feb 2007

sept tapes de dquipe SITE.

1.2.3.6. Interprtation des indicateurs


L'interprtation des indicateurs est exclusivement une fonction de ce qui a t
indiqu comme les indicateurs, les paramtres standards dans le domaine de la
recherche dinformation (gestion, chimique etc.) et le but de la recherche de
l'information.
Plusieurs facteurs influenceront l'interprtation des indicateurs. Certains de ces
facteurs sont lis la connaissance du veilleur en matire de

traitement de

l'information, tandis que les autres facteurs dpendront des dcideurs. Les outils
utiliss pour le traitement de l'information influeront aussi sur l'interprtation.

1.2.3.7. Dcision
La dcision peut tre vue dans des perspectives diffrentes selon (Thagard, 2001).
Nous pouvons le voir soumise l'intuition, ou au calcul et la cohrence.

Une dcision appuye sur lintuition


La dcision prise est base sur le sentiment et les convictions personnelles.

60

Supposons quun tudiant ait le choix dtudier :


x

soit l'histoire de lart, pour lequel il a un intrt affirm, mais qui ne lui
assure pas un avenir intressant.

soit l'informatique, qui peut le mener une carrire plus lucrative.

Il peut cder la raison, calculer, ou bien prendre une dcision intuitive, qu'il
justifiera par ses ractions motives. Ainsi les dcideurs intuitifs choisissent une
option fonde sur ce que leurs ractions motives leur indiquent comme prfrable.
Certes une option peut sembler attrayante en raison du manque de considration

tel-00131856, version 1 - 19 Feb 2007

pour les autres options disponibles, mais la notion d'intuition laisse une grande part
un brouillard intellectuel, probablement caus par - ou la faveur d'- une
information imprcise ou non pertinente.
Il va de soi que, dans une entreprise, une prise de dcision fonde sur lintuition
peut

avoir quelques srieux inconvnients. Le raisonnement intuitif est

problmatique dans des situations de groupe, o les dcisions doivent tre prises
collectivement. Si d'autres ne sont pas daccord avec le choix dintuition, on ne peut
pas simplement affirmer la dcision dintuition. Un consensus collectif est exig
travers une approche plus analytique que lexpression d'intuitions.

Une dcision appuye sur un calcul


La dcision prise est fonde sur

des paramtres vrifiables. Les experts prennent

une dcision fonde sur une approche plus systmatique et plus calcule. Des
publications dcisionnelles, comme Bazerman (Bazerman, 1994, p. 4), posent que
la prise de dcision raisonnable devrait inclure les six tapes suivantes :
x

Dfinition du problme, avec les caractristiques de l'usage universel de la


dcision.

Identification des critres, spcification des buts ou des objectifs accomplir.

Evaluation les critres, associe l'importance relative des buts.

61

Production des solutions de rechange, identification des lignes qui pourraient


accomplir les divers buts.

valuation de chaque alternative, sur chaque critre, valuant le point auquel


chaque action accomplirait chaque but.

Calculer la dcision optimale

Une dcision cohrente


Quand nous avons discerner le sens d'un texte, d'une image, d'un vnement, ou
d'une exprience avec une personne, nous construisons une interprtation qui est en
accord avec les meilleures informations disponibles. La meilleure perception des
tel-00131856, version 1 - 19 Feb 2007

objets, des vnements, des personnes, est celle qui constitue le lien le plus logique
avec ce que nous voulons comprendre, accordant deux informations conformes l'une
l'autre et refusant celles qui ne le sont.
Il y a quelques similitudes entre les processus d'IE et quelques autres formes
d'intelligence. Par exemple, dans le cas despionnage, le travail d'intelligence est
effectu au dtriment -et contre la volont- d'un groupe ou d'une cible individuelle.
Nous nous proposons de discuter maintenant ce genre d'intelligence bien particulire,
en comparant certaines de ses caractristiques celles de l'IE.

1.2.4. Lintelligence militaire C4ISTAR et lIE


Le C4ISTAR (Command and Control, Communications, Computing, Intelligence,
Surveillance and Reconnaissance : commandement, contrle, communications,
informatique, renseignement, surveillance et reconnaissance) comprend la doctrine,
les concepts, la connectivit, les systmes d'information, les capteurs et les outils qui
sont ncessaires pour appuyer efficacement le commandement dans l'ensemble des
oprations des forces militaires, grce la transmission rapide d'informations fiables
et pertinentes. Il comprend galement les systmes dinformation, la technologie des
satellites et des capteurs en plus dautres outils, comptences et processus venant
appuyer la collecte de linformation.

62

C4ISTAR est fond sur la guerre base sur un rseau-centrale (Network-centric


warfare : NCW), ou les oprations sur un rseau-centrale (Network-centric
operations : NCO)12. Cest une nouvelle doctrine militaire initie par les Etats-Unis,
prconisant lexploitation des opportunits techniques dans le domaine technologie
de l'information et de la tlcommunication pour amliorer la conscience
situationnelle et la vitesse de la prise de dcision (Boutelle, 2003).
Lobjectif de NCW/NCO est de fournir un accs une information sans faille tous
les militaires et dcideurs, chaque chelon dans la hirarchie militaire. Le but est
d'assurer une connectivit omniprsente dans toute l'organisation, les centres de

tel-00131856, version 1 - 19 Feb 2007

commande, pour chaque soldat d'infanterie isol, chaque vhicule sur le terrain, tous
les avions et vhicules navals et bien sr les vaisseaux spaciaux.
Cela permettrait tous les lments de partager l'information, rassemble pour tre
combine dans une image logique et prcise du champ de bataille, rendue disponible
toutes les units. Chaque unit "verrait" la somme de ce que toutes les autres units
voient, ayant ainsi une conscience considrablement accrue de la situation.
On suppose que le fait d'avoir un accs rapide l'information, donc la connaissance
de la situation, grce

une image oprationnelle commune, aura comme

consquence une planification stratgique plus rapide et l'excution de dcisions


tactiques plus efficaces.
Les huit tapes dans le processus de C4ISTAR (Boutelle, 2004) est presque identique
aux processus d'IE. Nous les comparons dans le tableau suivant :

12

Note : Les autres formes de guerre incluse asymtrique, usure, conventionnel,


fortification, la terre, gurillero, main la main, invasion, manuvre, naval, sige, total,
foss, non conventionnel

63

Processus dintelligence
Militaire C4ISTAR
Command

Dfinition de problme, Dcision

Control

Identification des sources pertinentes

Communications

Interprtation des indicateurs

Computers

Traitement des informations

Intelligence

Calcul des indicateurs

Surveillance
tel-00131856, version 1 - 19 Feb 2007

Processus dintelligence conomique

Collecte dinformations pertinentes,


Validation des informations

Target Acquisition

Prsentation des rsultats

Reconnaissance

Interprtation des indicateurs

Tableau 1.6 : Table de comparaison entre lIE et lintelligence militaire

1.2.5. Processus dcisionnels


Les dcideurs, qui sont habitus de nombreuses expriences, doivent prendre des
dcisions et agir dans le monde qui change rapidement. Dans cet environnement
turbulent, la capacit dvaluer la situation actuelle par le point de vue du "bon
jugement" avec succs est affaiblie avec le bruit externe (une multitude d'metteurs
d'informations sur des matires multiples) et en changeant des paradigmes de la
faon dont nous pensons aux issues sociales, culturelles, d'organisation et
conomiques, crant le bruit interne dans nos modles mentaux rgnants. Ces bruits
biaisent notre perception de ce qui se produit vraiment dans le monde. En plus, en
face de ce flux constant, les dcideurs sont invits choisir le chemin davenir aussi
bien que dexpliquer exactement comment ils projettent dy arriver. Avant quils
prennent leur dcision, les dcideurs commencent en dveloppant et en valuant des
hypothses au sujet des scnarios possibles, et puis liminent de nombreuses
possibilits jusqu' ce qu'un petit ensemble de choix viables reste. Une fois que la
dcision dagir est prise, la communication des nouvelles initiatives recommence.

64

Les rsultats de ces initiatives produisent habituellement un certain comportement


prvu, mais presque toujours, les actions produisent un comportement inattendu, de
sorte que cela change de nouveau les situations prsentes.
Les tapes suivantes ont t identifies comme les tapes impliques dans le
processus dcisionnel :
i. lidentification des problmes dans le monde changeant,
ii. la collecte dinformation,
iii. le dveloppement et la rflexion sur des solutions de rechange,
iv. le choix de la meilleure alternative,

tel-00131856, version 1 - 19 Feb 2007

v. la mise en application de la solution par la communication,


vi. la surveillance de la solution.
Les tapes sont relies ce que nous savons du processus en Intelligence
Economique. Trois points sont communs et des tapes vers la prise de dcision.
i. le problme doit tre identifi,
ii. les informations doivent tre collectes pour rsoudre le problme actuel et
iii. l'valuation des informations doit se faire avant et aprs son application.

1.2.6. Les systmes informatiss lis aux processus de dcision


Un systme automatis peut seulement aider a la prise de dcision, il ne peut pas
remplacer l'homme dans la prise de dcision. Plusieurs efforts ont t faits pour
utiliser l'ordinateur dans les prises de dcision. L'intelligence artificielle a t conue
au commencement pour excuter les processus similaires aux raisonnements
humains. Lide est de remplacer lhomme par des machines.
Nous essaierons de discuter certains de ces systmes.

Le but de cette

informatisation est d'aider l'homme pour prendre une dcision rapide, qui ne
compromette pas la qualit de sa prestation.

65

Dans un systme daide la

dcision, un utilisateur compose une requte

mentalement, la requte est transforme dans un format qui est en conformit avec
les rgles et les attributs dans le systme informatis. La requte est renvoye une
base de donnes de connaissance ou une base de donnes de faits. Des bases de
donnes de connaissance sont cres, fondes sur l'information disponible dans le
domaine, l'exprience et la connaissance des experts en matire de ce domaine
d'intrt. La requte est mise en correspondance avec la base de donnes pour
produire les slections qui saccordent avec la requte. Cet aspect compare le
contenu de la requte aux attributs et aux valeurs dans une base de donnes. Dans un
systme o la connaissance est fonde sur des faits ; la requte est guide par les

tel-00131856, version 1 - 19 Feb 2007

options choisies par lutilisateur. Cest dire que le systme propose les options et
l'utilisateur choisit une option qui est la meilleure selon son problme.

Slection
Base de
connaissance

Base de
Faits

Prsentation
des rsultats

Transformateur des
requtes aux rgles /
prdicats

Reformulation des
rsultats pour aider
une situation
dcisionnelle

Stockage de
slection / requt
de slections

Les avis
personnels

Requte(s)

Figure 1.3 : Les tapes de recherche dinformation


Quatre mthodes sont gnralement utilises pour dvelopper les systmes
interactifs informatiss d'aide la dcision et les systmes dexperts. Les

66

raisonnements base de cas, les raisonnements base de rgle, les rseaux


neuronaux et les rseaux probabilistes.
La requte est reformule en fonction du rsultat. Un des inconvnients principaux
des systmes interactifs informatiss est que la plupart d'entre eux nont pas de place
pour les commentaires personnels qui peuvent tre ajouts l'interface de
prsentation. Ces commentaires et les choix ainsi que la requte utilise en faisant le
choix peuvent tre un outil trs important pour amliorer la base de donnes de

tel-00131856, version 1 - 19 Feb 2007

source.

1.2.6.1. Les systmes d'aide la dcision (SIAD)


Les systmes interactifs d'aide la dcision (SIAD en anglais Decision support
system ( DSS)) sont une classe spcifique des systmes d'information automatis,
qui tiennent des activits des affaires et des organisations pour la prise de dcision.
Ils sont

caractriss par leur interactivit. Un SAD correctement conu est un

systme de logiciels interactifs prvus pour aider des dcideurs compiler les
informations utiles a partir des donnes brutes, des documents, de la connaissance
personnelle, et/ou des modles d'affaires, pour identifier et rsoudre des problmes
et pour prendre des dcisions.

McNurlin (McNurlin et al, 1989) ont dfini les systmes interactifs d'aide la
dcision (SIAD) en tant que systmes informatiss qui aident des dcideurs
confronter des problmes mal structurs, par l'interaction directe avec des modles
de donnes et des modles d'analyse." Ces systmes sont habituellement fortement
quantitatifs et permettent des utilisateurs d'explorer les consquences de diffrentes
dcisions bases sur des donnes diffrentes. Avec le SAD les modles divers
peuvent tre crs et analyss, par exemple sous forme de questions, de S' il y a .
Les bilans fournissent une mthode simple dun tel modle et analyse. Le travail de
Farrell (Farrell et al, 1992) montre comment les bases de donnes, simulation
dterministe de modle, et les systmes bass sur les rgles (expert) peuvent tout

67

contribuer au SAD. Les applications du systme de SAD sont rpandues dans le


domaine de l'agriculture dans les annes I990.

tel-00131856, version 1 - 19 Feb 2007

Figure 1.4 : Interface dun system de SAD (LEXSYS 2.3)


Les SADs ont volu tt dans l're de l'informatique distribue. L'histoire de tels
systmes commence vers 1965. Les technologies qui convergent au dbut du XXIme
sicle pour fournir l'appui intgr pour des directeurs qui travaillent dans la solitude,
dans les quipes et dans des organisations hirarchises, pour contrler des
organismes et pour prendre des dcisions plus raisonnables.

1.2.6.2. Systme dInformation Excutifs (SIE)


(Executive information systems EIS)
Les systmes d'informations excutifs sont considrs comme un genre de SAD
spcialiss pour satisfaire les besoins de l'information principalement des dcideurs.
Ils sont identifis dans les tapes suivantes par (McNurlin et Sprague 1989) :
x

Mesurer la performance de facteurs critiques,

Descririre de la cl actuelle des problmes,

Souligner les choses aux quelles le dcideur sintress le plus,

Dtailler les rapports de performance des subalternes.

Les dispositifs typiques d'un bon SIE incluent des agrgats plus larges, des donnes
d'organisations, des rapports de rel contre des actions prvues , des graphiques
clairs, un accs rapide l'information interne et externe et l'optimisation cense

68

concerner des facteurs critiques du succs des dcideurs. Un des bnfices du


systme de SIE sur les aspects du processus dcisionnel a t remarqu dans le
travail de Leidner (Leidner et al, 1993). Ils ont examin 46 utilisateurs excutifs
d'SIE. Ils ont constat que la frquence et la dure dutilisation de SIE a augment la
vitesse d'identification de problme et la prise de dcision et l'ampleur de l'analyse
dans la prise de dcision.

1.2.6.3. Les systmes d'aide la dcision de groupe


Les systmes d'aide la dcision de groupe (en anglais Group decision support
tel-00131856, version 1 - 19 Feb 2007

systems -GDSS) aident la prise de dcision collective de groupe travers

x la collaboration et la crativit,
x l'conomie de temps,
x les solutions amliores, et
x la mise niveau sociale ou la cration dambiance favorable.
Lewis et Keleman (Lewis et Keleman, 1989) ont remarqu plusieurs avantages de
lutilisation de GDSS. Les avantages comprennent un degr lev d'engagement
pour l'excution dun projet et une meilleure gestion des conflits. Les utilisateurs
tudis ont amlior leurs capacits dans le domaine de rsolution des problmes de
planification et observ une grande amlioration dans la productivit, bien plus que
dans le fonctionnement ordinaire d'une quipe. Les amliorations sont dues la
possibilit d'exprimer des avis personnels
Un GDSS vise amliorer le processus de la prise de dcision de groupe en enlevant
les barrires communes de communication, fournissant des techniques pour
structurer l'analyse de dcision, et diriger systmatiquement le modle, la
synchronisation, ou le contenu de la discussion dans un groupe (Davison, 1995). Le
mot groupe implique ici deux personnes ou plus, ainsi qu'un but commun, si ce nest
pas une perspective commune. On a conu un certain nombre d'outils et de
techniques qui peuvent tre utiliss pour amliorer le processus de la prise de

69

dcision de groupe. Un certain nombre de rsultats peuvent galement tre mesurs


afin de donner une apprciation de ce qui peut se nommer l'efficacit du GDSS.

1.2.6.4. Le traitement analytique en ligne (OLAP)


Le traitement analytique en ligne (OLAP : On-Line Analytical Processing) est une
catgorie de technologie de logiciel qui permet des analystes, des dcideurs et
des cadres de gagner une perspicacit des donnes par l'accs rapide, consistant et
interactif une grande varit de vues possibles, d'informations qui ont t

tel-00131856, version 1 - 19 Feb 2007

transformes partir des donnes brutes, pour reflter la vraie dimensionnalit de


l'entreprise comme le comprend l'utilisateur. Dans une base d'analyse OLAP, les
donnes sont organises selon une structure multidimensionnelle. On parle alors de "
cube dcisionnel".
Ce concept est appliqu un modle virtuel de reprsentation de donnes appel
cube ou hypercube OLAP. Il existe ensuite plusieurs dclinaisons semblables des
pilotes qui permettent d'adapter le stockage des donnes sur diffrents types de base
de donnes pour implmenter le concept OLAP :
x

R-OLAP (Relational OLAP)

D-OLAP (Dynamic ou Desktop OLAP)

M-OLAP (Multidimensional OLAP)

H-OLAP (Hybrid OLAP)

S-OLAP (Spatial OLAP)

Globalement, pour les systmes d'aide la dcision, il y a un lien formel entre les
lments dinformation, ou entre les rgles. Dans le systme fond sur l'annotation
que nous avons propos, la base de donnes d'annotation crer peut tre fonde
non seulement sur les liens entre les donnes mais galement sur les expriences et
les suggestions du crateur des annotations. Cette situation peut tre les bases de
donnes d'annotation ayant un facteur social, puisqu'un utilisateur peut faire des

70

annotations plusieurs fois sur le mme document dans les circonstances diffrentes.
Cette possibilit de crer une situation faisant place un lien entre les lments
d'annotation (dans la base de donnes) devient dynamique par rapport aux systmes
interactifs d'aide la dcision, qui, eux, sont statiques, figs. En plus, les entres
peuvent galement reflter les changements du temps par rapport l'environnement
et aux perceptions sociales.
Les bases de donnes fondes sur des rgles dans quelques systmes d'aide la
dcision , ou fondes sur l'organisation, comme dans d'autres systmes analytiques
sont gnralement cres en premier lieu avec la technologie du jour et avec une trs

tel-00131856, version 1 - 19 Feb 2007

ptite prise en compte de l'utilisateur. Les utilisateurs sont autonomes et doivent


trouver leur chemin dans les donnes organises. Les organisations des faits et des
figures dans les systmes d'aide la dcision sont fondes sur des concepts et non
pas sur les situations relles. Les SAD ne peuvent pas voluer avec la tendance du
temps ni reflter les changements humains.

1.2.7. Lintelligence et lannotation


Lobjet annotation est fortement li au contenu du document. Cest impossible de
faire une annotation de valeur si le contenu dun document n'est pas saisi.
Essentiellement, l'annotation est une consquence d'une ou plusieurs tudes
intelligemment faites dun document. Nous nous inspirons des raisons partir
desquelles les annotations sont faites, elles incluent :
x

l'interprtation de l'information,

le rsum d'un document et

la classification dun document etc.

Ce sont tous des processus cognitifs qui ont besoin de raisonner sur le contenu du
document. Nous disons donc que l'annotation est un effort intellectuel appliqu
une source d'informations.

71

1.2.8. Les problmatiques lies la recherche et au traitement de


linformation
L'information est seulement utile si elle peut aider la prise de dcision. La thorie
de la dcision ne considre comme information que ce qui est de nature entraner
ou modifier une dcision. Dans le cas contraire, il s'agit d'un simple bruit. On pense
souvent que l'information peut tre dfinie comme une donne rductrice
d'incertitude.

tel-00131856, version 1 - 19 Feb 2007

Plusieurs problmes doivent tre surmonts pour procurer l'information qui aidera
prendre une dcision. Les problmes suivants sont lis au processus de recherche et
au traitement de linformation :
x

problmes daccs l'information,

problmes de spcificit de l'information recherche,

problmes de traitement de l'information,

problmes dorganisation,

problmes de formatage et prsentation.

Aprs avoir dfini les terminologies de base de notre tude, le chapitre suivant est
ddi lxplication de quelques travaux majeurs faits en relation avec lannotation.
Nous discuterons aussi l'importance d'annotation dans les sciences de linformation
et de la communication.

72

Chapitre 2
Pour son existence, la dpendance de l'homme aux plantes a t d'une importance capitale
depuis que la race humaine existe - Victoria Abike Robert (1965 2005)13.
Pour son existence, l'annotation est indissociable du document de faon permanente
Charles Abiodun Robert14

2. tat de lart sur lannotation


Ce chapitre sera divis en deux parties. La premire partie discutera l'importance de

tel-00131856, version 1 - 19 Feb 2007

l'annotation dans les sciences de l'information et de la communication tandis que la


deuxime partie considrera de la cration et de stockage d'annotation.

2.1. Lannotation dans le domaine de SIC


Nous examinerons la connexion entre l'annotation et les sciences de l'information et
de la communication. L'accent sera mis sur les travaux qui ont t effectus cet
gard.

2.1.1. Les sciences de linformation et de la communication


Les sciences de l'information et de la communication sont lies aux sciences de la
documentation et l'informatique. Nous pouvons dire que, bien que les sciences de
linformation et de la communication soient proches et associes aux autres
disciplines, les liaisons sont dun intrt particulier pour notre tude. Avant une
prsentation des dfinitions lies aux sciences de linformations et de la
communication, nous prsenterons un "primtre" des six domaines d'tudes
prsents par le Conseil National des Universits (CNU 15 (71)) dans le rapport
d'valuation denseignement des sciences de linformation et de la communication
du comit national d'valuation, les sciences de l'information et de la communication
(Saget, 1993, p.16). Nous prsenterons les primtre :
13
14
15

Mans dependence on plants for his existence has been of paramount importance since human race began
Annotations dependency on document for its existence is inseparable all time

http://cnu71.online.fr/12-compe.html 23/03/2006

73

les tudes sur les notions d'information et de communication, sur leurs


relations, sur la nature des phnomnes ainsi dsigns ainsi que les analyses
philosophiques,

pistmologiques,

mthodologiques,

logiques,

mathmatiques de ces phnomnes ;


x

l'tude de l'information, de son contenu, de ses proprits et de sa


prsentation ;

l'tude des systmes d'information et des modles documentaires,


informatiques et autres, qu'ils mettent en oeuvre ;

l'tude des mdias de la communication sous leurs divers aspects ;

l'tude du fonctionnement des processus de communication et des

tel-00131856, version 1 - 19 Feb 2007

productions et usages de la communication ;


x

l'tude des acteurs de la communication et des agents du traitement et du


transfert de l'information, de leurs formations, de leurs professions.

Si nous devons rcapituler les points ci-dessus, nous dirons que la science de
l'information et de la communication est ltude de l'information dans la perspective
de (a) sa relation scientifique, (b) le contenu (c) des processus de linformation, (d)
les acteurs, et (e) les mdias de communication.
En France, les sciences de linformation ont une dnomination officielle, les
sciences de linformation et de la communication (SIC) . ltranger,
linformation et la communication sont gnralement spares.
Les sciences de la communication considrrent la communication comme toutes
les expressions issues dacteurs sociaux et porteuses dune intentionnalit
analysable du point de vue dun observateur-lecteur avis, c'est--dire capable den
comprendre le sens dans un contexte pertinent pour les acteurs concerns.
(Mucchielli et al, 1998). Dans ces dfinitions, les mots principaux se rptent
comme (a) expression (b) acteur (c) intention analysable (d) contexte pertinent.
Nous pouvons appliquer cette dfinition dans le domaine de lannotation dans le
contexte de la science de linformation et de la communication. Comme une
annotation est forcment crite dans un contexte de document dorigine, lanalyse
dannotation est toujours, elle aussi, dans un contexte de contenu de document. Une

74

annotation est faite par un acteur, qui analyse le contenu dun document dans un
systme dinformation.
Un autre travail d'importance est celui de Paoli (Paoli et al, 2003) qui montre une
analyse systmatique de l'information dans quelques pays choisis en utilisant un
indicateur prdermin de manire valuer le rle dun mdia d'information
(l'Internet).
Dans les sciences de linformation et de la communication, tout objet doit tre
communiqu. Quelle est la signification du mot communication .

Plusieurs

dfinitions du terme communication se trouvent dans le travail dAlex Mucchielli et


tel-00131856, version 1 - 19 Feb 2007

Jeannine Guivarch (Mucchielli et Guivarch, 1998). Dans les sections prcdentes,


nous avons dfini le mot information , mais linformation et la communication
sont toujours inseparables. Nous dfinissons le mot communication dans le
paragraphe suivant.

2.1.2. La communication
Dans la publication de National Joint Committee for the Communicative needs of
Persons with Severe Disabilities (National, 1992, p. 2), la communication se dfinit
comme suit :

Nimporte quel acte pour lequel une personne donne, ou reoit des autres les
informations dune autre personne sur les besoins, les dsirs, les perceptions, la
connaissance ou les tats affectifs de celle-ci. La communication peut tre
intentionnelle ou involontaire, elle peut impliquer les signaux conventionnels ou non,
peut prendre les formes linguistiques ou non, et peut se produire par le moyen
sonore ou autres.
Malgr le fait que cette dfinition soit une dfinition spcifique, nous focalisons sur
le mot central dans la dfinition lchange dinformation .

75

Une autre dfintion de la communication se prsnte comme le processus de la


transmission d'information de l'un mtteur un rcepteur par le moyen de
l'utilisation d'un message transmis d'un l'autre travers un canal16.
Quatre lments sont impliqus dans un processus de la communication : lmetteur,
le rcepteur, le canal et le message.
Modle

Dfinition de la communication

Problmatique principale

MODELE POSITIVISTES : le contenu et ses effets


Emetteur-rcepteur

Un transfert dinformation

Les proprits du contenu

De la communication

Un processus dinfluence

Linfluence sur les opinions

Une opration piloter

Lefficacit de lopration

deux niveaux
Marketing

tel-00131856, version 1 - 19 Feb 2007

MODELE SYSTEMIQUES : le systme comme cadre


Sociomtrique

Une relation daffinit

La structure affective et les places occupes

Transactionnel

Des rituels dchanges sur plusieurs

Les motivations profondes et les avantages

niveaux

tirs

Interactionniste et

Une participation un systme

Le systme des changes, le sens de

systmique

dinteractions

lchange dans le systme, les paradoxes

De lorchestre

Une production collective

Larticulation des jeux individuels

MODELES CONSTRUCTIVES : la gense du sens


De lhypertexte

Un dbat latent

Le sens du dbat

Situationnel

Une construction collective du sens

Les processus de la gense

Tableau 2.1 : La dfinition de la communication (Alex Mucchielli, 1998)

2.1.3. La communication et la recheche de linformation


A la suite des explications prcdentes, nous croyons que la communication est
lchange de l'information fond sur des besoins divers. Dans la plupart des
situations, la communication peut tre lance parce quelqu'un a besoin de quelque
chose. Dans le cas o la personne a besoin dinformation, linitiateur de la
communication

est

le

demandeur

dinformation.

Dans

certains

cas,

la

communication peut tre lance en raison d'une dclaration floue qui, elle peut
provoquer l'explication, la justification, la clarification ou lexemplification (besoin
d'information provoqu). Dans les deux cas, la participation des deux parties
(l'initiateur et le rpondant) est systmatiquement ralise. Enfin, la communication
est lie au besoin.

16

http://www.mind-graph.net/foundations/linguistic/communication.htm 31/08/06

76

Dans le cas de la recherche de l'information, le focus est la situation o la


communication est provoque par le chercheur d'information (la personne qui a un
besoin). Le chercheur d'information imagine qu'il peut y avoir une rponse son
besoin quelque part dans un systme d'information. Il est encourag faire une
recherche pour son besoin dans ce systme d'information. Il est noter que cette
situation sapplique dans les systmes d'information informatiss ou dans la vie
ordinaire. Par exemple, un tudiant recherche le vol le moins cher pour Londres. Son
besoin est linformation sur le vol le moins cher pour Londres. Il peut dcider
d'interroger son ami (initier une communication) ce sujet (information). On peut
temps lancer une recherche de vol moins cher sur linternet.

Besoin
dinformation

Barrire

tel-00131856, version 1 - 19 Feb 2007

voir son ami comme une partie d'un systme d'information global. Il peut en mme

Systme dinformation

Le monde
dinformation

Figure 2.1 : Un chercheur dinformation communique pour rduire une barrire


Dans une recherche d'information, le chercheur de l'information est spar du monde
de l'information par une barrire. La barrire peut prendre des formes diverses. Elle
peut tre une barrire linguistique ou une barrire de localisation (la distance), etc.
Le chercheur de l'information suppose quil existe un monde d'information o son
problme de besoin dinformation peut tre rsolu. Il croit aussi qu'il y a quelqu'un
(un expert) ou un outil qui peut rduire ou enlever la barrire entre lui et le monde de
l'information. L'expert est expriment dans l'organisation du monde de
l'information et il sait transformer les besoins du chercheur de l'information en terme
du monde de l'information. Le chercheur de l'information lance une communication

77

avec lexpert qui est un membre du systme d'information. Lobjectif de la


communication, cest de permettre lenlvement ou la rduction de la barrire entre
lui et le monde de l'information.

2.1.4. La recherche dinformation


La phrase recherche dinformation a deux connotations en anglais, Information
research et Information Retrieval . En anglais, la phrase information research
or Information search est un peu diffrente de celui de information retrieval ,
Information Research est plutt la recherche dinformation alors que
information retrieval est plutt la rcupration dinformation dans un stockage
tel-00131856, version 1 - 19 Feb 2007

informatis et une mathmatique de rcupration.


La recherche d'information est un domaine trs large. On peut le voir comme une
activit mono-processus dans laquelle la recherche d'information pour rsoudre un
problme est instantane (lacte de recherche dinformation sur place). On peut le
voir comme une activit multi-processus o la recherche dinformation prend des
tapes diffrentes. Comme nous lavons presnt dans les huit tapes de processus
dintelligence conomique dvoiles dans les sections prcdentes, la recherche
d'information dans tous les cas est une activit multi-processus.
Dans le cas o la recherche d'information est vue comme mono-processus (la
rcupration de linformation), l'attention est porte sur la requte concrte de
l'information partir d'une base de l'information. Plusieurs efforts et les recherches
scientifiques ont t effectus dans ce domaine. Certains de ces travaux sont dans le
domaine du profil dutilisateur, des travaux bibliographiques, des statistiques
defficacit du systme dinformation et des recherches documentaires. Quelques
modles de recherche dinformation ont t suggrs. Les recherches dinformation
(information retrieval) ont t autrefois lies l'organisation de l'information.
Considrons le travail de Rijsbergen (Rijsbergen, 1979) sur information retrieval ,
ou son attention (numre ci-dessous) sur la rcupration de linformation est
distinctement diffrente de notre conception (SITE-LORIA) de la recherche

78

d'information. Le information retrieval est dvoile dans

les perspectives

suivantes :
x

Analyse automatique de texte tudie la faon dont le texte dun document est
reprsent dans un ordinateur.

Classification automatique - mthodes gnrales de classification automatique et


valuation de mthodes de la rcupration de linformation.

Structures de fichier - structures de fichier selon le point de vue dun chercheur


dinformation principalement.

Stratgies de recherche - plan de recherche applique aux collections de

tel-00131856, version 1 - 19 Feb 2007

documents structures dans les manires distinctes, galement l'utilisation de la


rtroaction.
x

Recherche probabiliste - diffrents modles formels pour augmenter l'efficacit


de rcupration en utilisant des informations d'chantillon sur la frquence
d'occurrence.

valuation - une vue de la mesure de l'efficacit dans la thorie de l'valuation.

Les propositions de information retrieval sont essentiellement quantitatives. Or


la demande en recherche dinformation ne se limite pas des rsultats quantitatifs.
Nanmoins, il reste clarifier ce que les rsultats et les analyses quantitatives
peuvent tre.

2.1.5. Lannotation comme un moyen de communication


Comme nous lavons exprim dans les dfinitions de lannotation du contenu dun
document, une annotation peut tre une trace dusage dun document. C'est--dire, il
peut tmoigner du passage dun utilisateur. Lutilisateur a pour intention dexprimer
ses opinions sur un document. Les opinions sont les interprtations et les valuations
du document en question.
Un exemple : Imaginons quil y ait eu une annotation faite par Louis-Napolon
Bonaparte sur un document dobjet dart en Egypte en 1849. A travers lannotation,

79

nous pouvons dire aujourdhui que (a) Louis-Napolon Bonaparte tait directement
ou indirectement impliqu dans les objets dart Egyptiens (b) il y avait une relation
forte entre les objets darts dEgypte et lhomme politique Franais en 1849. Dans
les cas ci-dessus, cest lannotation sur le document qui communique ces
informations.
L'annotation peut tre un outil efficace dans le domaine de la communication. Le but
central dune annotation dans le domaine de communication est que les annotations
partages peuvent fournir une possibilit de communication efficace pour le public.
Dans le cas o le travail implique la rfrence frquente un ensemble de

tel-00131856, version 1 - 19 Feb 2007

documents et dutilisateurs, tels quentre les professeurs et les tudiants dans un


cours, lannotation partage peut tre un outil efficace pour des usages pdagogiques.

2.1.5.1. Lannotation comme un moyen de communication dun


groupe
Nous pensons que l'annotation est un processus continu. L'intrt sur le document
un moment peut tre sur l'implication conomique de lunion et un autre moment,
l'intrt peut tre sur la composition de lunion. Le document principal reste le
mme mais lorientation change. Dans ce cas, nous pouvons avoir un coordonnateur
de l'annotation qui dirige la tendance et lorientation est mene par lannotation.
Quand une annotation est prsente, nous poser des questions comme : Pourquoi
lannotation a-t-elle t faite ? Quelle est la personne qui a fait lannotation ? Quand
lannotation a-t-elle faite ? La rponse nest pas souvent nonce dans lannotation.
Comment rsolvons-nous ce genre de situation ? Si nous pouvons rgulirement
rpondre ces questions, nous pouvons faire une analyse croise entre les
annotateurs, entre le temps et les documents.

80

tel-00131856, version 1 - 19 Feb 2007

Figure 2.2 : Un extrait du trait Europen de 1951


Par exemple, si les annotations devaient tre faites sur l'extrait de figure 2.2 (un
extrait du trait europen de 1951), diffrents utilisateurs feront les annotations
diffrentes sur cet extrait. Les points saillants qui attireront l'attention des lecteurs
(les annotateurs potentiels) de cet extrait peuvent inclure, (a) l'union europenne, (b)
le march unifi (c) la coopration dans le domaine politique et diplomatique (d)
souverainet universel (e) l'emploi

(f) la croissance conomique. Il y a des

utilisateurs qui peuvent tre intresss par d'autres lments qui ne sont pas
directement noncs dans lextrait comme (g) les personnalits impliques dans le
trait (h) les pays dans le trait et (i) pourquoi et o ce trait a t fait ?
Dans ce cas, il sera ncessaire davoir un coordinateur pour diriger la tendance des
annotations sur ce document. Si ceci est fait, nous pouvons effectivement employer
lannotation comme un moyen de communication de groupe.

2.1.5.2. Lannotation et la cycle communicationnelles


2.1.5.2.1. La cration dune annotation
L'annotation est porte sur un document. Les critures d'un auteur donnent naissance
la production dun document. Un annotateur est principalement un lecteur. Il sest
inspir de ce qu'il a lu dans un document publi pour faire une annotation. Son

81

annotation n'est pas fonde sur le monde de l'information autour de l'auteur du


document de base, mais sur les sujets bien prcis dans le document publi. Le
lecteur du document ou lannotateur doit avoir accs au document concerne. Il cre
une ou plusieurs annotations fondes sur sa comprhension du document. La figure
2.3, est une illustration d'une cration d'annotation

Information
Valeur ajoute

crire

Ide dorigine

tel-00131856, version 1 - 19 Feb 2007

Produit

Annoter (action)

Produit

Document

Document &
Annotation (objet)

Auteur du document

Crateur dannotation

Figure 2.3 : La cration dannotation

2.1.5.2.2. Les annotations continues


Nous pouvons noter que le processus d'annotation n'est pas un processus statique.
Une annotation peut tre utilise pour effectuer une srie de discussions dans une
communication rptitive. Par exemple, une annotation de type clarification est
une manire de demander davantage dexplications dans une communication entre
l'auteur d'un document et le lecteur d'un document. Lannotation sur le document
dorigine exige une restructuration du document original pour que le contenu du
document puisse tre mis en vidence. Le document dorigine et l'annotation faite
par un lecteur

sont renvoys l'auteur dorigine par le crateur d'annotation

(lecteur). L'auteur du document dorigine devient subsquemment le lecteur de

82

l'annotation avec le document dorigine. Dans ce cas nous entrons dans ce que nous
pouvons appeler les annotations continues .
Dans un systme o le cycle d'annotation est continu, il y a plusieurs repres
d'intrt :
x

L'auteur du document dorigine et l'auteur de l'annotation initial peuvent tre


vus en tant qu'auteurs des annotations successives,

Le cycle d'annotation peut tre infini,

Le cycle dannotation peut fournir un forum pour la direction dune

tel-00131856, version 1 - 19 Feb 2007

comprhension du document dorigine,


x

La comprhension du document peut tre demande par un des participants


l'change,

La comprhension du document peut faire rfrence aux autres documents


hors du contexte de la discussion,

Le cycle des annotations peut tre une mthode de communication entre


deux ou plusieurs individus,

Il y a un historique des annotations,

Linterprtation du document volue avec le temps.

83

crire

Ide dorigine

Information
Valeur ajoute

Annoter (action)

A0

Produit

Produit

Document

Document &
Annotation (objet)

D0

crire

Ide dorigine

Di+1

Information
Valeur ajoute

Annoter (action)

A1
Produit

tel-00131856, version 1 - 19 Feb 2007

Document

Produit

Do=Document dorigine
D1=Nouvelle version du
document dorigine
At=Annotation linstant t
Dt-1= Document prcdent
D1= A0+D0
Di = Dt-1 +At
DiDi+1

Document &
Annotation (objet)

D1

D1+1

Figure 2.4 : Lannotation continue

Lagrgation de la connaissance : puisque plusieurs annotateurs sont


impliqus dans le processus dannotation continue, dans les travaux
collaboratif et dans les classifications ou valuations de la comprhension
dun document, lagrgation des connaissances des annotateurs est possible.

2.1.5.3.

Le cycle informationnel et lagrgation dexprience

Nous devons souligner que les annotations sont souvent pour tre partages. Le
partage peut faire rfrence au temps ou aux lecteurs. Quand un lecteur cre une
annotation pour un usage, lusage est pour l'avenir, soit pour un usage personnel, soit
pour tre partag avec dautres lecteurs. Nous supposons que nous pouvons avoir les
annotations sur les annotations dj existantes qui pourraient exprimer dautres
concepts que les concepts du document dorigine. Dans ce cas, les nouveaux
concepts introduits par lannotation reflteront les points de vue des annotateurs.
Nous nous sommes intresss au partage de l'annotation travers un groupe de
personnes. Dans ce cas, nous formulons les hypothses suivantes :

84

Nous avons au moins deux participants qui sont en collaboration par le


partage d'information,

Nous avons au moins un cycle dchange d'annotation entre les participants,

Il existe une utilisation distribue et collaborative des annotations,

Les annotations sont faites pendant une certaine priodes,

Le moyen d'change des annotations est de prfrence lectronique,

Les annotations refltent la comprhension des concepts exprims dans le


document.

Dans la section suivante, nous explicitons comment lannotation peut tre partage
tel-00131856, version 1 - 19 Feb 2007

par un groupe de personnes.

2.1.5.3.1. Le partage des expriences partir dun seul document


Nous considrons d'abord le cas o un seul document annot est la base dagrgation
de connaissances. Diffrentes mthodes peuvent tre utilises pour partager des
annotations sur un seul document. La mthode utilise pour partager l'annotation
dpend des acteurs impliqus dans le partage et lobjectif de ce partage. Nous
discuterons quatre mthodes de partage des annotations ici :
Partage en mode modr
Dans ce cas, une annotation est partage de manire modre. Il y a un modrateur
ou un responsable qui est charg de grer des annotations effectues. Tous les
annotateurs sont relis un unique annotateur central, cest dire le modrateur ou
coordinateur. Un acteur met ses suppositions lannotateur central (coordinateur),
ce dernier envoie linformation ajoute (annotation) avec le document tous les
autres annotateurs lun aprs lautre ou uniquement au destinataire concern. Le
modrateur a plus de contrle sur les annotations partages par chaque annotateur
que les autres annotateurs. Puisque qu'il y a un modrateur au centre des annotations
partages, les annotateurs autour du modrateur central ne doivent pas partager les
annotations entre eux-mmes.

85

Cette mthode de partage des annotations peut tre une mthode dimportance dans
le processus d'intelligence conomique o un dcideur peut avoir une activit
centrale sur les activits des autres. Lutilisation dannotation partage peut tre
efficace pour la gestion des activits des autres. Par exemple, un dcideur peut
lancer une discussion dans une entreprise. Il peut vouloir mettre en application cette
discussion avec l'utilisation des propositions d'annotation. Il dcide alors d'envoyer
un document (ou le document annot selon les circonstances), un agent dans
lentreprise. On s'attend ce qu'il value les propositions faites par celui-ci avant

tel-00131856, version 1 - 19 Feb 2007

quil envoie le document annot aux autres agents dans lentreprise.

Annotateur
1

modrateur
dannotation
partag

Annotateur
2

Annotateur
3

Figure 2.5 : Partage dannotation en mode modr


Partage en mode symbiotique
Des annotations sont partages fondes sur des expriences diverses des annotateurs
dans lespace collaboratif. Aucun modrateur n'est considr comme le coordinateur
de l'annotation dans ce cas. Chaque annotateur a une contribution unique faire dans
la collaboration.

86

Toujours dans le cas de l'annotation sur un document spcifique, nous supposons


que plusieurs annotations sont faites leur tour par les divers acteurs. Chaque acteur
fournit une annotation sur le document (ou le document annot) en fonction de son
exprience unique.

Cest possible d'avoir les domaines d'intersection entre les

annotateurs.
Dans ce cas dune annotation partage, nous considrons deux possibilits pour le
partage (a) union des annotateurs (b) intersection des annotateurs.
Dans le cas o le partage dinformation est fond sur ce concept symbiotique, cinq

tel-00131856, version 1 - 19 Feb 2007

expriences sont importantes dans le partage :


x
x
x

Toutes les expriences de tous les annotateurs A1  A2  .....  An


Toutes les expriences dun sous-ensemble dannotateurs A1  An .
Les expriences communes entre tous les annotateurs A1  A2  .......  An

Les expriences communes entre deux annotateurs A1  A2

Les expriences uniques de chaque annotateur A1 z A2 z A3 z ..... An

ou A1, A2 An sont les annotations par les acteurs 1, 2, .n


Annotateur 3

Annotateur 1

Annotateur 2

Figure 2.6 : Partage dannotation en symbiotique

87

Partage en mode propag


Il y a quelques similitudes entre ce type de partage d'annotation et le type modr.
Le processus d'annotation est lanc par un acteur dans les deux cas. La diffrence
dans le cas propag est que, linitiateur de lannotation n'a pas de contrle sur les
annotations faites. Il n'est pas le modrateur des annotations, bien qu'il soit
linitiateur. On ne s'attend pas dans ce mode, ce que les annotations retournent
linitiateur.
annotateur
1

tel-00131856, version 1 - 19 Feb 2007

annotateur
2

annotateur
3

Figure 2.7 : Partage dannotation en propagation


Ce type de partage d'annotation est largement rpandu dans les situations o nous
avons une hirarchie entre les annotateurs. Dans la figure 2.6, un annotateur 1, peut
lancer un travail collaboratif par les annotations, soit parce qu'il joue un rle
important dans la hirarchie soit parce qu'il est le responsable direct du systme qui
propose l'annotation. Il envoie le document contenant lannotation une autre
personne sous sa responsabilit au

88

niveau

hirarchique.

Successivement

lannotateur 2, envoie le document avec sa propre version d'annotation


l'annotateur 3. Ce partage peut tre utilis en tant que moyen pour dlguer la
responsabilit.

Partage en mode transition


Jusqu' prsent, nous avons discut de trois types de mthodes d'agrgation de
comprhension dun document travers l'utilisation d'annotation. Nous pouvons
voir rapidement que le sujet d'annotation est relativement constant. Les annotations
faites sont dpendantes des expriences des annotateurs. Nous avons dlibrment

tel-00131856, version 1 - 19 Feb 2007

nglig le sujet du contenu du document. Ce type de partage des expriences


travers les annotations est fortement li au contenu du document. Dans la mthode
de partage dannotation de mode transition, une action dannotation est initie
partir d'un sujet particulier sans ncessairement considrer les autres sujets qui
peuvent tre lis. Le fait est que, il ny a pas de discipline ou de domaine de
connaissance que lon peut isoler compltement des autres. Parce que les disciplines
sont lies, l'initiation dannotation ouvre un raisonnement interdisciplinaire vers un
autre domaine de raisonnement.

Gographie

Agriculture

Biologie

Mdecine

Comptabilit

Gestion

Figure 2.8 : Partage en mode de transition


Nous pouvons illustrer ceci grce un exemple. Supposons quun document dans le
domaine de la gographie porte sur le sujet d'une ruption volcanique. Le document
peut tre sur comment elle affecte la production des produits alimentaires dans une
rgion du monde. Le document peut recevoir une annotation par quelqu'un intress
par le domaine de lagriculture. Il peut dire "les systmes de production alimentaire
peuvent tre amlior grce au contrle biologique si l'cologie de la rgion a t

89

affecte." Quelquun du domaine biologique peut voir cette annotation qui implique
lagriculteur et peut ajouter par exemple, "L'anatomie des plantes pour ce contrle
est intressant." Nous remarquerons que le document dorigine tait du domaine de
la gographie. Sur le document de gographie nous avons des annotations de sujet
d'agriculture et sur le sujet dagriculture, nous avons l'annotation du domaine
biologique. Une personne du domaine mdical peut ajouter aussi sur les annotations
biologiques

"lapplication de ces plantes

dans le domaine mdical est trs

importante." Si laccumulation des ces annotations est envoyer a un dcideur, il peut


faire une annotation tel que"Peut-on en estimer limportance sur notre entreprise ?"

tel-00131856, version 1 - 19 Feb 2007

Partage en mode mixte


En ralit, nous n'avons pas exactement un type unique de partage des expriences
travers lannotation, mais un mlange de tout. Nous devons savoir quil est
impossible de continuer le partage de lannotation / agrgation des connaissances,
fond sur le contenu dun document ou sur les utilisateurs. Le partage peut changer
de lun lautre. Lannotation peut commencer sur les expriences des utilisateurs
dans le travail collaboratif et aprs devenir des annotations sur le contenu dun
document qui est rfrenc par un utilisateur.

Symbiotique
Informatique

Gographie

Agriculture

Transitionnel
Modre

Biologie

Figure 2.9 : Partage en mode mixte

90

Propag

2.1.5.3.2. Le partage des expriences partir de plusieurs


documents
Le partage de plusieurs annotations par plusieurs personnes sur plusieurs documents
adoptera une approche diffrente par rapport aux annotations sur un seul document.
Les questions sont : Qui partage quoi ? Qui peut initier le partage d'annotation ? Les
annotations sur des documents sont pour quel objectif ? Quels sont les critres pour
choisir des participants dans les annotations ? Quels documents sont intressants
considrer pour un travail de collaboration ? Quelles sont les situations de

Domaine

Domaine e

tel-00131856, version 1 - 19 Feb 2007

collaboration pour lesquels on peut utiliser lannotation ?

Document

Annotateur

Figure 2.10 : Le mise en correspondance des annotateurs et des documents


Avec des annotations par plusieurs personnes sur plusieurs documents, deux zones
de collaboration peuvent tre imagines : (a) zone des annotateurs et (b) zone des
documents. Une manire de partager des annotations entre les deux zones est de
crer une zone de documents qui classifient ceux-ci fonds sur les disciplines
(domaine). La zone des annotateurs peut tre classe aussi sur les mmes paramtres
utiliss pour classifier les documents. Dans ce cas une annotation dans la zone des
annotateurs est mise en correspondance sur la zone des documents.
Nous avons discut du partage des expriences par annotation dans la section
prcdente. Nous devons noter que, quand les annotations sont partages,
l'orientation et l'intention des participants peuvent tre diffrentes. Les individus
peuvent utiliser les annotations pour propager leurs propres idologies aux membres

91

du groupe de la collaboration. Nous pouvons mme avoir des individus qui


introduissent des informations drives en utilisant des annotations. Nous
discuterons de la relation entre l'annotation et la dsinformation dans la prochaine
section.

2.1.5.4. La dsinformation, la propagande et lannotation


La dsinformation est un acte dlibr, souvent secret, pour la diffusion
d'information incorrecte, habituellement avec l'intention d'influencer par dception

tel-00131856, version 1 - 19 Feb 2007

les actions ou les avis des autres. Cest une technique employe dans les relations
trangres et dans les conflits arms pour tromper les adversaires. La dsinformation
peut tre value partir des perspectives suivantes (a) autorit (b) exactitude (c)
objectivit (d) priode (e) couverture.
Puisque l'annotation est un acte d'interprtation de l'information, nous pouvons
valuer une annotation avec ces cinq paramtres s'ils sont conus pour dsinformer
le public. Cette tude n'a pas pour objectif

l'valuation de l'annotation. Nous

pouvons remarquer que le partage des annotations peut tre employ en tant que
moyen pour la dsinformation.
Aujourd'hui, un des outils le plus importants pour la diffusion des informations est
lInternet. LInternet est aussi un outil efficace pour diffuser les dsinformations. Un
exemple remarquable est la guerre dIrak. Dans ce cas, les groupes concerns
propagent leurs interprtations de la situation en utilisant le moyen d'Internet.
La propagande est dfinie comme le fitre quon met la ralit pour quelle soit
montrable 17. Elle est aussi dfinie comme lensemble des mensonges qui vont le
mieux permettre de raliser des buts cachs et inavouables .

17

http://andre.bourgeois.9online.fr/

92

La propagande est lintprtation et la filtration dinformation (Ellul, 1967)


(Almeida, 1995). Le document dorigine qui contient linformation peut ne pas tre
modifi. Cest linterprtation de document source qui tent changer la
comprehension du document source. Si cest le cas, nous pouvons considrer
lannotation dans la lumire de la propagande, quand lintention de lannotateur est
de tromper le public potentiel.
Nous entrepredrons de comparer quelques outils dinternet utiliss dans
communication avec annotations.

tel-00131856, version 1 - 19 Feb 2007

2.1.5.5. Les outils dannotation et les outils de communication


Nous n'avons pas de critres standard pour choisir un ensemble doutils pour
comparer les outils communicationnels avec des outils d'annotation. Puisque nous
considrons l'annotation en tant que moyen de communication dans un
environnement d'change d'information, nous essayons de le comparer aux autres
moyens communs de communication sur l'Internet. Les critres pour la comparaison
ne sont pas exhaustifs.
A partir de ce tableau, nous pouvons comparer les fonctionnalits des outils
d'annotation avec dautres moyens de communication sur lInternet. Nous
remarquons que les outils dannotation ont quelques avantages majeurs sur les autres
moyens de communication entre un groupe de personne. Un outil dannotation
fournit la possibilit du filtrage d'informations spcifique dans le stockage
dinformation. Nous pouvons voir encore que lannotation ne demande pas
beaucoup de ressources informatiques comme la mmoire vivantes. Il est aussi
possible de sauvegarder et analyser les informations stockes.

93

Outil

Outil de

Courrier

dannotation

Tchatte

lectronique

Blog

(ex. MSN,
yahoo)
Contexte de

Peut changer

Peut changer

avec le temps

avec le temps

Efficace

Immdiat

Immdiat

Efficace

Excellent

Pas approprie

Pas approprier

Efficace

Dpend du

Dpend de

systme

lutilisateur

Excellent

Possible

Excellent

Pas approprier

Possible

Possible

Centralis

discussion

Centralis

Partage de la
connaissance de
soit
Stockage de la
connaissance

tel-00131856, version 1 - 19 Feb 2007

Scurit de la
ressource
personnelle
Rutilisation
connaissances

de

personnelles

Tableau 2.2 : Table de comparisons des outils communicationnels sur internet

2.1.6. Le concept et les processus dannotations


La faon dont nous utiliserons les annotations dterminera lintrt, les processus
impliqus et leur cration. Nous considrons simplement quelques caractristiques
reconnues aux annotations.
x

Cognitif : L'annotation est un fragment textuel ancr au document, qui rvle


une ide d'valuation. Dans cette dimension, l'annotation permet aux acteurs
a distance de proposer des interprtations sur un document et de dinteragir
entre eux (Lortal et al, 2005a). Ce genre dinterprtation souligne l'influence
de l'annotation sur le lecteur et non pas sur la cration de lannotation.

Communication: La considration de l'annotation du point de vue


communicationnel souligne le fait que l'annotation est cre pour un usage
communicatif. Lortal et al (Lortal et al, 2005b) dfinit lannotation comme
llment discursif central dune lecture critique.

94

Directive : Nous pouvons regarder l'annotation comme un guide sur la faon


dont un document ou une section d'un document devrait tre utilis. Par
exemple dans les dictionnaires, nous avons souvent des notes qui
accompagnent un mot montrant la manire dont celui-ci devrait tre
prononc. Dans la musique, nous pouvons avoir des signes sur les notes qui
soulignent comment celles-ci doivent tre interprtes.

Les signes (dits

annotations) sont fonds sur les notes originales de la musique. Ainsi,


certaines de ces annotations peuvent inclure l' allgro , pause etc.

tel-00131856, version 1 - 19 Feb 2007

2.1.7. Lannotation dans le processus de recherche de linformation


La recherche dinformation peut tre compare un aveugle qui traverse une
autoroute. Il peroit l'information travers sa main (bton de marche) et ses oreilles,
puis il dcide de traverser la route. Laction de traverser la route n'est pas la
mme chose sur chaque route pour lui. Avant la dcision de traverser la route, il
analyse les informations reues. Il compare les informations reues avec ses
expriences. Dans cet exemple, nous avons lobjectif, lenjeu et les informations.
Laveugle a pour objectif de traverser lautoroute. Les enjeux incluent le risque
daccident, le risque de perdre sa voie.

Recherche dinformation

Systme dIE dans le SRI

Annotation dans IE pour SRI

Un aveugle dans un carrefour


avec un objectif et les moyens
d'excuter l'objectif

Un aveugle, dirig dans un


carrefour peut raliser son
objectif plus sr

Un aveugle, dirig dans un


carrefour avec un panneau de
direction peut raliser son objectif
plus rapide et plus sr

Figure 2.11 : Lannotation par rapport au SRI et IE


Dans la recherche dinformation, un dcideur a pour objectif de rsoudre un
problme dcisionnel. Plusieurs enjeux sont invoqus comme lenjeu de ne pas

95

trouver les informations pertinentes. Ces informations recherches ont pour objectif
de contribuer la resolution des problmes dcisionnels.
Nous considerons trois cas si un aveugle veut traverser la route : il peut le faire tout
seul, il peut le faire avec lassistance de quelquun et sans les panneaux
dinformations ou avec lassistance de quelquun et avec les panneaux dinformation.
Pour le premier cas, laveugle peut accomplir cet objectif avec ses expriences
personnelles. Les implications sont le temps et les risques. Bien sr, il ne peut pas

tel-00131856, version 1 - 19 Feb 2007

utiliser tous les outils disponibles pour atteindre cet objectif.


Dans le deuxieme cas, il peut traverser la route avec lassitance de quelquun.
Lassistant travaillera en collaboration avec l'aveugle. Il fera cette collaboration en
utilisant sa prope vue, ses expriences dans des situations similaires et son
raisonnement spcifique. Lexprience de laveugle est moins importante dans cette
situation.
Dans le troisime cas, lassistant utilise les panneaux dinformations en plus des ses
expriences personnelles. Il va combiner ses expriences dans la situation de
traverser les routes avec les expriences dans les autres domaines de sa vie et
comment lire et interprter les panneaux dinformations .
Comparons des trois situations avec le processus de la recherche d'informations et
lintelligence conomique. Un aveugle peut tre compar un dcideur qui a besoin
d'informations pour la prise de dcision. Lobjectif est de trouver les informations
pertinentes pour rsoudre un problme dcisionnel. L'assistant peut tre compar
un veilleur qui connat les mthodes et les techniques de recherche d'informations.
Le veilleur et le dcideur ont des environnements communs partager. Les
expriences du veilleur ainsi que les expriences du dcideur peuvent tre
combines pour rsoudre un problme dcisionnel.

96

Les panneaux de directions sur la voie dun aveugle sont gnralement utiles pour
lassistant de l'aveugle et non pour laveugle lui-mme. Les panneaux sur les routes
sont les indications que lon peut comparer aux annotations sur les documents. Les
panneaux montrent comment la route peut tre utilise ou comment la route a t
utilise. Dans le cas de recherches d'informations, les annotations sont sur les
documents afin de montrer comment le document a t utilis et comment celui-ci
peut tre utilis. Les panneaux dindication ne font pas partie de la route, mais des
commentaires sur la route. Ils ont t faits par un utilisateur de la route avec

tel-00131856, version 1 - 19 Feb 2007

l'intention de guider quiconque passera par celle-ci.

2.2.

Cration et stockage dannotation

Plusieurs travaux ont t effectus sur la cration et stockage dannotation avec les
points de vue diffrents. Microsoft a propos le "Standard Annotation Language"18
comme point de rfrence pour des annotations lectroniques. Il est difficile
d'imaginer la signification du mot standard ici. Comment pouvons-nous
connatre les critres standards pour dcrire les besoins de l'homme et les
possibilits par les annotations. Si nous devons nous limiter la cration de
l'annotation, nous ne pouvons pas tre satisfaits de ce standard considrant les
diffrentes mthodes d'annotation et de mdias diffrents qui peuvent tre impliqus.
Ce qui est considr comme standard ne correspond pas l'implication et
l'utilisation de l'annotation. Elles sont simplement appliques la cration des
annotations. Nous considrons quelques propositions de reprsentation des
annotations dans les sections suivantes.

2.2.1. XML : la base de spcifications des annotations


XML (en anglais Extensible Markup Language) est la norme dfinie par le
consortium W3C19. XML est considr l'origine comme un langage facilitant la
18
19

http://msdn2.microsoft.com/en-us/library/ms235402.aspx
http://www.w3c.org

97

dfinition, la validation et le partage de diffrents formats de documents sur le Web.


Descendant direct de la norme de description documentaire SGML (Standard
generalized markup language), il suscite aujourd'hui un vritable engouement
partout o il est question d'change et de partage de donnes. Contrairement
HTML (Hyper Text Markup Language), confin la prsentation des informations
sur un poste Web, XML s'efforce de leur donner un sens et de les structurer, comme
au sein d'une base de donnes.
On qualifie XML de mtalangage : un langage pour la reprsentation des donnes
portant sur le contenu d'un document et pas uniquement sur son apparence.

tel-00131856, version 1 - 19 Feb 2007

Comme leurs acronymes l'indiquent, SGML (Standard Generalized Markup


Language), XML (eXtensible Markup Language) et HTML (HyperText Markp
Language) sont des langages de balisage. XML et HTML sont drivs de SGML.
SGML est decrit par la norme ISO (ISO-8859) pour la structuration des documents
textuels. Ce language pemet de "baliser" un document de faon trs prcise. Ce haut
degr de prcision, de structuration, de portabilit et de prennit que permet SGML
se paie par une certaine complexit qui a jusqu' prsent, limit son usage quelques
applications particulires. HTML a t dvelopp pour rpondre aux besoins
spcifiques de la mise en page sur le Web d'informations textuelles (au sein
desquelles il est possible de rfrencer divers fichiers, par exemple, des images ou
du son). Mais HTML a des limitations : pas de possibilit de reprsenter des
structures dinformations. XML a t propos pour pallier les faiblesses d'HTML
sans qu'il y ait besoin d'avoir recours toute la difficult de SGML.
Les dialectes XML (WML, XSLT, XML Schema, XHTML, RDF/XML, SOAP,
SMIL, MathML, SVG) sont dcrits de faon formelle : une structure de donnes
simple est dfinie avec une DTD20 (Document Type Definition), une structure de

20

Le Document Type Definition (DTD), ou Dfinition de Type de Document, est un document


permettant de dcrire un modle de document SGML ou XML. Une DTD ne dcrit cependant que la
structure du document (hirarchie des champs, paramtres, type des donnes...) et non, par exemple,
les valeurs autorises des champs ou paramtres, ce en quoi elle se distingue de Schma XML, Relax
NG et Schematron. De plus, la norme DTD fait appel une syntaxe spcifique distincte de XML. Une
DTD n'est donc pas un document XML.

98

donnes dtaille est dfinie avec un XML Schema ou tout autre DSDL (Document
Schema Definition Languages, c'est--dire langage de description de schma).
L'efficacit de XML dpend fortement des normes strictes qui rgissent sa structure.
Pour tre considr comme un document XML, un document doit tre bien form,
c'est--dire qu'il doit tre conforme aux rgles suivantes :
x

Dans sa premire dclaration, le document doit tre identifi comme un


document XML. Cette premire dclaration est nomme le prologue. Il doit
contenir des informations sur la version de XML utilise, le codage des
caractres (si ncessaire) et indiquer galement si le fichier XML est associ

tel-00131856, version 1 - 19 Feb 2007

une DTD ou un autre langage de dfinition de document (XML Schema,


Relax NG, Schematron, etc.) ou s'il est autonome.
x

Un document XML ne doit avoir qu'un seul lment racine, tous les autres
lments sont contenus dans cet lment, aussi appel l'lment document.

Chaque lment XML doit commencer par une balise ouvrante et se terminer
par une balise fermante. Un lment vide peut tre reprsent par une balise
d'lment vide qui ressemble <exemple/>; cette balise est considre comme
tant une balise ouvrante suivie d'une balise fermante. Ceci est utilis pour
viter de devoir crire <exemple></exemple> tout en conservant le bon
formatage.

La valeur d'un attribut doit tre entre guillemets (simple ' ou double " ).

Il est noter que XML est sensible la casse et typographe. Par exemple,
<Exemple></Exemple> est une paire de balises bien forme alors que
<Exemple></exemple> n'en est pas une.

Quand un document XML est bien form et conforme la DTD auquel il est associ,
ce document est qualifi de valide.
Un document XML peut tre associ des feuilles de style XSLT, feuilles qui
permettent de gnrer de nouveaux documents contenant des informations provenant
du document XML. Il est ainsi possible de gnrer des fichiers XML ayant une
structure diffrente du document initial (transformation), mais aussi d'autres

99

documents : requtes SQL, pages HTML, etc. Un document XML peut aussi tre
affich par certains navigateurs Web (par exemple Internet Explorer, Mozilla
Firefox, Netscape etc.) en utilisant une feuille de style CSS.
Les langages de representation des annotations ne sont pas tout fait les dialectes de
XML mais sont les spcifications de XML pour les annotations.

2.2.2. Resource Desciption Framework (RDF)


Le resource description framework (RDF) est une spcification qui fournit un
tel-00131856, version 1 - 19 Feb 2007

systme d'ontologie lger pour soutenir l'change de la connaissance sur le Web,


fond sur un modle de graphique semblable l'OEM. Le RDF est une langue
d'usage universel pour reprsenter l'information dans le Web. RDF est sur des
composant triples (sujet, prdicat, objet), et peut tre arrang en srie dans XML, NTRIPLES, ou graphique. Les sujets et les prdicats sont identifis en utilisant URIs,
tandis que les objets peuvent tre URIs ou littrales d'un type de donnes (telles que
les chanes, le nombre entier, le flotteur, la date...). Puisque RDF est destin
l'change des donnes sur le Web, les URIs sont utiliss pour identifier des concepts,
des proprits, et des objets. Le RDF indique simplement lensemble minimal
d'attributs (rdf:type), et des couches plus leves telles que RDFS dfinissent
davantage des attributs pour une langue d'ontologie plus complte.
Aprs avoir prsent succinctement les langages les plus couramment utilises dans
les outils dannotation, nous prsentons dans la section suivante les projets
dannotation existants qui ont donn lieu des applications concrtes.

2.2.3. Les projets sur lannotations


Un framework d'annotation (en anglais, Application Framework) est un terme
informatique (ou cadriciel). Cest un ensemble de bibliothques (en anglais libraries)
permettant le dveloppement rapide des applications. Il fournit suffisamment de

100

briques logicielles pour pouvoir produire une application aboutie. Ces composants
sont organiss pour tre utiliss en interaction les uns avec les autres. Ils sont en
principe spcialiss pour un type d'application.
Un cadriciel (terme en usage depuis 1997) est un ensemble de classes abstraites
collaborant entre elles pour faciliter la cration de tout ou partie d'un systme
logiciel. Un cadriciel fournit un guide architectural en partitionnant le domaine vis
en classes abstraites et en dfinissant les responsabilits de chacune ainsi que les
collaborations entre les classes. Un cadriciel est habituellement implment l'aide
d'un langage objet, bien que cela ne soit pas strictement ncessaire. Le dploiement

tel-00131856, version 1 - 19 Feb 2007

grande chelle de bibliothques d'objets exige un cadriciel. Celui-ci fournit un


contexte o les composants sont r-utiliss. (wikipedia.org).
Les frameworks d'annotations sont des guides spcifiques qui indiquent
comment les annotations doivent tre faites. Ils fournissent la langage et la structure
pour les annotations que lon peut faire. Ils prcisent galement les lments
primordiaux (cls) (ce qui doit tre inclus), les lments secondaires (ce qui peut
tre inclus) et ce qui ne peut pas tre inclus. Chaque cadre a ses propres
objectifs. La plupart des cadres sont critsavec le langage XML.
Nous avons dcrit le langage XML comme la base de plusieurs framework et
spcifications de stockages et communication dans les travaux dannotations. Nous
prsentons dans les sections suivantes quelques frameworks d'annotations. Nous
allons essayer de voir s'il y a des similitudes et des interactions entre les modles et
les framework des annotations. Ainsi nous distinguerons les frameworks
dannotation et des modles dannotations. En effet, les cadres des annotations
donnent une vue gnrale sur lensemble de ce qui peut tre adapt dune manire
plus large et dans

un domaine spcifique. Un modle dannotation est plus

spcifique pour atteindre des objectifs particuliers.

101

2.2.3.1.

ANOTEA

LANNOTEA est un framework dannotation pour le dveloppement des


systmes de cration et ddition des annotations en commun sur des documents du
Web. ANNOTEA a t construit sur le HTTP, le RDF, et le XML. Il fournit un
protocole interoprable pour les navigateurs. Lobjectif principal est pour permettre
aux utilisateurs d'attacher des donnes aux pages Web pour que d'autres utilisateurs
puissent, leur choix, voir les donnes jointes quand ils passent en revue plus tard
les mmes pages. Le protocole d'ANNOTEA fonctionne sans modifier le document
tel-00131856, version 1 - 19 Feb 2007

original ; c'est--dire, il n'y a aucune condition pour que l'utilisateur accde la page
Web annote. Le protocole d'ANNOTEA convient pour les donnes d'annotation qui
sont faites pour tre visionnes par des internautes pour d'autres programmes
d'application, tels que les outils de classification, les moteurs de recherche, et les
applications automatiques.

Interface
Serveur du
Web

Serveur
dANNOTEA

Figure 2.12 : Larchitecture generale de cadre dANNOTEA

102

Un des objectifs du framework d'ANNOTEA a t de rutiliser autant que


possible les technologies existantes de W3C. Les mthodes appliques la plupart du
temps sont la combinaison de RDF, XPointer, XLink, sur HTTP. Lobjectif est de
permettre laccs de sorte que chaque utilisateur ayant un accs au serveur
d'annotation puisse consulter les annotations lies au document et ajouter ses propres

tel-00131856, version 1 - 19 Feb 2007

annotations.

Classe

Description

rdf:type

Le type de l'annotation, qui devrait montrer l'intention de l'annotateur.

annotates

Les resources auxquelles lannotation est lie.

body

Le contenu de lannotation.

context

Le context utilisant un XPointer, indique lendroit exact dans un


document o lannotation est attache.

dc:creator

Lannotateur dune annotation

created

La date et le temps de la cration de lannotation.

dc:date

La date et le temps de la modification de lannotation.

related

Les ressources lies aux informations du document, par exemple,


URL, les discussions etc.

Tableau 2.3: Les proprits dune annotation en format RDF pour ANNOTEA
LANNOTEA fournit les types d'annotation suivants : Conseil (advice),
Changement (change), Commentaire (comment), Exemple (example), Explication
(explanation), Question (question), Voir aussi (see also). L'identification de
l'utilisateur est stocke avec la date de cration. Un XPointer indique l'endroit o le
texte annot, et de plusieurs autres proprits. Chaque annotation cre est lie son
propre URI, ainsi les nouvelles annotations peuvent annoter les plus anciennes. En
termes d'activit agrgation de contexte, l'approche d'ANNOTEA semble plus
adapte annoter le contenu existant, le contenu peut tre soulign, mais seulement
en tant qu'lment du processus d'annotation.

103

2.2.3.2. Microsoft Common Annotation Framework (CAF)


L'objectif du Microsoft Common Annotation Framework (CAF) est de crer un
standard gnralis pour annoter les documents sur les pages Web. Le cadre cre un
forum commun pour crer et partager des annotations travers des applications
diverses. Lobjet est de favoriser l'interoprabilit des annotations entre des
applications htrognes. C'est--dire que l'annotation ne devrait pas dpendre de
l'application initiale o lannotation a t cre mais devrait tre "portable" sur
dautres applications. Le framework a t fond sur le modle logique et se
compose d'un schma compatible avec XLink. Il a pour objectif de soutenir

Microsoft
WORD

Adobe
Acrobat

CAF

tel-00131856, version 1 - 19 Feb 2007

l'annotation sur les mdias htrognes.

Noteworthy
Music

ANNOTATIONS

Les
Autres

Figure 2.13 : Common Annotation Framework (CAF) based on Logical model


Un outil WebAnn est fond sur le framework CAF pour permettre discussion
entre les tudiants. Il est un moyen pour la discussion publique dun groupe. Bien
que l'outil WebAnn ait t bas sur le framework de CAF, ce framework
n'est pas connu comme tant une norme pour les annotations des pages web ceci en
raison du fait que (a) cest trop gnral pour servir de but la plupart des
annotations (b) les communications entre les applications sur le web ne sont pas

104

statiques (c) le stockage et la structure de l'annotation ne sont pas correctement

tel-00131856, version 1 - 19 Feb 2007

traits dans CAF

Figure 2.14 : The CAF-based WebAnn tool21

2.2.3.3.

Extensible MultiModal Annotation Language (EMMA)

LEMMA (Extensible MultiModal Annotation language) le langage extensible


d'annotation pour les application MultiModal est un langage utilis pour reprsenter
l'entre de lutilisateur dans une application multimodale. On peut le voir comme le
framework d'interaction Multimodal de W3C. Cest un mcanisme d'change
entre les dispositifs d'entre d'utilisateur et les possibilits d'une application. Le
langage est concentr sur lannotation des interprtations des informations sur les
entres simples et composes, par rapport l'information qui pourrait avoir t
rassemble pendant ou au cours d'un dialogue.
LEMMA a t dvelopp pour permettre l'annotation des informations par les
entres de dispositifs htrognes. C'est un rassemblement dinformations
multimdia, multimodales, multi plateformes et les sources d'informations ainsi que
de systmes d'information htrognes. En fait, c'est une approche pour fournir une

21

Source : David Bargeron et al, 2001

105

plateforme commune pour

des protocoles et des reprsentations diffrentes

l'information. Nous avons actuellement des reprsentations de l'information qui sont


particulires aux dispositifs. Certaines de ces reprsentations incluent WML
(Wireless Markup Language) une langage de balisage pour les appareils sans fil, qui
a t dvelopp pour la reprsentation de l'information sur les dispositifs sans fil.
Souvent la question est, comment un dispositif sans fil, avec sa reprsentation de
l'information WML, peut tre employ pour annoter les informations sur un rseau
optique ? Ceci demande un framework d'annotation qui favorise les entres
travers les dispositifs htrogne.

tel-00131856, version 1 - 19 Feb 2007

Systme dinformation

Cadre dannotation EMMA

Palmtop

Ordinateur

Enregistreur de donnes

Tlphone

GPS

Figure 2.13 : Le cadre dannotation EMMA


Dautres objectifs d'EMMA sont de permettre des composants tel que (a)
reconnaissance de la parole (b) reconnaissance d'criture (c) moteur de
comprhension du langage naturel (d) autres mdias d'entre (par exemple DTMF,
pointage, clavier) et (e) Composant d'intgration de Multimodal pour gnrer un
balisage d'EMMA :

106

2.2.3.4. Linguistic Annotation Framework (LAF)


Le framework d'annotation linguistique est conu pour l'annotation dans la
perspective de lutiliser pour le traitement du langage naturel (Bird et al, 2000). On
croit que les donnes peuvent tre augmentes (annotes) avec l'information
linguistique telle que les catgories morphosyntaxiques, la structure syntactique ou
les structures de discours, l'information co-rfrence, etc. ; On suppose galement
que l'information peut tre aligne pour des correspondances (par exemple,
tel-00131856, version 1 - 19 Feb 2007

traductions parallles, son articul et transcription).


L'objectif du framework d'annotation linguistique est de pouvoir mettre en place
un outil pour identifier un segment d'information comme un mot, une phrase, un
paragraphe, etc. avec l'utilisation des annotations attaches. La mthodologie
implique inclut le cadrage syntaxique ou la dlimitation de chacun des mots dans
un document avec un balisages XML qui identifie le segment comme un mot, une
phrase, etc.
Dans les spcifications de cadre d'annotation linguistique (Ide et al, 2003), quelques
conditions gnrales ont t imposes. Certaines de ces conditions incluent :
Le degr dexpressivit
Le cadre doit fournir des moyens de reprsenter toutes les varits d'information
linguistique (et probablement aussi d'autres types d'information). Ceci inclut la
reprsentation de la gamme complte de l'information en gnral l'information au
niveau le plus fin de la granularit.
L'indpendance de mdias
Le cadre doit manipuler tous les types de supports potentiels, y compris le texte, le
son, la vido, l'image, etc. et devrait, en principe, fournir les mcanismes communs

107

pour les manipuler tous. Le cadre est fond sur les normes existantes ou les normes
en cours de dveloppement pour reprsenter le multimdia.
Ladquation smantique
x

Les structures de reprsentation doivent avoir une smantique formelle, y


compris les dfinitions des oprations logiques.

Il doit exister une manire de partager des descripteurs et des catgorisations de


l'information centralise.

Possibilit d'incrmenter

tel-00131856, version 1 - 19 Feb 2007

On est cens soutenir les diffrentes tapes pour l'interprtation d'entre et la


gnration de sortie.

Prvoir la reprsentation des rsultats partiels /non-spcifi et des ambiguts, les


rechanges, etc. et leur fusionnement et comparaison.

Luniformit

Les reprsentations doivent utiliser les mmes "modules de constructions" et les


mmes mthodes pour les combiner
Ladaptation

Le cadre ne doit pas dicter des reprsentations qui dpendent dune simple thorie
linguistique.
Lextensibilit

Le cadre est prvu pour les dclarations et les changes des extensions
l'enregistrement de catgorie de donnes centralis.
La lisibilit humaine
Les reprsentations doivent tre lisibles, au moins pour la cration et ldition.
Lexplicitation
L'information dans un dispositif d'annotation doit tre explicite -- c'est--dire,
l'interprtation ne devrait pas tre faite par le logiciel de traitement.

108

Luniformit
Les mcanismes diffrents ne devraient pas tre utiliss pour indiquer le mme type
d'information.

2.2.4. Les modles dannotation existants


Il y a beaucoup de modles d'annotation aujourd'hui sur le Web et pour les usages
personnels. Nous pouvons considrer le processus dannotation comme un
processus de rtroaction. La rtroaction a des importances et des applications
diverses non pas seulement dans le marketing mais dans le domaine de
tel-00131856, version 1 - 19 Feb 2007

dveloppement de produit, la gestion de l'information et dans la recherche et le


dveloppement scientifique. En raison de cette application large, l'annotation exige
des modles variables pour rpondre aux spcificits des domaines d'application.

2.2.4.1. Modle fond sur lorganisation du contenu


Ces modles fonds sur l'organisation de contenu ne sont pas gnralement
concerns par les utilisations ventuelles de l'annotation ni la cration d'annotation.
Ils ne sont pas fondamentalement proccups par les mthodes de stockage.
Lobjectif est l'accs aux annotations stockes.

2.2.4.1.1. Modle smantique


Nous centions dans cette section sur le mot Web smantique . La question est
quest ce que le Web smantique ? Le Web smantique est un projet qui prvoit
de crer un moyen universel pour l'change de l'information de sorte quun systme
(ou un logiciel) puisse connatre la signification du contenu des documents du Web.
Le Web smantique a pour objectif de rendre des pages Web comprhensibles par
les outils automatiques, de sorte que les logiciels puissent rechercher des sites Web
et effectuer des actions d'une manire standard.
Par exemple, comment lordinateur peut-il interprter la phrase Je cherche un
document rcents sur les dirigeants des pays dvelopps ? Dabord, le systme doit

109

comprendre la signification les expressions document courant , dirigeants ,


pays dvelopps . Le Web smantique essaye de voir comment organiser les
ressources lectroniques de telle sorte que les ordinateurs puissent rsoudre les
problmes comme ci-dessous.

Entreprise

Localisation

Type
Rgion

Pays

Peugeot

tel-00131856, version 1 - 19 Feb 2007

Type

Type

Peugeot a annonc rcemment un


nouveau produit : Peugeot 1007. Ce
produit sera fabriqu Mulhouse.
Leur march en Italie a baiss dans
les dernires annes.

Italie

Type

Siege
Mulhouse
Situer en

France

Figure 2.14 : Un exemple de dpt smantique


Par exemple, pour la phrase Peugeot1007Italie dans le schma (Figure 2.15),
le systme devrait utiliser lorganisation smantique pour svoir que lItalie est un
pays o Peugeot est localis .

2.2.4.1.2. Modle ontologique


Lontologie est une organisation systmatique de toutes les catgories
importantes des objets ou des concepts qui existent dans un certain domaine de
discours, montrant les relations entre eux 22 . Quand elle est complte, une
ontologie est une catgorisation de tous les concepts dans un certain domaine de
la connaissance, y compris les objets et toutes les proprits, relations, et
fonctions ncessaires pour dfinir les objets et pour indiquer leurs actions. Une
ontologie simplifie peut contenir seulement une classification hirarchique (une
taxonomie) montrant le type de relations de subsumption entre les concepts dans
22

http://www.answers.com/topic/ontology-computer-science

110

le domaine du discours. Lontologie peut tre visualise comme un graphique


abstrait avec des noeuds et des arcs reprsentant les objets et les relations. Les
concepts inclus dans l'ontologie et la commande hirarchique seront dans une
certaine mesure arbitraires, dpendant du but pour lequel l'ontologie est cre.
Ceci rsulte du fait que les objets sont les variables d'importante pour diffrents
buts, et diffrentes proprits. Des objets peuvent tre choisis comme critres par
lesquels ceux-ci sont classifis. En outre, diffrents degrs d'agrgation des
concepts peuvent tre employs, et les distinctions d'importance pour un but

tel-00131856, version 1 - 19 Feb 2007

peuvent tre sans souci pour un but diffrent.

Figure 2.15 : La table priodique est un exemple dorganisation ontologique


La table priodique des lments est un exemple typique d'une organisation
ontologique.23 Elle organise des lments par le nombre de protons du noyau. Les
lments sont numrs par le nombre atomique par ordre croissant (c.--d. le
nombre des protons au noyau atomique).

Nous voulons souligner que malgr les problmes inhrents dans les organisations
de contenus, il y a des avantages associs. Certains avantages incluent :
x

Avec lontologie, il est possible de voir les relations entre les lments

Il est possible de voir la hirachie des objets dans une organisation


dontologie

23

http://sw.deri.ie/svn/aharth/2004/04/query-languages/dip-wp21.html

111

Elle fournit la possibilit de rpresenter du contenu de rseau smantique.

Malgr ces avantages, nous pouvons identifier quelques problmes lis aux modles
fonds sur l'organisation des informations. Nous les discterons dans la prochaine
sections.

2.2.4.1.3. Les problmes lis aux modles organisationneles


L'organisation de contenu fournit un trs bon point de dpart pour l'organisation

tel-00131856, version 1 - 19 Feb 2007

de la connaissance, mais l'organisation fonde sur l'organisation de contenu


comporte des problmes : Problme de stabilit d'organisation dans le temps.
Une organisation que l'on assure impeccable aujourd'hui peut s'avrer
insatisfaisante demain. Par exemple, si les livres taient organiss sur les
disciplines, comment exprimenterons-nous les volutions dans les disciplines ?
Nous pouvons noter le problme d'intgration des diffrences culturelles. Par
exemple, ce qui est vu comme des articles religieux dans une certaine socit
africaine peut tre considr comme des articles d'arts aux Etats-Unis.
Nous pouvons interprter ou classifier des informations fondes sur une
rfrence prconue. Une tasse classifie comme moiti remplie peut galement
tre classifie comme une tasse moiti vide. Comment ces questions peuventelles tre rsolues par l'approche organisationnelle ?

2.2.4.1.4. Quelques langages d'organisation de contenus


L'information doit tre organise afin de faciliter son analyse, sa synthse, sa
comprhension et sa communication. L'organisation d'information est importante
parce qu'elle nous permet de :

112

Gerer l'information plus efficacement.

Communiquer l'information plus efficacement.

Identifier les informations pertinentes et rejeter les informations inutiles.

Identifier les tendances dans l'information recueillie.

Synthtiser les informations htrognes pour une nouvelle connaissance.

Diffrents langages sont employe dans l'organisation de l'information. Les divers


langages de reprsentation sont traits dans les sections suivantes. En fait, il y a
une tendance vers les dispositifs d'intgration d'un langage un autre pour
permettre plus d'expressivit. Une organisation d'information dfinit un
tel-00131856, version 1 - 19 Feb 2007

vocabulaire pour dcrire des informations on parle alors de classification,


d'agrgation, et de gnralisation (Horrocks et al, 2000). Le modle fondamental
de donnes est souvent sans schma explicatif, donc nous commenons notre
prsentation par des modles de donnes pour modeliser des donnes semistructures, telles que l'OEM et le RDF.

2.2.4.1.4.1.

Object Exchange Model (OEM)

Le modle d'change d'objet est un format pour l'change des donnes semi
structures. L'OEM a t utilis dans divers systmes de prototype de recherches
pour changer des objets entre les bases de donnes pour des tches d'intgration de
l'information. L'OEM est semi-structur et auto-descriptif et se compose de quatre
champs : identification, tiquette, donnes, et type.
Dans un modle d'change d'objet, l'change de linformation est vu comme
lchange des objets. Selon (Papakonstantnou, 1995), chaque valeur d'information
changer est reprsente comme le label (ou tiquette) qui dcrit sa signification. Par
exemple, si nous souhaitons changer la valeur de la temprature de 70 degrs
centigrade, nous pouvons la dcrire comme
(temprature-en-degr, integer, 70)
L o la chane temprature-en-degr est une tiquette humainement

113

comprhensible le integer (nombre entier) indique le type de valeur, et 70


est la valeur elle-mme. Dans ce cas chaque objet peut avoir sa propre tiquette.
Par exemple,

(ensemble-des-poids, ensemble, {wetg1, wetg2})


wetg1 est (poid-en-kilogramme, entier, 52)
wetg2 est (ensemble-en-livre, entier, 122)
Une caractristique principale d'OEM est qu'elle est auto descriptive. Nous

tel-00131856, version 1 - 19 Feb 2007

n'avons pas besoin de dfinir en avance la structure d'un objet, et il n'y a aucune
notion de classe fixe de schma ou d'objet. Dans un sens, chaque objet contient
son propre schma. Par exemple, la temprature-en-degr au-dessus joue le
rle d'un nom de colonne, o l'objet stocker serait le domaine pour cette colonne.
La diffrence entre un schma de base de donnes et l'OEM est que, une
tiquette ici peut jouer deux rles: identifier un objet, et identifier la signification
d'un objet (Papakonstantinou, 1995). Pour illustrer, considrons l'objet suivant:
(enregistrement-personnel, ensemble, {cmpnt1, cmpnt2, cmpnt3})
cmpnt1 est (nom-person, chaine, Francois)
cmpnt2 est (bureau, entier, 333)
cmpnt3 est (secteur, chaine, vente)

2.2.4.1.4.2.

Topic Maps

Les cartes thmatiques, (en anglais Topic Maps) constituent un outil trs gnral
de reprsentation des connaissances, dont le but est d'agrger autour d'un point
unique d'indexation (appel topic) toutes les informations disponibles concernant
un sujet donn, et de relier ces points par un rseau smantique de relations

114

appeles associations.
Un topic maps reprsente une information en utilisant des sujets (topics" en
anglais) qui reprsentent tout un concept, tels qu'une personne, un groupe de
personnes, une couleur, un pays, une organisation, un module logiciel, un fichier
individuel, des vnements, des associations qui reprsentent les relations
entre ces sujets , et des occurrences qui reprsentent des relations entre des
sujets et des ressources informationnelles qui s'y rapportent.
L'intrt des Topics Maps est de dfinir des contextes et profils d'utilisateurs

tel-00131856, version 1 - 19 Feb 2007

particuliers et de faciliter la fusion de topic maps provenant de sources des


documents diffrentes.

Un Topic maps est un type de couche d'index ou d'information qui peut tre
construit sparment d'un ensemble de documents. Le Topic maps permet
d'identifier des sujets et des relations dans l'ensemble de documents. Selon les
spcifications de Topic Maps de XML (XTM1.0) de TopicMaps.org, l'objectif
d'un Topic maps est de transmettre la connaissance au sujet des documents par
une couche superpose sur des documents. Un Topic maps saisit les sujets
principaux des documents et les relations entre les sujets, d'une manire
indpendante de son implmentation. Les concepts cls dans les Topic maps
sont les thmes, les associations, et les occurrences. Un thme est une
rpresentation d'un sujet. Les exemples de tels sujets pourraient tre recherche
d'information , indexation des documents lectroniques , ou rapport
d'activits . Les thmes peuvent avoir des noms, des occurrences c.--d., les
informations qui sont considres pertinentes par rapport au sujet. Les thmes
peuvent participer aux relations (les associations), dans lesquelles elles jouent des
rles comme membres. Ainsi, les thmes ont trois types de caractristiques : noms,
occurrences et rles jous comme membres des associations. L'attribution de
telles caractristiques est considre comme valide dans un contexte. Des Topic
maps peuvent tre fusionns. La fusion peut avoir lieu la discrtion de
l'utilisateur ou de l'application (au temps d'excution), ou peut tre indiqu par

115

tel-00131856, version 1 - 19 Feb 2007

l'auteur de le Topic maps l'heure de sa cration.

Figure 2.16 : Indexation dans Topic maps


(Source http://www.xml.com/pub/a/2002/09/11/topicmaps.html)

2.2.4.1.4.3.

Web Ontology Language (OWL)

La langue d'ontologie de Web de OWL est conue l'usage des applications qui
doivent traiter la teneur de l'information au lieu de l'information de prsentation
juste aux humains. Le OWL actuellement est adopt par la communaut du Web,
par exemple en dcrivant des personnes dans FOAF (Friend of a Friend), qui est
fond sur une ontologie exprime en OWL.
L'OWL facilite une plus grande traduction de contenu par la machine Web
soutenu par le schma de XML, de RDF, et de RDF (RDF-S) en fournissant le
vocabulaire additionnel avec une smantique formelle. Pour l'OWL se dployant
sur le Web, un codage tout fait bavard de RDF est employ. Il existe des

116

syntaxes plus concises, que sont plus faciles lire par des humains, mais ne
s'adaptent pas dans le cadre propos pour l'enchanement smantique.
L'OWL a trois sous-langages de plus en plus expressifs : OWL Lite, OWL DL, et
OWL compltement. Ces sous-langages peuvent tre employs pour crer les
ontologies qui sont lgrement limites dans leur expressivit mais aussi pour avoir des

proprits informatiques.

tel-00131856, version 1 - 19 Feb 2007

2.2.4.2. Modles fonds sur les modes de cration dannotation


2.2.4.2.1. Les annotations automatiques
Nous notons que l'annotation automatique est une annotation de type action et ce
n'est pas de l'annotation de type objet.
Quand nous parlons de l'annotation automatique, nous entendons que c'est une
action de cration des annotations par la machine qui fonctionne dans un mode
autonome, essentiellement sans l'interfrence de l'homme.

La plupart des outils considrs comme des systmes d'annotation automatiques


ne sont que des systmes d'information qui aident classification des documents
(cf, dfinition du document section 1.3). L'identification est faite avec un lien
une base de donnes des objets similaires ou avec des couleurs spcifiques. Un
exemple est le DOGMA (Wyman et al, 2004) et l'annotation automatique de
musique (Tumbull, 2005). DOGMA est un systme de Web qui permet
l'utilisation des recherches comparatives pour identifier et annoter des gnes dans
un gnome.

Dans le cas de l'annotation de musique, l'annotation inclut des tiquettes de classe


trouves en classifiant la musique et les mesures musicales valeurs relles en
utilisant la rgression. Les tches de classification classifient la musique fonde

117

sur des concepts objectifs tels que l'identification de l'artiste ou l'instrument aussi
bien que les concepts subjectifs tels que le genre ou le contenu motif.
Des exemples de mthodes utilises dans l'annotation automatique sont le
Support Vector Machines (SVM) , et le Artificial Neural Network (NN) .
Ceux-ci ont t appliqus pour l'annotation automatique de la musique. La logique
derrire le Support Vector Machines est de crer un modle gnralis pour les
donnes disperses (Schlkopf et al, 1998). Nous notons que la disposition des
donnes disperses drivs est fonde sur l'apprentissage de machine.

tel-00131856, version 1 - 19 Feb 2007

L'automatisation est alors cre et fonde sur cette mthode.


Un exemple de systme d'annotation automatique: GENETATOR
Le Genotator est un outil permettant l'annotation automatique et la navigation
dans les annotations (automated sequence annotation and annotation browsing).
Dans l'application sur des documents ADN, le systme effectue des analyses et
prsente le rsultat en utilisant des codes couleurs pour les classes de document.
Genotator fournit une manire d'identifier les rgions significatives (par exemple,
exons) dans une squence. Les utilisateurs peuvent interactivement ajouter des
annotations personnelles aux sortes d'tiquettes qui les intressent.

118

Magenta

tel-00131856, version 1 - 19 Feb 2007

Red

NNPP promoter predictions


GenPept hits (using BLASTX): GenPept consists of all the
GenBank coding regions translated to amino acids

Orange

EST hits (using BLASTN)

Yellow

Human repeat sequence hits (using BLASTN)

Chartreuse

xpound exon predictions

Green

GeneFinder exon predictions

Turquoise

GRAIL exon predictions

Dark Blue

Genie exon predictions

Purple

GenBank CDS (exons)

Magenta/Red/Orange Open reading frames (>=150 bases), colored by frame

Tableau 2.4 : Les couleurs des annotations en GENOTATOR


source http://www.fruitfly.org/~nomi/genotator/genotator-paper.html

2.2.4.2.2. Annotation semi-automatique


Il est difficile d'imaginer des systmes d'annotation entirement automatiques. Si
les activits d'annotation sont censes interprter ou valuer un document, ces
actes devraient impliquer la participation humaine. L'interprtation de document
dpend de plusieurs facteurs qui sont au del de la reprsentation symbolique.
Nous n'essayerons pas de prsenter ces facteurs dans la reprsentation
informatise. Ces facteurs d'annotation sont psychologiques, sociaux, religieux,
culturels et conomiques. En fait, c'est pourquoi nous croyons qu'un acte
d'annotation est un facteur non seulement du document mais du crateur
d'annotation et du temps. L'interprtation de document dpend du temps, des
publics viss et de l'objectif de l'interprtation.

119

Il est plus facile de faire confiance aux processus d'annotations semi-automatiques


o la machine est utilise pour effectuer des actions rptitives et o les calculs
mathmatiques sont ncessaires dans la cration d'annotation.

Les parties automatises de systme concernent gnralement des concepts


comme des concepts smantiques, ontologiques ou linguistiques. La partie non
automatise est laisse au choix de l'utilisateur par rapport son contexte
d'utilisation du rsultat et son exprience.
Plusieurs approches ont t utilises pour associer les significations aux mots. Une
tel-00131856, version 1 - 19 Feb 2007

des ces mthodes employes est la cration d'une base de mots (dictionnaire) de
type smantique ou ontologique. Une autre mthode est d'utiliser et d'appliquer
l'algorithme de matrice des mots dans les documents. Un exemple des mthodes
utilises pour analyser le contenu de l'information dans l'annotation semi
automatique est le modle Latent Space Model .
Latent Space Models et Probabilistic Latent Space Models
Le Latent space model (LSA) est un algorithme fond sur l'algbre linaire.
L'hypothse du LSA est qu'il existe des caractristiques communes entre deux
acteurs, par exemple entre l'acteur A et B, ou C et D. L'hypothse avance le fait
qu'il n'y a pas d'interaction entre A et C, A et D, B et C et B et D, illustr pas le
schma suivant (Shortreed et al, 2005).

Figure 2.16 : Interactions entre les acteurs dans LSA

L'objectif est d'tablir le lien entre la ligne de relation qui existe entre les diffrents
groupes. Dans son application l'analyse des documents, LSA dcompose le

120

terme par-document en trois matrices par une Singular Value Decomposition


(SVD) tronque. Dans ce cas, les mots sont rcuprs en groupes diffrents, alors
LSA est employ pour tablir les liens entre les groupes. PLSA (Probabilistic
LSA) est une amlioration de LSA qui permet l'annotation fonde sur le processus
de calcul de probabilits et spcifiquement, sur la distribution a posterieori des
termes de vocabulaire.

2.2.4.2.3. Annotation manuelle


L'annotation manuelle est l'utilisation des motivations et des expriences

tel-00131856, version 1 - 19 Feb 2007

humaines pour faire l'annotation. Il est difficile de classifier ce genre d'annotation


parce que l'annotation humaine peut prendre diffrentes formes applicables toute
sorts de documents (cf. section 1.3.5 sur notre dfinition d'un document).
L'annotation humaine peut tre crite, graphique ou vocale. Il est mme possible
de faire des annotations sous une forme code comprhensible pour les invits.
Ceci rend l'annotation manuelle unique par rapport d'autres formes d'annotations.
La signification attribue une annotation humaine peut changer selon le contexte.

L'annotation manuelle est la mthode la plus rpandue pour la cration des


annotations en raison de la participation de l'homme dans le processus. Elle est
galement la plus subjective cause des changements de l'action et du
raisonnement humain dans le temps. Il est psychologiquement et socialement
instable. Le centre d'application de cette tude est li aux changements de
l'annotation en raison du changement de l'tat de l'annotateur avec le temps. Nous
croyons que l'analyse des changements dans les annotations peut tre vue comme
l'indication de la personnalit implique dans l'annotation.

2.2.4.3. Annotation dans les technologies du Web


Une annotation d'un document Web est une annotation en ligne lie une
ressource du Web (typiquement une page Web). A travers l'utilisation d'un
systme d'annotation du Web, un utilisateur peut ajouter des commentaires sans

121

modifier le document source. L'annotation sur les ressources Web est une couche
sur la ressource existante. N'importe quelle couche d'annotation peut tre rendue
visible aux utilisateurs qui partagent le mme systme d'annotation et cache aux
autres.

2.2.4.3.1. Les dispositions du Web


Dans le cas de l'annotation fonde sur un serveur, l'annotation est effectue sur le
serveur du Web avant qu'elle ne soit envoye au client. Il n'y a pas beaucoup de
systmes connus dans cette catgorie car cette approche exige des documents

tel-00131856, version 1 - 19 Feb 2007

source d'tre prtraits l'avance pour avoir les crochets et nuds ncessaires
pour les annotations, et par consquent, ne peut tre gnralise pour annoter les
documents sur le Web. CoNote (Davis, 1995) et notes virtuelles (Geyer-Schulz,
1999) sont deux exemples dans cette catgorie.

Le modle CoNote est fond sur le concept d'un document de groupe, qui est un
ensemble de personnes qui partagent une collection de documents. Chaque
personne dans un groupe a un certain rle en ce qui concerne les documents dans
ce groupe avec les droits d'accs progressifs. Les rles possibles sont
observateur, lecteur , utilisateur et auteur . Un observateur peut afficher
un document annot, mais ne peut pas voir les annotations l-dessus. Un lecteur
peut voir les

annotations, mais ne peut pas ajouter quoi que ce soit sur le

document. Un utilisateur peut lire et ajouter, et un auteur peut lire, ajouter, et


supprimer les annotations.
Une personne peut avoir un rle diffrent dans des groupes diffrents. Par
exemple une personne pourrait avoir le rle d'un auteur dans un groupe et tre un
lecteur dans un autre. Les groupes peuvent galement dfinir un rle par dfaut
qui fournit un certain niveau d'accs aux utilisateurs externes. S'il n'y a aucun rle
par dfaut, alors les utilisateurs externes n'ont aucune autorisation d'accs aux
documents ou aux annotations dans le groupe.

122

Bien que les annotations apparaissent l'utilisateur en ligne dans le document,


elles sont stockes dans une base de donnes spare, et sont intgres dans le
document quand il est fourni l'utilisateur. Ainsi le document lui-mme n'est pas
chang par les annotations. Ceci signifie que le mme document peut apparatre
dans plus d'un groupe de document, ou des groupes dannotations peuvent
apparatre dans un document.
Un groupe de document se compose d'un ensemble d'utilisateurs, chacun avec un
rle spcifi et d'un ensemble de documents. L'ensemble des utilisateurs est
spcifi par une dfinition de rles . La dfinition de rle numre chaque
tel-00131856, version 1 - 19 Feb 2007

utilisateur et le rle qu'il prend pour ce groupe de document. Les documents dans
la collection sont spcifis par une dfinition de document , qui indique o les
fichiers sont stocks. La dfinition du document peut numrer les nuds
d'annotation dans le document.
Chaque document dans CoNote a un nom unique, le docid, qui est le nom
compos du groupe du document et de la dfinition de document (Davis et
Huttenlocher, 1995). De plus, chaque point d'annotation a un nom unique dans le
document. L'auteur assigne ces noms en indiquant les emplacements potentiels
pour l'annotation.

2.2.4.3.2. Prsentation dinformation


Dans le cas de ce genre de systmes d'annotations, ils sont faits pour prsenter
l'information annote dans un format spcifique. Le formatage est important en
raison des contraintes fonctionnelles. Par exemple, la prsentation d'annotation
dans le domaine mdical ne sera pas ncessairement la mme qu'une
reprsentation dans les systmes arospatiaux. Beaucoup de systmes
d'annotations dvelopps pour des utilisations spcifiques dans des domaines
spcifiques peuvent tre classifis dans cette catgorie. Nous notons que la
majeure partie de ces types de systme d'annotation repose sur un des modles

123

tels que lontologie, la smantique ou sur le modle linguistique. Nous voulons


seulement souligner que la prsentation de l'annotation est d'une importance
particulire dans la conception de son modle.
Exemple
GOA (Gene Ontology Annotation)
Le GOA est un projet gr par l'institut europen de Bioinformatics qui vise
fournir des attributions des produits de gne la ressource de Gene Ontology (GO)
sous la forme d'annotations. Le but de Gene Ontology Consortium est de
produire un vocabulaire contrl dynamiquement et qui peut tre appliqu toutes
tel-00131856, version 1 - 19 Feb 2007

les organisations qui travaillent dans le domaine de la biotechnologie.

Figure 2.17 : Un exmple dannotation base sur le format (GOA)

124

Quelleque outils d'annotation de domaine-spcifiques sont dcrits dans la table en


dessous:
Domaine

Nom de projet

Site internet

GOAT : Gene
Ontology Annotation

tel-00131856, version 1 - 19 Feb 2007

Gntique

http://goat.man.ac.uk/

Tool
Genetator

http://www.fruitfly.org/~nomi/genotator/

Statistiques

SAS Annotation

http://www.math.yorku.ca/SCS/sssg/boxplot.html

Mdicale

LEADTOOLS

Multimdia

VideoAnnEx

http://www.research.ibm.com/VideoAnnEx/

SIG (GIS)

Arc4You

http://www.wlm.at/A4_Eng/A4anno.htm

Gologie

GEM

http://www.leadtools.com/sdk/medical/MedicalAddon-Annotations.htm

http://ess.nrcan.gc.ca/pubs/carto/downloads/adding
_and_editing_annotation_in_gems.doc

ATLAS (Architecture
Linguistique

and Tools for


Linguistic Analysis

http://www.nist.gov/speech/atlas/

Systems)
Tableau 2.5 : La table des systmes dannotation spcifiques

2.2.4.3.3. Stockage d'information


Le stockage des informations est un des facteurs importants dans la modlisation
des systmes d'annotations. Comment les annotations sont-elles organises et
comment peut-on les stocker et o on peut-on les stocker. Nous avons trois
mthodes utilises pour les lieux de stockage des annotations : le stockage local et
le stockage distance.
Dans le cas du stockage local, les annotations sont stockes sur la machine d'un
utilisateur. Dans le cas du stockage distance, les annotations sont stockes par le
serveur web.

125

Plusieurs suggestions et dveloppements sont en cours de ralisation pour les


stockages des annotations. Parmi les technologies du stockage adoptes au cours
des annes pour les stockages d'informations on cite : XSL, DBF, TXT et CSV.
Ces denires sont associes avec les bases de donnes relationnelles. Dans le cas
des bases de donnes lies avec les informations sur le Web, les technologies

tel-00131856, version 1 - 19 Feb 2007

comme SGML, HTM, RDF, XML, HTML, TXT sont le plus utilises.

DBF

DBase File. Format de fichier du SGBD dBase. Un des formats


reconnus pour les bases de donnes relationnelles sur microordinateur

CSV

Comma Separated Values. Valeurs spares par des virgules (et par
extension, par un caractre particulier). Il s'agit d'une forme trs
primitive, mais finalement trs robuste, de base de donnes, o
chaque ligne est un enregistrement o les champs sont spars par un
caractre prdfini.

XLS

eXceL Spreadsheet. feuille de calcul du tableur Excel de Microsoft

HTM

HTM dsigne en particulier un fichier contenant un document


format en HTML (normalement on devrait utiliser HTML comme
extension de fichier)

SGML

Standard Generalized Markup Language.

Mtalangage utilis pour

dfinir de faon gnrale des langages dfinissant des documents


hypertextes de toutes sortes, normalis sous le nom d'ISO 8879.
HTML en est un driv (trs) simplifi, XML aussi (mais en moins
simplifi).
RTF

Rich Text

Format. Format de fichier strictement textuel (norme

ASCII ou ANSI), et contenant des codes de formatage du document.


Ces codes sont aussi exprims en ASCII ou ANSI. Le format RTF est
utilis par Microsoft comme code source des fichiers
Tableau 2.6 : Tableau des fichiers dans le stockage des informations

126

Les formats utiliss pour le stockage des informations annotes dpendent la


plupart du temps des annotations elles mmes. Les facteurs peuvent inclure:
comment accder aux informations stockes ? Comment transmettre les
annotations stockes pour son utilisation ? Quelle sera leur utilisation
fondamentale ?

2.2.4.3.4. Partage dinformation


Comme nous l'avons dit plus tt dans section 1.3.6, l'annotation peut tre utilise
pour valuer ou rcapituler l'information. Souvent le but des ces valuations, ou

tel-00131856, version 1 - 19 Feb 2007

sommaire, est le partage de l'information. Il y a des outils d'annotations qui ont t


dvelopps purement pour le partage de l'information. Quelques exemples de ces
outils d'annotation incluent le commentaire dans Microsoft Word, NOTE dans
LEXSYS et l'annotation dans la feuille de QuatroPro de Corel. Certains de ces
outils ne favorisent pas le partage de l'annotation en temps rel. Ils sont faits de
manire ce que les annotations soient envoyes un ou plusieurs rcepteurs
d'information par moyens lectroniques. Nous dcrivons le systme d'annotation
dans le logiciel LEXSYS.

LEXSYS (Legume Expert System) est un outil de partage d'information dvelopp


par l'institut international d'agriculture tropicale (IITA), Ibadan, Nigeria (Weber et
al, 1997). Dans le systme, il y a un outil d'annotation intgr nomm NOTE
sous le menu d'option. L'essence de cette NOTE est de permettre aux
chercheurs scientifiques dans le domaine agricole de partager les expriences par
un envoi des notes ou des observations sur les traits ou sur des espces spcifiques
des plantes lgumineuses. Des notes note.DBF et note.FPT faites par des
utilisateurs sont communiques au coordonnateur du projet par l'intermdiaire de
courriel.

127

tel-00131856, version 1 - 19 Feb 2007

Figure 2.18 : Un exemple d'annotation partage dans le systme dinformations


LEXSYS
L'une des utilisations de l'annotation dans ce systme permet la collaboration entre
les chercheurs dans le domaine d'agriculture. Par exemple, les utilisateurs en Italie
peuvent envoyer leurs expriences aux utilisateurs de ce systme au Brsil.

2.2.4.4.

Problmes lis aux outils dannotation sur le Web

2.2.4.4.1. Consistantes des sites Web


Le problme li la consistance des pages Web a t identifi dans (Miles-Board,
2004). L'auteur a remarqu que la plupart des outils d'annotation sur le Web sont
essentiels pour la gestion de l'information. En plus, en raison de la nature
changeant de la page Web, un des problmes principaux avec l'annotation du Web
est de savoir comment rsoudre le problme de consistance des Sites Web ?
Quelques systmes d'annotation, tels que XLibris, supposent que les documents
numriques annots ne changeront jamais. Des annotations sont typiquement
places en utilisant des moyens trs simples, tels que des ensembles de caractres
ou des positions (x,y).

128

L'hypothse est que le document de base n'est jamais modifi ainsi que les
annotations. iMarkup par exemple n'exige pas explicitement que les pages doivent
rester sans changement, mais travaille mieux quand il n'y a aucun changement de
position. iMarkup utilise la localisation gomtrique pour enregistrer le
positionnement des annotations. Dans le cas o la page Web

change, les

localisations initiales des annotations pourraient tre perdues. CoNote a essay de


compenser les modifications potentielles des pages Web en permettant aux
utilisateurs d'annoter seulement des positions prdfinies par le propritaire de la

tel-00131856, version 1 - 19 Feb 2007

page.

2.2.4.4.2.

Compatibilt

Un problme majeur avec les outils d'annotation sur le Web est la question de
compatibilit. Il y a plus de vingt types diffrents de navigateurs du Web. Les
outils d'annotation sont conus et fonds sur un concept et/ou un navigateur
spcifique. Pour tre capable de circonvenir ce type de problme, Amaya a
dvelopp son navigateur propre. Le travail (Vatton et al, 1999) remarquent que,
Amaya peut tourner sur le navigateur Netscape. L'outil d'annotation Annotator a
t conu pour le navigateur Netscape. Hylighting tourne sur son propre
navigateur (Lebow, 2003). ComMentor tourne seulement sur Mosaic Browser
(Roscheisen et al, 1995). Un autre problme est que quelques uns des outils
d'annotation ont t dveloppes sur une plate-forme particulire. Par exemple,
ComMentor fonctionne sur un navigateur spcifique (Mosaic). L'outil GrAnT
suppose qu'il existe un seul espace de travail avec une base de donnes
d'annotations sur la machine d'un utilisateur (Schickler, 1996). Web Annotator a
t conu comme un plugin sur le navigateur Internet Explorer (Reed et John,
2003).

129

2.2.4.4.3. Securit
Un des problmes des systmes d'annotation sur le Web est celui de la scurit.
Parce qu'une annotation est souvent sous la forme de document partag, elle doit
tre disponible pour tous les utilisateurs.
Nous voyons un cas particulier comme illustration pour le problme de scurit li
aux annotations sur le Web. ThirdVoice, est un outil d'annotation sur le Web qui a
encourag des utilisateurs et des Webmasters d'Internet partager des annotations
tel-00131856, version 1 - 19 Feb 2007

sur les sites Web en libert (Kumar, 2001). Le problme n'est pas ncessairement
que le systme ThirdVoice est envahissant, mais qu'il permet n'importe qui
d'ajouter des annotations

tels que le Spam

un site Web sans permission du

propritaire de ce site (Carter et al, 2004).


Le ThirdVoice est une plugin de navigateur de Web sous Windows qui permet
aux utilisateurs de choisir des textes sur une Page Web et d'y attacher des
annotations, sous forme de note instantane. Les autres utilisateurs de ThirdVoice
en visitant le Site Web voient une ou plusieurs icnes sur la page Web qui
signalent la prsence des annotations. Le ThirdVoice ouvre un Site l'attaque
externe.

2.2.4.4.4. Cot
Nous avons soulign que plusieurs outils d'annotations exigent des navigateurs
spciaux ou des systmes d'exploitation spciaux pour fonctionner. Les
navigateurs spciaux ou les systmes d'exploitation spciaux des cuts
supplmentaires. En dehors du systme d'exploitation, le cot de stockage des
annotations dans les archives doit tre intgr. D'aprs un rapport par Pogolinux24
en 2006, le cot minimum par giga octets des outils de stockage StorageWare est
de $3.67. Les annotations sur un document augmentent avec le temps. Il est
24

http://www.pogolinux.com/storage/ costpergigabyte.html 13/08/2006

130

possible que l'amlioration des technologies de stockage diminue le cot de


stockage, mais il est aussi vrai que la taille d'informations stocker galement
augmente.
Aprs avoir prsent les modles d'annotation ainsi que les problmes identifiables,
nous prsentons les outils d'annotation existants dans les sections suivantes.

2.2.5. Les outils dannotations spcifiques et leurs spcificits


Grants

tel-00131856, version 1 - 19 Feb 2007

2.2.5.1.

Figure 2.19 : Une fentre de cration d'annotation par GrAnt

Le GrAnt (Group Annotation Transducer) est un systme d'annotation conu pour


tre situ sur un serveur proxy. C'est un systme d'annotation des pages Web
personnelles (Kornacker et Gilstrap, 1997). Un module du systme interroge un
serveur de meta-donne pour les informations lies aux annotations concernant le

131

document HTML concern. Ensuite le module fusionne les annotations avec la


page Web avant d'envoyer le rsultat au client de l'application. Le GrAnt permet
des annotations en groupe.
L'annotation est enregistre par des formulaires HTML et les rsultats d'annotation
sont retourns au client comme des ajouts aux pages HTML du document source.
Bien que GrAnt soutienne l'attache des annotations une zone de texte, le texte en
question doit tre crit par l'utilisateur dans le champ appropri sous le formulaire
de cration d'annotation.

tel-00131856, version 1 - 19 Feb 2007

2.2.5.2.

One-Thousand Words (OTW)

Le One-Thousand Word (OTW) est un systme pour crer, enrichir et partager


des documents sur le Web (Parente et Bishop, 2003). Le logiciel OTW permet
des utilisateurs d'annoter des images numriques trouves sur les pages Web. En
consultant une page Web, l'utilisateur peut interroger les informations primaires
(images numriques) et leurs annotations. L'utilisateur peut couter les
annotations enregistres sous forme de son. La page Web contenant les images
n'est pas change ou remplace suite l'annotation. Un module spar recouvre
les annotations et les images annotes et les affiche sur la page Web. Cet outil est
particulirement adapt aux mal-voyants.
Des images annoter peuvent tre charges partir dun site Internet sur son
diteur integr. Une fois qu'une image est ouverte, l'utilisateur dfinit une
nouvelle annotation. Chaque annotation se compose d'un certain nombre de
couches d'informations. Des arrangements tels que la voix employer pour la
synthse texte-voix peuvent tre configurs dans une couche. Les couches dans
une annotation indique se composent d'un certain nombre de rgions qui
dfinissent des hotspots sur une Image. Ces hotspots prennent la forme de
rgions gomtriques dessines par l'utilisateur, ou des rgions fondes sur des
couleurs de Pixel. Des fichiers d'informations et de sons peuvent tre associs
chaque rgion pour tre affichs et jous respectivement quand l'utilisateur

132

tel-00131856, version 1 - 19 Feb 2007

clique dessus ou dplace le curseur sur le hotspot .

Figure 2.20 : Copie d'cran d'annotation d'une image sur OTW

Quand un utilisateur termine la cration d'une annotation, il peut choisir de le


sauvegarder localement ou de la tlcharger dans un dpt sur internet. Les
rgions dfinies par l'utilisateur sont crites dans un fichier XML qui est alors
sauvegard avec les fichiers de support dans les archives.

2.2.5.3.

AMAYA

Amaya a t dvelopp sur le framework d'ANOTEA. Il a t dvelopp pour


tre un navigateur de Web et en mme temps un outil d'annotation. Nous ne
sommes pas concerns par son efficacit comme outil de navigation. Il offre une
possibilit pour l'annotation personnalise des pages Web. Quelques versions
d'AMAYA existent comme plugins pour des navigateurs spcifiques. Le navigateur
d'AMAYA (ou les connexions pour les navigateurs d'Internet Explorer et de
Mozilla) peut tre configur pour communiquer avec un serveur d'annotation donn.
Le stockage peut tre distance ou local. Ce n'est pas possible d'utiliser deux

133

serveurs d'archivage simultanment. Dans les anciennes versions d'AMAYA, la


rfrence du serveur d'archivage est indique dans le fichier de configuration
d'AMAYA. Lors de l'affichage par un navigateur, les serveurs d'archivages sont
interrogs pour les annotations qui ont t faites sur le document affich. Les icnes
d'annotation sont insres dans le document pour montrer le texte annot. Chaque
annotation a son auteur, type et emplacement sur l'archivage. Des documents
fortement annots peuvent tre filtrs selon les mmes critres comme le nom
d'auteur, le type d'annotation et le parcours d'archivage d'annotation. Un mcanisme
de filtrage plus puissant est disponible et permet aux experts d'interroger l'archive,
par exemple pour demander des annotations d'un type particulier, faite une date
tel-00131856, version 1 - 19 Feb 2007

donne.
Bien que nous ne soyons pas concerns par son efficacit en tant que navigateur, un
des problmes principaux avec AMAYA est qu'il n'est pas capable de manipuler les
pages Web avec des cadres. Par exemple, dans la figure suivante, la page Web
LORIA, affich par AMAY A est tordue parce qu'elle contient les cadres. AMAYA
peut afficher une seule page Web et non pas l'ensemble des cadres figurant dans un
site Web.

134

tel-00131856, version 1 - 19 Feb 2007

Figure 2:21 : Interface of AMAYA 9.3 sur www.loria.fr/news sans les cadres

2.2.5.4.

Lannotation GeoMedia

La recherche des documents multimdias et la reprsentation du contenu


multimdia sont le dfi des groupes de recherche de National Institute of
Informatics, Japan2525.
.
Le dfi porte sur la difficult d'annotation des documents multimdia contenant du
texte, des images, de la vido. Ce sont les problmes fondamentaux qui les ont
pousss utiliser un systme d'annotation multimdia qui intgre les documents et
les annotations disperss gographiquement.
L'objectif de cette recherche est fond sur le fait que des facteurs gographiques
peuvent influencer les activits d'annotation. En dehors des facteurs gographiques,
25

http://research.nii.ac.jp/mma-req/description/need.htm

135

la perspective GeoMedia pense que l'ge des annotateurs est un facteur dans ce
genre d'annotation.
Le mot geomedia a une utilisation trs large. L'arme canadienne a utilis le
mot comme mthode pour tablir une base de donnes fdre travers plusieurs
localisation afin de mettre en application ce qu'elle ont appel le Spatial
Information Management System (Cobley, 2005).

2.2.5.5.

CoNote

tel-00131856, version 1 - 19 Feb 2007

Le CoNote26 26 est un systme d'annotation dvelopp l'universit de Comell,


EtatsUnis, qui est fond sur l'HyperNews et crit dans le langage Perl (Davis, 1994)
(Ovsiannikov et al, 1999). Dans ce systme, le modle d'annotations partages
fournit le forum pour les communications entre les tudiants et les professeurs. Le
CoNote a t valu comme le meilleur forum de discussion par rapport aux autres
mdias lectroniques tels que des newsgroups ou les blogs (Davis and Huttenlocher,
1995). La diffrence principale est que les documents annots fournissent un
contexte pour les discussions de groupe (Heck, 1999).

Figure 2 :22 : Copie d'ecran de CoNote


Nous prsentons dans les sections suivantes la manire dont les annotations sont

26

(http://www .cs.comell.edu/home/ dph/annotation/annotations.html)

136

intgres dans les documents.

2.2.6. Lintegration des annotations dans les documents


Une annotation est forcement lie au document d'origine et souvent se trouve
attache au document. Dans ce cas, l'environnement dans lequel une annotation
est lie au document influencera sa perception. Quand nous parlons de
l'environnement d'une annotation, nous parlons de section et de contexte de
document qui entoure le document et l'annotation. Ceux-ci peuvent tre

tel-00131856, version 1 - 19 Feb 2007

considrs comme l'cologie de l'annotation .

2.2.6.1.

Lem emplacements des annotations dans un document

Rappelons qu'une annotation peut se prsenter sur diverses formes - marque sur un
morceau de texte, commentaire, icne, etc. Le type et la taille de l'annotation adopte

peuvent influencer sa localisation sur le document. Un nuancier sur un texte sera


naturellement attach au-dessus d'une expression ou une phrase. Un surlignage est
normalement situ au dessous d'une expression ou d'une phrase. La norme
d'annotation est que des commentaires sont attachs dans la marge des documents.
Quand la forme d'une des annotations ne suit pas les normes (la convention), une
interprtation diffrente peut tre donne par un lecteur de cette annotation.

2.2.6.2. Les annotations non-intgres sur les documents


Nous avons montr qu'une annotation est lie au document source. Le lien est
souvent sous la forme d'ancre. Deux types d'ancres peuvent tre identifis. Il y a
les documents avec les ancres visibles, lies l'annotation et ceux qui n'ont pas de
liens visibles.

137

2.2.6.2.1. Lancre visible


Les ancres ne sont pas des annotations mais elles pointent sur l'objet du document
annot. Des ancres sont donnes sous la forme de flches, de puces numrotes,
des puces symboliques et de souligns. Elles peuvent galement tre sous la forme
dombres ou de signes sur les marges. Quand des puces numrotes, des puces
symboliques ou des signes sont utiliss comme ancres d'annotations, ils peuvent
tre utiliss avec des lgendes situes quelque part dans le document, sans lien
direct avec la partie du document annote. Dans le cas de surlignage, l'ancre pointe

tel-00131856, version 1 - 19 Feb 2007

directement sur l'annotation dans le mme document. Pour des documents non
textuels, l'annotation est habituellement situe sur l'objet. Dans le cas d'annotations
sur le Web, les annotations sont faites travers des ancres pour rfrencer les
annotations sur le document.

2.2.6.2.2. Ancres non-visibles


Certaines annotations sont physiquement spares du document source. C'est
souvent le cas quand les annotateurs veulent prserver le document source ou parce
qu'ils ne souhaitent pas partager leurs annotations avec d'autres utilisateurs du
document. Quand la taille d'annotation est relativement grande par rapport au
document source, l'annotation peut tre dissocie. Dans le cas o une ancre n'est
pas rendue visible par l'annotateur. Elle devient trs difficile de comprendre la
signification et le but de l'annotation. Lancre est la pour identifier la partie du
document laquelle l'annotation est associe. L'annotation sans ancre visible est
utilise souvent pour des annotations a usage personnelle. Dans ce cas, c'est
seulement lannotateur qui peut interprter exactement la signification de celle-ci.
Nous revenons, dans la section suivante, sur l'une de nos problmatiques qui
concerne l'annotation dans le processus d'IE.

138

2.3. Utilisation et intgration dannotation dans le processus dIE


Nous avons jusqu'ici considr l'annotation dans la perspective de sa conception, de
sa modlisation et de sa cration, notre objectif dans ce travail est de savoir
comment utiliser les annotations dans le processus d'IE.

2.3.1. Un regard sur annotation par son utilisation

tel-00131856, version 1 - 19 Feb 2007

Si l'utilisateur veut se souvenir d'un document qu'il a lu, il donne une trace de
manire simple (par exemple l'utilisateur peut souligner, marque, etc.) ; la marque
est appose pendant le processus d'annotation et l'objet annotation est sauvegard
dans un dpt d'annotation. Nous donnons dans les sections suivantes des exemples
d'utilisations possibles des annotations.
Une annotation peut tre utilise pour la classification des documents ou pour la
structuration des contenus des documents.

2.3.1.1. Annotation pour la classification


L'annotation de type classification est utilise pour classer les documents comme
des entits. L'objectif est de crer un classement des documents existants en se
servant des annotations.

Dans les bibliothques, les classifications sont faites en respectant des normes
souvent prdfinies. La classification fonde sur les annotations est faite selon les
critres exprims dans les annotations. Dans ce type d'utilisation, la frontire entre
l'annotation et l'indexation est rduite.
L'annotation de type classification est trs utilise dans le domaine des sciences

139

de la vie. Par exemple, l'outil AutoFACT permet six classes de classifications


par l'annotation pour squencer les donnes gnomiques [Liisa, 2005]. Un autre
exemple est l'outil d'annotation automatique dvelopp pour classer des
publications sur le site web de PubMeds MedLine [Sittichai, 2004].

Furlest un autre outil pour classifier les informations sur internet. Le noyau de Furl
permet de stocker le contenu disponible sur Internet et sauvegarder les documents
tout moment (par exemple, les articles, descriptions de produit, site, e-commerce

tel-00131856, version 1 - 19 Feb 2007

etc.).

D'autres exemples incluent Plpage un service gratuit qui permet la gestion de


favoris en ligne, l'importation et l'accs sur Internet toutes les prfrences
(favoris), bookmarks, signets et de les partager avec d'autres utilisateurs. L'objectif
principal de Plpage est pour la classification d'information.

2.3.1.2. Annotation pour la structuration


Les annotations de structuration des documents concerne les diffrents lments (la
structure) des documents. La plupart des outils d'annotation sur l'Internet sont de ce
type. Les exemples incluent, annotation engine , Hylighting , Amayas et
CritLink . L'outil d'annotation tel que celui sur Microsoft Word est du type
structuration.

2.3.1.3. Le public dans lutilisation


2.3.1.3.1. Annotation pour un groupe dutilisateur
Dans un systme d'annotation pour un usage public, l'accs peut tre restreint ou
ouvert. L'annotation peut tre modre ou non-modre. Pour l'annotation modre,
un but est fix ou un objectif est dfini pour le cadre des annotations.

140

Dans un espace de travail d'annotation public, les membres dans la collaboration


peuvent tre invits ou ouvert au public (non contrl). Quels sont les critres pour
la participation ? Quels sont les lments annoter ?

2.3.1.3.2. Annotation pour un usage personnel


L'utilisation prive d'annotation a t un des objectifs principaux du systme
d'annotation sur le papier. Dans ce cas, l'individu dcide de ce qui est annotation,
et comment. Les annotations prcdentes qui ont peut tre sur le document par les

tel-00131856, version 1 - 19 Feb 2007

autres annotateurs ne sont pas souvent considres.

2.3.2. Annotation et indexation


Indexation de documents
L'indexation consiste identifier dans un document certains lments significatifs
qui serviront de cl pour retrouver ce document au sein d'une collection. Ces
lments comprennent le nom de l'auteur, le titre de l'ouvrage, le nom de l'diteur,
la date de publication et l'intitul du sujet trait 27.
Les annotations peuvent tre faites pour indexer les documents. Nous pensons que,
l'indexation des documents est un cas spcifique d'annotation. L'indexation des
documents est un cas d'annotation qui doit respecter une rgle. Les indexations
peuvent tre faites sur :
x

les documents eux-mmes,

des parties de documents,

des groupes de documents.

Par rapport l'annotation, nous pouvons noter que l'indexation ne donne pas de
sens un document. Elle identifie les lments principaux d'un document et utilise
27

http://www.pblconsulting.com/techltech.html (16/03/2006)

141

ces lments pour classifier le document.

2.3.2.1.

Annotation hors du contexte

Nous devons affirmer qu'un annotateur annote un document selon le contenu d'un
document. Une annotation hors de son contexte n'est pas conforme la dfinition
d'une annotation. Si l'information provenant d'un auteur n'est pas interprte ou si
l'annotation est hors contexte de document, alors il s'agit d'une altration du
document, un embellissement, une variation ou un changement de style de l'objet

tel-00131856, version 1 - 19 Feb 2007

ou une recration du document.

2.3.2.2.

Langage dannotation

Le langage utilis pour le processus d'annotation peut tre formel ou non. Dans ce
contexte, l'importance est la communication entre l'auteur et le lecteur. Parfois a
peut tre une forme de convention pr-tablie entre ces deux acteurs (auteur,
lecteur).
Parmi ces conventions, il s'agit des formes d'expression, des formes de codage, des
formes symboliques qui permettent l'change d'information entre les acteurs. Les
rgles linguistiques spcifiques ou les rgles smantiques formalises sont parfois
implicites ou explicites pour accomplir cette tche de communication.
Nous pouvons identifier trois formes ou types de mthodes pour effectuer la
communication dans le contexte d'annotation. Les rgles suivantes sont possibles.

2.3.2.2.1. Rgle graphique


Il existe plusieurs types de communication graphique qui peuvent tre utiliss
pour annoter un document. L'ensemble est constitu par des lments de dessins,
des lments picturaux, des lments d'estampe et des lments photographiques.
Quelle que soit la forme utilise pour annoter un document, cette dernire doit

142

tre comprhensible por le lecteur. Le point commun entre l'auteur et le lecteur


d'annotation pour l'interprtation de ces types de communication graphique
rside dans la capacit d'utiliser les mmes conventions dans la perception de
l'information.

2.3.2.2.2. Rgle orale


L'usage des informations orales appliques l'annotation des documents est une
autre alternative de communication dans le contexte d'annotation. Notre intrt
s'oriente vers l'emploi de texte lectronique comme moyen d'annotation d'un
document. Nous donnons en exemple la solution apporte par iMarkup28 28
tel-00131856, version 1 - 19 Feb 2007

Solutions Inc qui a dvelopp et a commercialis un logiciel (iMarkup)


permettant l'annotation d'un document par la voix.

2.3.2.2.3. Rgle crite : explicite ou code


L'annotation peut prendre une forme explicite ou code. Quand l'annotation est
code, les individus qui disposent de ces informations doivent dchiffrer avant
de lire et d'interprter le message en question (annotation). La notion de codage
et de son dcodage en une information comprhensible est une autre forme
d'annotation qui peut tre ralise automatiquement. Ainsi il est utile de se
rfrer aux rgles de codage/dcodage de l'information pour retrouver la forme
lisible du message d'origine grce diverses techniques (cryptographie,
codage/dcodage, ...).

2.3.3. Fonctionnement dannotation sur un document


L'annotation des lments du document pennet les fonctions suivantes :
x

information, illustration, extension du document : lorsque le lecteur


rdige ses annotations, il devient alors rdacteur d'annotations, il peut
utiliser ses annotations pour illustrer ces points de vue,

28

http://www.imarkup.com/21/09/2004

143

forum: en permettant un ensemble de lecteurs de dbattre sur le


document,

interprtation et dsambigusation de l'information : l'objectif majeur de


l'annotation est de dsambiguser le document pour un ou plusieurs
utilisateurs de document annot,

aide au processus rdactionnel : en permettant d'indiquer des consignes


de rdaction (corrections, remplacement d'informations...),

support de lecture : (la mise en vidence de passages importants...)


permettant l'appropriation du texte par le lecteur, l'annotation est alors le
reflet de l'engagement par rapport un texte d'un lecteur qui le

tel-00131856, version 1 - 19 Feb 2007

personnalise (trace de lecture) afin de faciliter un futur retour ;


x

valuation d'un travail : permettant un enseignant/tuteur d'valuer et de


corriger/ commenter un devoir d'un tudiant. Ce type d'annotation reflte
l'avis de celui qui annote par rapport au travail effectu par le rdacteur
du texte annot,

Pour rcapituler les points dans le document. Pour valuer le contenu de


document,

Pour rsumer le document,

Pour relever les points dans le document, pour la classification de


document

Pour la restructuration du contenu du document,

Pour diffrencier un document par rapport aux autres document

Pour informer les autres lecteurs du document, Pour rpondre une


question lie au document,

Pour illustrer le contenu du document

Pour crer une extension du document,

2.3.4. Granularit dannotation


L'annotation est faite sur un document. La question est qu'est ce qu'un
document ?. Il est possible de faire une annotation sur :

144

une section de document,

un document complet,

une collection de documents.

L'agglomration d'un ensemble de caractres qui forme l'objet d'une annotation est
ce qui nous appellerons la granularit d'annotation . Nous considrerons quelques
types de granularits d'annotation sur un document crit.
L'annotation de granularit fine est souvent pour corriger les orthographes. Ce
genre d'annotation est souvent utilis par des rdacteurs, les diteurs et des
tel-00131856, version 1 - 19 Feb 2007

personnes intresses par la mise en forme du document.


Notre souci n'est pas principalement sur ce genre d'annotation. Nous pouvons
supposer que d'autres recherches peuvent tre effectues sur la relation qui existe
entre l'annotation de ce niveau de granularit et l'origine des langues de balisage
(Markup Languages).
L'annotation peut tre faite sur les mots isols. Le but est gnralement de corriger
des erreurs orthographiques dans un document. Ce type d'annotation est trs utile
sur les documents brouillons. Dans ce cas, le nombre d'annotations est en gnrale
gros, consequent plusieurs paramtres joueront un rle dans la dtermination du
nombre d'annotations. Certains des paramtres incluront (a) le niveau de
connaissance approfondie de la langue, (b) l'usage du vocabulaire, (c) le style
littraire et (d) le domaine du document.

2.3.4.1. Les valeurs dannotation et leurs granularits


La granularit d'annotation est le degr d'attention donn aux lments d'un
document pendant un processus d'annotation. L'annotation de granularit grossire
ne considrera pas la structure ou le contenu du document. L'annotation d'une
granularit plus fine donnera l'attention au contenu du document. Une annotation
d'une plus haute granularit (grossie) considrera l'annotation des lments des

145

articles plus dtaille. Une annotation de granularit grossire peut considrer


plusieurs documents dans une localit comme un groupe de documents. Par
exemple, nous pouvons voir une bibliothque comme un seul document annoter.

2.3.4.2. Granularit du documents et type des annotations


Nous pouvons identifier les niveaux diffrents du granularit du document et les
mettre en correspondance avec les types d'annotation. Il convient de noter qu'un
certain type d'annotation est mieux adapt certains types de documents selon leur
granularit. Par exemple, il est possible de regarder les annotations de type

tel-00131856, version 1 - 19 Feb 2007

classifications sur un ensemble de documents htrognes ou les annotations de


type structuration sur les orthographes du document.
Dans le chapitre suivant, nous prsentons la proposition de notre modle AMIE et
ses applications.

2.4.

Conclusion

Il tait ncessaire de situer ce travail dans les sciences de linformation et la


communication. Nous avons pris compte que, le document, l'annotation et
l'information peuvent tre appliqus plusieurs domaines des activits humaines. Si
c'est le cas, l'application spcifique des termes peut tre diffrente. Aprs avoirs
dfinir clairement ces terminologies pour notre utilisation spcifique, nous avons
dfini notre conception spcifique lintelligence conomique et quelques autres
terminologies relatives. Nous savons que d'autres vues sur ces derniers soumis
peuvent tre diffrentes du ntre.

146

Chapitre 3
" Nos doutes sont des traitres et nous font perdre, par crainte d'essayer, le bnfice que souvent nous pourrions gagner.
William Shakespeare29
Nos doutes et nos proccupations (soucis) ont une seule solution : la solution croise. William K30
Les doutes et les questions sont des sujets d'annotation31

3. Proposition pour la modlisation et la ralisation d'un systme


tel-00131856, version 1 - 19 Feb 2007

d'annotation pour lIE


Nous prsentons dans ce chapitre notre proposition pour la modlisation et la
ralisation des annotations. Le chapitre est compos de trois sections. La premire
section porte sur les lments ncessaires pour la modlisation d'un systme
d'annotation pour l'IE. Le modle AMIE (Modle d'annotation pour l'change
dinformation, (en anglais Annotation Model for Information Exchange)), que nous
proposons, sera prsent dans cette section. La deuxime section porte sur la
ralisation d'un systme d'annotation fond sur notre modle AMIE. La troisime
section concerne l'application du modle dans un systme de recherche
d'informations contenant des publications scientifiques, afin d'illustrer les
fonctiona1its d'un systme fond sur notre modle.

3.1. Schma gnral d'un systme d'annotation


L'objectif gnral des outils d'annotation est d'attacher des informations autres que
celles fournies par les auteurs des documents sources. Ces informations ne sont pas
stockes sur le document annot.

29

Our doubts are traitors, and make us lose the good we oft might win, by fearing to attempt
Our doubts and our cares have one single solution: The Cross solution
31
Doubts and questions are subject of annotations
30

147

Rappelons que le concept d'annotation peut se comprendre par annotation-action et


annotation-objet (cf. section 1.3). La plupart des modles d'annotation peuvent tre
expliqus l'aide du diagramme ci-dessous. Le module dannotation qui met en
uvre les fonctions d'annotation-action reoit en entre un document et met les
fonctions la disposition de l'annotateur. Le module dannotation envoie les
annotations-objet la base d'annotations ainsi que les rfrences des objets du
document annot. Le module dannotation assure aussi la fonction de visualisation
des annotations puis qu'il peut retrouver les annotations associes un document

tel-00131856, version 1 - 19 Feb 2007

ainsi qu'aux objets du document avant l'affichage.

Document a annoter

Docu + Annotation

Module
dannotation

Base
dannotation

Figure 3.1: schma gnral d'un systme d'annotation

Nous avons prsent dans la section 2.4.3. que les annotations sont souvent
stockes dans une base d'annotations locale ou distance. Le stockage dannotation
est important pour nous parce quil garantir laccs aux annotations stockes. Le
stockage est aussi un facteur de partage des annotations. Les annotations stockes
en local sont gnralement destines lusage personnel. Le stockage distance des
annotations favorise son partage, mais la scurit de la machine et des annotations
distance est un risque.

148

Nous avons prsent des outils d'annotation existant dans la section 2.2 : GrAnt,
One-Thousand Words, Amaya. Ils comportent des fonctionnalits similaires. Ces
similarits sont prsentes dans le tableau 3.1 et dans lannexe.

Objectif

tel-00131856, version 1 - 19 Feb 2007

Type de
document
Stockage
d'annotation
Affichage

GrAnt
Usage
personnel
Page Web

OneThousandW ord Amaya


Usage personnel
Collaboratif

CoNote
Educatif

Image numrique

Page Web

Distance

Local et distance

Document
Web
Local

Local et
distance
Ne supporte pas Spcifique
des frames
Windows,
Spcifique
Unix, MacOs

Tous les
navigateurs
Non
Systme
d'exploitation spcifi

Tous les navigateurs


Non spcifi

Tableau 3.1 : Tableau comparatif des outils existants

3.2. Notre choix des parametres d'une annotation: Le modle


AMIE
Dans cette tude, notre proccupation ne porte pas sur la modlisation de
l'utilisateur ni sur son profil dans un processus d'annotation, mais plutt sur le
contenu de lannotation et ses fonctions comme information valeur ajoute au
document. Nanmoins, les annotations pourront tre analyses pour dcouvrir ou
observer les attributs ou les traits caractristiques des annotateurs. Nous reviendrons
sur ce point dans 3.6. Dans notre modle d'annotation AMIE, nous reprsentons une
annotation-objet par rapport son contexte, l'annotateur et le document annot. Ce
modle est prsent sous forme d'une structure arborescente :

149

tel-00131856, version 1 - 19 Feb 2007

Annotation
o Rfrence
o Objet
o Type
o Contexte
Objectif
Type de collaboration
Problme recherche d'information
Problme dcisionnel
x L'objet
x Le signal
x L'hypothse
o Annotateur
Identit
o Document
Titre
Mots cls
Auteurs
Rsum

O :
Rfrence : L'attribut rfrence correspond l'identifiant de l'annotation
Objet: La rfrence de l'objet du document annot. Les objets peuvent inclure les
sections d'un document, par exemple un mot, une phrase, un paragraphe, une image,
etc.. . .
Type : Le type d'annotation est la faon de spcifier l'annotation. Nous avons
retenu cinq types d'annotation que nous prsentons ci-dessous.
x

Les annotations de type commentaire sont indiques la marge avec un


lien direct sur l'lment annot.

Les annotations de type symbole sont les annotations implicites car


l'interprtation est associe au symbole utilis.

L'annotation de type typographique prend des formes soulignes.

Les annotations de type rfrence , attache des numros des lments


du document correspondant au numro de rfrence de l'annotation.

150

Contexte : Le contexte caractrise le contexte de l'annotation. On trouve associs


cet attribut le type de collaboration, l'objectif et le problme de recherche
d'information ou le problme dcisionnel li aux activits des annotations.
Objectif : L'objectif d'une annotation est la raison pour laquelle une annotation
est faite. Les objectifs peuvent tre d'valuer, faire une remarque, relever un
point, approuver un concept, dsapprouver un concept, rsumer le document,
classifier le document, informer les lecteurs du document en question, rpondre
une question, illustrer un concept, clarifier des ambiguts, rcapituler des points
dans le document, poser une question ou une requte.

tel-00131856, version 1 - 19 Feb 2007

Type de collaboration : Le type de collaboration peut tre collectif ou individuel.


Problme de recherche d'information : La spcification du problme de la
recherche d'information
Problme dcisionnel : Le problme dcisionnel li la recherche d'information.
Nous avons retenu les paramtres de cet attribut propos par (Bouaka, 2004) pour la
reprsentation d'un problme dcisionnel. Ces paramtres sont l'objet, le signal et
1hypothse.
x

lobjet de lenvironnement,

le signal mis par cet objet

lhypothse que nous pouvons dduire de la dtection de ce signal.

L'annotateur est la personne qui inscrit ses perceptions, ses interprtations, ses
valuations ou ses suggestions sur les lments du document source par les objectifs
indiques ci-dessus. Dans un contexte dIE, lannotateur peut tre le dcideur, le
veilleur ou toute autre personne de l'organisme.
Nous nous sommes inspirs des travaux sur la modlisation d'un problme
dcisionnel (Bouaka, 2004) pour dterminer les attributs pertinents pour reprsenter
l'annotateur. Ces paramtres sont l'identit de l'annotateur (prsente ci-dessous)
ainsi que ses expriences par rapport au projet trait.

151

Identit : L'identit d'un annotateur correspond aux attributs ncessaires pour


l'identifier. Les attributs que nous avons retenus sont:
x

Nom,

Prnom,

Adresse postale,

Adresse lectronique,

Pays.

Document: L'attribut document regroupe des attributs du document annot. Les


paramtres du document que nous avons retenus sont le titre, les mots cls, les

tel-00131856, version 1 - 19 Feb 2007

auteurs du document et le rsum.

3.3. Notre choix des types de document possible pour une


annotation
Comme nous avons indiqu dans la section 1.3, nous nous intressons aux
documents crits. Nous identifions trois types de document crits: document
primaire, document secondaire, et annotation en tant que document.

L'annotation sur un document primaire


Un document primaire est pour nous l'uvre directe d'un auteur, par exemple des
livres et articles. Pour le travail d'annotation, il faut que les versions lectroniques
de ces documents soient accessibles directement.

152

Document primaire

tel-00131856, version 1 - 19 Feb 2007

Annotation A

..

Annotation N

Figure 3.1 : Annotation sur un document primaire

Les annotations portent directement sur ces documents et le lien annotation


document source est direct. C'est ce type d'annotation qui est le plus souvent mis en
uvre.

L'annotation sur un document secondaire


Nous considrons un document secondaire comme un document driv du
document primaire sans modification ou interprtation de leur contenu, par exemple
les index, des extraits des documents.
Nous considrons que les annotations sur les documents secondaires peuvent tre
transposes sur le document primaire. La diffrence principale entre annotation sur
un document primaire et annotation sur un document secondaire concerne le fait
que tous les lments du document primaire ne sont pas disponibles sur le
document secondaire. De ce fait, il peut tre difficile de comparer des annotations
sur des documents primaires avec celles faites sur les documents secondaires.

153

Document primaire

Document Secondaire

tel-00131856, version 1 - 19 Feb 2007

Annotation A

..
Annotation N

Figure 3.2 : Annotation sur un document secondaire

L'annotation sur une annotation existante


Nous avons montr que l'annotation est un processus continu au chapitre 1. Nous
pouvons effectuer des annotations sur des annotations existantes dans un document.
Dans ce cas l'annotation initiale est considre comme un document. Nous
rappellerons ces annotations les annotations secondaires . La question qui peut se
poser est : comment rconcilions-nous la diffrence entre le document primaire et
les documents avec les annotations en cascade?
Pour illustrer ce type d'annotation, rappelons notre exemple de partage en mode
transition des annotations au chapitre 2, page 87, sur les annotations sur un
document dans le domaine de la gographie qui porte sur le sujet d'une ruption
volcanique.
Le problme ici concerne la difficult de synthse des annotations car elles sont de
niveau de profondeur vari. Il serait difficile de comparer deux annotations de
niveaux diffrents, ou mme d'un mme niveau.

154

Document primaire

Document Secondaire

Annotation Initiale

tel-00131856, version 1 - 19 Feb 2007

Annotation initiale

Document tertiaire

..

Annotation Secondaire N

Figure 3.3 : Annotation sur des annotations

3.4. La modlisation du systme d'annotation


Dans cette section, nous prsentons ce que nous avons retenu comme concepts et
fondements pour la modlisation d'un systme d'annotation pour l'IE.
Nous pensons que le systme d'annotation doit intgrer le modle d'annotation
AMIE ainsi que les oprations ncessaires pour effectuer les annotations.
3.4.1.

Caractristiques fonctionnelles du systme

Nous pensons qu'un systme d'annotation doit permettre au moins les fonctionnalits
suivantes :
x

slection : slection des lments du document annoter,

spcification : spcifier l'annotation,

association : associer l'annotation l'lment du document,

instanciation : instancier les autres attributs de l'annotation, c'est--dire les


attributs du modle AMIE.

155

En considrant ce systme comme un systme d'information intgrant les


fonctionnalits d'annotation, nous prsentons dans la section suivante la description
du systme sous forme dun schma entit-association et du schma relationnel
correspondant.

3.4.2.

Schma Entit-Association et relationnel pour les donnes


du systme

Notre conception d'un systme d'annotation fond sur le modle AMIE se compose
tel-00131856, version 1 - 19 Feb 2007

des entits : annotateur, document, lecture, annotation et session.


Un utilisateur du systme peut ouvrir une session et lire un document d'intrt. La
session qu'il ouvre peut tre une session de lecture ou d'annotation. La lecture d'un
document peut engendrer un processus d'annotation. Dans le cas o un utilisateur
n'est pas intress par annoter un document, sa session est termine en enregistrant
ses activits. Dans le cas o un utilisateur est intress par annoter un document
consult, ses activits d'annotation sont enregistres. Remarquons que plusieurs
annotations peuvent tre faites pendant la mme session par un utilisateur.
Nous avons choisi de reprsenter l'acte de lecture pour observer les comportements
des utilisateurs en ce qui concerne leurs activits d'annotation, car on peut lire sans
annoter.

156

(1,1)

Code dannotation,
Date
Heure
Objectif dannotation
Type dannotation

(0,n)

Annote

Annotation

Document
Code document
URL document

[1,n]

(1,1)
(1,1)
(0,n)
(0,n)

Type de collaboration
Problme rech dinfo
Problme dcisionnel
Ref objet annot

[n,1]

appartient

Lecture

[1,n]

[1,n]

rsulte

(0,n)
(1,1)

[1,n]

Code session

(1,1)

tel-00131856, version 1 - 19 Feb 2007

Action Annote

(1,1)

Session

[n,1]

1,n

Heure dpart
Heure fin

Effectuer

(0,n)
(1,n)

Utilisateur

(0,n)

Code utilisateur
Nom
Prnom
Adresse postale
Adresse lectronique
Ville
Rgion
Pays
Secteur dactivit
Date de naissance

[n,1]

Effectuer dans

(0,1)

Lecture

Faire

Code lecture
Heure dpart
Heure Fin
(1,1)

[n,1]

Figure 3.4: Schma Entit-Association de notre systme d'annotation


Le schma Entit-Assoication pour le systme est prsent par le schma 3.5. Nous
traduisons ce modle comme ci-dessous:
1. Utilisateur-annotation
Un utilisateur peut faire 0 ou plusieurs annotations, la cardinalit est (0,n)
2. Annotation-utilisateur
Une annotation est faite un seul utilisateur, la cardinalit est (1,1)
3. Document-annotation
A un document peut tre associ 0 ou plusieurs annotations, la cardinalit est (0, n)
4. Annotation-Document

157

A une annotation peut tre associe 1 seul document, la cardinalit est (1,1)
5. Lecture-Utilisateur
Un utilisateur peut faire 0 ou plusieurs lectures, la cardinalit est (O,n)
6. Utilisateur-Lecture
Une lecture est faite pas un seul utilisateur, la cardinalit est (1,1)
7. Session-Utilisateur
Une session appartient un seul utilisateur, la cardinalit est (1,1)
8. Utilisateur-Session
Un utilisateur peut effectuer 0 ou plusieurs sessions, la cardinalit est (O,n)

tel-00131856, version 1 - 19 Feb 2007

9. Lecture-Annotation
Une lecture peut produire 0 ou plusieurs annotations, la cardinalit est (O,n)
10. Annotation-Lecture
Une annotation peut tre associe une seule lecture, la cardinalit est (1,1)
11. Session-Lecture
Une session peut produire 0 ou plusieurs lectures, la cardinalit est (O,n)
10. Lecture-Session
Une lecture est faite dans une seule session, la cardinalit est (1,1)

Schma de relation
Annotation (Code d'annotation, date, Objectif d' annotation, Type, Typecollaboration, Problme recherche d'information, Problme dcisionnel,ref objet
annot,Code utilisateur, code_session, code_document, code_lecture)
Utilisateur (Code utilisateur, Nom, Prnom, Adresse postale, Adresse lectronique,
Ville, Rgion, Pays, Secteur d'activit, date de naissance)
Lecture

(Code

lecture,

Heure

dpart,

Heure

Fin,

Code_document,

Code_utilisateur,Code_session)
Document (Code document, url document, code_session,code _lecture)
Session (Code session, Heure dpart, Heure fin, Code_utilisateur)

158

Graphe de relation de la collection de relations

Annotation

Document

Code dannotation,
Date heure,
Objectif dannotation,
Type,

Code document
URL document
Code_session
Code_lecture

tel-00131856, version 1 - 19 Feb 2007

annotation,
file_assoc
Code utilisateur,
code_lecture
Code_document
Code session

Session
Code session
Heure dpart
Heure fin
Code_utilisateur

Utilisateur
Code utilisateur
Nom
Prnom
Adresse postal
Adresse lectronique
Ville
Rgion
Pays
Secteur dactivit

Lecture
Code lecture
Heure dpart
Heure Fin
Code_utilisateur

Figure 3.5 : Graphe de relation de la collection de relations

3.5. Schma fonctionnel du systme I-AMIE


Le systme I-AMIE est un systme que nous avons dvelopp fond sur le modle
AMIE. Le systme permet la recherche d'information suivant le modle EQuAte
mais en mettant particulirement l'accent sur la fonctionnalit d'annotation.
Rappelons ce qu'est le modle fonctionnel EQuAte.

159

Demande

Base de
donnes
Utilisateur

E
Q
U
A

Base de
donnes
document

tel-00131856, version 1 - 19 Feb 2007

Mise en correspondance

Utilisateur
Doc.
Resultat

Annotation
Base de
donnes
Annotation

Systme dinformation
Figure 3.6 : Reprsentation du systme I-AMIE
Nous nous inspirons de (David, 2005) pour expliquer le lien entre notre modle
AMIE et le modle EQuAte. Comme il s'agit d'utiliser un SI pour aider la
rsolution d'un problme dcisionnel, le modle EQuAte a t propos pour
faciliter le processus de rsolution d'un problme dcisionnel par un SI. Cette
architecture est fonde sur les caractristiques fonctionnelles qui permettent aux
acteurs du processus d'IE (le dcideur et le veilleur ou tout autre personnel de

160

lorganisme) d'voluer dans les phases cognitives rencontres dans le processus


de rsolution de problme (David, 2002).

L'acronyme EQuAte est tir de ces quatre phases : Explorer, Interroger (Query),
Analyser et Annoter.
x

Explorer l'entrept de donnes, c'est--dire, naviguer dans les donnes ; le


systme hypertexte illustre bien cette fonctionnalit. Dans les systmes
que nous proposons pour des applications dans le domaine dIE, il s'agira

tel-00131856, version 1 - 19 Feb 2007

de la navigation par des attributs des donnes du systme. Par exemple,


cliquant sur un attribut donnera toutes les valeurs de l'attribut, une forme
de liste d'index. Et partir de cette liste, l'utilisateur pourra obtenir
l'intgralit du document ou de l'information.
x

Interroger l'entrept, c'est--dire, utiliser des requtes par le principe de


recherche par le contenu, sous forme d'quations Boolennes. Les
systmes documentaires et la plupart des moteurs de recherche emploient
cette approche pour la recherche d'information. L'inconvnient majeur est
que le degr de pertinence de l'information dpend du niveau de
connaissance de l'utilisateur sur les informations qu'il cherche ainsi que
sur les fonctionnalits de spcification des valeurs des attributs.

Analyser l'ensemble des donnes du systme pour faire merger des


distributions, tendances, etc.. La qualit de l'analyse dpendra bien sr du
degr de comprhension du problme dcisionnel ainsi que de la qualit
de la transformation du problme dcisionnel en indicateurs.

Annoter les solutions proposes pour les contextualiser selon des critres
personnels. Cette fonctionnalit permet d'adapter le systme par le contenu
informationnel des particularits individuelles.

A partir de la Figure 3.6, un utilisateur envoie une demande au systme


d'information (dlimit pas la ligne pointille). Dans notre application, le systme
exploite une base de donnes de documents bibliographiques de l'quipe de

161

recherche SITE. La demande de lutilisateur est mise en correspondance avec la


base documentaire.
Par rapport aux travaux de l'quipe de recherche SITE, les trois premires
fonctionnalits sont implmentes dans le systme de recherche dinformation
dvelopp dans lquipe savoir le systme METIORE.
Le systme METIORE permet lutilisateur de pouvoir voluer dans les diffrents
niveaux dhabitudes vocatives (observation, abstraction lmentaire, symbolisation
et raisonnement, et crativit) (David, 1999). Cest un systme de recherche

tel-00131856, version 1 - 19 Feb 2007

dinformations appliqu aux rfrences bibliographiques. Le systme est


expriment sur une collection de 5000 rfrences bibliographiques du laboratoire
LORIA. Le systme repose sur le concept que lutilisateur doit pouvoir voluer
dans ses niveaux dhabitudes vocatives.
Notre travail porte sur l'aspect de la deuxime "A", dans l'EQuAte, qui sont les
annotations possibles par l'utilisateur.
Bien sur, lannotation nest pas ncessairement une expression de besoin en
information mais elle peut participer une meilleure comprhension du besoin en
information suite des annotations des rsultats proposs par le systme.
Nous reprenons ci-dessous trois des principaux processus du systme I-AMIE.
La demande : La demande correspond lexpression du besoin informationel.
Dans les applications existantes dans l'quipe de recherche SITE, trois types de
demande sont implants : Explorer, Interroger et Analyse.
Mise en correspondance : La mise en correspondance est effectue par le systme
pour trouver des informations de la base de donnes documentaire qui
correspondent au mieux la demande de lutilisateur. Pour se faire, le systme peut
utiliser la base de donnes utilisateur qui contient des informations sur lutilisateur,

162

ses prfrences et ses expriences afin davoir une meilleure comprhension de la


demande exprime par lutilisateur.
Notre apport par rapport la mise en correspondance est doffrir la possibilit
dacquerir des connaissances sur lutilisateur par le biais du process dannotation.
Ainsi la base dannotation pourra participer la mise jour de la base de donnes
utilisateur.
Annotation : Annotation est le commentaire de l'utilisateur aprs avoir lu et

tel-00131856, version 1 - 19 Feb 2007

interprt (valu) le document provenant de la base documentaire.

3.5.1.

Le dveloppement du systme avec la technologie Internet

Nous avons choisi de dvelopper le systme avec la technologie Internet, en


employant l'architecture 3-tiers. Nous prsentons ci-dessous trs brivement ce
quest l'architecture 3-tiers.
L'architecture 3-tiers est compose de trois lments, ou plus prcisment dans ce
cadre, de trois couches. En effet dans ce contexte, et dans la philosophie qui a guid
l'laboration de cette architecture, il est plus adquat de parler de couche
fonctionnelle o chacune d'elle est attach un lment/entit logique. Dans
larchitecture 3-tiers, il faut distinguer :
x

Le niveau prsentation (ou affichage) associe au client. C'est ce niveau qui


permet un utilisateur d'envoyer sa demande d'une ressource aux machines
distance. Gnralement, un navigateur Web permet cette interface. La
machine client est relie au serveur Web par le rseau TCP/IP. Le
raccordement est indpendant de ce que le client fait. Chaque fois qu'il a
besoin d'une ressource (situe sur le Web), lutilisateur envoie sa demande
au serveur Web travers le protocole HTTP.

163

Le niveau fonctionnel li au serveur qui, dans de nombreux cas, est un


serveur Web muni d'extensions applicatives. Dans notre cas, le serveur Web
est aussi le serveur PHP. C'est ici que des commandes en PHP sont
excutes.
Rseau (TCP/IP)

Client

Serveur du Web
+PHP

Navigateur Netscape
Explorer
Mozilla
tel-00131856, version 1 - 19 Feb 2007

HTTP

PHP+SQL

Serveur des donnes


+MySQL

Figure 3.7 : Prsentation de larchitecture 3-tiers


x

Le niveau donn est li au serveur de base de donnes. Les serveurs de


bases donnes sont en charge du stockage et de la gestion des donnes
organises sous forme dune base de donnes. Elle fournit l'information
(comme donne) au serveur Web par des commandes PHP/SQL.

Le deux principaux composants logiciels dans cette architecture sont PHP et


MySQL ; que nous prsentons trs brievement dans les deux paragraphes suivants.

PHP
Nous avons choisi le PHP comme langage de programmation parce quil nous
permet de raliser notre objectif. PHP est un langage et un interprteur, qui est
intgr dans le serveur web ou bien compil en version CGI. Il est capable d'accder
aux fichiers, d'excuter des commandes et d'ouvrir des connexions rseaux. Le
problme majeur de PHP est qu'il rend fragile la scurit d'un serveur Web cause

164

de sa capacit accder des fichiers curant ainsi la possibilit de modifier les


fichiers ou infecter le serveur de virus. De plus, une slection rigoureuse des options
de compilation et d'excution permet d'obtenir un quilibre entre libert et scurit
(Mehdi et al, 2005).

MySql
MySQL est un systme de gestion de base de donnes relationnel. Le SQL dans
"MySQL" signifie "Structured Query Language" : le langage standard pour les
interrogations. MySQL est Open Source . Le mot Open Source signifie qu'il

tel-00131856, version 1 - 19 Feb 2007

est possible chacun de d'utiliser et de modifier le logiciel. Tout le monde peut le


tlcharger sur Internet et l'utiliser sans payer aucun droit.
Pour notre travail, nous avons utilis la version dj installe dans le systme du
rseau de LORIA. Le serveur MySQL o nous avons install notre base de donnes
est http://mysql.loria.fr.

3.5.2.

L'implantation du systme I-AMIE au LORIA

Nous avons implment le systme I-AMIE en utilisant les ressources


technologiques Internet du LORIA ainsi que des ressources documentaires de
l'quipe SITE. Comme le systme est dvelopp sur une architecture 3-tiers, nous
avons utilis un serveur Web et un serveur de donnes. Ainsi le systme peut tre
utilis partir de n'importe quel client / navigateur.

Le Serveur Web
Nous avions pens utiliser un serveur ddi (http://metiore.loria.fr) unique mais
pour des raisons de scurit, metiore.1oria ne peut pas communiquer avec d'autres
serveurs qui sont essentiels l'opration du systme comme le serveur Web LORIA.
Nous avons dcid d'utiliser le serveur Web centralis du Web
(www.loria.fr).

165

LORIA

Serveur Base donnes MySql


Nous avons utilis le serveur de base de donnes mysql.loria.fr pour grer la base
de donnes de notre systme. Nous aurions prfr avoir notre serveur MySql
propre extrieur plutt que sur le serveur du LORIA centralis. Le problme est
qu'un serveur MySQL extrieur ne peut pas communiquer directement avec le
serveur Web du LORIA. La communication entre un serveur MySQL et un serveur

tel-00131856, version 1 - 19 Feb 2007

Web est essentielle pour le fonctionnement de notre systme.

Serveur Base de
donnes
( MySql)

Serveur Web
(LORIA)

Serveur Web
(Metiore)

Utilisateur
La base de donne (resdoc)

Figure 3.8: Les interactions entre les composants du systme I-AIME

La gestion de la base de donnes


La base de donnes que nous utilisons, resdoc se trouve sur le serveur mysql.loria.fr.
Elle peut tre gre dpuis seulement deux machines crossway.loriafr et
lagos.loria.fr pour des raisons de scurit. Cinq tables ont t cres dans la base
de donnes (cf. figure 3.5). Les structures de ces tables sont prsentes dans
lannexe 3.

166

3.5.2.1. Les composants logiciels du systme I-AMIE


Dans cette section nous prsentons les composants logiciels du systme I-AMIE.
Dabord, lutilisateur demande une connexion au portail qui sert dinterface entre
lutilisateur et le systme (cf. n figure 3.9). La mthodologie utilise pour se
connecter est la mthode de login avec un mot de passe. Aprs la connexion,
lutilisateur peut soumettre des demandes au moteur de mise en correspondance (cf
p figure 3.9).

tel-00131856, version 1 - 19 Feb 2007

La demande correspond lexpression du besoin en information de lutilisateur. Les


formes dexpression les plus courantes sont la navigation, linterogation et lanalyse
globale de la totalit de la base dinformations. Ces formes ne sont pas
gnralement disponibles simultanment, ce qui explique lintrt du modle
EQuAte qui justifie la ncessit de proposer ces fonctionnalits. La demande peut
voquer le type d'information, le format, la date et les autres attributs des aux
documents recherchs. Le modle Mirabel (Goria, 2004) dvelopp dans l'quipe
de recherche SITE-LORIA est bien adapt pour rsoudre le problme de la
spcification des besoins en information. Ce modle a t propos pour clarifier
l'interprtation et la comprhension de la requte faite par un utilisateur.
Les modules du portail dcompose la demande pour extraire les attributs des
documents.
La demande peut porter sur les documents ou sur les annotations ( 3a

et

de3b de la figure 3.9). Dans ce denier cas, une annotation est considre comme un
document. La demande est mise en correspondance avec la base concerne. Notons
que cette mise en correspondance peut sappuyer sur la base utilisateur pour la
personnalisation des reponses la demande. Rappelons que la base utilisateur peut
tre mise jour en se servant des activits dannotations de lutilisateur afin de
mieux cerner certaines de ses caractristiques (cf section 3.5).

167

Le rsultat de la mise en correspondance est stock dans la base rsultats (q de la


figure 3.9). Cette phase peut ncessiter lassociation des lments dun document
rsultat avec les annotations qui y rfrent. Cette association peut tre faite avant de
stocker le resultat dans la base resultats (cf. q de la figure 3.9).

Base
dutilisateur

Base
documentaire

Base de
donne
dannotation

tel-00131856, version 1 - 19 Feb 2007

3b
3a

Mise en correspondance

Base
Rsultat

3
6
Portail

2
1

5
Connexion

Utilisateur
Figure 3.9 : Les composants logiciels de I-AMIE
Les rsultats obtenus sont affichs sur le portail avec la possibilit deffectuer des
annotations (cf. r de la figure 3.9). Notons quil est aussi possible de selectionner
les paramtres daffichage des annotations, par exemple, affichage par type
dannotation, par date dannotation, par annotateur, etc.. Enfin, nous avons prvu
les fonctionnalits pour lanalyse des annotations. Dans ce cas, la demande aura t
faite sur la base des annotations.

168

Rappelons que lannotation permet lutilisateur dapporter ses propres


interprtations / valuations sur les documents rsultat.
Nous avons considr la possibilit d'employer l'annotation comme un moyen de
partage d'information au chapitre 2. Un outil d'annotation peut tre adapt pour des
objectifs de collaboration. Dans ce cas, l'architecture (Figure 3.9) du systme IAMIE peut inclure la recherche collaborative d'information. Trois modes sont

tel-00131856, version 1 - 19 Feb 2007

possibles pour l'utilisation d'I-AMIE pour la recherche collaborative d'information :


x

Mode autonome

Mode observation

Mode collaborative

Ces modes ont t proposs par (David, 1999) et appliqus sur deux systmes de
lquipe SITE. Nous prsentons succintement ces modes dans les trois praragraphes
suivants.
Mode Autonome : Dans le cas d'une utilisation autonome d'I-AMIE, un utilisateur
a toutes les ressources lui seul. Il n'a rien en commun avec d'autres utilisateurs. Il
peut ne pas partager ses expriences ou ses annotations avec d'autres utilisateurs.
Mode Observation : L o un utilisateur observe l'utilisation d'I-AMIE faite par
les autres utilisateurs. Il n'est pas cens de faire sa propre annotation mais il peut
tirer les bnfices des annotations et des expriences d'autres annotateurs.
Mode Collaborative : Le cas d'une utilisation collaborative dI-AMIE d'annotation
est trs important pour nous car nous essayons de rsoudre un problme dcisionnel
qui peut tre une tche entre un dcideur et un veilleur (ou entre deux personne
simplement). Dans ce cas-ci, la base de donnes d'annotation est commune aux
deux utilisateurs en collaboration. Les portails auxquels ils accdent sont diffrents.
Comme illustr dans figure 3.13, le serveur de base de donnes et le Serveur Web
sont communs aux deux utilisateurs car ils utilisent le mme systme I-AMIE. Les
clients peuvent tre videmment diffrents selon le navigateur utils.

169

I-AMIE

tel-00131856, version 1 - 19 Feb 2007

Portail 1

Portail 2

Utilisateur 1

Utilisateur 2

Figure 3 .10 : Utilisation de systme I-AMIE pour la recherche dinformation


Outre lutilisation de I-AMIE pour la recherche collaborative, nous pensons que IAMIE peut tre utilis en mode distribu selon quatre fonctionnalits que nous
prsentons ci-dessous.

A. Raffineur
Par cette fonctionnalit, I-AMIE peut tre utilis pour affiner une requte en
recourrant la base dannotation. Par exemple, une requte d'information sur
"l'intelligence conomique" travers google peut tre tendue vers la base de donnes
d'annotation d'I-AMIE si lutilisateur n'est pas satisfait de la rponse de google.
B. Centralisateur

Le systme I-AMIE peut servir de fderateur des annotations. Ainsi des annotations
faites dans plusieurs domaines peuvent tre centralises et constitiuent ainsi une base

170

de connaissances.
C. Analyseur.
Nous pouvons utiliser I-AMIE pour analyser les annotations qui viennent d'autres
sources. Comme nous avons dit dans la section 3.5, des annotations et des documents
sont mis en correspondance avec la demande de l'utilisateur. La base de document ou
la base dannotation peut aussi tre le systme METIORE.
D. Systme multi-agent
I-AMIE peut confier des traitements particuliers des systmes externes. Par
tel-00131856, version 1 - 19 Feb 2007

exemple, le systme SIMBAD (Sidhom, 2002) peut tre sollicit pour traiter le
rsultat du systme I-AMIE. Le systme SIMBAD transforme cette information en
attributs et valeurs. Ces attributs et ces valeurs peuvent enrichir la base de donnes
d'annotation.

3.5.2.2. Les interfaces


Nous prsentons dans cette section des exemples dinterface du systme I-AMIE
illustres par des copies decran. La premire interface est linterface de connexion
(Figre 3.11). Un utilisateur qui est dj inscrit dans le systme devra entrer son
pseudonom et son mot de passe. Cette interface est lie la base de donnes de
l'utilisateur. Quand l'identit de l'utilisateur n'est pas trouve dans la base de donnes
ou si le mot de passe ne correspond pas celui de la base de donnes, une erreur est
rapporte et le systme est interrompu. Un nouvel utilisateur peut enregistrer son
identit dans la base de donnes (Figure 3.13). Les interfaces du systme ont t
ralises en francais et en anglais. Lutilisateur peut selection la langue de son choix.
Cette section de la thse a pour objectif dexpliquer certaines fonctionnalits du
systme dannotation qui ont t ralises pour la mise en place du systme dI-AMIE.
Nous voulons galement mettre en vidence le rapport entre chaque section du
systme. Nous expliquons l'interface lie la base de donnes. Nous illustrons
galement les rapports entre les diffrents lments du systme avec un schma.

171

(3)
Entre

(2)

(1)
Page de
Prsentation

Cre profil
utilisateur

tel-00131856, version 1 - 19 Feb 2007

Ajout
annotation

(4)

Ajout
Nouveau
document

(421)

Document
dans la base

Interroger

Par les
attributs

Croiser

Document
par lien
Figure 3.11: Schma fonctionnel dI-AMIE

172

A propos
/ Info

(42)
(422)

Explorer

Par
fichiers

Consultation
(equate)

(423)
Analyser

Frquence

tel-00131856, version 1 - 19 Feb 2007

Figure 3.12 : Ecran de login


Laccs au systme est le login . Un utilisateur se connecte au systme avec un
identtifiant et un mot de passe. Un utilisateur qui n'a pas un didentifiant et un mot de
passe correspondance peut crer son compte utilisateur (identifiant et mot de passe)
(2). Lidentifiant et le mot de passe associ sont sauvegards dans la base de donnes.
Aprs la cration du nom dutilisateur et du mot de passe, il peut alors se connect au
systme (1). Quand l'utilisateur se connecte avec succs au systme, une premire
page de prsentation du systme dannotation saffiche.

Figure 3.13: Prsentation de systme dannotation


La page de prsentation du systme dannotation prsente quatre types d'information
(a) l'accs aux documents associs une annotation et la cration dune l'annotation,
(b) la consultation des annotations existante (c) ajout dun nouveau document et (d)

173

propos du systme. Trois mthodes ont t adoptes pour consulter les annotations
existantes. Ces mthodes sont : explorer (421), interroger (422) et analyser (433).
Bien que les interfaces soient multilingues, une seule base de donnes (resdoc) est
utilise dans le systme.

tel-00131856, version 1 - 19 Feb 2007

3.5.2.2.1. La creation didentifiant utilisateur

Figure 3.14 : Ecran de cration d'un nouvel utilisateur


Linterface de cration dun compte utilisateur permet la cration dun compte
utilisateur dans la base de donnes utilisateur. Les paramtres de l'utilisateur comme
nous les avons montrs sur la figure 3.5 sont renseigns ici. L'utilisateur est libre de
saisir ses informations personnelles comme le nom, adresse postale, etc. Il doit crer
un pseudonom et un mot de passe avec lesquels il pourra se connecter. Cest

174

obligatoire quun utilisateur cre un pseudonom. En effet, le pseudonom est la


rfrence toutes les activits de lutilisateur dans le systme. Ce dernier (l'utilisateur)
peut envoyer ses informations la base utilisateur en cliquant sur Submit ou il
peut rinitialiser ce qu'il a saisi avec Reset .

3.5.2.2.2. La creation dannotation

tel-00131856, version 1 - 19 Feb 2007

o
p

Figure 3.15 : Interface de cration dannotation

Quand un utilisateur est connect au systme, le portail est prsent avec une page de
trois cadres. Le premier cadre n du ct gauche contient les rfrences des
documents primaires qui sont stocks sur metiore.loria.fr. Trois formats de fichiers
sont stocks dans metiore.loria.fr (format DOC, PDF et HTML). Lutilsateur peut
choisir le type de format qui lui convient dans le cadre n a gauche (indiqu par
dans Figure 3.15). Lutilisateur peut alors cliquer sur un document parmi les liens
prsents dans le cadre gauche n. En fait, le lien permet dafficher le document dans
son intgralit dans le cadre o en haut droite. Lutilisateur peut alors annoter le
document dans le cadre p situ juste en bas du cadre de document. Le cadre o
contient inialement une brve information sur le systme dannotation et des liens lis

175

nos travaux dquipe (Figure 3.16). Lutilsateur peut cliquer sur un lien ou sur le
cadre n pour accder son contenu.

tel-00131856, version 1 - 19 Feb 2007

Figure 3.16 : Premier cran dans la cration d'annotation

Le cadre o peut tre charg avec la page Web de lutilisateur (en format complet
comme http://www.pagepersonnel.com) en cliquant sur le lien pages personalises
( dans Figure 3.16). Lutilisation de ce lien nest pas toujours sr compte tenu de la
surcharge des pages Web ou de laffichage des pages Web graphiques.
Supposant que lutilisateur clique sur un lien dans le cadre n Modlisation de
l'utilisateur, systmes d'informations stratgiques et Intelligence Economique.htm ,
le fichier li sera affich dans le cadre o.

176

tel-00131856, version 1 - 19 Feb 2007

Figure 3.17 : Zone de cration d'annotation


Dans la zone de cration d'annotation reprsente sur la Figure 3.17, lutilisateur est
invit faire son choix partir des options prdfinies dans section 3.2. Par exemple,
il

poura

slectionner

Objectif

dannotation ,

Type

dannotation ,

Section annot et Type de collaboration etc. Nous aurions aim avoir une
situation o le document annoter soit directement inclus dans l'interface de cration
d'annotation,

c'est--dire dans le cadre 3. Ainsi nous aurions

directement les

rfrences du docment annoter. Nous navons pas pu raliser ceci vu les contraintes
du temps.
Aprs avoir choisi les options, lutilisateur doit completer les valeurs en relation avec
le Problme dcisionnel, Problme de recherche dinformation et sa propre
annotation.
L'utilisateur peut envoyer l'annotation faite la base d'annotation avec Envoyer
Annotation . Nous avons combiner la lecture de document avec l'annotation
dans la mme interface. C'tait pourquoi nous avons le Lire simplement sur
l'interface. Cette option n'a pas t suffisamment dveloppe.

177

3.5.3.

Consultations des annotations existantes

3.5.3.1. Affichage des annotations


Nous n'avons pas pu raliser les modules permettant l'utilisateur de choisir les
modes daffichage des annotations. En revanche nous avons dvelopp un module qui
permet de lister le contenu du fichier d'annotation comme reprsent sur le schma

tel-00131856, version 1 - 19 Feb 2007

3.18.

o
p

r
s
t

Figure 3.18 : Ecran de liste des annotations dans la base

Nous presentons la signification de chaque colonne dans la tableau 3.2.

178

Colonne

Signification

Reference dannotation

Objectif dannotation

Type dannotation

Annotation propre

Section du document annot

Date dannotation

Psedonom dutilisateur

tel-00131856, version 1 - 19 Feb 2007

Tableau 3.2 : Signification des colonnes de lcran 3.18


Aprs avoir prsent le systme I-AMIE par ses fonctionalits et pas ses composants
logiciels, nous prsentons dans la section suivante des exemples de domaines
dapplication aussi bien de la base dannotation que du systme I-AMIE.

3.5.3.2. Accs et interrogation de base dannotation


3.5.3.2.1. Explorer

Figure 3.19 : Interface pour explorer le contenu de la base


Quand cliquer pour explorer par les attributs est choisi, un utilisateur peut accder
aux occurrences spcifiques d'un attribut dans le systme. Par exemple, un utilisateur
peut vouloir savoir quel est les types de diffrents Problmes dcisionnels qui
existent dans le systme ou les diffrents types de Problme de recherche
d'information saisie. L'utilisateur peut alors cliquer sur n'importe lequel des types
affichs pour obtenir la frquence de l'occurrence choisie.

179

Figure 3.20 : Interface pour slection une variable a explor

tel-00131856, version 1 - 19 Feb 2007

Au lieu d explorer le systme par des attributs, un utilisateur peut explorer le


contenu de des bases de donnes dans le systme. Par exemple, il peut analyser les
utilisateurs qui sont stockes dans le systme.

3.5.3.2.2. Interroger
Logique de recherche dinformation
Interroger permet l'utilisateur de choisir plusieurs attributs pour avoir leur
recurpement. Par exemple, un utilisateur peut vouloir savoir l'occurrence de objectif
d'annotation type valuation avec la section d'annot type titre ensemble.
Il est possible de choisir objectif d'annotation type valuation avec
objectif d'annotation type remarque . Un utilisateur peut croiser jusqu' quatre
paramtres dans ce cas. Pour le croisement des attributs et des valeurs, nous avons
utilis les oprateurs Boolens ET et OU.

Figure 3.21 : Interface de recherche des livres de biblotheque duniversit Nancy 2

180

tel-00131856, version 1 - 19 Feb 2007

Figure 3.22 : Un essai comparable aux autres systmes de recherche dinformation

Nous avons t inspirs par les systmes d'information existants, comme le systme
de recherche des ouvrages mise en place par la bibliothque de l'universit de Nancy
2. Lavantage de cette option est la possibilit de slectionner les oprateurs Boolen
aprs chaque attribut comme dans la Figure 3.22. Ce n'est pas une mthodes efficace
de rechercher dinformation dans une base dinformation. La logique derrire ce
genre de combinaison des oprateurs Boolens est dfectueuse. Les intentions des
utilisateurs ne sont pas reprsentes.
Par exemples, si nous avons trois valeurs A, B et C pour trois attributs, la
reprsentations des trois parametres peuvent prendre une des format suivants :
(Paramtre A OU Paramtre B) OU Paramtre C 1
Paramtre A OU (Paramtre B OU Paramtre C) . 2
Paramtre A OU Paramtre B OU Paramtre C . 3

Dans la reprsentation dans Figure 3.22, les trois quations sont identiques. Mais
nous sommes convaincus que les trois quations sont totalement diffrentes selon les
thories des ensembles.
Les mthodes de reprsentation possibles
Mthode 1 : Une mthode pour rsoudre le problme est de reprsenter
exclusivement les combinaisons des attributs. Une reprsentation de ce genre

181

exclusivement impliquera 6 possibilits de combinaison pour quatre attributs utilisant


ET entre deux pairs dattributs seulement (exemple (A+B)+(C+D). Pour utiliser la
combinaison de ET et OU entre deux pairs dattributs, nous avons plus de
1290 possibilits. Cest au del de notre objectif dans ce travail.
Mthode 2 : Une autre mthode pour rsoudre ce genre de problme de
reprsentation est de couper la reprsentation en tapes. La premire tape peut tre
comme (A+B)=K et (C+D)=L. Aprs la premire tape, nous pouvons avoir la
deuxime

comme (K + L). Nous estimons que cette approche peut tre trop

tel-00131856, version 1 - 19 Feb 2007

compliqe et difficile matriser par la plupart des utilisateurs du systme.


Mthode 3 : Une autre approche pour rsoudre ce problme est de permettre aux
utilisateurs de saisir leur demande comme il souhaite. Un problm est associs cette
mthode. Cette mthode encourage les erreurs syntaxe. Puisque les utilisateurs
peuvent ne pas saisir les requtes justes.

Notre approche

Figure 3.23 : Interface de spcification dune interrogation


Nous avons employ l'approche de deux niveaux en choisissant les attributs et les
variables correspondantes dans la recherche dinformation dans la base de donnes
dannotation. Le premier niveau est de choisir les attributs qui doivent tre associs

182

aux variables. Lutilisateur doiit au minimum un attribut et au maximum quatre


attributs. Quand plus d'un attribut est utiliss, il sagit du mme attribut (rptitive) ou
un combinaison de plus d'un attribut. Par exemple, nous pouvons avoir objectif ,
objectif , objectif et objectif avec l'oprateur OU pour localiser quatre
objectifs diffrents dans la base de donnes dannotation. Nous pouvons galement
utiliser quatre objectif avec loprateur ET pour trouver quatre objectifs
diffrents dans la base de donne dannotation. Nous pouvons aussi utiliser attribut
objectif avec attribut section annot pour trouver l'existence d'un objectif
avec une section annote du document.

tel-00131856, version 1 - 19 Feb 2007

Aprs avoir choisie ces attributs, pour la deuxime tape, l'utilisateur indique les
valeurs associes aux attributs. Nous notons que les valeurs fonds sur les valeurs
prdfinies pendant la cration dannotation. Nous avons mis en place la
possibilit d'un seul oprateur la fois.

Figure 3.24 : Interface dinterrogation pour choisir les variables a croiser

La runion des "attributs" et les "valeurs" indiqus sont affichs comme dans la
Figure 3.25.

183

tel-00131856, version 1 - 19 Feb 2007

Figure 3.25 : Exemple de rsultat dune interrogation utilisant OU


Oprateurs prolongs
D'autres oprateurs associs la recherche d'information incluent NOT, XOR et
NEAR.
Commande Signification syntaxe
NOT
XOR

NEAR

Explication
Trouve un mot $a o il ny a pas $b.
SAUF
$a || $ab
Exemple information || intelligence
Trouve $a ou $b mais o lexistence
des deux mots ensemble n'est pas
XOR
$a XOR $b
accepts. Exemple information XOR
intelligence.
La possibilit de localiser un mot, une
expression qui est cot dun autre
Proximit
$a NEAR $b mot. Par exemple Information near
intelligence. La proximit dpend de
la prfrence des utilisateurs.
Tableau 3.3 : Les autres oprateurs qui ne sont pas utiliss

Nous n'avons pas employ NOT, XOR et NEAR parce que l'incorporation de ces
oprateurs dans notre systme peut prendre beaucoup de temps dans la recherche de
chaque lment dans une base de donnes d'information textuelle. Elle exige
galement beaucoup de temps pour que nous crivent les programmes qui mettent en
application les logiques.

184

tel-00131856, version 1 - 19 Feb 2007

3.5.3.2.3.

Analyser

Figure 3.26 : Interface pour saisir les textes a analyser dans la base
L'objectif d analyser est de permettre un utilisateur de saisir sa propre requte sur
trois attributs. Les attributs concerns sont Problme dcisionnel , Problme de
recherche dinformation et les Annotation textes. Les valeurs saisies sont
recherches dans la base dannotation. Nous avons utiliss les mmes oprateurs
comme dans le cas d INTERROGER .

Dans linterface Figure 3.25, nous pouvons tre intresser dans les objectifs
dannotation et les annotation sur Problme dcisionnel li a TGV ,
transform a la recherche dinformation information . Linterface nous permettre
de trouver toutes les annotation et lobjectif dannotation lis au problme
dcisionnel TGV ou les problme de recherche dinformation est informationnel.

185

3.5.4. Diverse

3.5.4.1. Alimentation de la base de document


Avec le temps, les documents dans la base de donnes devront tre aliments pour les
meilleures informations. Deux types de documents sont stocks dans notre base de
donnes de document. Nous avons les documents de source stocks dans notre
serveur de projet (http://metiore.loria.fr) et les documents stocks par rfrence. Les
documents sur le serveur de projet peuvent tre mis jour par les individus dsigns.
Nous avons fait le ncessaire pour les mises jour des documents par rfrence. Dans
ce cas, un utilisateur du systme peut ajouter des documents en se rfrant la base
tel-00131856, version 1 - 19 Feb 2007

de donnes de document.

Figure 3.27 : Interface pour alimenter la base de document


On s'attend ce que l'utilisateur fournisse son identifiant. Seulement les utilisateurs
enregistrs peuvent ajouter les nouveaux documents au systme. On s'attend ce qu'il
fournisse une rfrence complte par lien et titre du document en question. Il peut
galement crire quelques remarques au sujet de ces documents.

186

3.5.4.2. Filtration des documents affichs


Autrefois, la liste de documents pour l'annotation devient si longue quil devient
pratiquement difficile que un utilisateur identifie le document intressant pour lui.

tel-00131856, version 1 - 19 Feb 2007

Nous avons pris la disposition de filtrer les documents la convenance de l'utilisateur.

Figure 3.28 : Interface pour spcifier les paramtres de filtration

L'utilisateur peut imaginer les documents intrresant en fournissant un ou deux


identits des documents qui peut tre dans le titre du document. Il peut combiner deux
identits avec l'oprateur boolen de "ET" ou "OU". Les identits trouveront les
documents pertinents au utilisateur.

3.5.4.3. Recherche Plus


Un utilisateur dans la recherche dun document dans la base de document, envoie sa
requte avec des paramtres spcifiques. Dans le cas o il ne peut pas localiser le
document d'intrt dans la base, nous avons imagin quil peut reconduire sa
recherche aux 'autres bases de documentaire (notamment base dannotations). Nous
avons fait le ncessaire pour que les utilisateurs pouvent leur

recherche des

documents dans la bass des annotations qui ont t faire sur les documents.
L'utilisateur peut galement rechercher des documents dans la base de donnes
utilise par google.com. Limplantation complte de la recherche dans la base de
google.com n'a pas t accomplie en raison du temps.

187

Base
dAnnotation

Requte
Etendue

Rponse

Base
dinformation
Reponse

tel-00131856, version 1 - 19 Feb 2007

Requte

Rponse

Utilisateur
Figure 3.29 : Recherche dinformation avec annotation

3.6.
3.6.1.

Domaines dapplication du systme I-AMIE


Application des annotations dans un contexte dIE

Pour appliquer les sytme I-AMIE en IE, nous considrons les annotations avec les
paramtres: priode, utilisateurs et documents. L'ensemble des annotations sur un ou
plusieurs documents, par un ou plusieurs utilisateurs, pendant une priode peut tre
utilis pour la rsolution de problmes de recherche d'informations dans les processus
d'intelligence conomique.

Les annotations peuvent tre analyses par croisement des attributs, par exemple avec
la formule suivante :

dUdTdD
x

188

O dU correspond lensemble des utilisateurs, dT, et dD les priodes des


annotations et les documents annots respectivement (cf. (1) dans tableau 3.4).
Un ou plusieurs de ces paramtres peuvent tre fixs et dautres peuvent changer.
Quand les trois paramtres sont fixs, cela concerne lensemble des annotations
dun utilisateur. Dans le cas o aucun des trois paramtres nest fix, nous nous
intressons toutes les annotations possibles sur tous les documents, par tous les
utilisateurs (ligne 8 dans le tableau 3.4).
On peut s'intresser aux annotations faites par un utilisateur particulier sur un
tel-00131856, version 1 - 19 Feb 2007

document particulier pendant une priode (ligne 7 dans le tablea 3.3). L'objectif peut
tre de voir les ractions de l'utilisateur en face d'un vnement. Cela peut tre
reprsent par :

UD dT
Nous pouvons nous intresser la perception diverse ou aux comprhensions diverses
d'un groupe de personnes sur un sujet particulier (document) pendant une priode
donne (cf. ligne 4), reprsent par :

DT dU
Ligne 4 : Dans le cas des informations lies l'utilisateur, nous pouvons nous
intresser aux perceptions gnrales d'un individu dans une priode sur les sujets
(documents). Les annotations faites par cet individu pendant la priode sur plusieurs
documents peuvent rvler des informations importantes. Cela peut nous donner la
tendance gnrale des vnements autour de lui (son environnement) et ainsi nous
permettre de mieux le caractriser (cf. ligne 6), reprsente par .

UT dD

Dautres attributs peuvent tre utiliss pour le croisement des informations :

189

l'annotateur avec l'enjeu pour connatre les annotateurs qui sont intresss
pour les enjeux spcifiques.

l'objectif avec l'annotateur pour prendre connaissance des annotateurs


qui font les annotations avec les objectifs spcifis.

x
x

le document avec l'objet d'annotation pour savoir les raisons des annotations.
Etc....
paramtres fix Reprsentation

contexte d'annotation

tel-00131856, version 1 - 19 Feb 2007

Toutes les annotations de tous les


documents de tous les utilisateurs
Toutes les annotations de tous

utilstr doc priode

utilisateurs sur tous

les

dUdDdT

les

documents

TdUdD

pendant une priode spcifique


3

Toutes

les annotations de tous

les

DdUdT

utilisateurs d'un document spcifique


Toutes les annotations de tous
4

les

utilisateurs sur un document dans une

DTdU

priode spcifique
5

Toutes les annotations d'un utilisateur X

UdDdT

sur tous les documents


Toutes les annotations d'un utilisateur
6

sur tous les documents

pendant une X

UTdD

priode spcifique
7

.outes les annotations d'un utilisatew

UDdT

sur un document
L'annotation d'un utilisateur sur un
8

document pendant une priode


X
X
X
UDT
spcifique
Tableau 3.4 : Synthse des exploitation des annotations dans le contexte dIE

190

En changeant une ou plusieurs variables, ou en ajoutant ou enlevant quelques


paramtres de document ou dans les paramtres de l'utilisateur, nous pouvons donner
un nouveau regard ce modle. Cela peut nous permettre d'adapter le modle pour un
usage dans un certain nombre de disciplines.
Nous donons dans les sections suivantes quelques exemples de domaines
dapplication.

tel-00131856, version 1 - 19 Feb 2007

3.6.2.

Application dans le domaine bibliographique

Nous pouvons appliquer ce modle pour un usage bibliographique lorsque nous


voulons suivre l'utilisation des documents ou l'habitude des utilisateurs dans une
bibliothque. Dans ce cas, nous voulons voir l'volution dans l'utilisation du matriel
publi ou l'volution des l'utilisateurs. Nous devons seulement ajouter une ou deux
proprits matriaux publis en tant que paramtres du document. Si il est possible
d'enregistrer toutes les utilisations des documents par tous les utilisateurs de tout
temps il est possible de suivre les volutions d'utilisation des documents dans le
temps.
3.6.3. Application dans le domaine d'administration juridique
Comment interprtons-nous l'effet d'une loi promulgu? Comment pouvons-nous
savoir si un ordre public est bien accept ? Le patrimoine collectif et la loi peuvent
tre considrs comme des documents et les ractions ces derniers comme des
annotations. Par exemple, nous pouvons appliquer ce modle pour valuer les impacts
de la loi d'immigration de la France. Comment contrlons-nous les problmes des
banlieues ? Pouvons-nous considrer les annotations par tous les utilisateurs
sur la loi ? Dans le cas o nous avons des ractions publiques sur un ordre, il peut
tre intressant de voir ce qui se produit dans le public. Il convient de noter que le
public se compose de groupes divers et d'idologies diverses. Certains membres du
public peuvent tre dans l'opposition, certains d'entre eux peuvent tre du ct du
gouvernement, dans lopposition ou simplement neutres. En particulier les

191

commentaires sur une loi peuvent tre d'une importance considrable aprs qu'une loi
a t promulgue.

3.6.4. Gestion de dveloppement Open Source


Open source est une mthode de dveloppement de logiciel par plusieurs
programmeurs gographiquement disperss. Le logiciel est souvent distribu
gratuitement.
Les contributions des programmeurs dans un systme Open Source sont
tel-00131856, version 1 - 19 Feb 2007

considres comme des annotations sur les programmes existants. Nous pouvons
identifier quatre lments dans un dveloppement Open Source (a) un utilisateur
est un membre d'espace de collaboration (b) le rpertoire de programmes (c) la base
de donnes d'annotation (d) le temps.
Un utilisateur dans une espace de collaboration aura normalement son identification
(codeutilisateur). Il utilise le code d'identification pour demander un programme
particulier du dpt de logiciel. L'utilisateur reconnat le programme comme tche
commune s'il est un membre de la collaboration. Il est libre d'diter ou de modifier le
programme. Au lieu d'envoyer la modification de programme comme un
remplacement dans le dpt, nous proposons qu'il l'envoie comme paramtre de sa
contribution dans la base d'annotation. Une nouvelle version du programme est cre
avec un nouveau code de version tandis que la version ancienne du programme est
maintenue dans le rpertoire.
Le nouveau programme est dpos au rpertoire avec un nouveau code de version.
L'identit de l'utilisateur est stocke dans l'espace de travail avec la date, la priode et
les codes du programme sur lequel il a travaill (lancien code et le nouveau code).
La base de donnes d'annotation reoit la proposition en tant qu' annotation ainsi
que les paramtres lis la proposition.

192

3.6.5.

Application dans les travaux de ressources ouvertes

Dans une ressource de domaine public, trois entits sont importantes pour nous :
l'utilisateur, la ressource et l'activit commune. Plusieurs activits peuvent tre
importantes pour nous dans un systme de ressource du domaine public. Certaines de
ces activits incluent l'tiquetage (tagging), l'dition, la publication, la contribution et
l'annotation. Nous pouvons favorablement comparer ces activits avec l'activit
d'annotation dans un domaine public.
Les

utilisateurs

des

ressources

publiques

sont

gnralement

disperss

tel-00131856, version 1 - 19 Feb 2007

gographiquement. Ils sont souvent lis par la technologie comme l'Internet ou lis
par un espace public (comme un panneau d'affichage). Le point commun chez les
utilisateurs est l'intrt qu'ils ont pour les ressources communes. Les ressources
peuvent tre une passion pour un objet ou une activit comme la photographie, la
natation ou un document spcifique. En gnral, il n'y a aucune qualification ou chose
exige de l'utilisateur, except son intrt pour l'objet en commun.
Nous caractrisons la zone de travail avec deux composants : le serveur de ressource
et des activits en commun. Le serveur de ressource peut tre l'Internet ou un systme
d'affichage tandis que l'activit en commun peut tre unique ou multiple. Pour la
simplicit, nous identifions des activits en commun en tant qu'tiquetage (tagging),
modification, contribution et annotation. Nous prsentons trois exemples pour
montrer comment notre modle peut tre appliqu dans une zone de travail commun.

3.6.5.1. WIKI
Lune des ressources du domaine public sont des wikis. Un wiki est un type de site
Web qui permet aux utilisateurs d'ajouter, d'enlever, d'diter et de changer la plupart
du contenu d'un site Web facilement, parfois sans la ncessit d'tre inscrit dans le
portail de ce site Web. Cette facilit d'interaction et d'opration met les wikis dans
une position d'avantage pour tre des outils efficaces pour l'criture en collaboration.

193

Le terme wiki peut galement se rapporter au logiciel en collaboration lui-mme


(moteur de wiki) qui facilite l'opration d'un tel site Web ou de certains sites Web
spcifiques de wiki, y compris le site Web wiki, WikiWikiWeb, et les encyclopdies
en ligne telles que Wikipedia.
Il existe des millions de wikis locaux qui sont construits autour des utilisateurs locaux
sur des serveurs de Webs locaux qui exigent un compte personnel sur le serveur de
systmes de wiki. Un exemple de ces wikis locaux est http://wiki.loria.fr.
Quelques langages de programmation prsentent, des plugins, des modules ou des

tel-00131856, version 1 - 19 Feb 2007

APl pour rendre la cration des ressources de domaine public (comme des wikis)
facile. TCL/TK a prsent ce qu'ils appellent le wikit qui est mis en application par
le CGI ou autonome. Le projet de Javapedia est une excution des wikis dans Java
avec des classes telles que WebChanges, WebIndex, WebStatistics, WebPreferences,
CreateANewPage.
Quelques wikis sont dvelopps pour faciliter les discussions professionnelles au lieu
de l'utilisation des blogs. Certains de ces derniers incluent, VBWiki, FoxWiki,
SQLWiki, sql.wikis.com, www.tiddlywiki.com. wiki.wxpython.org, etc...

3.6.5.2. DELICIOUS
del.icio.us est un site web permettant de sauvegarder et de partager ses pages
Internet marqus et de les classer selon le principe de folksonomie par des tags. Il
fut cr fin 2003 par Joshua Schachter dans le but de sauvegarder ses marque-pages
personnels.
L'interface du site repose sur du HTML simple, ce qui rend le site facile d'utilisation.
del.icio.us propose galement de syndiquer son contenu par RSS (Rich Site Summary)
et repose sur la teclmologie des tags. Les tags, sous la forme d'un mot, par exemple:
Sports, Cinma, Internet... pemettent de retrouver facilement les diffrents sites ayant
un rapport avec le mot du tag. Les tags sont choisis par l'utilisateur lui mme, ce qui

194

lui pennet de grer entirement ses marques pages.


Dans delicious, un site Web d'intrt est identifi comme le centre de
communication pour un utilisateur. Ce Site Web a les proprits d'URL, l'tiquette
(tag) et l'annotation (commentaire). L'tiquette place sur cet site Web peut tre lie
une autre site Web utilisant la mme tiquette ou une autre tiquette lie au mme site
Web. Par exemple, un emplacement peut tre tiquet (taggu) avec le mot
ordinateur , une autre personne peut tiqueter le mme site Web avec le mot
technologie . Il est souligner que le mme mot technologie peut tre li un
autre site Web. L'essence de ces tiquettes est de pouvoir voir les faisceaux des mots

tel-00131856, version 1 - 19 Feb 2007

utiliss pour classifier les sites Web.


Les tiquettes (tags) sont simplement des labels pour URLs, choisis pour aider un
utilisateur dans la rcupration postrieure des ces URLs. Les tiquettes ont l'effet
additionnel pour regrouper les URLs. Il n'y a aucun ensemble de catgories fixes ou
de choix officiellement approuvs. Vous pouvez utiliser des mots, des acronymes, des
nombres, n'importe qoui dimportant pour un utilisateur, sans se demander si cest
important pour un autre.
Le problme avec ce type d'tiquetage est que les individus sont libres d'utiliser
n'importe quelle langue ou symbole pour tiqueter un site Web. Il peut devenir trs
discordant de ne pas avoir un vocabulaire contrl pour tiqueter des sites Web. Nous
pouvons avoir un centre de contrle attach au site Web pendant l'tiquetage. Ce
centre de contrle peut agir en tant que thesaurus pour contrler l'utilisation de mots
dans l'tiquetage. Les mots utiliss sont alors considrs comme les annotations.

3.6.5.3. Flickr
Flickr est un site Web qui permet aux utilisateurs de tlcharger, partager des photos
et d'tiqueter chaque photo avec des mots descriptifs (Marlow et al, 2006). Les autres
utilisateurs peuvent alors faire des recherches sur ces tiquettes, leur permettant de
trouver et de prsenter leurs observations sur les photos. La communaut active et les

195

dispositifs de partage de Flickr ont attir des millions d'autres utilisateurs. En dehors
du fait que les utilisateurs externes peuvent rechercher des photos dans la base de
donnes, ils peuvent galement avoir la permission de classer des photos qui
appartiennent aux autres utilisateurs (Hidderley et Rafferty, 2006). Flickr est la fois
un site et un systme d'change de photos.
Flickr se fond sur l'interprtation personnelle des images. Le problme avec un
systme comme Flickr est que les images sont interprtes et fondes sur la
perception des couleurs et dautres considrations environnementales. Par exemple,
vous pouvez explorer des photos sur Flickr un article bien choisi comme les images
tel-00131856, version 1 - 19 Feb 2007

classifies en tant que boy . Les mots comme "girl", "kid", "eyes", "play",
"woman", "people", "love" sont tiquets avec "boy 32 . Comment pouvons-nous
connaitre la relation entre deux concepts reposant sur les images ?
Un autre problme est le problme du vocabulaire et de l'orthographe. Par exemple le
mot "fils" peut tre utilis pour qualifier un garon ou garons . Puisque nous
tiquetons les images et non les textes, un autre problme inhrent est
l'internationalisation. Comment rconcilions-nous des mots dans les langues
diffrentes ?
Nous pouvons appliquer notre modle d'annotation pour rsoudre certains de ces
problmes. Dans ce cas, chaque tiquette est considre comme une annotation et est
envoye la base de donnes d'annotation. Les tiquettes sont envoyes la base de
donnes d'information seulement aprs qu'ils auront t contrls. Avec le concept de
notre modle, il sera possible d'identifier l'identit des utilisateurs apportant des
contributions.

32

http://flickr. corn/photos/tags/boy/clusters/

196

3.6.6. Application globale


Il est possible d'appliquer ce modle dautres situations de gestion de l'information,
de recherche de l'information et de travail en collaboration. Les conditions
importantes sont de pouvoir associer l'objet central (cf. dfinition du document) avec
les paramtres ncessaires et que les activits associes puissent tre rduites une
sorte d'annotation si les conditions sont remplies. Nous pensons que les applications

tel-00131856, version 1 - 19 Feb 2007

possibles de modles sont nombreuses.

3.7. Le test et lanalyse du systme I-AMIE


Le premier objectif dans l'analyse de la mise en oeuvre du systme I-AMIE tait de
comprendre la perception et la facilit d'utilisation auprs du public. Trois ensembles
de personnes ont t invits utiliser le systme : les tudiants de premire anne de
master en information scientifique et technique (b) les tudiants prparant une licence
en informatique l'universit d'Ibadan, Nigeria et (c) le grand public. Le grand
public inclut les utilisateurs ayant accs Internet dans le monde entier.
Le questionnaire intitul Systme d'annotation en IST (Intelligence conomique) a
t envoy aux utilisateurs du systme I-AMIE. Le questionnaire avait pour objectif
de connatre les problmes lis l'utilisation du systme d'annotation sur
http://www.loria.fr/~robert/annot. Les questions qui ont t prsentes sont
regroupes en cinq groupes pour identifier la perception et connatre la possibilit
d'amliorer du systme. Les six groupes de questions sont :
(a) Gnral (b) Contenu (c) Prsentation (d) Efficacit (e) Appel et convenance et
(f) Facilit dutilisation.
Le questionnaire complte est prsenter dans lannexe 1.
Lentretien avec les utilisateurs montre que les utilisateurs nont pas suffisamment
utilis le systme pour comprendre son fonctionnement. Ils pensent que la
prsentation des informations dans le systme est logique et pertinents. En revanche,

197

ils ont sugr dajouter quelques exemples de formulaires (remplir). Selon eux, le

tel-00131856, version 1 - 19 Feb 2007

systme provoque une comprhension profonde du domaine dIE.

198

Chapitre 4
La vie est enregistrement humain. Les annotations peuvent tre les enregistrements d'utilisations de la vie.

4. Conclusions gnrale
4.1. Conclusion
Rappelons que notre hypothse est que nous pensons que lannotation devrait

tel-00131856, version 1 - 19 Feb 2007

contribuer la transformation de linformation collecte en des informations


valeur ajoute qui seront plus adaptes pour la prise de dcision. Associes cette
hypothse, nous avons identifi les problmatiques suivantes :
a. La recherche de l'information, pralable une prise de dcision, peut-elle tre
renforce par des outils d'annotation ?
b. Peut-on guider, par un modle appropri, le processus d'annotation qui peut
soutenir la recherche d'information ?
c. Comment les informations annotes peuvent-elles tre collectes pour aider
la prise de dcision ?
d. Comment l'information annote peut-elle tre utilise pour la prise de
dcision ?
Nous avons retenu quatre principaux composants dans le cadre de notre tude : le
document, lutilisateur, lannotation et la priode des annotations.
Un document a t dfini dans un sens trs large de sorte que notre tude puisse
tre applique une grande varit de domaines. Le document a t dfini comme un
conteneur de l'information, prcisment comme une trace des activits humaines.
Pour que nous puissions formuler un modle d'annotation pour la recherche
d'information dans des processus d'IE, nous avons tabli notre travail sur des
documents lectroniques crits. Plusieurs de leurs caractristiques ont t identifies
pour notre tude. Nous avons pris en compte le format et les autres caractristiques

199

bibliographiques des documents.


Un document est la base de n'importe quelle annotation. Le mot annotation a t
considr comme un processus (une action) et galement comme un objet. Nous
avons montr que l'annotation est une rfrence un document, et la majeure partie
du temps une annotation se trouve sur le document de base. Le lien entre le
document annot et l'annotation ne constitue pas ncessairement un lien physique.
Nous avons dmontr que nous pouvons avoir diffrents types d'annotation tels que
des graphiques et des crits. Notre souci a port sur l'annotation crite. Nous avons
montr que l'annotation peut tre compare plusieurs autres terminologies
tel-00131856, version 1 - 19 Feb 2007

notamment l'indexation. Les diffrences et les similitudes entre l'annotation et ces


terminologies ont t prsentes dans la section 1.4.
Nous avons soulign l'importance du rle d'un utilisateur dans un processus
d'annotation. L'annotation sans rfrence son crateur n'a pas de valeur dans le
processus de la prise de dcision.
Nous considrons l'utilisateur d'un document du point de vue de lecture et de
lannotation. Lannotateur est dabord un lecteur de document avant de devenir un
annotateur. Nous ne nous sommes pas attachs au profil d'un crateur de document
parce que ses caractristiques n'ont pas d'importance dans notre travail. Nous avons
prcis qu'un annotateur pouvait tre le crateur du document annot.
La priode d'annotation est lattribut temporel de lannotation, exprime par une
date et heure. Le mme utilisateur ne peut pas forcment faire le mme type
d'annotation des priodes diffrentes.
Nous avons tudi deux diffrentes approches dannotation : l'une utilise pour la
cration et l'autre utilise pour l'organisation du contenu d'annotation. Le fondement
de ces approches port sur des cadres et des modles spcifiques dannotation. Les
cadres comme le Common Annotation Framework de Microsoft, ANNOTEA,
Linguistic Annotation Framework et Extensible MuitiModal Annotation framework

200

ne sont pas suffisants dans la cration et l'organisation des annotations pour la


recherche d'information. Nous avons examin quelques modles existants pour la
cration d'annotation, parmi lesquels certains sont fonds sur l'organisation du
contenu d'annotation (ontologique, smantique) et dautres sur la technologie.
Puisque nous navons pas trouv un modle satisfaisant pour notre besoin, nous
avons formul notre propre modle.
Notre modle s'appel AMIE (Annotation Model for Information Exchange), le
modle d'annotation pour l'change de l'information. Le modle est fond sur le fait
qu'une annotation peut tre faite pour prendre en charge les caractristiques du
tel-00131856, version 1 - 19 Feb 2007

document, de lannotateur et la priode de lannotation. Nous croyons que ces


caractristiques sont suffisantes pour rendre une annotation exploitable dans le cadre
de la recherche d'information pour la prise de dcision. Chacune de ces
caractristiques a t considre en dtail. Nous avons propos une architecture
fonde sur ce modle qui permet la cration, le stockage et l'exploitation des
annotations dans un environnement d'IE. Nous avons developp les bases de donnes
associes.
Nous avons mis en application ce modle sur une base de donnes bibliographiques
disponible dans l'quipe de recherche SITE-LORIA. Nous avons not que ce modle
peut tre appliqu dans plusieurs secteurs. L'application gnrale du modle
considre un objet en tant qu'un document et son utilisation ou les observations sur le
document comme les annotations. L'application de ce modle peut tre classifie
dans les groupes suivants :
x

Systme d'valuation,

Systme de rtroaction,

Systme de collaboration,

Systme pour le partage des expriences par les annotations,

Systeme de partage des ressources distribues,

x
x

Systme d'aide a la dcision,


Systme dobservation des usages des documents.

201

Nous avons galement tudi certaines applications spcifiques de ce modle comme


dans le cas de delicious, flickr et wikis.

4.2. Perspectives
Ecologie d'annotation
Certaines autres considrations non ngligeables dans la cration et l'utilisation de
l'annotation pour la recherche de l'information peuvent inclure les questions

tel-00131856, version 1 - 19 Feb 2007

suivantes :
x

O les documents sont-ils utiliss ? (localisation)

Quels sont les objets ncessaires pour rendre le document utilisable ?


(technologie)

Quel traitement serait ncessaire pour rendre le document utilisable ?


(processus)

Quel a t l'tat initial et final du document avant et aprs un usage ?

Il peut tre ncessaire de savoir exactement o un document a t utilis. En effet,


quelques influences culturelles et gographiques peuvent tre impliques dans
l'utilisation d'un document. Par exemple, tablant sur notre dfinition gnrale du
document et de l'annotation, nous pouvons tudier les annotations parmi les socits
musulmanes. Pour eux, il est interdit d'crire sur le coran. Serait-il possible d'intgrer
toutes nos propositions si nous considrons le document coran dans les pays
musulmans ?
Nous ne pouvons pas indiquer comment une annotation sur un document sera utilise
mais il peut tre important de savoir exactement comment un document a t utilis.
On peut utiliser un document pour demander une action ou juste pour l'information.
Un document peut tre utilis pour poser une question etc. Il peut tre important
d'noncer avec prcision le contexte de l'utilisation d'un document dans certains cas.
Certains types de document ne peuvent tre utiliss seuls sans connatre dautres
documents qui sont ncessaires leur comprhension. Comme nous le savons, les

202

livres sont en rapport avec d'autres documents. Les documents secondaires (comme
les catalogues dans les bibliothques) dpendent de leurs sources primaires. Ceci
implique que le document secondaire ne peut tre utilis seul dans certaines
circonstances.
Quel traitement serait ncessaire pour rendre un document utilisable ? Nous pouvons
tre intresss par les processus qu'un document utilis a subis avant qu'il puisse tre
utilis dans le processus d'une annotation. Dans la plupart des cas, nous prfrerons
une situation o rien n'est fait sur le document original avant son utilisation. Il est
important de noter que ce ne sont pas tous les documents qui sont dans cette situation.

tel-00131856, version 1 - 19 Feb 2007

Il y a des documents qui doivent tre traduits d'une langue l'autre avant leurs
utilisations.
Nous devrions galement pouvoir indiquer l'tat initial et l'tat final d'un document
avant et aprs son utilisation.

Diversit de points de vue sur les documents


Ce travail n'a pas essay d'appliquer certains des rsultats fondamentaux dans
certaines disciplines comme les mathmatiques et la bibliomtrie. L'attention a t
porte sur la faon dont la recherche d'information pour l'IE peut tre amliore avec
un modle d'annotation. Un regard critique sur lannotation demande une application
de technologie smantique. Par exemple, nous avons tabli que deux individus
n'annoteront pas le mme de document la mme manire. Deux individus peuvent
parfois annoter le mme document diffremment simplement de par les
terminologies utilises. Par exemple, un utilisateur peut annoter un document avec le
mot gographie. Ce mme document peut tre annot avec le mot science de la
terre par un autre utilisateur. Dans ce cas, la base d'annotation contiendra le mot
gographie et science de la terre . Les deux mots sont essentiellement les
mmes. Il est donc impratif que les travaux ontologiques et smantiques puissent
tre adapts pour augmenter les rsultats de ce travail.

203

Une autre point qui peut tre considr dans les processus d'annotation concerne les
questions lies au langage. Comment pouvons-nous rconcilier le problme de
syntaxe de langue pour augmenter le stockage et la rcupration de l'information
dans une base de donnes d'annotation ? Typiquement, la morphologie de la langue
peut considrablement influencer la signification de l'information dans les bases
d'annotation. En effet, un problme caractristique d'annotation est un langage utilis
par lannotateur. Par exemple, dans la mise en oeuvre de ce travail faite en anglais et
en franais, nous pouvons avoir deux utilisateurs diffrents qui utilisent deux langues
diffrentes. Comment rconcilions-nous les mots en provenance de langues

tel-00131856, version 1 - 19 Feb 2007

diffrentes ?
Nous pouvons galement vouloir distinguer toutes les convergences ou divergences
dans les annotations d'un document. Par exemple, comment pouvons-nous utiliser la
convergence de l'annotation ou ses divergences pour authentifier les interpretations et
informations ajoutes par des diffrents utilisateurs d'un document ?

Exploitation de la base dannotations


Nous ne nous somme pas intresss la faon d'analyser les rsultats issus de la
question envoye une base de donnes d'annotation en terme de pertinence. Bien
sr nous avons prcis que nous pouvons utiliser SQL pour valuer le contenu de la
base de donnes d'annotation. Il est mme possible d'utiliser des outils comme
http://metiore.loria.fr pour exploiter la base de donnes d'annotation. Nous
soulignons que le contenu du rsultat est laiss la discrtion de l'utilisateur et d'un
travail supplmentaire.
Des approches diffrentes ont t suggres comme la faon de rechercher de
linformation dans une base de donnes en exploitant une base d'annotations.
L'application de Topic Maps peut tre intressante dans la recherche dinformation
dans la base d'annotations. Nous croyons que quand la base de donnes d'annotation
devient grande elle peut tre difficile de trouver exactement l'information cherche.
Nous prsentons ce que peut tre le scnario probable de la recherche d'information

204

dans une base d'annotations avec Topic Maps.


Sujet 1
Sujet 2

Annotation 1

Sujet 3

Document 3
Annotation 2

Annotation 5

Document 4

Utilisateur 2

tel-00131856, version 1 - 19 Feb 2007

Utilisateur 1

Figure 4.1 : La mise en correspondance des sujets avec les utilisateurs et les
annotations
Si le concept de topic maps est appliqu dans la recheches dinformation dans les
bases d'annotation, il sera possible de voir d'un coup d'oeil le nombre d'annotations
par sujet particulier. Nous pouvons galement voir comme sur le schma figure 4.1,
les utilisateurs qui sont intresss par un sujet. Nous voyons dans le schma
comment les sujets sont associs aux annotations ou les sujets avec les utilisateurs.
La diffrence entre cette approche et notre systme est que, les sujets sont
indpendants des attributs.

Une autre possibilit qu'on pourrait appliquer est le concept des SUMS (System for
Universal Media Searching) pour la recherche dans les bases d'annotations. Comme
point de dpart SUMS utilise le principe des questions: Quoi ? Qui ? O ? Quand ?
Comment ? et Pourquoi ? Le Qui mne la connaissance des personnes. La
question Quoi mne aux objets ; La question O mne aux endroits. La
question Quand mne aux vnements et aux schmas chronologiques. La
question Comment mne aux instructions. Les questions Pourquoi mnent
aux raisons et aux causes. Le choix d'une question mne aux listes, dont les sousensembles sont alors choisis pour atteindre d'autres listes et les ordres.

205

Situation actuelle dans la perspective


Nous avons pu dmontr les utilisations possibles de ce modle plusieurs domaines.
Notamment, nous avons eu des publications dans des confrnces pour demontrer les
applications possibles du modle. Une publication avec un professeur d'universit de
Grand Valley State, Allendale, Michigan, Etats-Unis a t ralise, portant sur
l'application de notre modle pour l'valuation des participations des tudiants dans
une tche de programmation en commun (Evaluating Student Participation in Open
Source Software Development with an Annotation Model, The Fourth IASTED

International Conference on Knowledge Sharing and collaborative engineering,


tel-00131856, version 1 - 19 Feb 2007

KSCE 2006, November 29-December l, 2006, St. Thomas, US Virgin Islands, USA,
2006).
Nous recherchons galement une manire d'valuer le contenu de l'annotation en
utilisant des concepts de Topic Maps intgrant SUMS (System for Universal
Multimedia Searching).

Nous navons pas pu dvelopper tous les modules ncessaires pour lvaluation du
systme I-AMIE pour deux raisons principales :

Pour evaluer le systme, nous avons besoin des annotations par plusieurs
annotateurs et pendant une priode assez longue. Vues des contraintes de
temps nous navons pas pu avoir plusieurs annotations dun mme annotateur
sur une priode suffisament longue. Ainsi, nous navons pas pu observer
lvolution des habitudes des annotateurs.

La programmation est techniquement lourde raliser, ce qui ncessite


davantage de temps de dveloppement.

Notre hypothse tait que lannotation devrait contribuer la transformation de


linformation collecte en des informations valeur ajoute qui seront plus adaptes
pour la prise de dcision.

206

Nous avons prouv avec notre modle AMIE et le systme I-AMIE que cest
possible de contribuer la transformation de linformation collecte par les
annotations pour donner de la valeur ajoute aux informations collectes pour la

tel-00131856, version 1 - 19 Feb 2007

prise de dcision (dans chapitre 3).

207

208

tel-00131856, version 1 - 19 Feb 2007

Bibliographies
(ACSIOME, 1989)
ACSIOME, 1989, Modlisation dans la conception des systmes d'information avec
exercices comments, MASSON, Paris
(Almeida, 1995)
D'almeida Fabrice, 1995, Images et propagande, Castennan-Giunti, Pages 91-95

tel-00131856, version 1 - 19 Feb 2007

(Ansoff, 1965)
I. Ansoff, 1965, Corporate Strategy: An Analytic Approach to Business Policy for
Growth and Expansion. McGraw-Hill.
(Bargeron et al, 2001)
Bargeron David, Gupta Anoop, and Brush Bernheim A.J., 2001, A Common
Annotation Framework, Technical Report MSR-TR-200l-l08, Microsoft Research,
Microsoft Corporation, Redmond, W A 98052
(Brub, 1991)
Brub Louise, 1991, Terminologie de neuropsychologie et de psychologie du
comportement, Les ditions de la Chenelire, Montral, Pp 176
(Bird et al, 2000)
Bird Steven, Day David, Garofolo John, Henderson John, Laprun Christophe and
Libennan Mark, 2000, ATLAS: A Flexible and Extensible Architecture for
Linguistic Annotation, Proceedings of the Second International Conference on
Language Resources and Evaluation, pp. 1699-1706, Paris: European Language
Resources Association, 2000
(Bouaka, 2004)
Bouaka Najoua, 2004, Dveloppement d'un modle pour l'explicitation d'un
problme dcisionnel : un outil d'aide la dcision dans un contexte d'intelligence
conomique, Thse doctorat de l'universit Nancy 2, Sciences de l'information et de
la communication, PP 209
(Bouaka and David, 2003)
Bouaka Najoua, and David Amos, 2003, Modle pour l'Explicitation d'un Problme
Dcisionnel : Un outil d'aide la dcision dans un contexte d'intelligence
conomique. Editor: Amos, David, Intelligence Economique : Recherches et
Nancy,
14,
15
avril
2003,
URL:
Applications
http://www.inist.frliera/fichiers/ieral1.pdf
(Bourgeois, 1980)
L. J. Bourgeois. Strategy and environment: a conceptual integration. Academy of
management review, vol. 5, n1, p. 25-39, 1980.
(Bourret, 2004)
Bourret Christian, 2004, Data concerns and challenges in health: Networks,
information systems and electronic records, Data Science Journal, Volume 3, 17

209

September 2004, Pp 96-113.


(Boutelle, 2003)
Boutelle, Steven W., 2003, Anny Network Centric Operations and Warfare: Putting
Power to the Edge" MILCOM 2003 Transformational Strategies Panel. Boston, MA.
16 October 2003,
http://www.afcea.org/pastevents/milcom2003/Boutelle_files/ 09/09/2006

tel-00131856, version 1 - 19 Feb 2007

(Boutelle, 2004)
Boutelle Steven W., 2004, Making the Move to a Network Centric Army, AUSA
Institute of Land Warfare Breakfast, 09 Sept 2004,
http://www.army.miIlCIOG6/references/briefings/Boutelle/MILCOM2004Keynote.
ppt
(Bringay et al, 2004)
Bringay Sandra, Barry Catherine, and Charlet Jean, 2004, Les documents et les
annotations du dossier patient hospitalier, Information-Interaction-Intelligence,
Volume 4, n1, Juillet 2004
(British Police, 2003)
British Transport Police, 2003, Effective Approaches to the Removal and
Prevention of Vandalism and Graffiti on Public Transport- Final Report: The Case
Studies and Emerging Issues, Department for Transport Prepared by Crime Concern:
London, Pp 54
(Brusilovsky, 1996)
Brusilovsky Peter, 1996, Efficient technique for adaptive hypermedia, Intelligent
hypertext: Advances techniques for the world wide web. Lecture notes in computer
science, 1326, Berlin, Spring-Verlag, 12-30
(Brush et al, 2002)
Brush B., Bargeron, D., Grudin, J., and Borning A., Gupta, A., Supporting
Interaction Outside of Class: Anchored Discussion ys. Discussion, online,
Proceedings of Computer Support for Collaborative Learning (CSCL 2002),
http://newmedia.colorado.edu/cscl/, 2002, visited on January 2003
(Buckland, 1998)
Buckland Michael, 1998, What is a document ? Journal of the American Society for
Information Science, Volume: 48, (9) Pp: 804-809
(Cadiz et al, 2000)
Cadiz U, Gupta Anoop et Grudin Jonathan, 2000, Using Web Annotations for
Asynchronous Collaboration Around Documents, CSCW'OO, Philadelphia,
Microsoft Research, Collaboration & Multimedia Group, Date: December 2-6, 2000
(Campbell, 2003)
Campbell Eoin, 2003, Creating Accessible Online Content Using Microsoft Word,
XML Workshop Ltd: Irish Learning Technology Association EdTech 2003,
Waterford, Ireland, Pages: 1- 10, Date: 23May, 2003

210

(Carayon, 2003)
Carayon Bernanrd, 2003, Intelligence conomique, comptitivit et cohsion
sociale Pp: 79, Date: June 2003
(Carter et al, 2004)
Carter Scott, Churchill Elizabeth, Denoue Laurent, Helfman Jonathan and Nelson
Les, 2004, Digital Graffiti: Public Annotation of Multimedia Content, CHI 2004,
April 24-29, 2004, Vienna, Austria. http://www.fxpal.com!publications/FXPALPR-03-263.pdf

tel-00131856, version 1 - 19 Feb 2007

(Casallas-Gutierrez, 1996)
Casallas-Gutierrez Rubby, 1996, Objets historiques et annotations pour les
environnements logiciels, Thse de Doctorat l'Universit Joseph Fourier Grenoble
l, May 1996.
(Cauvin et al, 1994)
Cauvin, P. and Cailloux, G., 1994, Les types de personnalits: La mthode MBTI
Edited by ESF, ESF - Psychologie - Psychanalyse, Paris, Pg 11-32
(Chien et al, 2001)
Chien Shu-Yao, Tsotras Vassilis J. and Zaniolo Carlo, 2001, Efficient Management
of Multiversion Documents by Object Referencing, Proceedings of the 27th VLDB
Conference, Roma, Italy, 2001
(Chou, 2004)
Chou Wu, Dahl Deborah A., Johnston Michael, Pieraccini Roberto and Raggett
Dave, 2004, EMMA: Extensible MultiModal Annotation markup language, W3C
Working Draft 14 December 2004
(Clay, 2005)
Clay, Shirky, 2005, Ontology is overrated: Categories, Links and Tags, Journal of
Networks, Economics and Culture, May 31, 2005
(Coadic, 1994)
Coadic, Yves-Franois. Le, 1994, La science de l'Information, PUF,Paris
(CEE/ONU, 1995)
Communication des dlgations Autrichienne et Suisse, 1995, Recommandation
CEE/ONU no 25, Relative l'utilisation de la norme des nations unies concernant
l'change de donnes informatis pour l'administration, le commerce et le transport
(edifact/onu), Nations Unies, Pages: 1-9, 18-19 septembre 1995
(Cook, 2004)
Cook John, Leathwood Carole and Oriogun Peter, 2004, Online conferencing with
multimedia students: monitoring gender participation and promoting critical debate
The e-Journal of the LTSN-ICS,
http://www.ics.ltsn.ac. nklpublitalics/issue2/ cook/006 .html (24/04/2006)

211

(Corbley, 2005)
Corbley, Kevin P., 2005, Spatial Information Management
http://www.military-geospatial-technology.com!article.cfm ?DocID=861 (20/02/06)
(Crossen et al, 2001)
Crossen, A., Budzik, J., Warner, M., Birnbaum, L., and Hammond, K., 2001, XLibris:
An Automated Library Research Assistant, Proc. 2001 International Conference on
Intelligent User Interfaces,
URL:http://www.infolab.northwestem.edulinfolab/downloads/papers/paperl0103.pdf
(Darmon, 1993)
Darmon, R. Y., 1993, Management des ressources humaines des forces de vente,
Economica, Paris

tel-00131856, version 1 - 19 Feb 2007

(Darses, 1994)
Darses, F., 1994, Gestion des contraintes dans la rsolution de problmes de
conception, Universit de Paris VIII, Saint-Denis.
(Davis et al, 1995)
Davis James R. and Huttenlocher Daniel P., 1995, Shared Annotation for
Cooperative Learning,
http://www .cs.comel1.edulhome/dphlannotation/annotations.html (14/0712005)
(David et al, 2001)
David Amos., Bueno David and Kislin Philippe, 2001, Case-Based Reasoning,
User model and IRS. The 5th World Multi-Conference on Systemics, Cybernetics
and Informatics - SCI'2001. International Institute of Informatics and Systemics
(II1S).
(Orlando,
USA).
2001.
http://isdm.univtln.fT/PDF/isdm111isdm11a98_amos.pdf, 31/01/2005
(David, 2005)
David Amos L'Intelligence conomique et Les Systmes d'Information:
Problmatiques et approches de solutions, in "Veille stratgique: Mise en oeuvre et
valorisation de la veille stratgique en entreprise", Algrie Tlcom, Alger, Algrie,
Juin 2005
(Davison, 1995)
Davison Robert M., 1995, A Survey of Group Support Systems: Technology and
Operation, Dept of Information Systems, City University of Hong Kong. Hong
Kong, Pages: 1-38
(Delecroix , 2005)
Delecroix Bertrand, 2005, La mesure de la valeur de l'information en Intelligence
Economique: Application la mise en place de solutions pour accrotre la plusvalue d'information labore dans le contexte d'un intra net, Thse doctorat de
Universit de Marne-la-Vallee, Information Scientifique et Technique,
http:// quoniam. univ-tln.fT/jurys/Delecroix/DelecroixThese.pdf 11/0812006
(Denoue et al, 2000)

212

Denoue, L. and Vignollet. L., 2000, An annotation tool for Web browsers and its
applications to information retrieval. Proceedings of RIA 0200, Apr. 2000.
http://www.fXpa1.comlpeople/denoue/publications/riao2000.pdf. 31/0312005
(Conseil Switzerland,2005)
Dpartement Fdral des Affaires Etrangres, 2005, Rapport annuel 2004 du
Conseil fdral sur la participation de la Suisse au Conseil de partenariat euroatlantique et au Partenariat pour la paix, Partnership for Peace, Switzerland

tel-00131856, version 1 - 19 Feb 2007

(Desmontils et al, 2003)


Desmontils E., Jacquin C, and Simon L., Vers un systme d'annotation distribu,
2003,http://www.sciences.univ-nantes.fr/irinNie!RR/RR-IRIN2003-01.pdf
17/07/2004
(Dewees, 1995)
Dewees Peter A., 1995, Social and economic incentives for smallholder tree
growing: A Case Study from Murang'a District, Kenya, Food and Agriculture
Organization of the united nations, Uppsala, Sweden
(Dohar, 2003)
Dohar, Vic, 2003, Adding and Editing Annotation Using GEMS, Natural Resources
Canada, ESS Info Division, Publishing Services Subdivision, Pages: 1-10
(Dou et al, 2005)
Dou H., Leveill, V., Manullang, S. and Dou JM Jr, 2005, Patent analysis for
competitive technical intelligence and innovative thinking, Data Science Journal,
Volume 4, 31 December 2005, Pg 209-236,
http://www.jstage.jst.go.jp/article/dsj/4/0/209/ydf
(Dou et al, 1987)
Dou H., Hassanaly P., Latela A., and Milon M., 1987, Etudes de cas: le traitement
de l'IST par les indicateurs scientomtriques, Bulletin des bibliothques de France,
Vol. 32, No 3, pp. 220-226
(Dubois et al, 1997)
Dubois Didier, Fargier Hlne, Prade Henri, 1997, Decision-Making under Ordinal
Preferences and Comparative Uncertainty, Journal of Uncertainty in Artificial
Intelligence
(Dumas, 2006)
Dumas Philippe, 2006, VETIC & Territoires : Quels dveloppements ? Territoire &
Mondialit, Universit de Franche comt, Besanon, 9-10 juin 2006,
http://isdm.univ-tln.fr/PDFlisdm26/4.Dumas.pdf
(Ellul, 1967)
Ellul Jacques, 1967, Histoire de la propagande. Paris : Presses Universitaires de
France, 1967
(Encyclopredia, 2006)

213

Encyclopredia Britannica, 2006, Physical science, Encyclopredia Britannica


Premium Service. URL: http://www.britannica.com/eb/article?tocId=32545.
08/06/2006
(Farrell et al, 1992)
Farrell R.A., C.J. Pearson, and L.C. Campbell, 1992, Relational databases for the
design and construction of maintainable systems in agriculture. Journal of
Agricultural Systems, Volume: 38, Pages: 411-423.

tel-00131856, version 1 - 19 Feb 2007

(Farrell et al, 2005)


Farrell C., Ross and Maness R. Thomas, 2005, A relational database approach to a
linear programming-based decision support system for production planning in
secondary wood product manufacturing, Journal of Decision Support Systems,
Volume: 40, Issue: 2, Pages: 183-196, Date: August 2005
(Francica, 2004)
Francica J oe, 2004, Intergraph's GeoMedia WebMap Publisher
Overview
Date:
May
29,2004,
http://www.locationintelligence.netiarticles/S8S.html

Product
URL:

(Futtersack et Bolf, 1999)


Futtersack Philippe and Bolf Didier, 1999, XML and related standards for data
warehouses Paris, URL:
http://www.infoloom.comlgcaconfs/WEB/philadelphia99/futtersack.HTM#Nl
(Garshol, 2002)
Garshol, Lars Marius, 2002, What Are Topic Maps
URL: http://www.xml.comlpub/a/2002/09/111topicmaps.html 07/04/06
(Geyer-Schulz et al, 1999)
Geyer-Schulz Andreas, Koch Stefan and Schneider Georg, 1999, Virtual Notes:
Annotation on the WWW for Learning Environments, Proceedings of the 5th
Americas Conference on Information Systems, Pages: 136-138,
http:// citeseer .ist.psu. edu/263 780 .html 24/03/2006
(Gonzalez-Barahoma, 2000)
Gonzalez-Barahoma Jesus M., 2000, Free Software/Open Source: Information
Society opportunities for Europe? Working group on Libre Software, version 1.2,
http://eu.connecta.it
(Gonzalez, 200S)
Gonzalez Guadamuz Andrs, 2005, Legal challenges to open source licences, 2:2
SCRIPT-ed 301,
http://www.law.ed.ac.uk/ahrb/script-ed/vol2-2/challenges.asp 19/07/2006
(Goria et al, 2004)
Goria, Stphane and Geffroy, Philippe, 2004, Le modle MIRABEL : un guide
pour aider questionner les Problmatiques de Recherche d'Informations. Veille
Stratgique Scientifique et Technologique - VSST'2004 (Toulouse), 2004. 5p.

214

(Goria, 2006)
Goria Stphane, 2006, L'expression du problme dans la recherche d'informations :
application un contexte d'intermdiation territoriale, Janvier 2006, Thse doctorat
de l'universit Nancy 2, Sciences de l'information et de la communication, Pp 6S6
(Gupta et al, 2001)
Gupta, David Bargeron; A.J. Bernheim Brush; Anoop, 2001, A Common
Annotation Framework, Microsoft Research, Redmond, Pages: 1-22, November
2001

tel-00131856, version 1 - 19 Feb 2007

(Gustavo et al, 1998)


Gustavo Alonso, Fabio Casati, Harumi Kuno and Vijay Machiraju, 1998, Web
Services: Concepts, Architectures and Application, Springer-Verlag, Berlin, Pg:
115-120
(Hammer et al, 1995)
Hammer Joachim, Garcia-Molina Hctor, Ireland Kelly, Papakonstantinou Yannis,
Ullman Jeffrey, and Widom Jennifer, 1995, Information translation, mediation, and
mosaic-based browsing in the TSIMMIS system, Proceedings of the 1995 ACM
SIGMOD Record, v.24 n.2, p.483, May 1995, International Conference on
Management of Data
(Handschuh et al, 2003)
Handschuh S., Staab S., and Volz R., 2003, On deep annotation, Proceedings of
International World Wide Web Conference, Pp 431-438.
(Handschuh and Staab, 2003)
Handschuh S. and Staab S., 2003, Annotation for the semantic Web, Frontier ln
Artificial Intelligence and Application, Vol 96, IOS Press, Amsterdam, Pp 46-60.
(Harris, 2003)
Harris, Nomi L., Genotator: 2002, A Workbench for Sequence Annotation,
Lawrence Berkeley National Laboratory, Human Genome Informatics Group
Berkeley
(Harvard, 2004)
Harvard Family Research Project: Harvard Graduate School of Education, 2004,
Detangling Data Collection: Methods for Gathering Data. Out of School Time
Evaluation Snapshots, number 5, Pages: 1-6
http://www . gse.harvard.edulhfip/ content/proj ects/ afterschoollresources/
snapshot5. pdf 24/03/06
(Hayes et al, 1998)
Hayes, J. and Allinson, C. W., 1998, Cognitive style and the theory and practice of
individual and collective learning in organisations, Journal of Human relations,
Volume: 51, Issue: 7

215

(Heck et al, 1999)


Heck R. M., Luebke S. M., and Obermark C. H., 1999, A Survey of Web
Annotation Systems,
http://www.math.grin.edul-rebelsky/Blazers/Annotations/Surnmer1999
/Papers/survey_ pa per.html 10/04/2006
(Hearst et al, 1998)
Hearst M.A., SchlkopfB., Dumais S., Osuna E., and Platt J.. 1998, Trends and
Controversies - Support Vector Machines, IEEE Intelligent Systems, 13(4): 18-28,
1998.

tel-00131856, version 1 - 19 Feb 2007

(Hidderley et al, 2006)


Hidderley Rob and Pauline Rafferty, 2006, Flickr and Democratic indexing:
Discipling desire lines, Advances ln Knowledge organlzation, Volume: 10, Pp: 405411, 4 - 7 July 2006
(Heiner et al, 1999)
Heiner Jeremy M., Hudson Scott E., Tanaka Kenichiro, 1999, The Information
Percolator: Ambient Information Display in a Decorative Object, ACM Symposium
on User Interface Software and Technology, Issue: November, Pp: 141-148
(Horrocks et al, 2000)
Horrocks, D., Fensel, J. Broekstra, S., Decker, M., Erdmann, C., GobIe, F., van
Harmelen, M. Klein, S. , Staab, R., Studer, and E. Motta, 2000, The Ontology
Inference Layer OIL,
http://www.cs.man.ac.uk/-horrocks/Publications/download/2000/ oil.pdf
(Horrocks, 1998)
Horrocks Ian, 1998, Using an expressive description logic: FaCT or fiction?
Proceedings of KR-98, Pages: 636-647
(Horrocks et al, 1999)
Horrocks Ian, Sattler U., and Tobies S., 1999, Practical Reasoning for Expressive
Description Logics, Proc. 6th Int '1 Conf Logic for Programming and Automated
Reasoning (LPAR 99), Volume: 1705, Pp: 161-180, Lecture Notes in Computer
Science
(Ide et al, 2003)
Ide Nancy, Romary Laurent and de la Clergerie Eric, 2003, International Standard
for a Linguistic Annotation Framework,
URL: http://acl.ldc.upenn.edu/W/W03/W03-0804.pdf
(loyal et al, 1996)
loyal Paul M., 1996, Industrial espionage today and information wars of tomorrow,
19th National Information Systems Security Conference, Baltimore
(Kahan et al, 2001)
Kahan Jos, Koivunen Marja-Ritta, 2001, Annotea: an open RDF infrastructure for
shared Web annotations, Proceedings of the IOth international conference on World

216

Wide Web, Hong Kong, Pages: 623 - 632


(Kahan,200 1 b)
Kahan, l., Koivunen, M., Prud'Hommeaux, E., and Swick, R. 2001, Annotea: An
Open RDF Infrastructure for Shared Web Annotations, Proceeding of the WWWIO
International Conference, Hong Kong, May 2001, URL:
http://www1 0.org/cdrom/papers/488/index.html

tel-00131856, version 1 - 19 Feb 2007

(Kislin et al, 2003)


Kislin P., David A., Peguiron F., 2003, Caractrisation des lments de solutions en
recherche d'information: conception d'un modle dynamique dans un contexte
dcisionnel, 4me Congrs ISKO-France. L'organisation des connaissances:
approches conceptuelles. (Grenoble, France). 2003. Grenoble, Pages: 13
(Kislin et David, 2003)
Kislin Philippe and David, Amos, 2003, De la caractrisation de l'espace-problme
dcisionnel l'laboration des lments de solution en recherche d'information dans
un contexte d'intelligence conomique: le modle WISP. Confrence Intelligence
Economique: Recherches et Applications, Edited by Amos, David, IERA'2003.
(INIST, France), Nancy
(KnowTIPS, 2006)
KnowTIPS, 2006, Spectrum College and Consulting Services Ltd, KnowTIPS
Online Conference, http://knowplace.ca/moodle/mod/resource/view .php?id=4606
(13/06/06)
(Knauf et David, 2004)
Knauf Audrey and David Amos, 2004, Vers une meilleure caractrisation des rles
et comptences de l'infomdiaire dans le processus d'intelligence conomique.
Veille Stratgique Scientifique et Technologique - VSST'2004 (Toulouse). Poster
(Kolmayer et Pevre1ong, 1999)
Ko1mayer Elisabeth, Pevrelong Marie-France, 1999, L'mergence du document
dans un processus de capitalisation des connaissances, Communication aux
Journes "Org & Co", SFSIC, Aix-en-Provence, 3-5, June 1999
(Kornacker et Gilstrap, 1997)
Kornacker Marcel and Gilstrap Ray, 1997, An Annotation Service for the World
Wide Web CS294-6 Project
http://ratogi.net/archive/unused/c1ass/cs294-6/ (27/05/2004)
(Kumar, 2001)
Kumar A., 2001, "Third Voice Trai1s Off...",
http://www.wired.comlnewslbusiness/O. 1367 ,42803,00.htm1, Wired News,
Apri12001
(Lebow et Lick, 2001)
Lebow D. G. and Lick D., 2001, HyLighting: A new approach to distributed
leaming. Annual convention of the Association for Educational Communications

217

and Technology, Atlanta, GA, November 7-10, 2001


(Lebow et al, 2003)
Lebow, D., Lick, G., and Marks, P., 2003, Introducing Hylighting: Learning to
learn with interactive annotation technology, Florida Educational Technology
Conference, Orlando, 2003, February
(Leidner et E1am, 1993)
Leidner, D.E. and Elam J.J., 1993, Executive information systems: Their impact on
executive decision making, Journal of Management Information Systems, Winter
1993-94, vo110, Issue: No. 3, Pages: 139-155.

tel-00131856, version 1 - 19 Feb 2007

(Lemyre et Willemant , 2006)


Lemyre Pierre-Paul and Willemant Richard, 2006, The legal issues surrounding
ftee and open source software: Challenges and solutions for the government of
Qubec, http://www.cirano.qc.calpdflpub1ication/2006RP-04.pdf
(Lewis et Keleman, 1989)
Lewis, L.F. and Keleman, K.S., 1989, Experiences with GDSS Deve1opment: Lab
and Field Studies, Journal of Information Science Principles and Practice, Volume:
16 Issue: 3, Pages: 195-205
(Lveill, 2000a)
Lveill, Valrie, 2000, De l'organisation des donnes dans les systmes
d'information : Ralisation d'un outil de gestion de donnes htrognes et
formelles appliqu la veille technologique, Doctorat en sciences de l'universit de
droit, d'conomie et des sciences d'Aix-Marseille, Marseille, Pages: 192
(Lione1, 1910)

Lionel, Giles M.A., 1910, The Art ofwar of Sun Tzu, The oldest military Treatise in
the worId, translated from Chinese with an introduction and critical notes, Puppet
press classic
(Liu et al, 1999)
Liu, K.D., Wu, H.Q., Pong, Y.J., Liu, K.C. and Guo, C.Q., 1999, Unascertained
Information, Mathematical Treatments and Applications, Scientific Press, Beijing
(Lortal et al, 2005b)
Lortal G., Lewkowicz M., Todirascu-Courtier A., 2005, Annotation: textual media
for cooperation, International Workshop on Annotation for Collaboration, Paris,
November, 24-25, 2005
(Lortal et al, 2005b)
Lortal Galle, Lewkowicz Myriam and Todirascu-Courtier Amalia, 2005,
Modlisation de l'activit d'annotation discursive pour la conception d'un collecticiel
support l'hermneutique; Jaulent M-C. Actes de la confrence JC 2005, Pg 169 180
(Maes et Potter, 2003)

218

Maes Stphane H. and Potter Stephen, 2003, Requirements for EMMA: W3C Note
13 January 2003, URL: http://www.w3.org/TR/2003/NOTE-EMMAreqs-20030113/
(Marlow et al, 2006)
Marlow Cameron, Naaman Mor, Boyd Danah and Davis Marc, 2006, Position
paper, tagging, taxonomy, flickr, article, ToRead, WWW 2006 Collaborative Web
Tagging Workshop, Edinburgh, Scotland
(Martinet, 1989)
B. Martinet et J. Ribault. La veille technologique concurrentielle et commerciale.
Les ditions d'Organisation, 1989.

tel-00131856, version 1 - 19 Feb 2007

(Martre, 1994)
Martre, H., Intelligence conomique et stratgie des entreprises, Rapport du
commissariat Gnral au Plan, Paris, La documentation Franaise, 1994, pp 17,18
(Martin, 2004)
Martin David, 2004, EDIFACT: the international standard for EDI Contribution to
eLib Study on Document Requesting Standards
URL: www.ukoln.ac.uk/dlis/models/models l/serials-mtg/serials-req-edi.doc
(McGonagle et Vella, 1990)
McGonagle, J.J. and Vella, C.M., 1990, Outsmarting the Competition: Practical
Approaches to Finding and Using Competitive Information, Sourcebooks,
Naperville, Illinois
(McNurlin et Sprague, 1989)
McNurlin B.C. and Sprague R.H. 1989, Information systems in practice, 2nd
Edition, Upper Saddle Miner, US, Prentice-Hall International
(Mehdi et al, 2005)
Mehdi Achour, Friedhelm Betz, Antony Dovgal, Nuno Lopes, Philip OIson, Georg
Richter, Damien Seguy and Jakub Vrana, 2005, Manuel PHP
URL: http://php.benscom.com/manual/fr/index.php 12/03/2006
(Miles-Board, 2004)
Miles-Board, T., 2004, Everything Integrated: A Framework for Associative
Writing in the Web. PhD thesis in Electronics and Computer Science, University of
Southampton
(Mucchielli et al, 1998)
Mucchielli Alex, Corbalan Jean-Antoine, Ferrandez Valrie, 1998, Thorie des
processus de la communication, Collection "Sciences de la communication",
Armand Colin, Paris
(Mucchielli et Guivarch, 1998)
Mucchielli Alex and Guivarch Jeannine, 1998, Nouvelles mthodes d'tude des
communications, Collection "Sciences de la communication", Armand Colin, Paris

219

(Mller et Strube, 2003)


Mller Christoph and Strube Michael, 2003, Multi-Level Annotation in MMAX,
Proceedings of the 4th SIGdial Workshop on Discourse and Dialogue, Sapporo,
Japan: 198-207.
(National, 1996)
National Communication Systems Technology & Standards Division, 1996
Telecommunications: Glossary of Telecommunication terms, General Services
Administration, Information Technology Service, Federal Standard 1037C URL:
http://www.its.bldrdoc.gov/fs-1037/dir-018/_2613.htm

tel-00131856, version 1 - 19 Feb 2007

(National, 1992)
National Joint Committee for the Communicative Needs ofPersons with Severe Disabilities,
1992, Guidelines for meeting the communication needs of persons with severe disabilities,
(1992,March), Asha, 34,1-8.,
http://www.asha.org/NJC/njcguidelines.htm (08/06/2006)

(Nicholas et al, 1996)


Nicholas Charles, Mayfield James and Sasaki James, 1996, Category theory as a
foundation for document processing, Computer Science Department, University of
Maryland, Baltimore, Pg 13
(Ovsiannikov et al, 1999)
Ovsiannikov L, Arbib M.A. and McNeill T.H., 1999; Annotation Technology,
International Journal of Human-Computer Studies, Vol 50, pp 329 - 362
(Paoli et al, 2003)
Paoli Clment, Dou Henri, Dou Jean-Marie Jr and Maninna Bruno, 2003, La
constitution d'indicateurs brevets par domaines technologiques, Cahiers de la
documentation, N 2, 2003, http://www.imcsline.com/Docimcs/CdDocjuin2003.pdf
11108/2006
(Papakonstantinou et al, 1995)
Papakonstantinou Yannis, Garcia-Molina Hctor and Widom Jennifer, 1995, Object
exchange across heterogeneous information sources, 11th International Conference
on Data Engineering (ICDE'95), Pages: 251-260
(Parente et Bishop, 2003)
Parente, Peter and Bishop, Gary, 2003, Enrichments. Unpublished paper. UNC
Computer Science. URL: http://www.cs.unc.edu/-parente/et/Enrichments.pdf (04/1
0/2006)
(Paul, 2005)
Paul Jones, 2005, ITEE seminar: Ambient Information Displays, The School of
Information Technology & Electrical Engineering, University of Queensland,
Australia Date: 08/1112005
(Phelps, 1998)
Phelps Thomas A., 1998, Multivalent Documents: Anytime, Anywhere, Any Type,

220

Every Way User-Improvable Digital Documents and Systems, Ph.D. Dissertation,


University of California, Berkeley, UC Berkeley Division of Computer Science
Technical Report No. UCB/CSD-98-1026, December 1998
http://citeseer.ist.psu.edu/context/1225810/0 04/09/06
(Phelps et Wilensky, 2001)
Phelps Thomas A. and Wilensky Robert, 2001, The Multivalent Browser: A
Platform for New Ideas, Editor: Munson, Ethan V., Proceedings of Document
Engineering. Atlanta, Georgia,
(Phelps et Wilensky, 2004)
Phelps Thomas A. and Wilensky Robert, 2004, Robust Hyperlinks: Cheap,
Everywhere, Now, Digital Documents: Systems and Principles, 28-43

tel-00131856, version 1 - 19 Feb 2007

(Porter, 1986)
M. Porter, 1986, Choix stratgique et concurrence. Technique d'analyse des
secteurs et de la concurrence dans l'industrie. Economica, Paris.
(Prescott et Gibbons, 1993)
Prescott, J.E. and Gibbons, P.T., 1993, Global Competitive Intelligence: An
Overview. In J.E. Prescott, & P.T. Gibbons (Eds.), Global Perspectives on
Competitive Intelligence. Society of Competitive Intelligence Professionals,
Alexandria, VA:
(Price et al, 1998)
Price Morgan N., Schilit Bill N., Golovchinsky Gene, 1998, XLibris: The Active
Reading Machine, Proceedings of CHI98,
http://www.fxpal.com/publicationsIFXPAL-PR-98111. pdf
(Prie, 1999)
Prie Y., Modlisation de documents audiovisuels en Strates Interconnectes par les
Annotations pour l'exploitation contextuelle, Thse de Doctorat l'Universit
Claude Bernard Lyon l, France, 1999
(Pyle, 2003)
Pyle Dorian, 2003, Business Modeling and Data Mining, Morgan Kaufinann
Publishers, San Francisco
(Reed et John, 2003)
Reed Dale and John Sam, 2003,Web Annotator, Proceeding of ACM Special
Interest Group on Computer Science Education (SIGCSE), SIGCSE'03, February
19-23, 2003, Reno, Nevada, USA.
http://logos.cs.uic.eduireed/Papers/SIGCSEAnnotatorPaper.pdf 10/02/2006
(Reix,1969)
Reix Robert, 1969, Techniques Quantitatives de Gestion: Traitement des
Informations, Les Editions Foucher, Paris

221

(Reix,2004)
Reix Robert, 2004, Systmes d'information et management des organisations,
Vuibert, Paris, 5me Edition - 486 pages
(Revelli, 1998)
Revelli C., 1998, Intelligence stratgique sur intemet, Editions Dunod, Paris.
(Reimer et Staudt)
Reimer Ullrich, A., Staudt Margelisch, M., 2000, EULE: A Know1edge-Based
System to Support Business Processes, Knowledge Based Systems, Volume: 13,
Issue: 5, Pages: 261-269 (28/04/2005)

tel-00131856, version 1 - 19 Feb 2007

(Rijsbergen, 1979)
Rijsbergen, Comelis Joost van, 1979, Information Retrieva1, Butterworth, London
(Robert, 2003)
Robert, A.B.C., Reprsentation des activits du veilleur en contexte de
l'intelligence conomique, DEA en Sciences de l'information et de la
Communication, Universit Nancy 2, Universit de Metz, Octobre 2003, Pp 15
(Rscheisen et al, 1994)
Rscheisen, Martin, Mogensen Christian, and Winograd Terry, 1994, Shared Web
Annotations As A P1atform for Third-Party Value-Added Information Providers:
Architecture, Protoco1s, and Usage Examp1es,
URL: http://www-dig1ib.stanford.eduldig1ib/pub/reports/commentor.html
(Rscheisen et al, 1995)
Rscheisen, M., Mogensen, C., and Winograd, T., 1995, Interaction Design for
Shared World-Wide Web Annotations, Proceedings of CHI 1995
(Roscheisen et al, 2001)
Roscheisen Martin, Winograd Terry and Paepcke Andreas, 2001, Content Ratings,
and Other Third-Party Value-Added Information: Defining an Enab1ing P1atform
URL:
http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?1ang=en&doc=
199556&format=pdf&compression=&name= 1995-56.pdf
(Rostaing, 1993)
Rostaing Herv, 1993, Veille Technologique et Bibliomtrie: Concepts, Outils,
Applications, Thse de docteur en Sciences, Spcialit sciences de l'Information et
de la Communication, Universit de droit et des sciences d'Aix-Marseille, Facult
des Sciences et Techniques de Saint Jrme, Aix-Marseille
(Rumeau, 2006)
Rumeau Y., 2006, Historique des dcouvertes
URL: http://grottesdegargas.free.fr/PAGE_5.html (25/06/2006)
(Saget et al, 1993)
Saget Pierre, Brunet Jean and Sirinelli Jean, 1993, Les sciences de l'information et
de la communication, Comit National d'Evaluation, Rapport d'valuation Mars
1993, Pierre Saget, charg de mission pour les valuations,

222

http://www.cne-evaluation.fr/WCNE_pdf/INFO_COM.pdf 31/08/06
(Schickler et al, 1996)
Schickler Matthew A., Mazer Murray S., and Brooks Charles, 1996, Pan-Browser
Support for Annotations and Other Meta-Information on the World Wide Web,
Fifth International World Wide Web Conference May 6-10, 1996, Paris, France

tel-00131856, version 1 - 19 Feb 2007

(Schneider, 1996)
Schneider Daniel, 1996, Modlisation de la dmarche du dcideur politique dans la
perspective de l'intelligence conomique, Facult des sciences conomiques et
social dpartement de sciences politiques, Universit de Genve, Genve, Pages:
414
(Sch1kopf et al, 1998)
Schlkopf B., Burges C. and Smola A., 1998, Advances in Kernel Methods:
Support
Vector
Machines,
MIT
Press,
Cambridge,
http://citeseer.ist.psu.edu/33565.htm1
(SCIP, 2002)
SCIP, 2002, What is CI?, Society of Competitive Intelligence Professionals URL:
http://www.scip.org/ci
(Shannon, 1948)
Shannon C.E., 1948, The Mathematical Theory of Communication, The Bell System
Technical Journal, Vol. 27, pp. 379-423,623-656, July, October, 1948
(Shipman et al, 2003)
Shipman Frank, Price Morgan, Marshall Catherine C., Go1ovchinsky Gene, 2003,
Identifying useful passages in documents based on annotation patterns, 7th
European Conference on Research and Advanced Technology for Digital Libraries
(ECDL 2003) Trondheim, Norway, August 17-22,2003
(Shirky, 2005)
Shirky Clay, 2005, Clay Shirky's Writings About the Internet: Ontology is
Overrated: Categories, Links, and Tags, URL:

http://www.shirky.com/writings/onto1ogy - overrated.html 14/05/2006


(Sidhom, 2002)
Sidhom Sahbi, 2002, Plate-forme d'analyse morpho-syntaxique pour l'indexation
automatique et la recherch d'information: de l'crit vers la gestion des
connaissances, Thse de Doctorat l'Universit Claude Bernard Lyon 1, France,
Mars 2002.
(Smith, 1999)
Smith Tony, 1999, Third Voice slammed for defacing Web sites
URL: http://www.theregister.co.ukI2004/06/l)/five3ears_ago/ 11104/2006
(Spais, 2005)

223

Spais George S., 2005, Marketing Analytics: Managing Incomplete Information in


Consumer Markets and the Contribution of Mathematics to the Accountability of
Marketing
Decisions,
2005
Hercma
Conference,
Athens,
http://www.aueb.gr/pympelhercmalproceedings2005/H05-FULL- P APERS-I/SP
AISVELOUTSOU-1.pdf
(Sreenath et al, 2002)
Sreenath D.V., Grosky William, and Andres Frdric, 2002, Intelligent Virtual
Worlds: Technologies and Applications in Distributed Virtual Environments,
chapter Metadata-Mediated Browsing and Retrieval in a Cultural Heritage Image
Collection. World Scientific Publishing Company, Singapore

tel-00131856, version 1 - 19 Feb 2007

(Stacia, 2004)
Stacia Wyman, Robert K. Jansen and Jerey L. Boore, 2004, Automatic annotation
of organellar genomes with DOGMA, Lawrence Berkeley National Laboratory,
University of California, Los Angeles
(Strassner et al, 2004)
Strassner John, Fleck Joel, Huang Jenny, Faurer Cliff and Richardson Tony, 2004,
TMF White Paper on NGOSS and MDA: Version 1.0, TeleManagement Forum
(The Institute, 2006)
Strategy, Science of Competitive Intelligence Gathering Techniques ITom "The Art
of War"
URL: http://www.clearbridge.com/competitive_intelligence.htm 09/08/2006
(Shortreed et al, 2005)
Shortreed Susan, Handcock Mark S. and Hoff Peter, 2005, Positional Estimation
within the Latent Space Model for Networks, Methodology, vol. 2 no. 1, 24-33.
http://www.stat.washington.eduisusanms/meth06.pdf04/06/06
(Sudhir et al, 2005)
Sudhir A., Siegfried H., and Staab S., Annotation, Composition and Invocation of
Semantic Web Services, Journal ofWeb Semantics, 2005,
http://www . websemanticsj ournal.org/ps/pub/2005- 5, 21/03/05
(Thagard, 2001)
Thagard Paul, 2001, How to make decisions: Coherence, emotion, and practical
inference, MIT Press, Cambridge, Pages: 355-371.
(Thiery et David, 2002)
Thiery Odile and David Amos, 2002, Modlisation de l'utilisateur, Systmes
d'Informations Stratgiques et Intelligence Economique, Revue Association pour le
Dveloppement du Logiciel (ADELI), Volume : 47, Pp: 12 p
(Thiery et al, 2002)
Thiery O., Ducreau A., Bouaka N. and David A., 2002, Piloter une organisation :
de l'information stratgique la modlisation de l'utilisateur; application au
domaine de la GRH, Congrs Mtamorphoses des organisations Nancy Novembre
2004.

224

(Treurniet, 2004)
Treurniet J., 2004, An Overview of Passive Information Gathering Techniques for
Network Security, Defence R&D Canada Ottawa Technical Memorandum, DRDC
Ottawa TM 2004-073, Ottawa, Pg 50, May 2004
(Troncy, 2004)
Troncy Raphal, 2004, Formalisation des connaissances documentaires et des
connaissances conceptuelles l'aide d'ontologies: application la description de
documents audiovisuels, Thse de doctorat, Universit Joseph Fourier (Grenoble)

tel-00131856, version 1 - 19 Feb 2007

(Truitt et Rogers, 1960)


Truitt T.D. and Rogers A.E., 1960, Basics of analog computers, John F. Rider
Publishing, Inc New York
(Tumbull, 2005)
Tumbull Douglas, 2005, Automatic Music Annotation, Department of Computer
Science and Engineering, University of Califomia, San Diego, pp 19
(Vannevar, 1945)
Vannevar Bush, 1945, As We May Think, The Atlantic Monthly, July 1945
(Vatton et al, 1999)
Vatton L, Gutari, R., Kahan, J., and Quint, V., 1999, Amaya Overview, Technical
report, W3C. http://www.w3.org/Amaya. 12/04/2006
(Vernon, 2005)
Vernon Prior, 2005, The language
http://www.scip.org/2_langbi.php

of

business

intelligence

URL:

(Veryard, 1992)
Veryard Richard, 1992, Information Modelling: Practical guide, Welland, Ray
Prentice Hall, Hertfordshire, Pp: 12-15
(Vriens,204)
Vriens Dirk, 2004, Information and communication technology for competitive
intelligence, IRM Press, Hershey, P.A.
(Watzlawick,1999)
Watzlawick Paul, 1999, Rencontre de Paul Watzlawick, Technologie et
Communication L'Harmattan, Paris, Pages: 133-139
(Weber et al, 1997)
Weber G., Robert A.B.C., Carsky R.J, 1997, Handbook ofuse ofLEXSYS (Legume
Expert System): Decision Support for integrating herbaceous legumes into farming
systems. International Institute of Tropical Agriculture, Ibadan, Nigeria. 31pp

225

(Wheeler, 2005)
Wheeler A. David, 2005, Why open source software / Free software (OSS/FS,
FLOS S, or FOSS)? Look at the numbers,
http://www.dwheeler.comlossJs_why.html(27 /06/2006)
(Whittington, 1996)
Whittington C. D., Annotation systems: A review. 1996,
ftp://ftp.cs.strath.ac.uk/researchreports/rr -96-202. ps.Z,
(Wyman et al, 2004)
Wyman, S.K., Jansen, R.K. and Boore, J.L., 2004, Automatic annotation of
organellar genomes with DOGMA, Bioinformatics.; 20( 17):3252-5

tel-00131856, version 1 - 19 Feb 2007

(Yee, 2002)
Yee K., 2002, CritLink: Advanced Hyperlinks Enable Public Annotation on the
Web, Demo to the CSCW 2002 conference, New Orleans, Dec 2002,
http://zesty.ca/pubs/yeecritcscw2002-demo.pdf 30/03/2005

226