Vous êtes sur la page 1sur 652

Universit´e de Nice - Sophia Antipolis Facult´e de Lettres, Arts et Sciences Humaines

´

Ecole Doctorale Lettres, Sciences Humaines et Sociales

I3M

Information, Milieux, M edias,´

M ediations´

Hypertextualit´e

Construction du sens et repr´esentation des

connaissances

Tome I

`

TH ESE

pr´esent´ee et soutenue publiquement le 2 d´ecembre 2005

Pour l’obtention du grade de:

Docteur

Discipline : Sciences de l’information et de la communication

par

Marc Augier

Directeur de th`ese :

Monsieur le Professeur Norbert Hillaire

Jury:

´

Monsieur le Professeur Eric Bruillard (IUFM Caen)

Monsieur David Piotrowski (Charg´e de recherche CREA-CNRS)

Monsieur le Professeur Pascal Vidal (CERAM Sophia Antipolis)

Monsieur Georges Vignaux (Directeur de recherche CNRS)

Monsieur le Professeur Norbert Hillaire (UNSA)

Mis en page avec la classe thloria.

Remerciements

Les remerciements Exercice de style pendant les remises de prix de chaque cérémonie offi- cielle, c’est en les rédigeant que l’on comprend mieux pourquoi l es gens qui les lisent ont les yeux mouillés. Ce travail, a priori et forcément personnel, n’a toutefois été possible que grâce au soutien, direct ou indirect, de nombreuses personnes. C ertains m’ont aidé directement, d’autres indirectement, mais tous ont joué un r ôle déterminant même s’ils n’étaient pas présents à mes côtés. Je pense en premier lieu à mes grand-parents, Félix et Emma ; c’est grâce à eux que j’ai développé confiance en moi et curiosité, quand je n’étais encore qu’un enfant. C es qualités m’ont suivi bien après qu’ils nous aient quittés et il se passe peu de journées sans que j’ai une pensée pour eux. Je remercie aussi mes parents, qui m’ont laissé le libre arbitre de mes choix, ce qui m’a permis de m e construire de manière autonome. Je remercie mon épouse et mes enfants, qui m’ont accompagnés sur le chemin de cette thèse ; leurs soirées et leurs vac ances en ont souvent souffert, mais je n’ai jamais entendu de reproche et toujours des encouragements. Maria, tu as souvent su me redonner courage quand l e doute m’envahissait. Matthieu, j’espère te voir bientôt sur les bancs de l ’Université, maintenant c’est à toi ! Et last but not least Daphné, je compte sur toi pour tous nous rattraper et même nous doubler. Il y a aussi des remerciement plus professionnels, qui n’en sont pas moins chaleureux. Je voudrais tout d’abord remercier tout particulièrement RMS, sans le savoir, c’est lui qui a rendu tout cela possible. Il ne me li ra sans doute malheureusement jamais, mais les remerciements sont aussi le moment de rêver un peu Je remercie Yannick Geffroy et Norbert Hillaire pour m’avoir fait confiance ; un ingénieur en construction mécanique et informati cien se

i

sent parfois comme un éléphant dans un magasin de porcelaine. E n m’ac- cueillant et en me permettant de participer à votre projet commun av ec le CNRS, vous m’avez permis de découvrir que mes expériences profes- sionnelles et personnelles précédentes avaient malgré les apparences un fil conducteur. Pour terminer, je remercie chaleureusement avec une attention toute particulière Georges Vignaux et Marc Silberstein pour leur accueil et la confiance qu’ils m’ont témoignée dans le cadre du projet C o L i S ciences . Ils ont souvent fait preuve de beaucoup de patience pour comprendre, ad opter mais quelquefois aussi rejeter avec beaucoup de tact les expériences technico- informatiques que je lançais sans crier gare. Je leur suis infiniment redevables pour leurs précieux conseils et le soutien qu’ils m’ont apporté tout au long de mon projet personnel de thèse qui voit son aboutissement dans ce d ocument. L’aboutissement de ce projet n’est bien entendu pas tout, et j’espère que nous aurons encore de nombreuses occasions de collaborer, que ce soit pour C o L i S ciences ou pour d’autres expériences, que je serai heureux et fier de pouvoir accompagner.

ii

Je dédie cette thèse à Maria, mon épouse.

TABLE DES MATIÈRES

Introduction Générale

 

1

 

Chapitre 1

Introduction

1.1

Objectifs thématiques et finalités

 

5

A. Objectif Général

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

8

 

1. Analyser

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

8

2. S’interroger

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

9

3. Croiser

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

9

4. Discuter

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

10

5. Numériser

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

11

6. Éditer

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

11

 

B. Objectifs Particuliers

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

12

 

1.

Hypertexte

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

12

v

Table des matières

 

2. Parcours

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

18

3. Sens et cognition

 

.

.

.

.

.

.

.

.

.

.

.

.

18

1.2 Cadre de référence théorique

 

20

A. Première idée régulatrice : la simulation

 

21

B. Deuxième idée régulatrice : la rétroaction

 

21

C. Troisième idée régulatrice : l’information codée

 

22

1.3 Éléments méthodologiques

 

23

A.

Finalité de cette recherche

 

23

1. Action

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

23

2. Analyse de corpus

 

.

.

.

.

.

.

.

.

.

.

.

.

24

3. Études expérimentales

 

24

Chapitre 2 Cadre épistémologique

 

2.1 Les questions à résoudre

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

27

A.

Problématique

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

27

2.2 Organisation par thèmes de recherche

 

27

A. Intelligence artificielle

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

28

 

1. Définition

 

.

.

.

.

.

.

.

.

.

.

.

.

28

2. Système expert

 

.

.

.

.

.

.

.

.

.

.

.

.

32

3. Traitement du langage naturel

 

33

4. Pensée et apprentissage

 

34

5. Approche connexioniste

35

B. Cartographie

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

38

C. Orientation et repérage

 

41

D. La linguistique cognitive

 

44

E. La communication

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

45

F. L’informatique linguistique

 

47

G. La sémiotique

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

47

2.3 Organisation de la thèse

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

49

 

vi

Partie I Du livre au Web

L’hypertexte nouveau support de pensée ?

Chapitre 3 L’écrit, la médiation, la numérisation

3.1 Introduction

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

55

3.2 Le document

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

56

A. Définition

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

56

B. Théorie du support numérique

 

58

C. La chaîne documentaire

 

62

1. Définition

 

.

.

.

.

.

.

.

.

.

.

.

.

62

2. L’application, notion technique imposée

 

63

3. Approche dynamique du document

 

67

3.3 La notion de collection

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

68

A. La définition du dictionnaire

 

69

B. La collection pour valoriser

71

3.4 Le livre, du papier à l’électronique

 

73

A. Le livre traditionnel

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

75

1.

Poids économique

 

.

.

.

.

.

.

.

.

79

B. Qu’entend-on par livre électronique ?

 

81

1. Première définition du livre électronique

 

83

2. La définition du dictionnaire

 

85

3. Notre définition

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

85

C. Le point sur les technologies

 

86

1. Modèles ou contenus anglophones

 

86

2. Modèles ou contenus francophones

 

88

3. Cartables et manuels numériques

 

90

4. Normes, standards et formats

 

93

5. Papier et encre électroniques

98

D. Livre électronique : Rupture ou continuité ?

 

101

1.

Texte imprimé ou électronique

 

105

vii

Table des matières

2. Le futur du livre ?

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

106

3. Rupture

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

108

4. Les métadonnées

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

118

5. Lecture sur papier et lecture sur écran

 

120

6. Modélisations sémantiques et cognitives

 

128

3.5 Conservation numérique

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

136

A. Les formats

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

136

B. La numérisation comme changement de support

 

138

C. La chaîne de numérisation

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

138

1. Soin continu

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

139

2. Rafraîchissement

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

140

3. Migration

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

140

4. Émulation

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

141

5. Conservation de la technologie

.

.

.

.

.

.

.

141

3.6 Les corpus électroniques .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

144

A. Pourquoi un corpus en ligne ?

 

145

1. Pérennisation et patrimoine

 

145

2. Travail collaboratif

 

147

B. Les grands projets de numérisation de textes

 

149

1. Les projets Français

 

150

2. Les projets étrangers

 

158

Chapitre 4 Réflexions sur l’hypertexte

4.1 Introduction à l’hypertexte

 

165

A. Historique .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

166

1. Un mot

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

166

2. Un concept

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

166

3. Les ancêtres

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

169

B. Définition

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

170

4.2 Fondements théoriques de l’hypertexte

 

176

A.

Modèles théoriques hypertextuels

 

177

1. Modèle de Marc Nanard

177

2. Modèle de Dexter

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

178

viii

3.

Modèle à trois modules

 

179

4.3 Les notions autour de l’hypertexte

 

180

A. Interactivité

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

180

B. Hypertexte et connaissances

 

183

C. Hypertexte collaboratif

 

187

1. Définition de la collaboration

 

187

2. Écriture hypertextuelle : Wiki

188

3. Wikipédia

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

190

D. Les systèmes hypertextes

 

199

1.

Web et hypertexte

 

.

.

.

.

.

.

.

.

201

4.4 La Gestion électronique de Documents

 

204

A. Définition

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

204

B. Le traitement du document

 

204

1. L’indexation

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

207

2. Le catalogage

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

212

3. Le résumé

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

212

C. Les normes de balisage

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

213

1. DTD

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

213

2. SGML .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

213

3. XML

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

213

D. Les DTD de l’information–documentation

 

216

1. TEI Text Encoding Initiative

 

217

2. DocBook

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

218

3. BiblioML

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

218

4. Dublin Core

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

219

Partie II Construction et représentation du sens

ix

Table des matières

Chapitre 5 Construction du sens

5.1 Introduction

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

225

A. Définition du sens

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

226

B. Définition de la quantité d’information

 

230

5.2 Mémoire de lecture

. A. Réseau et apprentissage B. Restitution des parcours C. Modèle de représentation .

.

.

.

.

5.3 Le sens

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

233

234

 

237

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

238

239

A. Cadre de référence théorique

 

239

B. Créer du sens, pour qui, par qui ?

 

240

C. Navigation et recherche d’information

 

244

D. Représentation de la connaissance

 

245

1. L’intelligence artificielle

 

245

2. Le Web Sémantique

 

246

3. Métadonnées et annotations

 

251

5.4 Sémantique interprétative

 

252

Chapitre 6 Le dispositif C o L i S ciences

6.1 Introduction

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

257

A.

Présentation et objectifs

 

258

6.2 Description du système C o L i S ciences

 

261

A. Une base de connaissances (multimédia)

 

264

B. Un espace de travail collaboratif

 

266

C. Une bibliothèque virtuelle

 

267

6.3 Le dispositif technique

 

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

268

A. Modèle de publication

 

.

.

.

.

.

.

.

.

.

.

.

.

273

B. Le stockage de données XML

 

275

C. Délinéarisation et découpage du corpus

 

281

1. L’unité d’information

 

281

2. Délinéariser mais pas désorienter

 

282

3. Génération automatique des liens

 

283

x

4.

Problématique du changement de support .

283

D. L’influence des réseaux de Petri

 

284

E. Structuration

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

289

F. Appropriation et apprentissage

 

290

1.

C o L i S ciences : un outil pour l’étude des pro- cessus d’appropriation

 

291

G. Les médiations autour de C o L i S ciences

 

294

1. Pourquoi publier sur la toile

 

294

2. Les dispositifs disponibles dans C o L i S ciences 297

 

3. Les interfaces

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

299

6.4

Notre architecture

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

302

A. Numérisation

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

304

B. Architecture serveur

.

.

.

.

.

.

.

.

.

.

.

.

306

C. Le corpus disponible

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

307

D. Construction de la DTD

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

308

Chapitre 7 Représentation des parcours de lecture

 

7.1 Navigation à travers C o L i S ciences

 

317

7.2 Parcours

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

326

 

A. Qu’est-ce qu’un parcours ?

 

326

B. La co-construction des parcours de lecture

 

326

C. Reconstructions du sens et parcours

 

327

D. Lecture sur écran et parcours cognitifs

 

328

1. Typologie des parcours et Navigation

 

331

2. La compréhension de textes .

.

7.3 Topologie

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

332

333

 

A. Hypertextes et repères pour la navigation .

.

.

.

.

.

333

B. Le cas de la bibliothèque numérique

 

335

C. Représentation

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

337

1. Les Schémas de représentation

 

338

2. Les attributs techniques .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

7.4 Lectochromie

.

.

.

.

.

.

.

.

.

.

.

.

341

342

 

A.

Description

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

343

1.

Un système commun de référence

 

343

xi

Table des matières

 

2.

Matrice de parcours

 

343

B. Cartographie ou statistique ?

343

1. Statistiques de lecture

 

343

2. La cartographie pour rendre visible