Vous êtes sur la page 1sur 6

L’INTELLIGENCE ARTIFICIELLE ET

LE LANGAGE
GERARD SABAH

RESUME

Présenté en deux volumes, L'intelligence artificielle et le


langage se propose de faire le point sur les possibilités
actuelles de communication - limitée au langage écrit avec une
machine. Le premier volume expose les diverses
connaissances nécessaires (lexicales, syntaxiques,
sémantiques et pragmatiques) et les formalismes utilisés en
intelligence artificielle pour représenter ces connaissances.
Allant des modèles linguistiques aux travaux spécifiques des
informaticiens, en passant par des théories issues de la
psychologie, il cherche à présenter l'ensemble des possibilités
actuelles, tout en donnant au lecteur suffisamment
d'informations et de références pour choisir les théories qui lui
semblent adéquates à l'application qu'il envisage.
Le second volume, quant à lui, développe les divers
mécanismes informatiques qui servent de fondement aux programmes de compréhension et montre les liens entre
les théories utilisées et les architectures informatiques mises en place.

TABLE DES MATIERES


Introduction 13

Première partie Analyse des phrases

Chapitre 1 L'analyse morphologique

1.1 Introduction 19
1.2 Les diverses solutions 22
1.3 Exemples de systèmes d'analyse morphologique 25
1.3.1 Un analyseur procédural (Winograd) 25
1.3.2 Un analyseur déclaratif (Pitrat) 28
1.3.2.1 Formes des données 28
1.3.2.2 Analyse des mots 31
1.3.2.3 Génération des mots 33
1.4 Conclusion 35

Chapitre 2 Les principes de l'analyse des phrases

2.1 Entrées-Sorties 39
2.1.1 Le formalisme grammatical 39
2.1.2 La couverture syntaxique 41
2.1.3 Relations entre syntaxe et sémantique 43
2.1.4 La représentation interne produite 44
2.1.5 Aspects pragmatiques 45
2.2 Architecture informatique 46
2.2.1 Le traitement des mots 46
2.2.2 Organisation des sources de connaissances 47
2.2.2.1 Modularité 47
2.2.2.2 Règles et interprète 53
2.2.3 Les stratégies d'analyse 54
2.2.3.1 Analyse montante ou descendante 54
2.2.3.2 Traitement des possibilités multiples 58
2.2.3.2.1 Retour en arrière 58
2.2.3.2.2 Parallélisme 58
2.2.3.2.3 Utilisation d'une table 59
2.2.3.3 Ordre des éléments traités 62
2.2.3.4 Mécanisme de pile 63
2.3 Quelques exemples d'analyseurs 64
2.3.1 Grammaires non contextuelles 64
2.3.2 Grammaires transformationnelles 65
2.3.3 Grammaires en chaîne 67
2.3.4 Grammaires contextuelles 68
2.3.5 Grammaires de type 68
2.3.6 Grammaires systémiques 69
2.4 Conclusion 69

Chapitre 3 Réseaux de transitions

3.1 Les réseaux de transitions 73


3.1.1 Présentation 73
3.1.2 Utilisation 75
3.2 Les réseaux de transitions récursifs 79
3.2.1 Définition 79
3.2.2 Mécanisme d'analyse 82
3.3 Les réseaux de transitions augmentés 83
3.3.1 Définition 83
3.3.2 Exemples 85
3.3.3 La communication dans les réseaux 89
3.3.4 Mise en œuvre 91
3.3.4.1 Partage des structures 91
3.3.4.2 Ensembles de traits 92
3.3.4.3 Utilisation d'une table 92
3.3.4.4 Ordonnancement des arcs 94
3.4 Extensions 94
3.4.1 Les réseaux en cascade 95
3.4.2 Les réseaux à nœuds procéduraux 95
3.5 Quelques systèmes fondés sur les réseaux de transitions 96
3.5.1 Lunar 96
3.5.2 Programmar 97
3.5.3 Gus 98
3.5.4 Sophie 99
3.5.5 SpeechIis 99
3.6 Conclusion 100

Chapitre 4 Analyseurs dirigés par le lexique

4.1 Analyseurs à mots clefs 104


4.2 Analyseurs conceptuels 106
4.2.1 La notion d'attente 106
4.2.2 Analyse dirigée par les scénarios 109
4.2.3 Analyse dirigée par l'intérêt 111
4.2.4 Analyse dirigée par les buts 112
4.3 Analyseurs par experts de mot 113
4.3.1 Modèle général 114
4.3.2 Le langage d'interaction lexicale 116
4.3.3 Le langage de différenciation de sens 116
4.4 Conclusion 118

Chapitre 5 Analyseurs déterministes

5.1 Généralités sur l'analyse déterministe 121


5.1.1 Arguments psychologiques 121
5.1.2 Le déterminisme et l'ambiguïté du langage 124
5.1.3 Le regard en avant 125
5.1.4 Parsifal, l'analyseur de Marcus 126
5.2 Exposé détaillé de l'analyseur ANDI 128
5.2.1 Modèle du système 128
5.2.2 La structure de contrôle 131
5.2.3
Les règles de traitement 133
5.2.3.1 Les règles usuelles 133
5.2.3.2 Les règles d'interruption 135
5.2.3.3 Les paquets et les priorités 135
5.2.4 Un exemple détaillé d'exécution 137
5.2.5 Extensions 143
5.2.5.1 Introduction d'aspects pragmatiques 143
5.2.5.2 Apprentissage des règles 147
5.3 Conclusion 148

Chapitre 6 Traitement des non-attendus

6.1 Introduction 151


6.2 Niveaux d'erreur 153
6.2.1 Erreurs de compétence /erreurs de performance 155
6.2.1.1 Erreurs de l'utilisateur 155
6.2.1.2 Erreurs du système 157
6.2.2 Niveau lexical 158
6.2.2.1 Erreurs de performance 159
6.2.2.2 Erreurs de compétence 159
6.2.3 Niveau syntaxique 160
6.2.3.1 Erreurs de performance 160
6.2.3.2 Erreurs de compétence 161
6.2.4 Niveau sémantique 162
6.3 Les diverses stratégies de correction 164
6.3.1 Niveau lexical 164
6.3.1.1 Répartition statistique des erreurs 164
6.3.1.2 Les méthodes de recherche dans les dictionnaires 166
6.3.1.2.1 Génération de voisins 166
6.3.1.2.2 Utilisation de clefs 167
6.3.1.3 Les méthodes phono logiques 169
6.3.1.4 L'utilisation de connaissances morphologiques 171
6.3.1.5 L'interprétation de mots inconnus 173
6.3.2 Niveau syntaxique 175
6.3.2.1 Traitement des fautes d'accord 175
6.3.2.2 Correction des erreurs de construction 177
6.3.2.3 La "transparence" des systèmes 179
6.3.3 Niveau sémantique 180
6.4 Conclusion 182

Deuxième partie Structuration du discours

Introduction 187

Chapitre 7 Inférences

7.1 Les divers types d'inférences 191


7.1.1 Quelques catégories importantes de raisonnements 191
7.1.1.1 Raisonnements déductifs 191
7.1.1.2 Raisonnements (connaissances incertaines, évolutives) 192
7.1.1.3 Raisonnements plausibles (induction, analogie) 193
7.1.1.4 Gestion des raisonnements 194
7.1.2 Quand déclencher les inférences? 195
7.1.3 Mécanismes 200
7.1.3.1 Logiques 200
7.1.3.2 Démons 203
7.1.3.3 Réseaux sémantiques et schémas 205
7.2 Sélection des inférences nécessaires 210
7.2.1 Schank et al 210
7.2.2 Raisonnement en monde ouvert 214
7.3 Conclusion 216

Chapitre 8 Références

8.1 Les anaphores 220


8.1.1 Heuristiques générales 222
8.1.2 Contraintes sémantiques 224
8.1.3 Inférences 226
8.1.4 Le contexte du discours 228
8.1.4.1 Kantor 228
8.1.4.2 Lockman 229
8.1.4.3 Grosz 231
8.1.4.4 Sidner 232
8.2 Les ellipses 236
8.2.1 Les formes figées 238
8.2.2 Relations avec la grammaire 238
8.2.2.1 Règles explicites 239
8.2.2.2 Métarègles 240
8.2.3 Relation avec le contexte 241
8.2.3.1 Grammaire sémantique 242
8.2.3.2 Utilisation d'ossatures 243
8.2.3.3 Approche unifiée 244
8.2.4 Questions ouvertes 245
8.3 Autres problèmes de référence 246
8.3.1 Cataphores 246
8.3.2 Indéfinis 247
8.3.3 Génériques 247
8.3.4 Quantificateurs 248
8.3.4.1 Nash- Webber 248
8.3.4.2 Colmerauer 249
8.3.5 Les ensembles 252
8.4 Conclusion 252

Chapitre 9 Modélisation de textes

9.1 Structuration des récits 256


9.1.1 Identification des fonctions 257
9.1.2 Formalisation des séquences possibles 259
9.1.2.1 Les grammaires de récit 259
9.1.2.2 Un exemple: Rumelhart 260
9.2 Construction dynamique des liens inter-phrases 265
9.2.1 Généralités 265
9.2.2 Un exemple: Sabah et al 266
9.2.2.1 Le point de vue culturel 267
9.2.2.2 Le point de vue des actions 270
9.2.2.2.1 La notion d'abrégé 270
9.2.2.2.2 Les règles de comportement 271
9.2.2.2.3 Le processus de compréhension 271
9.2.2.2.4 La notion de plan 273
9.2.2.3 Le point de vue des personnages 275
9.2.2.4 Le point de vue symbolique 277
9.2.2.4.1 Présentation des chengyu 277
9.2.2.4.2 Compréhension des chengyu épiphonèmes 278
9.3 Conclusion 279

Chapitre 10 Modèles de dialogues

10.1 Les principes généraux du dialogue homme-machine 283


10.1.1 Caractéristiques d'un dialogue souple 284
10.1.1.1 Aspects linguistiques 285
10.1.1.2 Flexibilité 285
10.1.1.3 Adaptation à l'interlocuteur 286
10.1.1.4 Métaraisonnement 287
10.1.2 Les diverses tâches à effectuer 288
10.1.3 Les connaissances nécessaires 289
10.1.3.1 Les connaissances figées 289
10.1.3.1.1 Modèle de la langue 289
10.1.3.1.2 Modèle de la tâche 290
10.1.3.1.3 Modèle du dialogue 290
10.1.3.2 Les connaissances dynamiques 291
10.1.3.2.1 Historique du dialogue 291
10.1.3.2.2 Etat de la tâche 291
10.1.3.2.3 Modèle de l'utilisateur 292
10.1.4 Historique rapide 292
10.2 Gestion d'un dialogue par des schémas 294
10.2.1 Les problèmes particuliers traités 294
10.2.1.1 Changement d'initiative 295
10.2.1.2 Réponses indirectes 295
10.2.1.3 Anaphores 295
10.2.1.4 Phrases incomplètes 295
10.2.2 Organisation des programmes 296
10.2.3 Organisation des connaissances et raisonnement 297
10.2.4 Les limites de GUS 298
10.3 Planification, Croyance 298
10.3.1 Les primitives du modèle 299
10.3.2 Actions et plans 301
10.3.3 Inférence de plan 302
10.3.4 Détection des obstacles et génération des réponses 304
10.4 Adaptation à l'interlocuteur, exemple d'une réalisation 307
10.4.1 L'historique du dialogue 308
10.4.2 Le modèle du dialogue 309
10.4.3 La représentation de l'interlocuteur 310
10.4.4 La conduite du dialogue, exemple 312
10.5 Conclusion 315

Troisième partie Génération

Introduction 319

Chapitre 11 Génération des structures de surface

11.1 Utilisation de formes prédéfinies 325


11.1.1 ELIZA 325
11.1.2 SHRDLU 326
11.2 Génération de phrases par réseau de transitions 328
11.3 Choix lexicaux 330
11.3.1 Aspects généraux 330
11.3.2 Réseaux discriminants 332
11.3.2.1 Description des tests 333
11.3.2.2 Exemples de réseaux 334
11.3.3 Dictionnaire de concepts 334
11.3.4 Linéarisation 337
11.4 Un modèle de production spontanée 337
11.4.1 Le type de génération considéré 337
11.4.2 Le modèle proposé 337
11.4.3 Description du composant linguistique 339
11.4.3.1 Construction de l'arbre syntaxique 339
11.4.3.2 Génération de la structure de surface 340
11.4.4 Exemple 341
11.5 Conclusion 343

Chapitre 12 Organisation du texte

12.1 Danlos 345


12.1.1 Choix des phrases simples 347
12.1.2 La structure du discours 350
12.1.2.1 La grammaire du discours 350
12.1.2.2 Algorithme de choix 351
12.1.2.3 Sélection d'une structure du discours 351
12.1.3 Construction des schémas de phrases 353
12.1.4 Composant syntaxique 354
12.2 McKeown 354
12.2.1 Prédicats rhétoriques 355
12.2.2 Moules 356
12.2.3 Structure syntaxique 356
12.2.4 Linéarisation 357
12.3 McCoy 357
12.4 Simonin 359
12.4.1 Structuration du document 359
12.4.2 Génération du texte 361
12.5 Appelt 361
12.5.1 Le langage de description du monde 362
12.5.2 La génération de plans 362
12.5.3 La génération des textes364
12.6 Conclusion 365

Conclusion 369

Bibliographie 375

Index des noms 397

Index des notions 403


TOP