Vous êtes sur la page 1sur 4

Vergez-Couret Marianne le 02/10/06

N° Etudiant : 10204440
Thèse à l’Université de Toulouse le Mirail II

Sous la direction de Marie-Paule Pery-Woodley


Encadrée par Myriam Bras et Anne Le Draoulec

Projet de Recherche

SÉMANTIQUE DU DISCOURS
Le cas de la relation d'élaboration :
Etude en corpus de la relation et de son marquage

1. Introduction

La problématique centrale de cette thèse concerne l'analyse du discours et le fait que derrière
les discours que nous écrivons ou que nous prononçons se cachent une structure hiérarchique. Cette
structure prend la forme de relations qui s'établissent entre des segments de texte. Parmi ces
relations, nous allons principalement étudié la relation d'élaboration. La relation d'élaboration est
celle qui s'établit entre un segment de texte général et un ou des segments de textes plus sécifiques
qui viennent apporter des détails sur le segment plus général.

2. La relation d'élaboration en quelques mots

La relation d’élaboration met en place une information plus générale et une ou des information(s)
plus spécifique(s) [5] comme cela est illustré dans l’exemple suivant :

[L’été de cette année là vit plusieurs changements dans la vie de nos héros]K 1. [François épousa
Adèle]K2. [Jean-Louis partit pour le Brésil]K3 et [Paul s’acheta une maison à la campagne]K4.

1
Evénement global
L’été de cette année-là vit
plusieurs changements dans la vie
de nos héros

Sous-événements

François épousa Jean-Louis partit Paul s’acheta une


Adèle pour le Brésil maison à la campagne

Représentation schématique de la relation d’élaboration

Cet exemple le plus classique de la relation d’élaboration est un exemple extrait de [2] qui servait à
démontrer un usage particulier du passé simple où les verbes introduits au passé simple ne donnent
pas une succession d’événements dans le temps mais sont des sous événements d’un événement
principal.

La relation d’élaboration est celle qui s’établit entre l’événement global et chacun des sous
événements : le mariage de François, le départ de Jean-Louis pour le Brésil, le déménagement de
Paul. Les sous événements donnent plus de détails sur l’événement global. L’argument introduit
« nos héros » dans l’événement global est explicité à travers Les protagonistes François, Jean-Louis
et Paul. Par ailleurs, nous savons qu’un mariage, un départ ou un déménagement sont des
changements dans une vie. Ainsi, nous pouvons inférer la relation d’élaboration entre l’événement
global et les sous événements.

3. Résumé du mémoire de Master 2

La thématique centrale de mon mémoire de Master 2, dirigé par Marie-Paule Péry-Woodley et


encadré par Myriam Bras et Anne Le Draoulec, concernait les relations de discours et leur
marquage et plus particulièrement le cas de la relation d'élaboration. Au terme de ce travail, nous
sommes arrivés à plusieurs conclusions qui vont être des points de départ pour ce travail de thèse :
− Nous n'avons pas mis au jour de marqueurs spécifiques de la relation d'élaboration (tels que
'puis' pour la narration). [4]
− Nous avons mesuré la difficulté, dans certains cas, à choisir une relation de discours, par
exemple entre background et élaboration ou explication et élaboration.
− Certaines de nos observations peuvent mettre en doute le statut de l'élaboration comme une
relation de discours, tel que le proposait déjà [3].
− Et enfin, nos premières observations nous encouragent à étudier le lien qui existe entre la
relation d'élaboration et des relations lexicales et/ou conceptuelles.

4. Perspectives suite au travail du Master 2

Les modèles du discours s’appuient sur l’hypothèse qu’un discours possède une structure sous-

2
jacente : alors que le texte se présente de façon linéaire, l'hypothèse que nous suivons considère que
le discours est une structure hiérarchisée sous forme de relations qui s'établissent entre des segments
de texte. Nous souhaitons exploiter la structure du discours pour avoir accès au contenu du
document.

Par rapport au travail du Master 2, l'analyse va être approfondie suivant trois axes d’études :

• Axe empirique : Le travail de Master 2 a été limité par un corpus de petite taille. Il est
nécessaire dans un premier temps d'agrandir ce corpus mais aussi de l’élargir avec d’autres
genres. Dans un second temps, nous souhaitons continuer à rechercher des marqueurs et des
indices de la relation.
L'objectif est de mettre en place une méthodologie qui permette de repérer la relation
d’élaboration dans des textes. C’est une démarche originale qui part, non pas d’un marqueur,
mais d’une relation. Cette méthodologie, je l’espère, pourra servir dans tout projet
d’annotation manuelle de la relation.
Par ailleurs, le recours à des outils de TAL sera incontournable pour ce travail.

• Axe théorique : Nous souhaitons aborder ce travail dans le cadre d'une théorie sémantique
du discours, la SDRT (Segmented Discourse Relation Theory) [1], sans toutefois exclure les
autres théories.
La SDRT est un modèle de sémantique formelle. Elle propose de donner une structure logique au
discours en fournissant pour toutes les propositions une représentation sémantique. Nous
pensons qu’il est utile de s’inscrire dans un modèle de discours précis car celui-ci nous donnera
une méthodologie à suivre lors de l’analyse de nos textes. La SDRT est le modèle que nous avons
choisi pour plusieurs raisons :
(i) Il fonctionne avec un ensemble réduit de relations.
(ii) L’interprétation du discours se fait à travers les notions de relation de discours et
de topique.
(iii) Une place particulière est réservée aux conséquences temporelles et spatio-
temporelles des relations de discours.
Les principales étapes de l'étude théoriques sont :
− Proposer une description linguistique.
− Formaliser la description linguistique en SDRT.
− Enrichir le modèle.
− Déterminer la place de la relation par rapport à d'autres relations de discours (par exemple la
relation de narration) et par rapport à des relations lexicales (par exemple l'hypéronymie ou la
méronymie).

• Axe TAL :
 1/ Le premier axe TAL concerne l'automatisation de la méthodologie mise en place pour
repérer la relation d'élaboration.
 2/ Le deuxième axe TAL concerne la validation des modèles fournis par les études
empiriques et théoriques sur un corpus à grande échelle.

5. Enjeux

Nous pouvons dégager un enjeu double pour cette thèse. D'une part, il existe un enjeu théorique.
Notre objectif est de faire progresser des analyses descriptives et formelles sur une relation peu
étudiée et d'enrichir les études sur les connecteurs discursifs. D'autre part, il existe un enjeu au

3
niveau des applications du TAL. Accéder au contenu des textes numérisés est une application
émergente du traitement automatique des langues. Prendre en compte la structure organisationnelle
des textes, au niveau des relations de discours, du thème et du topique peut constituer un point
d’entrée pour l’extraction d’informations spécifiques dans une problématique de résumé
automatique par exemple. Nous pourrons également voir les apports d’une étude sur la structure
discursive d’un texte dans des applications telles que l’annotation automatique ou la navigation
documentaire.

6. Bibliographie succincte

[1] Asher, N. & Lascarides, A. (2003). Logics of Conversation. Cambridge : Cambridge


University Press.

[2] Kamp, H. & Rohrer, C. (1983). Tense in texts in Bäuerle, R., Schwarze, G., & von Stechow
A. (èds). Meaning use and interpretation of languages. Berlin, de Gruyter.

[3] Knott, A., Oberlander, J., O'Donnell, M. & Mellish, C. (2001). Beyond elaboration : the
interaction of relations and focus in coherent text in Sanders T., Schilperoord J. &
Spooren W. (éds.) Text representation : linguistic and psycholinguistic aspects, pp 181-
196, Amsterdam : Benjamins.

[4] Knott, A. & Dale, R. (1994). Using linguistic phenomena to motivate a set of coherence
relations in Discourse Processes, 18, pp 35-62.

[5] Mann, W. C. & Thompson, S. A. (1987). Rhetorical structure theory: a theory of text
organization in L. Polanyi (éds.) The Structure of Discourse. Norwood, N.J.:Ablex.

[6] Miltsakaki, E., Prasad, R., Joshi, A. & Webber, B. (2004). The Penn Discourse TreeBank
in Proceedings of the Language ressources and Evaluation Conference, Lisbon, Portugal.

[7] Péry-Woodley M.-P. (2005). Discours, corpus, traitements automatiques. In A.


Condamines (Ed.), Sémantique et Corpus (pp. 177-210). Paris: Hermès.

Vous aimerez peut-être aussi