Vous êtes sur la page 1sur 11

Langages

Reconnaissance des expressions figées lors de l'analyse


automatique
M. Éric Laporte

Citer ce document / Cite this document :

Laporte Éric. Reconnaissance des expressions figées lors de l'analyse automatique. In: Langages, 23ᵉ année, n°90, 1988. Les
expressions figées. pp. 117-126;

doi : https://doi.org/10.3406/lgge.1988.1994

https://www.persee.fr/doc/lgge_0458-726x_1988_num_23_90_1994

Fichier pdf généré le 02/05/2018


Eric LAPORTE
Laboratoire d'Automatique Documentaire et Linguistique

La reconnaissance
des expressions figées
lors de l'analyse automatique

1. Introduction

Les expressions figées posent des problèmes spécifiques en analyse automatique


des textes en langues naturelles. Les systèmes existants ne les prennent pas en compte
d'une façon satisfaisante, car on manque de méthodes générales pour les reconnaître.
A. Schenk (1986) propose un système de traduction automatique produisant des
phrases figées dans la langue cible, mais il n'aborde pas le problème de la reconnaissance
automatique des expressions figées dans les textes. Dans cet article, nous examinerons
dans quelle mesure cette tâche est indépendante des autres procédures constituant un
système d'analyse.

2. Etiquetage des mots simples

Lors de l'analyse syntaxique, tous les mots simples de la phrase doivent être
identifiés dans un dictionnaire. Cette opération est appelée « étiquetage ». Les mots
figurant dans un texte sont des mots fléchis : les verbes sont conjugués, les adjectifs
peuvent être au masculin ou au féminin, etc. L'étiquetage permet de donner les traits
flexionnels des mots fléchis (genre, nombre, temps, personne) et leur forme de base,
c'est-à-dire, par exemple, le masculin singulier pour les adjectifs. Ainsi la
représentation attribuée au mot serait est constituée d'une forme de base et d'un jeu de traits
flexionnels :
catégorie : verbe
forme de base : être
serait ► •{ temps : conditionnel
personne : 3e
nombre : singulier
En cas d'ambiguïté morphologique1, l'étiquetage donne la liste des possibilités. Enfin,
l'étiquetage donne accès à une description syntaxique et sémantique du mot
rencontré. Les ambiguïtés syntaxiques et sémantiques2 sont donc aussi prises en compte à ce
stade.
On peut étiqueter les mots simples un par un, au fur et à mesure que l'analyse de
la phrase progresse. On peut aussi étiqueter tous les mots simples de la phrase lors
d'une étape indépendante précédant le reste de l'analyse syntaxique. Cette étape
préalable peut même être étendue à tous les mots simples du texte, si celui-ci est disponi-

1. Voici des exemples d'ambiguïtés morphologiques : 1) dans l'adjectif capable, le genre


n'est pas marqué ; 2) le mot mise peut être une forme nominale, une forme du verbe miser, ou
une forme du verbe mettre.
2. Par exemple, le verbe travailler présente une ambiguïté entre des emplois à sujet humain
et un emploi technique illustré par la phrase Le bois de cette planche a travaillé.

117
Ые dans son entier. Ces trois solutions ne sont pas équivalentes du point de vue
informatique. En effet, la deuxième et surtout la troisième permettent d'utiliser des
techniques d'inversion de texte (M. Silberztein, 1987) et d'optimiser ainsi les recherches
dans les dictionnaires. De plus, nous verrons dans la section 5 que ces deux solutions
facilitent aussi la reconnaissance des expressions figées.
Dans cette section, nous n'avons envisagé que les emplois libres d'un mot simple à
étiqueter. Mais un mot simple peut aussi avoir des emplois dans des expressions
figées. Ainsi le verbe rendre et le nom compte, qui ont des emplois libres illustrés dans
les deux phrases suivantes :
Guy a rendu ce disque à Anne
Luc a un compte dans cette banque
apparaissent également dans se rendre compte. Les emplois libres des mots simples ne
permettent de déduire ni le sens ni la syntaxe de la locution. On ne peut donc faire
abstraction de celle-ci lors de l'étiquetage. La section suivante aborde ce problème.

3. Reconnaissance de la zone fixe d'une expression figée

Orthographiquement, les éléments d'une expression figée peuvent être séparés soit
par des blancs, soit par des tirets, soit par une aspostrophe :
mot de passe
essuie-mains
prud'homme
Ces conventions typographiques sont souvent indécises (M. Mathieu, 1986). Une
expression figée ne peut donc être reconnue automatiquement que si le système
d'analyse contient une base de données donnant sa forme m extenso et ses propriétés.
Il faut également prévoir un renvoi à la locution à partir d'un au moins des mots
simples qui la constituent. L'article de ce mot dans le dictionnaire, en plus de donner ses
emplois libres, donne alors accès à la description syntaxique de l'expression figée.
Ainsi, après l'étiquetage, on peut tester si les mots constituant la locution figurent
dans le texte et sont dans le bon ordre. Une expression figée comme
pour les besoins de la cause
peut être reconnue avec une quasi-certitude par une simple comparaison entre une
portion de texte et la liste des mots de cette locution, à laquelle on a eu accès par
l'intermédiaire du mot besoins ou du mot cause. Cela suppose que l'entrée besoins du
dictionnaire de mots simples, par exemple, renvoie non seulement aux emplois libres
de cette forme mais aussi à ses emplois figés :
besoins
emploi libre : Nq avoir des besoins
emplois figés : Ng subvenir aux besoins de Nj
pour les besoins de la cause
Considérons maintenant le cas de l'adverbe figé
pour les beaux yeux de N
Dans cette locution, on observe un complément libre 3. N est un élément
arbitrairement long, alors que le début de la locution, pour les beaux yeux de, comporte un
nombre fixe de mots simples. Nous dirons que cet adverbe figé est constitué d'une
zone fixe suivie d'un argument libre N. La présence d'arguments libres n'est pas
spécifique aux adverbes figés et se retrouve dans d'autres catégories d'expressions figées.
En pareil cas, seule la zone fixe (pour les beaux yeux de) peut être reconnue par la
méthode exposée ci-dessus : l'argument libre comporte un nombre de mots simples
arbitrairement grand.

3. Pour simplifier la lecture, les groupes nominaux libres sont notés /V.

118
Il est souvent possible dès l'étiquetage de reconnaître la zone fixe d'une expression
figée, et cette opération apporte une forte présomption que cette locution figure dans
le texte. La notion de « zone fixe » d'une expression figée est donc essentielle et nous
allons la préciser.
Nous appelons zone fixe d'une expression figée la partie de l'expression qui admet
un nombre fixe de mots simples, même si ces mots sont susceptibles de variations
morphologiques. Dans les deux exemples ci-dessus, aucun élément de la zone fixe ne peut
varier. Cependant, comme le remarquent G. Richard et A. Bérard-Dugourd (1986), il
arrive souvent qu'un mot admette des variations morphologiques au sein d'une
expression figée. Ainsi, dans l'adverbe figé de tout Poss poids, la variable Poss symbolise un
adjectif possessif qui peut prendre plusieurs formes :
de tout son poids
de tout leur poids
Malgré ces variations, l'adjectif possessif peut être identifié dès l'étiquetage. C'est
pourquoi nous considérerons qu'il fait partie de la zone fixe, bien qu'il varie. La zone
fixe de de tout Poss poids est donc l'ensemble de la locution.
Lorsqu'une expression figée se construit avec un verbe support 4, comme dans les
phrases suivantes, nous ne considérons pas que le verbe support fait partie de la zone
fixe :
Nq être un bon à rien
Ng avoir un trou de mémoire
Nq avoir lieu à cause de Ni
Nq être bon public
En effet, il peut être effacé :
Paul a engagé un bon à rien
Le public n'a pas remarqué le trou de mémoire de Jean
Guy dort à cause d'Anne
A la merci d'un tyran, aucun homme ne peut être heureux (L. Danlos, 1980)
Luc a des amis bon public
ou remplacé par un opérateur causatif :
Cela a donné un trou de mémoire à Jean (G. Gross, 1987)
Ceci a mis Pierre à la merci de Marie (L. Danlos, ibid.)
Ceci a rendu Luc bon public
ou bien par une variante aspectuelle :
Paul est devenu un bon à rien
Pierre est tombé à la merci de Marie (L. Danlos, ibid.)
Luc est devenu bon public
ou encore par un opérateur à lien (M. Gross, 1981) :
Marie a Pierre à sa merci
Certaines locutions admettent un complément libre facultatif introduit par une
préposition qui n'apparaît que si le complément libre est présent. L'expression figée en
colère (E, contre N), où E symbolise la séquence vide, en est un exemple :
Guy est en colère (E, contre Anne)
Dans ce cas, nous ne considérons pas que la préposition facultative fait partie de la
zone fixe de la locution, car il n'est pas nécessaire de la reconnaître pour détecter la
locution.
Le traitement que nous proposons suppose une étude distributionnelle, syntaxique
et sémantique de chaque expression figée, en particulier afin de délimiter sa zone fixe.

4. Sur la notion de verbe support, voir Z. S. Harris (1964) et M. Gross (1981).

119
Une telle étude n'a de sens que si on distingue les différentes locutions les unes des
autres et si on étudie séparément des expressions figées distinctes. Par exemple, la
ressemblance entre les deux locutions des phrases suivantes :
Ce verbe est à l'actif
Ceci est à l'actif de Jean
ne justifie pas qu'on les décrive comme une locution unique admettant un complément
facultatif. Chacune d'elles doit être décrite indépendamment de l'autre parce que
leurs propriétés syntaxiques sont distinctes (par exemple, elles n'imposent pas les
mêmes contraintes au sujet), et qu'un système d'analyse doit pouvoir les identifier,
donc en particulier les distinguer l'une de l'autre, ou du moins détecter une ambiguïté
éventuelle.
Dans certaines expressions figées, la zone fixe admet quelques variations mais peut
être reconnue après l'étiquetage. Par exemple, certaines locutions peuvent être
réduites :
au petit bonheur la chance = au petit bonheur
Dans d'autres on peut intervertir deux sous- séquences :
à temps plein = à plein temps
ou choisir une sous-séquence parmi un nombre de variantes étroitement limité :
en (E, toute, pleine) connaissance de cause
Nous ne reviendrons plus sur ces variations limitées de la zone fixe, qui ne posent pas
de problèmes délicats, et qui affectent seulement une minorité d'expressions figées.
De nombreuses expressions figées peuvent subir des transformations syntaxiques.
Par exemple, darís l'adverbe figé pour les beaux yeux de N, le complément libre peut
se pronominaliser, ce qui donne pour Poss beaux yeux où Poss symbolise un adjectif
possessif tel que ses. La locution peut donc apparaître dans un texte sous sa forme de
base ou sous la forme transformée. Ces deux variantes ont des structures différentes :
la première admet un argument libre N, alors que la deuxième s'identifie à sa zone
fixe, de même que de tout Poss poids ci-dessus. De plus, la zone fixe n'est pas la
même dans les deux variantes. Plus généralement, le problème de la reconnaissance
peut être très différent suivant les variantes d'une même locution, et dans la suite nous
l'envisagerons séparément.

4. Informations apportées par la reconnaissance de la zone fixe

Lorsqu'on a reconnu dans un texte la zone fixe d'une expression figée, on ne peut
pas toujours en déduire que celle-ci figure effectivement dans le texte : il peut aussi
s'agir d'une expression lui ressemblant mot pour mot, mais employée dans un sens
littéral. Ainsi, dans Guy pense aux anges, on peut reconnaître la zone fixe de la locution
No être aux anges, mais cette locution n'y figure pas 5.

5. Dans le cas particulier où on a reconnu deux expressions figées dans la même phrase,
mais où leurs zones fixes se chevauchent, les deux locutions ne peuvent être effectivement
présentes dans le texte concurremment. Cette situation peut se produire entre au bout du fil (figé
dans Anne est au bout du fil) et le nom composé fil électrique. Ainsi, en reconnaissant ces deux
expressions dans la phrase suivante, on obtient l'information que seule l'une des deux peut y
figurer :
II y a un interrupteur au bout du fil électrique de droite
II en est de même lorsque l'une des deux zones est incluse dans l'autre, comme à temps (figé
dans Paul a parlé à son fils à temps) et à temps perdu :
Luc travaille à temps perdu
Nous n'avons pas étudié plus en détail ces conflits entre expressions figées.

120
Seules certaines expressions figées peuvent être détectées avec certitude par simple
reconnaissance de leur zone fixe. C'est le cas, par exemple, lorsqu'un des mots simples
n'a d'emploi que dans la locution :
scie égoïne
Nq être à jeun
au fur et à mesure de N
et aussi pour certaines expressions figées écrites avec un trait d'union, comme à tue-
tête ou après-midi.
Dans une deuxième catégorie d'exemples, il faut vérifier des contraintes formelles
sur la structure de la phrase pour déterminer si ces locutions y figurent réellement.
Par exemple, la forme Nq casser Poss pipe ne peut mettre en jeu une expression figée
que si l'adjectif possessif est coréférent au sujet libre Nq, donc si l'adjectif possessif et
le sujet sont accordés en personne et en nombre. Ce n'est pas le cas dans la phrase
suivante où l'expression a son sens littéral :
Pierre et Marie ont cassé sa pipe
Dans cette phrase, on peut reconnaître la zone fixe de la locution. Mais après
l'analyse du sujet, on peut constater que la contrainte d'accord n'est pas vérifiée, et en
déduire que la phrase ne contient pas l'expression figée.
Enfin, dans certains cas, la compréhension du texte est nécessaire, par exemple
pour désambiguïser la phrase Guy a cassé sa pipe.
En reconnaissant simplement la zone fixe, on n'a donc pas toujours la certitude
absolue qu'il y a une expression figée, et l'analyse complète peut être nécessaire pour
conclure. Toutefois, l'examen de textes montre qu'en général, lorsqu'on repère une
locution par sa zone fixe, elle est dans le texte. Même lorsqu'on peut employer une
locution dans le sens littéral (exemple : prendre le taureau par les cornes), on a
tendance à éviter de le faire, car l'interprétation idiomatique est préférée à
l'interprétation littérale 6. Donc, lorsqu'on a reconnu la zone fixe d'une expression figée,
l'hypothèse la plus plausible est qu'elle figure dans le texte, et on a intérêt à considérer en
premier cette éventualité. En effet, dans la majorité des cas, le choix de cette
hypothèse est justifié et permet d'éviter la poursuite d'hypothèses fausses. Par la suite, une
analyse est nécessaire pour confirmer ou infirmer la présence de la locution.
En résumé, la reconnaissance de la zone fixe d'une expression figée apporte la
présomption que celle-ci figure dans le texte. Cette présomption n'est pas une information
certaine, mais c'est une information de valeur lors de l'analyse automatique.

5. Dépendance entre la reconnaissance de la zone fixe d'une expression figée et


le reste de l'analyse

Pour certaines expressions figées, telles que à temps, la zone fixe peut être
reconnue indépendamment du contexte :
Paul a parlé à son fils à temps
Dans cette phrase, la reconnaissance automatique de l'adverbe figé ne requiert aucune
analyse du reste de la phrase, honnis l'étiquetage des mots. C'est la situation la plus
favorable pour deux raisons :
a} Cette procédure de reconnaissance peut être conçue indépendamment des
autres procédures de l'analyse automatique. Elle peut donc servir de premier module
à tout système d'analyse.

6. De plus, il est rare que le sens littéral et le sens idiomatique appartiennent tous les deux à
un même domaine sémantique, ce qui réduit le problème dans le cas d'un analyseur limité à un
domaine sémantique.

121
b) La détection d'une expression figée sans analyse du contexte apporte des
informations servant à l'analyse du contexte. Dans l'exemple ci-dessus, l'identification de à
temps comme adverbe figé donne accès à ses propriétés syntaxiques. En particulier, il
s'agit d'un adverbe de phrase, ce qui permet de rattacher ce groupe prépositionnel
directement au verbe a parlé, et non au nom fils. Cela implique, pour la suite de
l'analyse, que le groupe nominal formé autour du nom fils est réduit à à son fils, et
que l'objet indirect en à du verbe a parlé ne peut être que à son fils, à l'exclusion de à
temps.
Par ailleurs, en raison de leurs variations morphologiques, ces locutions ne peuvent
être reconnues qu'après l'étiquetage des mots simples. Ainsi, lors de la reconnaissance
de de tout Poss poids, un des mots du texte est comparé à la variable Poss, et on doit
être en mesure de savoir si ce mot peut être un adjectif possessif au masculin singulier.
Pour cela, le mot doit avoir été préalablement étiqueté. Il est donc préférable de
procéder à l'étiquetage de tous les mots simples d'une phrase — ou d'un texte — avant
d'y rechercher les expressions figées. Nous avons d'ailleurs vu dans la section 2 que
cette solution a également des avantages du point de vue informatique.

6. Expressions figées discontinues


Le cas le plus simple de discontinuité dans la zone fixe d'une expression figée est
celui de l'insertion entre virgules. Lorsqu'une partie fixe est suivie d'un complément
libre introduit par une préposition (ou une conjonction) figée, on peut presque
toujours insérer un adverbe ou une incise entre virgules devant la préposition :
Anne a agi pour le compte, semble-t-il, d'une autre société
Luc acceptera ceci dans la mesure, en fait, où il le pourra
Lorsque le complément est figé, l'insertion est interdite :
* Anne a agi pour les besoins, semble-t-il, de la cause
A l'écrit, les deux virgules sont obligatoires :
*Anne a agit pour le compte semble-t-il d'une autre société
*Anne a agi pour le compte, semble-t-il d'une autre société
*Anne a agi pour le compte semble-t-il, d'une autre société
On rencontre rarement une troisième virgule à l'intérieur de l'adverbe ou de l'incise :
? Anne a agi pour le compte, disait Jean, désolé, d'une autre société
En comptant deux virgules, on peut donc reconnaître automatiquement toute la zone
fixe de l'expression figée — y compris la préposition introduisant le complément libre
— sans analyser la portion de texte encadrée de virgules. Ce cas de discontinuité
n'introduit donc pas de dépendance entre la reconnaissance de la zone fixe et le reste
de l'analyse. Nous le laisserons de côté pour passer en revue les principaux types
d'expressions figées discontinues :
a) Adverbes figés. Quelques adverbes figés comportent un argument libre précédé
et suivi de parties de la zone fixe. Il peut s'agir d'un argument nominal :
d'aussi loin que TV se souvenir
à TV près =: à ces réserves près, à quelques mètres près
d'un argument adjectival :
dans le plus Adj des cas =: dans le plus facile à vérifier des cas
ou d'un argument adverbial :
(moins, plus) Adv que (annoncé, convenu, prévu)
= : plus indépendamment de Guy que prévu
La plupart des cas se trouvent dans la table PF de M. Gross (1986a) :
d'aussi loin que TV se souvenir
au point où TV en être
si TV avait su
si Nq en croire TV;
à ce que TV dit

122
b) Groupes prépositionnels figés employés avec être. Certains admettent un modi-
fieur facultatif (L. Danlos, 1980). C'est le cas de No être aux dimensions (E, Modif)
de Ni, où Modif symbolise un ou plusieurs modifieurs :
Les rideaux sont aux dimensions presque exactes de la fenêtre
Ces modifieurs sont très contraints, mais ils introduisent une variation du nombre de
mots :
Luc est sous l'emprise (E, totale, presque totale) de Jean
c) Phrases figées. Les types de discontinuité sont nombreux :
— Présence d'un groupe nominal dont seul le nom tête est figé, comme dans No
produire Dét témoin (E, Modif), où Dét symbolise le déterminant :
La défense n'a pas produit de témoins convaincants
Dans le groupe nominal que nous avons noté Dét témoin (E, Modif), seul le nom tête
témoins est figé avec le verbe produire. Le déterminant et les modifieurs éventuels
sont relativement libres. La discontinuité vient ici du fait que le déterminant est libre.
Ces groupes nominaux dont seul le nom tête est figé présentent toujours certaines
propriétés. Tout d'abord, ils réfèrent à une entité spécifique : ainsi, le groupe nominal
Dét témoin (E, Modif) réfère à une personne, alors que dans une locution comme Ng
lever l'ancre il n'est pas clair que le groupe nominal l'ancre ait un réfèrent. D'ailleurs,
ils sont pronominalisables :
Ce témoin est convaincant. La défense devrait le produire.
Lorsqu'ils sont pronominalisés, leur nom tête n'apparaît plus, et la détection de la
locution devient difficile. Lorsque l'ensemble d'un groupe nominal est figé dans une
locution (et non plus seulement son nom tête), il n'est généralement pas pronominali-
sable. C'est le cas dans la phrase Guy a pris Anne à témoin :
Guy a pris Anne à (elle, cela)
Guy (lui, y) a pris Anne
Quel que soit le contexte, ces exemples n'ont pas d'interprétation où figurerait la
phrase figée Ng prendre à témoin N^
— Possibilité d'insérer un adverbe après le verbe de la phrase figée. Cette
possibilité, mentionnée par G. Richard et A. Bérard-Dugourd (1986), existe pour presque
toutes les phrases figées :
Ceci est sans doute cause de cela
On ne prend pas assez en compte ces faits
L'adverbe inséré n'est pas obligatoirement encadré de virgules. La situation est donc
différente de celle décrite au début de cette section (insertion d'un adverbe ou d'une
incise entre virgules). Si le verbe est à un temps composé, l'adverbe est inséré après
l'auxiliaire, comme dans toutes les phrases :
Ceci a sans doute été cause de cela
On n 'a pas assez pris en compte ces faits
Les quelques phrases figées où l'insertion d'un adverbe après le verbe est interdite
appartiennent aux tables CO, COQ et CFF de M. Gross (1982). Les tables CO et
COQ sont celles où le sujet et le verbe sont figés ensemble :
CO — On aura (E, bientôt) tout vu
COQ — J'aime (E, vraiment) autant vous dire que P
Ces phrases perdent leur interprétation figée si on y insère un adverbe. Quant à la
table CFF, elle comporte des phrases de structures variées mais comportant deux
verbes reliés par un connecteur. Certaines sont très figées et toute insertion leur fait
perdre leur interprétation figée :
Voir N et mourir
Voir N de ses yeux et mourir
Dans les autres, on peut généralement insérer un adverbe après l'un ou l'autre des
deux verbes :
Marc ne dit (E, jamais) rien, mais il n'en pense (E, sans doute) pas moins

123
— Présence de compléments obligatoires précédés et suivis de parties de la zone
fixe. Cette situation se produit systématiquement dans les tables suivantes de M.
Gross (1982) :
CNP2 — Nq prendre TV; en compte =:
Marie prend cette demande en compte
C6 — No mettre Nj sur le dos de N2 =:
Guy met cet incident sur le dos de Paul
ANP2 — No avoir N1 au bout du fil =;
Anne a Pierre au bout du fil
Dans les tables C1PN, CPP, CPQ,. CPPN, CPPQ, CV, CFF, elle se produit
seulement pour certaines entrées. En effet, ces tables regroupent des phrases qui présentent
entre elles des différences du point de vue du nombre des actants libres, ou du point
de vue de l'ordre des actants. Enfin, dans les tables suivantes, un des actants figés de
la phrase admet parfois un complément humain en de, qui se trouve alors précédé et
suivi de parties de la zone fixe :
CO — Le ton de Luc n'admet pas de réplique
СОЕ — Loin de N Dét idée Modif =: Loin de Jean l'idée de partir
EO1 — Le calme d'Alain est olympien
EOP1 — Le sort de Marc est entre les mains de Marie
C1P2 — Ceci a figé le sang de Guy dans ses veines
Dans la table СОЕ, le complément introduisant la discontinuité peut aussi être phras-
tique :
Ce n'est pas l'envie (que Paul vienne, de dormir) qui manque à Anne
— Présence du verbe support être entre le sujet figé et un complément figé. Il
s'agit des tables EO1 et EOP1. Le sujet y est figé et le verbe être présente les
variations évoquées dans la section 3, c'est-à-dire l'effacement :
Le doute est permis
Pierre estime le doute permis,
le remplacement par un opérateur causatif, éventuellement au passif :
Cette opération rend le doute permis
Le doute est rendu permis par cette réponse
ou bien par une variante aspectuelle :
Le doute (reste, devient) permis
ou encore par un opérateur à lien :
Le sort de Marc est entre les mains de Marie
Marie a le sort de Marc entre ses mains
Rappelons qu'en raison de ces variations, nous ne considérons pas le verbe support
être comme faisant partie de la zone fixe de ces phrases. Avec cette convention, elles
présentent une discontinuité.
— Variations dans les modalités ou les aspects du verbe. On peut souvent
introduire des modalités ou des aspects dans une phrase figée à l'aide de verbes. Dans les
tables où le sujet et le verbe sont figés ensemble (СО, СОЕ, COQ, CFF), cela crée
une discontinuité :
СО — Le jeu en valoir la chandelle =:
Le jeu (doit, peut, continue à) en valoir la chandelle
СОЕ — (C'est, cela devrait être) d'accord pour que Psubj
COQ — Le bon sens (dicte, semble dicter) à Luc de partir
CFF — (C'est, cela a l'air d'être) clair comme deux et deux font quatre

7. Bien que le sujet soit figé avec le verbe, nous notons ce dernier à l'infinitif pour indiquer
qu'il se conjugue.

124
— Présence de plusieurs compléments libres à la suite les uns des autres. Dans
chacune des tables suivantes, c'est le cas de certaines entrées :
C1PN — No attirer l'attention de Nj sur N2
CPPN - No dire du bien de Nj à N2
CPPQ — Nq avoir en commun avec Nj que P
CV — No faire bien voir Nj de N2
CFF — Que n'as-tu dit à Nj que P ?
CO — L'avenir réserver Ni à N2
СОЕ — II y avoir avantage pour Ni à ce que P
COQ — Le bon sens dicter à Nj de V-inf
— Possibilité de transformations syntaxiques introduisant des arguments libres
précédés et suivis de parties de la zone fixe, par exemple le passif :
Nq tirer les ficelles de Nj
Les ficelles de Nj être tirées par Nq
l'extraction par c'est (...) que :
Nq abattre Poss cartes maîtresses
Ce sont ses cartes maîtresses que Marie a abattues
ou l'extraction d'un complément introduit par une préposition, soit pour former une
relative, soit pour former une question :
Nq tirer un trait sur iV;
L'éventualité sur laquelle Guy a tiré un trait
Sur quoi Guy a-t-il tiré un trait ?
Nq pencher du côté de Ni
L'éventualité du côté de laquelle Luc penche
De quel côté Luc penche-t-il ?
L'extraction d'un nom est généralement interdite lorsque le déterminant est figé, et
permise lorsque le déterminant et les modifieurs sont libres :
Nq prendre Ni à témoin
*C'est à témoin que Paul a pris Anne
Nq produire Dét témoin Modif
Ce sont ces témoins que la défense a produits
Cette corrélation a de nombreuses exceptions mais elle montre l'importance de la
propriété de figement du déterminant.

Conclusion

La reconnaissance des expressions figées est dépendante ou indépendante du reste


de l'analyse automatique, suivant les locutions envisagées. Une même locution peut
avoir l'un ou l'autre de ces comportements suivant les transformations syntaxiques
qu'elle subit. A l'aide d'un lexique-grammaire des expressions figées, on peut
sélectionner celles pour lesquelles le problème de la reconnaissance est indépendant du
reste de l'analyse, et construire un système qui les identifie dans les textes avec un
taux d'erreur non nul mais réduit.

Bibliographie

COURTOIS Blandine (1984) : Le dictionnaire des formes simples du français.


Notice technique. Rapport de recherches du LADL, université Paris 7.
DANLOS Laurence (1980) : Représentation d'informations linguistiques : constructions
« N être Prép X ». Thèse de troisième cycle, université Paris 7.

125
GROSS Gaston (1986) : « Typologie des noms composés », in Rapport final de
VATP« Recherches nouvelles sur le langage », Université Paris XIII.
GROSS Gaston (1987) : Etude syntaxique de constructions converses. Thèse d'état,
Paris XIII.
GROSS Maurice (1981) : « Les bases empiriques de la notion de prédicat
sémantique », Langages, n° 63, pp. 7-52, Larousse, Paris.
GROSS Maurice (1982) : « Une classification des phrases figées du français ».
Revue québécoise de linguistique, volume 11, n° 2, pp. 151-185, Presses de
l'Université du Québec.
GROSS Maurice (1986a) : « Lexicon-Grammar. The Representation of Compound
Words », in Proceedings of Coling '86, University of Bonn.
GROSS Maurice (1986b) : « Les adjectifs composés du français », in Rapport de
recherches du PRC « Informatique et linguistique », CNRS, Paris.
GROSS Maurice (1988) : Grammaire transfor mationnelle du français. Syntaxe de
l'adverbe, Cantilène, Paris.
HARRIS Zellig S. (1964) : « The Elementary Transformations », Transformations
and Discourse Analysis Papers, n° 54. University of Pennsylvania, Philadelphie ;
in Z. S. Harris, 1970, Papers in Structural and Transformational Linguistics,
Reidel, Dordrecht.
MATHIEU Michel (1986) : « Variations graphiques des mots composés dans le
Petit Larousse et le Petit Robert », in Rapport de recherches du PRC «
Informatique et linguistique », CNRS, Paris.
RICHARD Gilles et BÉRARD-DUGOURD Anne (1986) : Le traitement des locutions
dans l'analyse du langage naturel, Etude n° F101 du Centre scientifique IBM,
Paris.
SCHENK André (1986) : « Idioms in the Rosetta Machine Translation System », in
Proceedings of Coling '86, University of Bonn.
SlLBERZTEIN Max (1987), « L'inversion de texte », Rapport du Programme de
Recherches Coordonnées « Informatique et Linguistique », Université de
Paris- VII.

126

Vous aimerez peut-être aussi