Vous êtes sur la page 1sur 19

Langue franaise

Drivations smantiques et collocations dans le DiCo/LAF


Alain Polgure, Igor Mel'cuk

Citer ce document / Cite this document :


Polgure Alain, Mel'cuk Igor. Drivations smantiques et collocations dans le DiCo/LAF. In: Langue franaise, n150,
2006. Collocations, corpus, dictionnaires. pp. 66-83.
http://www.persee.fr/doc/lfr_0023-8368_2006_num_150_2_6854
Document gnr le 21/10/2015

Alain Polgure & Igor Mel'cuk


Universit de Montral
OLST - Dpartement de linguistique et de traduction

Drivations smantiques
et collocations dans le DiCo/LAF
I. INTRODUCTION

Au moins deux questions se posent qui veut dcrire les collocations


d'une laneue : comment les collecter et comment les dcrire ? Afin de
rpondre ces deux questions, nous allons prsenter l'approche originale
adopte dans le projet lexicographique DiCo/LAF (Polgure 2000). Pour la
collecte des collocations, nous utilisons la grille d'analyse fournie par les fonc
tions lexicales (dornavant FL) de la thorie Sens-Texte. Le systme des FL
standard nous sert de guide pour la recherche des principales collocations
contrles par chaque lexie dcrite. Bien entendu, cette approche issue de la
thorie s'accompagne aussi du recours l'observation directe sur corpus. La
rponse la deuxime question... encore les FL. Nous utilisons un double
encodage des liens collocationnels. 11 est bas, d'une part, sur des formules du
langage formel des FL, et d'autre part, sur des vulgarisations (c'est--dire
des francisations) de ces formules. Ces vulgarisations sont particulirement
intressantes puisque, fondes sur un mtalangage contrl, elles sont directe
ment interprtables par toute personne possdant une connaissance approxi
mative du franais, sans qu'aucune connaissance du modle linguistique
sous-jacent ne soit ncessaire.
Le DiCo est une base lexicale centre sur la modlisation des liens lexicaux
du franais ; le LAF (acronyme de Lexique actif du franais) est un dictionnaire
grand public entirement produit par extraction et formatage des donnes du
DiCo. Aprs avoir rsum le travail sur le DiCo/LAF, nous nous concentre
rons sur deux points mthodologiques :
1. la ncessit de modliser les liens collocationnels contrls par les lexies en
tenant compte de la structure actancielle de ces lexies ainsi que de leur
combinatoire syntaxique ;
66

Drivations smantiques et collocations dans le DiCo/LAF

d'une approche globale de la modlisation des liens lexi


caux, approche qui s'intresse simultanment aux liens syntagmatiques
collocationnels et aux liens paradigmatiques contrls par chaque lexie.

2. la ncessit

Nous illustrerons notre propos en prsentant la modlisation DiCo des


diffrentes acceptions du vocable DBAT.
Rappelons que, dans la terminologie Sens-Texte, une lexie est une unit
lexicale, c'est--dire un mot associ un sens bien spcifique et devant tre
dcrit par un article de dictionnaire ; un vocable est un regroupement de
lexies formellement identiques qui se distinguent smantiquement, tout en
partageant une composante de sens non triviale. Chaque lexie d'un vocable
correspond donc une acception d'un mot polysmique.
2. LE PROJET LEXICOGRAPHIQUE DICO/LAF

2.1. Base lexicale DiCo et produits drivs du DiCo


Le projet lexicographique DiCo/LAF se distingue d'autres projets de lexi
cographie informatise, tel WordNet (Fellbaum 1998), du point de vue des
phnomnes linguistiques dcrits et du point de vue des structures de
donnes qu'il vise produire. Nous allons commencer par expliciter ces deux
aspects de notre travail. Mme s'il pourrait sembler que nous dvions ici du
thme traiter - les collocations -, il est essentiel de partir du contexte plus
gnral du projet DiCo/LAF pour faire apparatre la particularit de notre
modlisation lexicographique des phnomnes collocationnels.

Nous ferons dornavant rfrence au DiCo et au LAF comme des mod


lisations uniques, clairement spcifies dans leurs formats et leur mode de
prsentation des donnes. Cependant, il s'agit en fait de deux cas particuliers
de produits lexicographiques. Le DiCo nous intressera en tant que type parti
culier de base de donnes reprsentative de ce que doit tre une base lexicale
fonde sur les principes de la lexicologie explicative et combinatoire (Mel'cuk
et al. 1995) ; le LAF n'est qu'un type particulier de produit driv d'une telle
base (Polgure 2000). La principale distinction entre ces deux produits est que
le premier relve du travail du lexicographe comme tel, alors que le second
est extrait du premier pour une utilisation autre que l'activit lexicogra
phique : la consultation. Dans ce qui suit, nous dsignerons par DiCo la base
de donnes lexicale dveloppe selon nos principes, par LAF, un produit
dictionnairique grand public driv d'une telle base, et par DiCo/LAF, le projet
lexicographique visant la production d'un DiCo et d'un LAF.

Nous commencerons par prsenter les deux familles de phnomnes


linguistiques viss par le DiCo : les drivations smantiques et les colloca
tions. Nous expliquerons ensuite pourquoi, selon nous, ces deux phnomnes
doivent tre considrs simultanment en lexicologie et lexicographie. Finale
ment, nous prsenterons les autres proprits des units lexicales qui sontprises en compte dans la base de donnes DiCo, de faon priphrique la
modlisation des drivations smantiques et des collocations.
LANGUE

FRANAISE

:,

67

Collocations, corpus, dictionnaires

2.2. Phnomnes linguistiques viss par

le DiCo

Les projets lexicographiques traditionnels visent la production de


dictionnaires dont les articles tournent autour d'un type de donne bien spci
fique : la dfinition lexicographique. On peut ainsi immdiatement identifier
un dictionnaire spcial par le fait que la dfinition n'est pas au cur de ses
articles : dictionnaires de prononciation, de drivations, de synonymes, de
collocations, etc. Le DiCo/LAF est un projet lexicographique spcial puisqu'il
vise avant tout la modlisation des drivations smantiques et des colloca
tions du franais. Attention cependant contrairement aux autres diction
naires spciaux, et notamment aux dictionnaires de collocations, le DiCo
prsuppose dans chacun de ses articles une dfinition rigoureuse (sinon
complte) des lexies. Cela deviendra clair la toute fin de notre expos
:

(section 4.).
Dans cette section, nous allons prciser les notions de drivation sman
tique et de collocation, telles qu'elles doivent tre comprises dans le cadre de
la lexicologie explicative et combinatoire.

2.2.1. Les drivations smantiques


La notion traditionnelle de drivation est bien connue. Elle correspond
des relations smantiques et formelles entre deux lexies, relations du type
FUMER - FUMEUR (nom d'agent), COMPTER -> COMPTAGE (nom d'action), NOIR
-> NOIRCIR (verbe causatif), etc. Le DiCo s'attache une notion de drivation
plus large, savoir la drivation smantique.

Une drivation smantique est une relation entre deux lexies base sur
une parent de sens. Plus prcisment, une lexie L2 est dite smantiquement
drive d'une lexie L^ si et seulement si les trois conditions suivantes sont
satisfaites :
- L2 entretient une relation smantique avec L[. Dans le cas plus typique, L2
se dfinit en terme de L,.
Par exemple, la lexie HACHE [= L2] est dfinie en terme de COUPER [= L,],
car le sens 'hache' - 'artefact servant couper...'.
- La relation smantique entre L2 et L-j est rcurrente dans la langue.
Par exemple, la relation entre HACHE et COUPER, 'artefact servant ...", est
rcurrente en franais : FRAPPER - MARTEAU, OUVRIR [une porte] -> CL,
FUMER -> PIPE, etc.

La relation entre L-j et L2 s'exprime frquemment de faon morphologique.


Par exemple, pour la relation 'artefact servant ...", on trouve en franais
les drivations suffixales suivantes : bouch(-er) -> bouch+on, ras(-er) -
ras+oir, dcapsul(-er) dcapsul+eur, etc.

Puisque la relation smantique qui lie HACHE COUPER satisfait les trois
conditions ci-dessus, nous pouvons dire que la lexie HACHE est smantique
ment drive de COUPER.
Remarquons qu'un lien de drivation smantique qui est marqu explicite
ment par un moyen morphologique correspond une drivation au sens
68

Drivations smantiques et collocations dans le DiCo/LAF

traditionnel. La drivation au sens traditionnel est donc un cas particulier de


drivation smantique.
On peut identifier trois grandes familles de drivations smantiques
correspondant aux trois cas de figure ci-dessous.
1 .

Les deux lexies possdent (approximativement) le mme sens.

11

s'agit ici

d'une drivation smantique (quasi) vide, qui correspond aux cas bien
connus suivants

-synonymie exacte ou approximative (bicyclette -> vlo; interdire -


dfendre)

- conversion exacte ou approximative (X

prcde Y -> Y suit X ; X donne Y a


Z^Z
reoit Y de X) ;
- changement de partie du discours (marchander -> marchandage, vendre ->
vente, frapper -^ coup ; terrestre est l'adjectif pour [relatif la] terre, paternel
pour [relatif au] pre, urbain pour [relatif la] ville).

Par convention, on inclut galement dans cette premire famille les termes
gnriques (cours d'eau pour rivire, lgume pour haricot...).
2.

Les deux lexies possdent des sens opposs (interdire et autoriser, petit et
grand...). 11 s'agit ici de l'antonymie exacte ou approximative.

3.

Une des deux lexies dsigne un lment de la situation dsigne par


l'autre. 11 peut s'agir d'un participant (nager - nageur, envoyer [qqch. par la
poste] - destinataire, accident - victime...), d'un circonstant (dormir -> ///,
patiner -> patinoire...) ou d'une caractristique d'un participant ou circons
tant (s'irriter -> irritable, comprendre -> comprhensible...).

1.1.1. Les collocations


La notion de collocation, telle que nous l'entendons, correspond celle
prsente dans Hausmann (1979), et qui a t clairement mise en avant sous le
nom de srie phrasologique dans Bally (1909) L Elle est au centre du prsent
numro de Langue franaise et notre perspective sur cette notion n'est pas radi
calement diffrente de celle de la plupart des auteurs qui participent cette
publication. Nous allons nanmoins prsenter la collocation selon nos propres
termes, notamment afin de mieux tablir la connexion thorique et descriptive
entre le phnomne des collocations et celui des drivations smantiques, qui
vient juste d'tre examin.

Pour expliciter la notion de collocation , nous commencerons par quel


ques exemples. Supposons qu'afin de caractriser une entit physique quel
conque un locuteur cherche exprimer le sens 'dont le volume physique est
plus important que la moyenne'. Pour exprimer le sens en question, le locu
teur a sa disposition l'adjectif gros. Peu importe l'entit, il pourra presque
toujours utiliser gros un gros cheval, une grosse mouche, un gros sandwich... Si
une lexie franaise sert dsigner une entit physique ayant un volume, elle
:

1.

Pour une dfinition rigoureuse, faite dans le cadre de la thorie Sens-Texte, cf. Mel'cuk (1995
Mel'cuk (2003a : 23 sq) ou Mel'cuk (2003b : 24 sq).

1S2 sq),

LANGUE

FRANAISE

\H

69

Collocations, corpus, dictionnaires

peut toujours tre modifie par gros (ou grosse). Les combinaisons ^rus cheval,
grosse mouche, gros sandxoich... sont, donc, des combinaisons libres de
lexies. Pour les construire, le locuteur se contente de slectionner des lexies
exprimant chacune un sens donn, puis de les combiner en se conformant
simplement aux rgles grammaticales de la langue.

Examinons maintenant un cas de figure tout diffrent. Supposons que le


locuteur veuille exprimer auprs d'un sens lexical donn un sens beaucoup
plus vague comme 'trs, intense, important", c'est--dire l'intensification. 11
existe une foule de lexies pouvant exprimer ce sens, mais le choix de la lexie
approprie n'est pas libre : il dpend de la lexie dont le locuteur veut intensi
fier le sens. Ainsi, il dira
- pour argument : argument massue, de poids... ;
-

pour brouillard
pour mchant
pour dormir

:
:
:

brouillard dense, pais, opaque, couper au couteau


mchant comme la gale, comme une teigne ;
dormir comme un loir, poings ferms.. .

Ce sont ces expressions que nous appelons collocations et qui, avec les dri
vations smantiques, sont au c
de la description lexicographique du DiCo.
De faon non formelle, on pourrait dfinir la collocation de la faon suivante :
Une collocation est une combinaison de lexies qui est construite en fonction de
contraintes bien particulires elle est constitue d'une base, que le locuteur choisit
librement en fonction de ce qu'il veut exprimer (argument, brouillard, mchant...), et
d'un collocatif (massue pour argument, dense pour brouillard, connue une teigne pour
mchant...), choisi pour exprimer un sens donn (ici, 'intense') en fonction de la base.
:

Notons qu'un collocatif n'est pas ncessairement un lexme (lexie mono


lexicale). 11 peut tre une locution ( couper au couteau, comme une teigne...) ;
cela est mme trs souvent le cas, notamment pour les collocatifs valeur
mtaphorique.
Les collocations dcrites dans le DiCo peuvent correspondre l'expression
de sens aussi varis que, par exemple :
- l'attnuation (c'est--dire, l'oppos de l'intensification) : un sommeil lger ;
- l'valuation positive : une phrase bien faite, bien tourne, lgante ;
- l'valuation ngative : une phrase mal faite, mal tourne, maladroite.
Dans un nombre lev de collocations d'un type fort diffrent - colloca
tions de verbes supports - le collocatif ne sert pas exprimer un sens donn
mais supporter syntaxiquement le nom qui est la base de la collocation.
Ainsi, pour exprimer verbalement le groupe nominal la rsistance de Jean face
Pierre on peut dire Jean oppose une rsistance Pierre. Si l'on veut un verbe
support qui prenne Pierre, et non Jean, comme sujet grammatical, on dira
Pierre se heurte la rsistance de Jean.
Voici deux autres exemples prsentant le mme type de contraste :
Jean

Jean

apporte son aide Pierre.


donne un cours Pierre.

~
~

Pierre reoit de l'aide de Jean.


Pierre suit un cours de Jean.

intuitive de ce que recouvre la notion de


dans notre perspective. C'est un phnomne omniprsent

Ces exemples donnent une ide

collocation

70

Drivations smantiques et collocations dans le DiCo/LAF

dans la langue. 11 relve, en outre, d'une comptence linguistique difficile


acqurir. En effet, pour un grand nombre de lexies de la langue, le locuteur est
amen mmoriser des sries de collocatifs, qui s'opposent parfois par des
distinctions smantiques fines et qui ont des comportements syntaxiques trs
spcifiques. Ainsi, pour le nom fortune, il est possible de dire faire fortune, sans
article, alors que l'article est obligatoire lorsque l'on utilise le verbe accumuler :
accumuler une fortune vs ^accumuler fortune.

Nous allons maintenant aborder l'aspect vritablement original de la


modlisation des collocations faite dans le DiCo (et dans toute modlisation
explicative et combinatoire) en explicitant ce qui runit logiquement les deux
notions de drivation smantique et de collocation .

2.3. Drivations smantiques et collocations comme manifestations


d'un mme phnomne conceptuel
Ce qui caractrise vritablement la modlisation d'une base lexicale du type
DiCo est le fait que les notions en question sont vues comme reposant toutes
deux sur la notion beaucoup plus gnrale de lien lexical orient.

- Une drivation smantique

est une relation particulire entre deux lexies :


une lexie de dpart et une lexie smantiquement construite partir de
celle-ci. 11 s'agit donc d'un lien lexical orient : de la base de la drivation
vers le driv.

- Une collocation est une expression linguistique constitue de deux lexies,


dont l'une - la base - contrle l'emploi de l'autre - le collocatif. Une collo
cation n'est donc pas une relation. Cependant, chaque collocation prsup
pose une relation particulire de contrle entre les deux lexies qui la
constituent : la base contrle le choix du collocatif. Ce contrle est alement un lien lexical orient : de la base de la collocation vers le collocatif.

Puisque dans les deux cas nous sommes en prsence de liens lexicaux
orients, il est possible de modliser les deux phnomnes au moyen d'un
mme outil descriptif. 11 s'agit de pointeurs qui, pour chaque lexie dcrite
dans un article de dictionnaire, spcifient ses drivs smantiques et ses collo
catifs ; par exemple :
couper - instrument - hache
mchant - intensificateur > comme la vale
mchant - intensificateur > comme une teigne

La description des liens lexicaux offerte par le DiCo - comme par toute
modlisation du type Dictionnaire explicatif et combinatoire (Mel'cuk et al. 1984,
1988, 1992, 1999) - s'appuie sur un ensemble restreint de patrons de liens lexi
caux drivationnels et collocationnels, qui sont des liens lexicaux standard.
Chaque lien lexical standard est modlis comme une fonction , au sens
mathmatique, qui s'applique aux lexies pour retourner la liste de leurs
drivs smantiques ou de leurs collocatifs. On peut donc crire, en s'inspirant du formalisme mathmatique f (x) = y :

Lien lexical(lexie)
LANGUE

FRANAISE

= expressions possibles du lien

71

Collocations, corpus, dictionnaires

Pour reprendre les sries d'exemples ci-dessus

Instruirtent(coHUi'r) = hache...
Intensif
icate\ir(mchant) = comme la gale, comme une teigne...
Chaque FL standard modlisant un type de lien particulier porte un nom
spcifique, que l'on retrouvera dans l'encodage du lien en question quelle que
soit la langue dcrite par le dictionnaire explicatif et combinatoire. Ainsi, la
fonction retournant les noms d'instruments s'appelle Sinstr ; celle retournant
les collocatifs intensificateurs s'appelle Magn. Les formules ci-dessus peuvent
donc se rcrire

Sinstr(copc?") = hache...
Ma.gn(mchant) = comme la gale, comme une teigne...

Tout lecteur connaissant les principes de base de la lexicologie explicative et


combinatoire reconnatra ici les formules d'encodage faisant appel aux FL.
Rappelons que la lexie apparaissant entre parenthses dans de telles formules
(couper, mchant...) est appele l'argument de la FL, et la liste de lexies ou de
locutions qui suit le signe d'galit est appele la valeur retourne par l'appli
cation de la FL l'argument en question. Les FL standard forment un vritable
systme, la structure trs riche, qu'il ne nous appartient pas d'introduire ici
- pour une courte introduction, cf. notamment Polgure (2003a : 129-142), et
pour une prsentation dtaille, cf. Mel'cuk et al. (1995 : 125-152).
Le systme des FL est particulirement puissant puisqu'il offre un mme
outil formel pour modliser tous les types de liens lexicaux contrls par les
lexies, et cela pour n'importe quelle langue. 11 permet de runir des phno
mnes qui sont la plupart du temps considrs sparment - autant en
linguistique qu'en lexicographie ou en linguistique applique l'enseigne
ment - alors qu'en fait ils relvent tous en profondeur de la notion de lien
lexical. On remarque que, lorsque les drivations smantiques et les contrles
collocationnels sont runis dans la littrature linguistique sous la mme
notion de lien lexical, c'est pour tre traits sparment en tant que liens lexi
caux paradigmatiques vs liens lexicaux syntagmatiques. Or, si nous adhrons
cette distinction fondamentale (cf. les FL paradigmatiques s syntagmati
ques), nous sommes convaincus que la frontire entre les deux types de liens
n'est pas tanche par nature, et cela, pour au moins deux raisons.
Premirement, l'activation des liens lexicaux en parole est au cur du fonc
tionnement de la paraphrase linguistique - Mel'cuk (1992), Milicevic (2003).
Or, les liens de paraphrase reposent trs souvent sur des galits de structures
qui mettent en jeu cls FL paradigmatiques et syntagmatiques. Par exemple,
l'quivalence trs gnrale suivante dmontre le lien profond qui unit la notion
de verbe support et celle de drivation smantique vide de type verbal :
Oper^D + L^V^L)
Cette rgle de paraphrasage trs simple permet de rendre compte des
quivalences smantiques suivantes

pousser\= Oper1(L)] un soupir\= L] = $oupirer[= V0(soupir)]


commettre[- Oper^L)] un assassinal[= L] = assassiner[= vQ(assassinat)]
72

Drivations smantiques et collocations dans le DiCo/LAF

Deuximement, le contenu d'un collocatif, d'un Magn par exemple, peut tout
tait s'exprimer de faon fusionne, c'est--dire au moyen d'une lexie qui
n'est pas un collocatif de l'argument de Magn mais plutt un synonyme plus
spcifique, incluant le sens d'intensification. Dans nos descriptions, nous indi
quons une valeur fusionne au moyen de l'oprateur //. Comparons, par
exemple, les diffrentes valeurs de Magn de l'acception de base de PAUVRET
ci-dessous, que nous avons extraites du DiCo :

grande

antpos < absolue, extrme //misre.

Contrairement aux adjectifs grande, profonde, etc., le nom misre n'est pas
un collocatif de pauvret, mais un substitut . II s'agit d'une lexie qui entre
tient un lien paradigmatique de quasi-synonymie avec PAUVRET, tout en
tant un Magn de cette lexie
!

On voit quel point le systme des FL, appliqu la lettre, nous force consi
drer ensemble les notions de liens paradigmatiques et de liens syntagmatiques.
Pour qui croit en la sparation profonde, conceptuelle, de ces deux notions, c'est
clairement une tare du systme en question. Mais pour celui qui, au contraire,
pense que ces deux types de liens sont intrinsquement lis du point de vue de
l'utilisation du code linguistique par le locuteur, c'est un bnfice considrable.
Cette remarque nous permet d'avancer ce qui est peut-tre notre slogan quant
la modlisation des collocations et des drivations smantiques.
Le systme des FL standard, plus qu'un outil d'encodage, est un outil d'explora
tion et de modlisation des liens lexicaux paradigmatiques et syntagmatiques,
ces deux types de

liens devant tre considrs simultanment.

Une telle approche distingue radicalement le DiCo des dictionnaires de


collocations proprement dits, mme lorsqu'il s'agit de dictionnaires conus
selon une perspective trs linguistique comme Benson et al. (1997) ou
Crowther et al. (2002), pour l'anglais.

2.4. Autres proprits lexicales dcrites

dans le DiCo

Le DiCo n'est pas un simple rpertoire de drivations smantiques et de collo


cations. 11 s'agit vritablement d'une base lexicographique dcrivant les lexies
du franais. Mme si cette base se focalise sur la description des liens de FL
contrls par les lexies, elle vise une modlisation de toutes leurs proprits
de combinatoire. A cette fin, on trouve dans le DiCo, outre les liens de FL,
quatre autres types de proprits associes chaque lexie : ses caractristiques
grammaticales, son tiquette smantique, sa forme propositionnelle et son

rgime syntaxique.
Caractristiques grammaticales
11 s'agit des proprits de combinatoire qui sont avant tout d'ordre gram
matical comme la partie du discours, le genre grammatical (pour les noms),
les restrictions lies l'emploi du dfini/indfini ou du nombre (pour les
noms), etc. On considre ici aussi les contraintes d'emploi de nature plus
pragmatique, comme celles dont rendent compte les marques d'usage (formel,

familier, vulgaire, etc.).


LANGUE

FRANAISE

73

Collocations, corpus, dictionnaires

tiquette smantique
L'tiquette smantique d'une lexie est un lexme ou un syntagme qui fonc
tionne comme genre prochain de sa dfinition lexicographique - cf. Polgure
(2003b). Les tiquettes sont souvent utiles pour distinguer les diffrentes
acceptions d'un vocable. Cependant, leur intrt va bien au-del. En effet,
l'tiquette smantique rsume la quintessence smantique de la lexie et
permet donc d'effectuer des prdictions trs fortes quant aux liens de FL que
celle-ci peut contrler. De plus, parce qu'il engendre une classification des
units lexicales, le systme d'tiquetage du DiCo permet au lexicographe
(comme l'usager) de facilement rcuprer les donnes sur les lexies ayant
une forte parent de sens.
Structure actancielle
La structure actancielle de la lexie est sa caractrisation en tant que
prdicat smantique. 11 existe bien entendu une forte corrlation entre struc
ture actancielle et tiquette smantique. Par exemple, toute lexie tiquete
sentiment possdera au moins un premier actant correspondant l'tre
anim prouvant le sentiment en question ; dans de trs nombreux cas, il y
aura aussi un deuxime actant, correspondant la source du sentiment. Autre
exemple les lexies tiquetes confrontations
d' ides - comme D13AT1
[Un dbat entre partisans et adversaires de la peine capitale agite la socit.], dont il
sera question plus loin - ont typiquement une structure actancielle trois
actants "~ entre X et Y propos de Z\
:

Rgime syntaxique
Le rgime syntaxique de la lexie est la correspondance entre ses actants
smantiques, syntaxiques profonds, syntaxiques de surface et leurs expres
sions dans la phrase. Il s'agit donc de la faon dont une lexie contrle l'expres
sion de sa structure actancielle.

L'approche descriptive du DiCo et, plus gnralement, de la lexicologie


explicative et combinatoire repose sur le postulat que toutes les proprits qui
viennent d'tre numres sont interconnectes et doivent tre considres
simultanment dans le cadre de l'activit lexicographique. En fait, le travail
sur un vocable particulier commence par une premire hypothse faite sur la
structure polysmique du vocable, qui s'accompagne d'une bauche rapide
de caractrisation de chaque acception en termes de proprits grammati
cales, tiquette smantique, structure actancielle et rgime. On commence
ensuite runir autour de chaque lexie un premier ensemble de liens de FL
qu'elle contrle. Cela nous amne souvent revenir sur nos hypothses
premires, et la suite du travail va se faire par affinements successifs et correc
tions sur les hypothses de dpart. On peut considrer qu'il s'tablit une sorte
de dialogue entre toutes les caractristiques d'une lexie dcrite, qui fait qu'il
est pratiquement impossible de considrer une caractristique spcifique de
faon isole.

74

Drivations smantiques et collocations dans le DiCo/LAF

3. ENCODAGE DES DONNES DANS LE DICO

3.1. Structure des fiches lexicographiques du DiCo


Chaque lexie est dcrite dans le DiCo au moyen d'une fiche lexicogra
phique subdivise en champs. La lexie dcrite dans une fiche est appele le
mot-vedette de la fiche, et chaque champ contient un type d'information bien
spcifique associ au mot-vedette.
Pour illustrer la structure et le contenu d'une fiche DiCo, nous utiliserons
la fiche de BOUILLIEll [Avec la chaleur, nos jolies pches ne sont plus que de la
bouillie.], une des quatre acceptions du vocable BOUILLIE identifie dans le
DiCo2. Nous remettons plus tard l'examen des donnes sur DBAT dans la
mesure o les lexies de ce dernier vocable ont des fiches trs riches et
complexes, qu'il serait difficile d'utiliser pour simplement illustrer notre
approche. Voici donc le contenu des principaux champs de donnes lexicogra
phiques de la fiche de BOUlLLlEl, telle qu'elle a t construite par les lexico
graphes du DiCo.
Champ cg : caractristiques grammaticales

sinq,

s'emploie

surtout

avec un modificateur

Champ Etiq. : tiquette smantique

entit

physique

endommage

Champ fp : formule propositionnelle modlisant la structure actancielle du mot-vedette


:
[L'entit
physique
X EST DE LA] Champ tr : tableau de rgime syntaxique

Champ nb : nota bene (ensemble assez htrogne d'informations non encore formalises)
Champ Syn : liens de FL associs
{QSyn} nasse informe

la synonymie (svnonvmes, quasi-svnonvmes, gnriques, etc.)

Champ fl : tous les autres liens de FL (paradigmatiques et syntagmatiques)


{Epie}
informe
postpos
I

{Telle
eue X est une partie
eu corps
ensanglante}
sanglante,
sanguinolente
postpos
/* [X] tre une B. */'
{Operl}
tre
[ART ~j , n'tre
eue [ART -]
/* i Qqn . /Qqch . ] causer que X sci't de la E.*/
{CausOperl}
rduire
[N=X en AR? ~]
Champ ex : exemples d'emploi du mot-vedette
Il rcuisit
en une bouillie
sanguinolente
les entrailles
ce la pauvre
crature.
Avec la chaleur,
nos jolies
pches ne sont plus que
I

de la

bouillie.

Champ p h : mimration des phrasmes complets (= locutions) construits avec le mot-vedette


_en bouiliie_

Figure

I :

Fiche DiCo de la lexie BOUlLUEll

trois autres acceptions sont : BOUlU.IEI.l [11 mange nue bouillie d'avoine.], BOUILLIEI.2 |i/
marchait dans une sorte de bouillie d'argile.] et BOUILUH1I1 [Si? thse est nulle; c'est une bouillie d'ides
incohrentes.].

2. Les

LANGUE

FRANAIS!

75

Collocations, corpus, dictionnaires

11 est intressant de s'arrter brivement sur le contenu du dernier champ


(ph) de la fiche de BOUILLIEll. On voit que nous avons considr qu'il existe
une locution 'en BOUILLIE1. C'est cette locution qui est employe, par exemple,
dans une phrase comme
(1)
Ce fui un horrible accident : ou l'a retrouv en bouillie sur le bord de la route.
La modlisation de l'emploi de l'expression en bouillie dans la phrase cidessus ne relve pas de la fiche DiCo de BOUILLIEll, mais bien de celle de 'EN
BOUILLIE1 (qui a d'ailleurs t rdige dans le DiCo). L'expression en bouillie
apparaissant en (1) ne doit pas tre confondue avec celle apparaissant dans la
phrase ci-dessous qui, elle, relve bien de la combinatoire de BOUILLIEll :
:

(2)

Rduisez lotit d'abord les haricots rouges en une paisse

bouillie.

Le contenu de chacun des champs de la Figure 1 ainsi que le mode d'enco


dage utilis mriteraient d'tre examins en dtail. Nanmoins, dans le cadre
du prsent article, nous devons nous concentrer sur la modlisation des liens
de FL, c'est--dire sur le contenu des champs Syn et fl.

3.Z. Encodage des liens lexicaux


Les liens drivationnels et collocationnels sont encods dans le DiCo selon
le schma suivant :
'^Formule
ce vulgarisation
(<Lien ce fonction
lexicale>;

du lien
0.'ale::r>

ce fonction

lexicaie>*/'

Comme on peut le constater dans la Figure 1 ci-dessus, les formules de


vulgarisation dcrivant les liens lexicaux sont bases sur un mtalangage
comprhensible par tous - une sorte de franais standardis. Commentons un
peu plus en dtail le contenu des champs Syn et fl de la Figure 1, en exami
nant l'encodage de chaque lien de FL tour de rle.
Le premier lien encod correspond la quasi-synonymie :
\QSyr.} masse inferme

On notera que ce lien se prsente sans formule de vulgarisation. En effet,


nous ne vulgarisons pas les liens auxquels un dictionnaire grand public
driv du DiCo associerait toujours un mme encodage vulgaris, quelle que
soit la lexie. Par exemple, dans le LAF, les FL Syn et QSyn sont toujours trans
crites par le symbole '* .

Nous quittons maintenant le champ des liens de nature synonymique,


pour entrer dans celui contenant l'essentiel des liens de FL.
{Epit}

informe

postpos

Epit dsigne un modificateur redondant qui est un clich langagier repre


nant une composante smantique du mot-vedette. En effet, bouillie informe est
un plonasme, qui est pourtant souvent utilis et ne doit aucunement tre
considr comme une erreur.
{Telle

que

ensanglante}

es:

une partie

sanglante,

du corps

sanguinolente

postpos

Nous avons ici un lien de FL non standard qui encode une combinatoire
courante du mot-vedette. Les expressions bouillie sanglante et bouillie sanguino76

Drivations smantiques et collocations dans le DiCo/LAF


lente, bien que smantiquement transparentes au niveau du dcodage linguis

tique, doivent tre consignes dans le dictionnaire du fait de leur nature


collocationnelle. Elles reprsentent des clichs propres au franais, que le
locuteur doit avoir appris.
/* [X] tre une 3.*/
{Operl} tre [ART ~] , n'tre
que [ART ~:
/* [Qqn. /Qqch. ] causer que X soit de la B.*/
{CausOperl} rduire
[N=X en ART ~]

La FL Oper-L reprsente les verbes supports qui prennent le mot-vedette


comme complment et l'expression du premier actant de celui-ci comme sujet.
CausOper-L encode un collocatif causatif, pour le mme type de structure
syntaxique. On voit que les formules de vulgarisation qui prcdent les enco
dages formels permettent de court-circuiter le recours aux formules de FL
en paraphrasant les expressions dcrites.
La technique de la vulgarisation des liens de FL, outre qu'elle facilite l'accs
aux donnes par le non-spcialiste, ouvre la voie nombre de recherches sur le
systme des FL lui-mme. En effet, les formules de vulgarisation, du fait
qu'elles varient - pour une mme FL - selon l'tiquette smantique du motvedette, permettent de mettre en vidence les diffrentes facettes smantiques
de chaque lien paradigmatique ou syntagmatique standard. Ce type d'infor
mation est trs utile, notamment, lorsqu'on explore les possibles connexions
entre les FL et la dfinition lexicographique des lexies auxquelles ces fonctions
s'appliquent - cf. Kahane (2003) et lordanskaja & Polgure (2005).

Notons, pour conclure sur le sujet, que les liens de FL non standard sont
traditionnellement encods dans les dictionnaires explicatifs et combinatoires
au moyen d'expressions non formalises, qui fonctionnent comme des para
phrases du lien en question. Ces expressions n'ont pas besoin d'tre vulgari
ses puisqu'elles sont immdiatement interprtables sans connaissance du
systme des FL standard. On trouve par exemple les liens non standard
suivants dans la fiche DiCo de DBAT2 [Elle participe un dbat tlvis sur le rle
de l'cole dans la socit.]

{[Qqn.] contrler le droulement d'un D.} animer, diriger


[ART -]
{Individu qui contrle le droulement d'un D. } animateur ide ART ~]
{ v n emen t social
qui comprend un D.

X1

D. en

apposition

un dner-dbat

"- Nous vous convions

"j

Le lecteur aura remarqu que nous avons saupoudr notre prsentation de


rfrences DBAT, qui est le vocable que plusieurs auteurs du prsent
volume ont dcid de prendre comme point de rfrence pour comparer leurs
approches. Avant de passer l'application de nos mthodes au cas spcifique
de ce vocable, nous allons brivement aborder deux aspects essentiels de
l'organisation du projet DiCo/LAF : la modlisation des liens lexicaux fonde
sur une stricte division des mots polysmiques en units lexicales
(section 3.3.) et l'extraction de nouvelles structures de donnes partir du
DiCo (section 3.4.).
LANGUE

FRANAISE

.'

77

Collocations, corpus, dictionnaires

3.3. Division

des mots polysmiques en units lexicales

C'est un fait bien connu qu'un mot polysmique (un vocable, dans notre
jargon) doit tre divis, pour fins de description lexicographique, en accep
tions correspondant chacune une unit lexicale spcifique. Une unit de
description lexicographique correspond donc la modlisation d'une unit
lexicale, pas celle d'un mot polysmique. Cependant, lorsqu'il est question
de la description des drivations smantiques ou des collocations, on a
tendance oublier celte vrit banale et runir dans une mme numration
les drivations et les collocations de toutes les acceptions d'un vocable. C'est
le dfaut principal de plusieurs dictionnaires de collocations, qui les invalide
un degr significatif. Cela s'explique par le fait que la division d'un vocable
en units lexicales, c'est--dire la rsolution de la polysmie, est une des
tches les plus difficiles que doit affronter le lexicographe.
Cependant, les drivations et les collocations sont trs sensibles la poly
smie. Tel driv ou telle collocation sera possible pour telle acception d'un
mot polysmique, mais pas pour une autre. Ainsi, LVATION est driv
d'LEVER 'porter un rang suprieur", tandis que LEVAGE vient d'LEVER
's'occuper des animaux" ; ATTAQUER 'commencer le combat" a le nom
d'action ATTAQUE (une attaque des blinds), mais pas ATTAQUER "dtruire la
substance de qqch.' (*une attaque de l'acide) ; on dit que l'arme bat en retraite,
mais on dit que l'employ en fin de carrire part la retraite. Nous pourrions
continuer citer des exemples de ce type par milliers, mais point n'est
besoin de le faire : en thorie, tout le monde ou presque est d'accord sur la
ncessit de rsoudre la polysmie, mme si en pratique on nglige souvent
de le faire.
Dans notre projet DiCo/LAF, une bonne division du vocable en units
lexicales est une condition sine qttn non une prsentation valide des liens lexi
caux. Nous ne nous permettons jamais de runir drivs smantiques et collo
cations sous un mme mot-vedette sans gard pour sa polysmie ventuelle.
Plus que cela, la diffrence des drivs et des collocations sert souvent d'indi
cateur sr pour la distinction des acceptions.

3.4. Extraction

de nouvelles

structures de donnes

partir du

DiCo

La problmatique de l'extraction de donnes et de produits lexicographiques du DiCo a t au c


de nos proccupations depuis le dbut du projet.
Nous avons commenc par mettre au point un formai possible de dictionnaire
pdagogique driv de la base, le LAF, que nous avons dvelopp graduelle
ment par transformation et reformatage manuels des fiches DiCo -cf. Polgure
(2000).

Grce une Chaire Biaise Pascal accorde 1. Mel'cuk et une collaboralion avec J. Steinlin (Paris 7) et S. Kahane (Paris 10), nous disposons depuis
tout rcemment d'un transmuteur de DiCo qui compile l'ensemble de

fiches DiCo en un ensemble de tables de donnes interrogeables au moyen de


requtes SQL - cf. Steinlin et al. (2004). L'interface DiCoube est accessible sur
le site de l'Observatoire de linguistique Sens-Texte (OLST) l'adresse
78

Drivations smantiques et collocations dans le DiCo/LAF

suivante3 : Jiitp://umm.oIst:umontreal.ca/dicouebe. Le DiCo compil n'est plus


vritablement un ensemble de fiches lexicographiques, un dictionnaire sur
support informatique. Sa structure interne ressemble plutt la structure de
bases lexicales du type WordNet (mme si l'information qu'il contient est
beaucoup plus riche que celle que l'on trouve habituellement dans ces bases).
Le lexique y est modlis comme un gigantesque rseau fait de connexions
tiquetes entre entits lexicales . Alors que le DiCo en fiches correspond
une structure de donnes adapte l'activit de rdaction lexicographique, la
structure en rseau vise la consultation automatique et, de faon plus gn
rale, le traitement informatique.
Nous allons maintenant, dans la dernire section, appliquer l'approche du
DiCo/LAF au cas particulier du vocable DBAT.
4. MTHODOLOGIE LEXICOGRAPHIQUE

APPLICATION AU VOCABLE DBAT

4.1. Rsum du travail lexicographique effectu sur dbat


La construction des fiches DiCo pour le vocable DBAT s'est faite en trois
tapes pincipales :
1

bauche de la structure du vocable

2. recherche d'exemples d'emplois de chaque acception ;


3. laboration des fiches compltes (en commenant par

l'unit lexicale de

base du vocable).

Nous examinons maintenant brivement ce qui caractrise chacune de ces


tapes.

4.1.1. bauche de la structure du vocable

Avant mme d'entamer le vritable travail lexicographique sur DBAT, on


peut se rendre compte que l'on est en prsence d'un vocable polysmique : le
dbat qui agite la socit n'est pas peru comme tant le mme dbat que
celui qu'on organise la fin d'une confrence4. 11 faut donc commencer par
faire une bauche de la structure polysmique du vocable.
Bien entendu, nous ne pouvons pas expliquer ici exactement quelles ont
t toutes nos rflexions et discussions ; contentons-nous de dire qu'elles nous
ont conduits la structure suivante, o chaque acception est caractrise
smantiquement de faon trs approximative et illustre par un exemple :
DBAT]

"confrontation d'ides avant lieu entre diffrents membres d'un groupe


social du fait d'un dsaccord sur un sujet donn" |Ex. Un dbat agile In
socit.]

3. On peut tlcharger celle adresse une documentation dtaille prsentant le DiCo, sa struc
ture compile et l'interface DiCoube : Jousse & Polgure (2005).

Il s'agit d'une faon volontairement nave de prsenter les choses. On pourrait tout fait perce
a affaire deux situations concrtes diffrentes, et ensuite se rendre compte,
l'examen du comportement linguistique de dbat, que le franais ne dispose ici que d'une lexie
vague, qui permet de dsigner les deux situations en question.

4.

voir que l'on

[ANUE

FRANAISE

Collocations, corpus, dictionnaires

"discussion organise entre diffrents participants


social" |Ex. Ln confrence sera suivie d'un dbat.]

D13AT2

un vnement

"discussion organise dans un corps lgislatif [Ex. Les dputs

DBATS.!

se sont

mis

d'accord nu terme d'un interminable dbut.]

'discussion organise durant une sance de tribunal" lEx. l'affaire fera


l'objet d'un dbat contradictoire devant le tribunal correctionnel]

DBAT3b

L'acception choisie comme unit lexicale de base - DBATi - a mrit cette


position dans notre description cause de tout un faisceau d'indices lexicographiques de sa prdominance. Citons notamment les trois indices suivants :
1. 11 s'agit du sens le plus gnral. Ainsi, un dbatz peut tre vu comme une
concrtisation, ou spcialisation, du dbati.
2. La lexie DBATi semblait a priori contrler plus de liens lexicaux que les
autres, mme si DBAT2 paraissait elle aussi trs riche de ce point de vue.
Cette dernire intuition a t confirme au cours des tapes de traitement
subsquentes, puisque notre fiche finale de DiCo pour DBAT] contient
environ un tiers de liens de FL de plus que celle pour DBAT2.
Les deux dernires lexies du vocable, DBATSa et DBATSb, relvent de
domaines de l'activit humaine trs spcifiques (domaine parlementaire et
domaine juridique). II tait d'ailleurs clair ds le dbut que dans le cas de
DBAT3b, au moins, nous tions en prsence d'une lexie terminologique
et qu'il nous serait impossible de la dcrire de faon satisfaisante sans
consulter de la documentation sur le domaine juridique.
Arrivs ce niveau de description de DBAT, nous avons en fait construit
cinq fiches DiCo pratiquement vides une fiche pour chacune des quatre
acceptions et une fiche additionnelle, numrote 0, qui contient toute l'infor
mation pouvant tre factorise au niveau du vocable lui-mme ; le champ cg
de la fiche dbat 3 0 contient l'indication que toutes les lexies du vocable sont
des noms masculins.
3.

Nous consultons ensuite la hirarchie d'tiquettes smantiques du DiCo


(Polgure 2003b) afin d'effectuer l'tiquetage smantique de chaque accep
tion. L'identification des tiquettes va ventuellement nous permettre de
reprer des lexies smantiquement proches dj dcrites dans la base. la fin
de cette premire tape de travail, nous avons obtenu la structure suivante :
dbat -0
c

r.on"i,

ma se

dbat * 1

tiq.

confrontation

Syn

dialogue#2

dbat -.2
Etiq.
=

Syn

dbat

=-3

d'ides
change

Syn
dbat=; 3 b
Etiq.

discussion
en public
dbats 2 public
_table i'cnde_ ; face--face

Etiq.

80

,-

discussion
en public
dbat i\ 3a parlementaire
sance
discussion

en public

polmique

"angl" panel

dialogue#la

Drivations smantiques et collocations dans le DiCo/LAF

Nous indiquons ci-dessus en gras les lexies dj dcrites dans le DiCo, que
l'on utilisera comme points de dpart pour la description des acceptions de
DBAT dont elles sont des quasi-synonymes.

4.1.2. Recherche d'exemples dans les corpus (et ailleurs)


11 est essentiel ce niveau de plonger dans les donnes linguistiques pour
rcolter un maximum d'exemples d'emplois des acceptions que nous avons
postules. Pour cela, nous avons bien entendu recours des corpus lectroni
ques, notamment des corpus journalistiques. Nous utilisons aussi la recherche
sur Internet, avec toutes les prcautions d'usage. Notons ce propos que tout
corpus est potentiellement dangereux s'il est utilis sans discernement. Le but
du travail lexicographique est de construire une modlisation des connais
sances linguistiques d'un locuteur idalis et non de construire une reprsen
tation du contenu d'un corpus donn, aussi large et gnral soit-il.
L'examen des donnes, alli au recours notre propre intuition linguistique,
nous permet de collectionner un ensemble important d'exemples qui, une fois
ajusts et tris, vont tre intgrs dans les champs ex des diffrentes fiches. Nous
en profitons galement pour grappiller les liens de FL que nous rencontrons
en chemin. Cela nous permet de valider ou invalider nos hypothses de dpart
quant la structure du vocable et l'tiquetage smantique des acceptions. En
effet, les diffrents contextes d'emploi rencontrs dans les corpus sont des indi
cateurs trs forts du contenu smantique d'une lexie et donc, par consquent, des
indicateurs de ce que doit tre son tiquette smantique.

4.1.3. Elaboration des fiches dtailles


Nous pouvons maintenant commencer le travail de description mthodique
des acceptions, en commenant par l'unit lexicale de base du vocable. 11 est
important de commencer par cette lexie car, si notre hypothse de dpart est
exacte, il sera ensuite plus facile de dcrire les autres acceptions relativement
celle-ci. Les tiquetages smantiques nous indiquent en effet que les carts
smantiques entre acceptions sont somme toute assez faibles ; notamment, le
vocable ne semble contenir aucune acception de nature mtaphorique.
Remarquons qu'il est beaucoup plus difficile d'effectuer la description
d'un vocable de ce type. En rgle gnrale, plus les carts smantiques entre
acceptions sont grands, plus il est ais d'identifier, rpartir et dcrire les
proprits de chaque acception. Dans le cas d'un vocable comme DBAT, au
contraire, on trouvera dans les corpus beaucoup d'interfrences et, notam
ment, de greffes collocationnelles effectues sur une acception donne
partir de la combinatoire d'une autre acception - sur la notion de greffe
collocationnelle , cf. Polgure ( paratre).
Pour la description de la lexie de base, nous avons eu la chance de disposer
d'une fiche DiCo finalise pour une lexie possdant la mme tiquette sman
tique (confrontation
d ' ides), la mme structure actancielle et le mme
rgime syntaxique que DBATi D1ALOGUE2 [Rien n'indique que toutes les parties
accepteront de reprendre le dialogue.]. Nous nous sommes donc fortement inspirs
de la description de cette dernire lexie pour dvelopper notre nouvelle fiche.
:

LANGUI

AN

A I

81

Collocations, corpus, dictionnaires

Faute de place, nous ne pouvons prsenter ici le contenu des fiches dcri
vant les lexies de DBAT. La modlisation DiCo de ce vocable est cependant
accessible en ligne via l'interface DiCoube (mentionn plus haut). Si l'on
consulte les donnes sur DBATi, on noiera que le champ ph de sa fiche DiCo
contient l'numration des phrasmes complets (= des locutions) 'dbat de
CONSCIENCE"1 et rDBAT INTRIEUR1. Cette information est trs importante car
elle indique que, selon nous, il n'existe pas d'autres acceptions de DBAT qui
correspondraient aux exemples ci-dessous :
(3)

a.
b.

Gide n'a pas publi son ouvrage sans un cruel dbat de conscience,
Racine a distribu sur deux personnages les ples du dbat intrieur.

Ces exemples mettent en effet en jeu des locutions du franais, locutions


qui doivent tre dcrites dans leurs propres fiches de DiCo. On pourra
rapprocher cette remarque de ce qui a t dit la section 3.1. propos de
BOUILLIEll

>s

rEN BOUILLIE1.

Nous n'avons pas la place de commenter ici la description des trois autres
lexies de DBAT. On notera simplement que DBAT2 se construit d'une part
partir de DBATi, dont elle emprunte nombre de liens lexicaux, et d'autre part
partir de la fiche de DIALOGUEia {C'tait clairement un dialogue entre deux
amants perdument amoureux.], dj disponible dans le DiCo. Notons que nous
nous sommes volontairement abstenus, dans le cadre du prsent exeirice, de
faire des recherches dans des dictionnaires et rpertoires de drivations
smantiques et collocations pour complter nos donnes.

4.2. Quelques remarques pour conclure sur l'approche DiCo/LAF


Nous avons dj insist en dbut d'article sur le fait que notre approche du
traitement des collocations se caractrise par sa nature globale les liens
collocationnels sont un des axes d'analyse de la lexie, tous les axes d'analyse
tant interconnects. Il convient d'insister, pour conclure, sur l'omniprsence
de la caractrisation smantique de la lexie dans notre approche. Mme si le
DiCo ne contient pas, proprement parler, de dfinition lexicographique,
nous ne pouvons faire l'conomie du recours la dfinition pour effectuer
l'encodage des liens paradigmatiques et syntagmatiques.
Le couple form par l'tiquette smantique et la forme propositionnelle
(dcrivant la structure actancielle) nous procure un squelette de dfinition
auquel nous avons sans cesse recours pour encoder les liens de FL (formelle
ment et au moyen des formules de vulgarisation). De plus, les encodages du
champ fl de chaque fiche contiennent en filigrane le renvoi des composantes
de la dfinition, clairement identifies au cours du travail lexicographique, et
qui n'attendent que de trouver leur place dans une dfinition du type de
celles du Dictionnaire explicatif et combinatoire5.
:

Un projet de construction de base de dfinition:- formelles - la BDf - est en cours l'OLST. Ce


projet n'a pas atteint la maturit du projet DiCo, mais notre but ultime est d'intgrer au DiCo de
vritables dfinitions lexicogiaphiques construites selon les principes de la lexicologie explicative
et combinatoire. Pour une prsentation du projet BDf. cf. Allman fr Polgure (2003).
5.

82

Drivations smantiques et collocations dans le DiCo/LAF

Pour illustrer ces propos par un exemple concret, examinons l'extrait de la


fiche de DBATi reproduit ci-dessous, qui concerne la zone du champ fl rele
vant des FL de ralisation Reali; Facti et Labreali;i.
/*[X/Y]

apporter

{Reall/2--I;
/*Ce

qqch.

contribuer

que X/Y

dans

un D.*7

; ART -j

apporte

dans

un D.*/'

{SresReall/2--II}

contribution
[de N=X/Y ART ~] [ Les cramiissions
piscopales
viennent
d'apporter
une
contribution
importante
au dbat. ]
/*D. mne un rsultat*/
{FactO--II}
aboutir,
dboucher
/*[Qn./X]
causer de faon autoritaire
que le D.
mne un rsultat*/

{ce

faon

autoritaire

Caus

FactO--II

trancher

[ART ~]

Les collocations encodes ci-dessus relvent clairement de la famille des FL


de ralisation. Elles sont un indice trs fort de la prsence, dans la dfinition
de la base, d'une composante de sens lie la finalit de la situation de dbati.
Si l'on peut dire, par exemple, trancher le dbat pour signifier 'faire en sorte
que le dbati mne un rsultat", c'est parce qu'il est smantiquement

encod dans la langue qu'un dbati a une finalit, un but que cherchent
atteindre les participants (X et Y) de la situation en question. Cette observa
tion est d'ailleurs corrobore par la prsence de collocatifs de type Ver (FL
associe au sens trs gnral 'tel qu'il doit tre") ou AntiVer qui sont directe
ment lis la notion de finalit :
/*Utile*/
{Ver-finalit}
concluant
/*Inutile*/
{AntiVer-f
inalit}
inutile,

postpos,
strile,

fructueux,

utile

vain

L'existence d'une collocation comme dbat strile, parce qu'elle s'encastre


parfaitement dans la grille d'analyse des FL standard, nous permet de tisser
notre toile smantique autour du mot-vedette. On voit aussi qu'elle nous
pousse dcrire des expressions qui ne sont pas des collocations trs typi
ques, comme dbat inutile. Cette dernire, que l'on pourrait premire vue
considrer comme smantiquement compositionnelle, entre dans le champ de
gravit des collocations apparentes du fait des proprits smantiques et de
combinatoire du mot-vedette. 11 est donc justifi de l'inclure dans notre fiche6.

Nous esprons avoir dmontr que le DiCo n'est pas un dictionnaire de


collocations, mais bien un dictionnaire explicatif et combinatoire part entire.
11 est vrai que le nom DiCo trouve son origine dans l'expression dictionnaire de
cooccurrences, car la modlisation des collocations tait au centre de nos proc
cupations lorsque nous nous sommes lancs dans cette entreprise. Trs vite,
cependant, il est devenu vident que les collocations devaient tre au DiCo ce
que la crme frangipane est la galette des Rois : la partie la plus savoureuse,
peut-tre, mais qui est difficilement mangeable sans le reste.

d'autres termes, dbat inutile n'est pas une expression aussi -- innocente que chaise inutile, fatigue
inutile... ; elle doit tre considre comme une collocation malgr son faible degr d'idiomaticit.

6. En

LANGUE

FRANAISE

-:

83