Vous êtes sur la page 1sur 18

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/279763853

Les collocations fondamentales : une piste pour l’apprentissage lexical

Article  in  Revue Française de Linguistique Appliquée · May 2015


DOI: 10.3917/rfla.201.0081

CITATIONS READS

13 388

3 authors:

Veronica Benigno Francis Grossmann


Pearson Education Université Stendhal - Grenoble 3
28 PUBLICATIONS   66 CITATIONS    66 PUBLICATIONS   598 CITATIONS   

SEE PROFILE SEE PROFILE

Olivier Kraif
Université Grenoble Alpes
101 PUBLICATIONS   637 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Global Scale of English View project

PhraseoRom : La phraséologie du roman (ANR-DFG, 2016-2020) View project

All content following this page was uploaded by Olivier Kraif on 21 October 2017.

The user has requested enhancement of the downloaded file.


Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
LES COLLOCATIONS FONDAMENTALES : UNE PISTE POUR
L’APPRENTISSAGE LEXICAL
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Veronica Benigno,Francis Grossmann , Olivier Kraif

Pub. linguistiques | « Revue française de linguistique appliquée »

2015/1 Vol. XX | pages 81 à 96


ISSN 1386-1204
Article disponible en ligne à l'adresse :
--------------------------------------------------------------------------------------------------------------------
http://www.cairn.info/revue-francaise-de-linguistique-appliquee-2015-1-page-81.htm
--------------------------------------------------------------------------------------------------------------------

Pour citer cet article :


--------------------------------------------------------------------------------------------------------------------
Veronica Benigno et al., « Les collocations fondamentales : une piste pour l’apprentissage
lexical », Revue française de linguistique appliquée 2015/1 (Vol. XX), p. 81-96.
--------------------------------------------------------------------------------------------------------------------

Distribution électronique Cairn.info pour Pub. linguistiques.


© Pub. linguistiques. Tous droits réservés pour tous pays.

La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des
conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la licence souscrite par votre
établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque forme et de quelque manière
que ce soit, est interdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en
France. Il est précisé que son stockage dans une base de données est également interdit.

Powered by TCPDF (www.tcpdf.org)


Rev. franç. de linguistique appliquée, 2015, XX-1 (81-96)

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
Les collocations fondamentales : une piste pour l’apprentissage lexical

Veronica Benigno, Pearson


Francis Grossmann & Olivier Kraif, Université Grenoble-Alpes
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Résumé : Les listes de fréquence (listes de base, élémentaires, etc.) ont connu un certain succès
pédagogique, notamment en France à la suite des travaux pionniers de Gougenheim. Cependant, les
recherches étaient restées centrées sur l'unité-mot, sans prendre en compte les associations lexicales les
plus fréquentes de la langue, associations qui fonctionnent comme de véritables unités lexico-
grammaticales. Notre contribution vise à préciser la relation entre fréquence et jugement pour
l’identification du caractère ‟fondamental” des unités polylexicales et avance l’hypothèse que le
figement de ces unités joue un rôle dans le choix opéré par les locuteurs natifs. Nous proposons ensuite
quelques pistes didactiques à partir d’une étude de corpus réalisée dans le domaine des ‟événements
sociaux”.

Abstract: Following the pioneering work of Gougenheim and his team in the 1950s, pedagogical
frequency lists have received much attention in France and elsewhere. However, research has mainly
focused on single lexical items, whereas the role played by high-frequency phraseological units, i.e. units
functioning as independent lexico-grammatical chunks, has been neglected. In this paper we describe the
relationship between frequency and native speakers’ judgements in order to determine the basic
character of phraseological units; additionally, we show that individual judgements seem to be affected
by the degree of fixedness between the components of such units. In the last section we discuss some
pedagogical implications derived from a corpus-based study in the domain of ‘social events’.

Mots-clés : lexique, acquisition du lexique, collocation, corpus/exploitation


Keywords: vocabulary, vocabulary acquisition, collocation, corpus use

0. Introduction

Du fait de leur caractère souvent arbitraire et idiosyncrasique, les


collocations représentent un défi majeur pour l’apprentissage lexical en langue maternelle, et
plus encore pour l'apprentissage des langues étrangères, surtout en production. C’est sans
doute ce qui explique que de nombreuses recherches ont tenté de mieux définir leurs
propriétés (parmi des synthèses récentes, citons Bartsch (2004), Carter & Schmitt (2004),
Cowie (1998), Grossmann & Tutin (2003), Tutin (2013)). D’autres chercheurs ont cherché à
préciser leur traitement lexicographique (Lo Cascio 1999 ; Polguère 2003), ou encore à mieux
comprendre leur rôle dans le fonctionnement du lexique mental (Wray 2000). Notre
contribution vise en premier lieu à préciser le concept de ‘collocation fondamentale’. Nous
proposons pour cela d'élargir la notion de ‘vocabulaire fondamental’ (Gougenheim & al.
1964) à la dimension syntagmatique. Nous tenterons de répondre à trois questions
principales : quelle est la corrélation entre fréquence et jugement pour établir le caractère
‘fondamental’ des associations polylexicales ? De quel facteur autre que la fréquence dépend
l’attribution du caractère fondamental de la part des locuteurs natifs ? Quelle est l’utilité de la
82 Veronica Benigno, Francis Grossmann & Olivier Kraif

fréquence, des mesures associatives et de la dispersion pour le repérage des collocations


fondamentales ? Nous reviendrons d’abord (section 1) sur l’héritage du français fondamental
et des listes de fréquence, puis nous préciserons le sens que nous donnons à l’expression
‘collocation fondamentale’ (sections 2 et 3). Enfin, nous envisagerons les pistes didactiques
(section 4) puis nous conclurons par des considérations plus générales sur la manière dont

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
pourrait être revitalisé un projet pour le français fondamental intégrant la dimension
syntagmatique.

1. L’héritage des listes de fréquences


Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

1.1. Le Français Fondamental et autres études pionnières

Le Français Elémentaire (1954), né d’une initiative de l’UNESCO, mieux connu sous le nom
Français Fondamental, a été rédigé par Georges Gougenheim et son équipe, et s’inscrit dans
la lignée des travaux sur les listes de vocabulaires simplifiées ou réduites nées des besoins de
l’enseignement de la langue étrangère (cf. pour l’anglais, Thorndike (1921), le Basic English
d’Ogden (1930), et la General Service List de West (1953) ; pour le français, voir Henmon
(1924), Vander Beke (1927), Haygood (1937)).
Nous ne détaillerons pas ici le parcours, assez complexe, qui mène de sa première
élaboration à la dernière édition du Dictionnaire fondamental (Gougenheim 1971). Retenons
que la liste de fréquence1 a été élaborée à partir de grandes enquêtes sur la langue orale, et a
été complétée plus tard par des données concernant la langue écrite.
Le Français Élémentaire, en offrant des moyens d’expression plus larges, se voulait
différent du projet du Basic English. Il présentait une liste de 1 138 mots (en grande partie des
mots lexicaux), rédigée d’après le dépouillement et la transcription de 163 conversations
recueillies à l’aide de magnétophones et correspondant à un total de 312000 occurrences (et
d’à peu près 8000 mots différents). Dans l’édition de 1956, une liste de mots classés par
fréquence décroissante et une liste de mots classés par ordre alphabétique est fournie. Elle
s’élargit, dans la dernière mise à jour de la liste (le Dictionnaire fondamental de 1971), à
3 500 mots et comprend des mots fréquents ainsi que des mots disponibles, c’est-à-dire des
mots peu fréquents mais essentiels pour la communication, relevés au cours de l’enquête dans
les écoles, à partir de seize ‘centres d’intérêt’ principaux.
Comme tous les travaux de pionnier, l’ouvrage a été très critiqué. En témoigne en
particulier le petit volume de Marcel Cohen de 1955, intitulé Français Elémentaire ? Non.
L’auteur, entouré d’autres illustres linguistes de l’époque, y exprime son refus catégorique de
l’entreprise et de sa signification politique et sociale : le Français Elémentaire est considéré
comme un travail conduisant à une langue imprécise et réduite, qui plus est, comme une
tentative d’imposer la langue française aux populations locales. Cette critique semble
aujourd’hui très injuste étant donné le caractère novateur et la valeur de la méthode adoptée
pour le recueil des données orales, surtout avec les moyens dont on disposait à l’époque. Une
des limites principales de l’entreprise, cependant, avait bien été perçue par Cohen : les listes
de fréquence restaient cantonnées au mot, sans que soit pris en compte ses ‘associés’ les plus
courants, autrement dit le fait qu’un mot entre fréquemment dans des collocations2.

1
Cette liste a représenté un travail de référence pour de nombreuses études sur le vocabulaire, notamment
l’Inventaire thématique et syntagmatique du Français Fondamental de Galisson (1971), le LOB (Listes
orthographiques de base du français de Catach, publiées en 1984) et bien d’autres travaux.
2
Malgré ses défauts, l’entreprise continue à susciter l’intérêt des chercheurs, comme en témoigne le
colloque organisé à l’ENS de Lyon en 2005 (Cortier & Parpette, 2006).
Les collocations fondamentales : une piste pour l’apprentissage lexical 83

1.2. Vocabulaire fondamental : fréquence et autres critères définitoires

Qu’est-ce que le vocabulaire fondamental d’une langue ? C’est son noyau lexical, le
vocabulaire dont chaque locuteur dispose pour ses actes communicatifs élémentaires et
quotidiens. Bien que ce vocabulaire de base ne soit pas un ensemble cohérent, des études ont

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
montré que des traits généraux peuvent en être proposés. Par exemple, pour l’italien, Thorton,
Iacobini et Burani (1997) présentent des données quantitatives et qualitatives prenant en
compte la distribution des catégories grammaticales, des classes de flexion, du genre, des
affixes ; ou encore les structures accentuelles prédominantes, la longueur moyenne en
syllabes, etc. Pour l’anglais, Carter (1998) explique qu’il est possible de soumettre un mot à
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

des tests pour vérifier si celui-ci appartient au vocabulaire fondamental. Ces tests, qui
recourent à des informateurs natifs, tentent de fixer des critères objectifs permettant
d’identifier les traits généraux (formels ou non) qui caractérisent le vocabulaire de base. Le
vocabulaire fondamental d’une langue serait générique, ‘neutre’3, et non marqué, même s’il
ne s’agit là que de tendances.
Le degré d’intégration dans le système linguistique paraît également important : le trait de
‘substitution syntaxique’ est possédé par un mot fondamental lorsque celui-ci ne peut pas être
remplacé par d’autres mais peut en revanche se substituer à d’autres mots. Le mot eat, par
exemple, qui exprime un trait sémantique de base de dine et devour, peut se substituer à eux,
mais ne se laisse pas définir par ces mots. Un test a montré que 80 % des informateurs à qui
on demandait de définir guffaw, chuckle, giggle, laugh, jeer, snigger utilisaient le mot de base
laugh pour expliquer ces termes. Ce sont évidemment les mots génériques ou superordonnés
qui passent le test de la substitution syntaxique. Des traits plus simples à tester et qui
reçoivent une attention constante de la part des rédacteurs de listes de vocabulaire
fondamental sont la fréquence, la dispersion et la disponibilité.
La fréquence est basée sur l’observation empirique de la langue d’usage. Tous les
rédacteurs de listes simplifiées ou réduites se sont servis de ce critère et elle est la première
caractéristique invoquée dans toute définition du vocabulaire fondamental. Selon Nattinger et
DeCarrico (1992), la fréquence serait un facteur primaire dans l’apprentissage car la
‘ritualisation’ joue un rôle fondamental dans l’acquisition du langage comme dans tous les
autres types de comportement humain. Le fait que la fréquence facilite l’apprentissage lexical
en langue maternelle comme en langue étrangère est bien connu : selon l'hypothèse du niveau
seuil de Paradis (2004), l’activation d’un item dans le lexique mental dépend de la quantité
d'impulsion neurale reçue, qui à son tour dépend de la fréquence d’occurrence de l’item.
Lorsqu’un item lexical est activé, son niveau seuil s’abaisse et cela facilite sa réactivation.
D’après Tomasello (2003), la fréquence est un facteur crucial dans l’apprentissage lexical.
Elle explique pourquoi des constructions irrégulières, et donc difficiles à apprendre de la part
d’un locuteur étranger, sont malgré tout mémorisées : elles sont souvent utilisées et donc
apprises comme des blocs.
Une étude intéressante sur les moyens d’identifier le vocabulaire fondamental français a été
effectuée au Québec par Richards et Savard en 1970. Selon les auteurs, certains mots de basse
fréquence sont en réalité fondamentaux pour l’interaction quotidienne bien qu’ils
n’apparaissent que dans un ou deux contextes particuliers, et que pour cette raison, ils ne sont
jamais pris en compte dans les comptages de fréquence. Ce sont les ‘mots disponibles’, des
mots forts importants comme fourchette et dents, dont on ne se sert que rarement en
production : la fourchette est un instrument qu’on utilise tous les jours, mais qu’on nomme
bien moins souvent qu’on n’en fait usage. Il en va de même des dents, dont on ne parle que si

3
Par exemple, le test de ‘neutralité de discours’ (neutral field of discourse) montre que les mots
fondamentaux ne concernent pas un domaine spécialisé, comme par exemple la médecine.
84 Veronica Benigno, Francis Grossmann & Olivier Kraif

on en souffre. La fréquence n’est pas un facteur stable, sauf en ce qui concerne les mots les
plus fréquents et les plus génériques qui ne sont pas influencés par un contexte de situation
particulier. Tous les autres mots ont une fréquence assez variable.
Outre la fréquence, un second trait permet de définir le vocabulaire fondamental : la
disponibilité. Le vocabulaire de base d’une langue contient des mots peu fréquents qui sont

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
propres à certains contextes et que les locuteurs natifs considèrent comme utiles dans
l’interaction quotidienne. Richards et Savard (1970, 37) montrent que la disponibilité d’un
mot mesure le vocabulaire d’un certain domaine. Les auteurs expliquent que la familiarité du
vocabulaire est liée aux domaines sociaux et culturels familiers au locuteur.
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Enfin, un troisième critère est celui de la dispersion ou homogénéité de distribution. Les


mots qui peuvent être employés dans des contextes divers (c’est-à-dire qui sont distribués de
façon homogène dans tout le corpus de référence plutôt que dans quelques sections du corpus)
sont sans doute plus utiles que ceux qui ont un usage restreint à des contextes particuliers.
Considérons le verbe faire : il se retrouve pratiquement dans n’importe quel type de texte,
tandis que le verbe grimper se trouve dans un nombre restreint de textes. La dispersion
permet de relativiser la fréquence et d’exclure du vocabulaire fondamental les mots qui sont
très fréquents mais qui n’apparaissent que dans des contextes limités. Une des façons les plus
simples pour mesurer la dispersion est de mesurer la répartition, c’est-à-dire de calculer le
nombre de textes différents dans lesquels le mot apparaît.

1.3. Les leçons du passé

Les observations qui précèdent suggèrent qu’il est nécessaire, dans la constitution d’un
vocabulaire fondamental, de faire preuve d’un certain empirisme de manière à intégrer des
mots peu fréquents mais nécessaires à l’expression de concepts clés apparaissant dans une
langue, ainsi que de prendre en considération l’homogénéité de la répartition des mots dans
les différents domaines de la langue générale. La valeur de la fréquence comme élément pour
la sélection du vocabulaire fondamental n’est pas remise en question, mais ce critère apparaît
à l’évidence insuffisant. Il faut accepter en outre le fait que l’apprentissage du lexique d’une
langue est un procès évolutif et différencié. Le vocabulaire fondamental devrait être envisagé
comme un point de départ : si les locuteurs disposent d’un bagage lexical qui se retrouve dans
tout type de contexte (les mots très fréquents) ou mieux, d’une liste de mots qui inclut en sus
les mots ‘disponibles’, ils peuvent communiquer adéquatement dans la majorité des contextes
communicatifs quotidiens, surtout si l’on organise ce vocabulaire en domaines, champs
sémantiques ou macro-actes de langage.
Un deuxième point important réside dans le fait que le vocabulaire fondamental ne peut pas
être considéré comme une simple liste d’items lexicaux, mais qu’il doit être étudié avec ses
associés les plus typiques : le bagage lexical d’une langue consiste en une variété de formules,
chunks, phrases de routine, expressions figées, collocations. Au fur et à mesure que les
rencontres en contexte se font plus nombreuses, la connaissance des associations lexicales
privilégiées d’un mot s'accroît. C’est aussi à l’aide de ces liens privilégiés que les mots voient
leurs sens désambiguïsés.

2. Vocabulaire fondamental en contexte : les collocations

2.1. Approches statistiques et approches phraséologiques

Les approches essentiellement statistiques (Firth 1957 ; Halliday 1985 ; Sinclair 1991, etc.),
n’intègrent pas la mesure statistique à des informations syntaxiques et/ou sémantiques
détaillées et courent donc le risque de ne pas repérer des collocations peu fréquentes mais
Les collocations fondamentales : une piste pour l’apprentissage lexical 85

pertinentes, généralement spécialisées. Elles ont été étroitement liées aux domaines de la
lexicologie et de la lexicographie, et ont proposé une analyse inductive à partir d’un repérage
des cooccurrences lexicales dans les corpus. Elles ont tendance à inclure, parmi les unités
phraséologiques, des associations moins figées mais qui constituent un choix fréquent de la
part du locuteur.

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
Dans les approches essentiellement phraséologiques (Hausmann 1989 ; Mel’čuk 1998 ;
Cowie 1998, etc.), on court le risque inverse d’exclure des associations plutôt libres qui sont
cependant représentatives de l’usage linguistique. Ces approches expliquent les assemblages
collocationnels en terme d’opérateurs/fonctions (à la Mel’čuk) ou en modélisant les relations
sémantiques au sein de composés comme dans stone furniture, ou dans des relations
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

prédicatives telle que la cause, comme dans malarial mosquitos.


Les deux approches, bien qu’elles soient à l’origine très différentes, se rejoignent
aujourd’hui. A l´heure actuelle aucun représentant de l´approche statistique ne considère la
fréquence comme un critère absolu. Les études basées sur corpus relativisent les erreurs
provenant de la fréquence en utilisant des mesures associatives, et distinguent les phénomènes
syntagmatiques réguliers des phénomènes syntagmatiques restreints ou arbitraires. Comme le
fait remarquer Hoey (2005, 3), on ne peut pas donner la même importance à des
cooccurrences non significatives du type the student (où the est un mot fréquent de manière
absolue) et à des structures fréquentes et significatives de type lexical telles que les
collocations.
Mais il est tout aussi vrai que le recours à des critères linguistiques/fonctionnels
(syntaxiques ou sémantiques) plutôt que simplement statistiques/textuels se révèle
indispensable pour des analyses descriptives plus fines ainsi qu’en TAL. C’est ce qui explique
que ce sont les approches mixtes, fondées sur un équilibre entre critères statistiques et
analyse formelle, qui ont aujourd’hui le vent en poupe : on peut citer entre autres les travaux
développés récemment autour des routines discursives, témoignant d’une conception
‘étendue’ de la phraséologie (Legallois 2012 ; Legallois & Tutin 2013).

2.2. L’apport des linguistiques cognitives

Depuis quelques décennies, les approches cognitives ont également enrichi la réflexion sur la
phraséologie en intégrant la dimension cognitive et l’usage. La grammaire générative insistait
sur la créativité linguistique et l’étude des séquences phraséologiques avait donc reçu très peu
d’attention. Les approches cognitives, en effaçant les frontières entre syntaxe et lexique,
peuvent réaffirmer l’importance de l’automatisation et de la réutilisation de blocs lexicaux
fonctionnels dans l’apprentissage linguistique, sans pour autant la restreindre à la vision
behaviouriste classique. Parmi les représentants de ce courant, on peut citer les représentants
des ‘Grammaires de Construction’ (Fillmore & al. 1988 ; Goldberg 1995 ; Langacker 1987 ;
Lakoff 1987 ; Croft & Cruse 2004) selon lesquels les unités linguistiques sont symboliques et
les niveaux syntaxique et sémantique ont tendance à se confondre (point qui reste à nos yeux
discutable4) ; et la ‘Grammaire des Patterns’ (représentée par les linguistes anglais Francis et
Huston (2000)) qui continue les travaux de l’école contextualiste et étudie « les patrons
distributionnels qu’intègrent certaines classes de mots sémantiquement homogénéisés par le
pattern ». Selon Legallois (2005, 114) ces deux modèles, en reconnaissant le rôle primaire de
la phraséologie pour l’apprentissage linguistique, ont rendu possible un véritable « tournant
phraséologique de la grammaire » (op. cit. 109).

4
On peut rappeler que Sinclair & al. (2004) à travers la notion de prosodie sémantique montrait à
moindre coût la jonction de la forme et de la fonction à partir des facteurs pragmatiques qui pèsent sur les
choix lexicaux.
86 Veronica Benigno, Francis Grossmann & Olivier Kraif

Dans ce courant de réaction au générativisme, les théories psycholinguistiques jouent, elles


aussi, un rôle important : elles décrivent le développement linguistique comme un procès qui
va des séquences conventionnelles et stéréotypées aux séquences créatives. Selon Ellis
(2002), la séquence acquisitionnelle la plus naturelle a la structure ‘formula > low-scope
pattern > creative constructions’ : l’acquisition est un procès qui va des unités non analysées

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
aux constructions produites de façon créative en passant par l’analyse des structures de la
langue. L’émergence d’un système créatif serait liée à la décomposition des unités
préfabriquées. Wray et Perkins (2000, 1) partagent la même opinion. Ils considèrent l’unité
phraséologique comme une séquence préfabriquée, mémorisée et restituée au moment de
l’usage. Il s’agit donc d’une nouvelle vision langagière, pour laquelle les concepts de lexical
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

priming (Hoey 2005) et de lexique-grammaire (Altenberg & Granger 2002 ; Jackendoff


2002 ; Schmitt & al. 2004 ; Gross 1988) occupent un rôle central. Les démarches empiriques
liées aux corpus et les grammaires ‘fondées sur l’usage’ convergent et autorisent aujourd’hui
un renouvellement de la problématique des vocabulaires fondamentaux.

3. Le concept de collocation fondamentale : une étude de corpus

Nous avons voulu surmonter certaines des limites des approches classiques du vocabulaire
fondamental (exclusivité du critère de fréquence et minoration de la dimension
syntagmatique) dans une étude de corpus visant à identifier les critères qui définissent les
collocations fondamentales. Si repérer les mots par fréquence ne représente guère d’obstacle
grâce aux outils informatiques, le repérage des mots plus rares mais ‟disponibles” pour les
locuteurs, c’est-à-dire utiles sur le plan communicatif, représente un vrai défi. En couplant
une analyse de corpus à l’exploration du jugement des locuteurs natifs, on a pu, d’une part,
développer un système d’extraction de corpus des unités les plus fréquentes ou disponibles
(c’est-à-dire celles dont les composants étaient plus étroitement associés selon des mesures
associatives telles que l’information mutuelle) ; et d’autre part, montrer d’où vient, chez les
locuteurs natifs, l’attribution du caractère fondamental. Les ‘collocations fondamentales’ sont
définies comme des unités polylexicales dont les composants sont unis par des liens
sémantiques, fréquentes (dans l’usage) ou non fréquentes (lorsqu’elles sont pertinentes pour
la communication), et qui représentent pour les locuteurs natifs les contextes privilégiés d’un
mot donné.

3.1. Les collocations issues des mots pivots

L’étude a été conduite sur un échantillon d’environ 400 collocations dérivées de 10 mots
fondamentaux inclus dans le Français Fondamental. Nous synthétisons ici les résultats
présentés dans Benigno (2012). L’étude a extrait environ 400 collocations produites de 10
mots pivots qui représentent la ‘tête’ ou ‘base’. Ce sont les substantifs : colloque, conférence,
congrès, conversation, débat, fête, interview, rencontre, réunion, séminaire. Ces mots
représentent des ‘événements sociaux’ selon le Thésaurus Larousse de Péchoin (1991), et ils
sont fondamentaux, c’est-à-dire fréquents ou disponibles selon le Dictionnaire Fondamental
de la langue française de Gougenheim (1971). Nous avons choisi des mots fondamentaux
comme bases des collocations fondamentales en raison de leur nombre élevé d’occurrences
ou du fait de leur haute disponibilité. Nous sommes partis du postulat que, si ‘+’ désigne un
mot fondamental et ‘–’ un mot non fondamental, les collocations fondamentales ne seront pas
de type ‘– –’. En effet, une collocation composée de deux mots non fondamentaux aboutit en
principe à un domaine de discours spécialisé et n’est pas représentative du langage
fondamental, et nous avons donc a priori décidé de l’exclure de notre inventaire (on peut
comparer, par exemple, recevoir le courrier, du type ‘+ +’, et accusé de réception, du type
‘– –’).
Les collocations fondamentales : une piste pour l’apprentissage lexical 87

Nous avons choisi des substantifs parce que le substantif représente souvent (voir Grossmann
& Tutin (2003) pour des exceptions) la tête lexicale dans le couple base-collocatif : il a un
caractère référentiel et dénotatif plus précis que les adjectifs et les verbes (au moins dans la
langue générale) ; l’accès lexical est plus rapide que celui des verbes dans le lexique mental
(Ellis 1997) ; et il joue un rôle principal en tant que tête syntaxique et sémantique du

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
syntagme (Lo Cascio 2000). Enfin, sur un plan méthodologique, l’extraction des substantifs
d’un corpus est beaucoup plus simple que l’extraction des verbes : la variation morphologique
du substantif est moins importante que celle du verbe, car elle est restreinte au nombre, au
genre et éventuellement aux procès de dérivation ou de composition.
Le choix d’un domaine sémantique spécifique se justifie par différentes raisons. En premier
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

lieu, l’analyse de toutes les entrées (quelques milliers de mots) de la liste de référence du
vocabulaire fondamental du français (Gougenheim 1970) demanderait un travail énorme et
équivaudrait à la rédaction d’un ouvrage lexicographique. En outre, le choix d’une base
correspondante à une catégorie grammaticale sans un groupement dans un domaine
sémantique aurait constitué un inventaire peu homogène et peu exploitable (les relations de
synonymie sont mises en évidence si on choisit des mots sémantiquement proches). De plus,
l’analyse des substantifs qui appartiennent à un domaine sémantique précis présente de
l’intérêt pour l’exploitation didactique. L’échantillon constitué n’a pas la prétention de
représenter de façon exhaustive tous les ‘événements sociaux’ ni de constituer tout le mini-
lexique combinatoire de base, mais vise à constituer un échantillon du vocabulaire
fondamental représentatif du domaine choisi.

3.2. Corpus et outil utilisés

Le corpus (Baroni & al. 2010), consiste en plus d’un milliard de mots constitué de textes issus
du Web à l’aide d’un crawler filtrant le contenu d’Internet sur la base d’une liste de mots clés
de fréquence haute et moyenne. Le but des auteurs était de repérer des textes représentatifs de
la langue française générale (et non du français du Web) et de différents genres. Le corpus
inclut des textes pré-édités et en format électronique sur le Web (des sermons aux recettes, en
passant par les manuels techniques et les récits, et des transcriptions de la langue orale) ainsi
que des textes typiques du Web (pages personnelles, blogs, messages de forums). Ce corpus a
été exploré par des scripts de programmation ad hoc développés par Kraif (2011) : d’une part
une liste de fréquence accompagnée de mesures statistiques, qui affiche la fréquence des
cooccurrences, leur dispersion et leur degré d’association selon des mesures spécifiques telles
que l’information mutuelle ; un concordancier d’autre part, qui affiche les lignes de
concordances pour chaque cooccurrence du mot pivot ; les sources Web d’où elles sont
extraites, c’est-à-dire l’URL, sont aussi indiquées. C’est à partir de ces concordances qu’ont
été construits les patterns sémantiques et syntaxiques caractérisant les cooccurrences extraites.

3.3. Démarche méthodologique

L’étude extrait du corpus un échantillon d’environ 400 candidats à l’aide de la fréquence, de


la dispersion, et des mesures associatives de l’information mutuelle, du log-likelihood, et
du t-score. Afin de constituer l’échantillon des associations candidates au statut de
collocations fondamentales, nous avons opéré un nettoyage à la fois manuel et automatique de
la liste de fréquence, visant à éliminer le bruit des données extraites, et choisi des valeurs de
significativité statistique ; nous n’avons retenu que les unités les plus fréquentes, auxquelles
ont été ajoutées des unités moins fréquentes pertinentes, selon les locuteurs natifs, du point de
vue communicatif. 90 locuteurs natifs ont été soumis à un questionnaire écrit. Il s’agissait de
locuteurs volontaires, de nationalité française (pour la majorité), suisse, belge ou canadienne,
88 Veronica Benigno, Francis Grossmann & Olivier Kraif

de niveau d’instruction, d’âge et de professions variés. Avant de commencer le test, les


locuteurs étaient invités à lire les instructions, qui leur fournissaient une explication détaillée
du concept de ‘association fondamentale’, avec des exemples extraits du corpus. Le test a été
soumis à 3 groupes de 30 locuteurs chacun :
- le groupe des 3 mots pivots conférence, débat, rencontre aux 30 premiers locuteurs,

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
- le groupe des 3 mots pivots colloque, fête, réunion aux 30 autres locuteurs,
- le groupe restant des 4 mots pivots congrès, séminaire, interview, conversation aux 30
derniers locuteurs.
En résumé, un total de 400 collocations fondamentales a été réparti entre les 90 répondants,
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

divisés en 3 groupes de 30 selon le mot pivot à analyser. Les associations ont été présentées
dans leur structure lexico-syntaxique d’occurrence la plus fréquente : par exemple, étant
donné que conférence se présente toujours au pluriel en association avec cycle, c’est la forme
un cycle de conférences qui a été choisie. Le même principe motive l’association choisie entre
conférence et s’intituler : la collocation se présentant le plus souvent dans notre corpus dans
la forme verbale du présent, nous avons présenté aux répondants l’association la conférence
s’intitule. Le même principe vaut pour l’alternance article défini/indéfini dans l’association de
animation et de conférence : la forme la plus fréquente dans l’usage, l’animation de la
conférence, a été choisie.

3.4. Résultats

Les deux résultats principaux de notre étude mettent en évidence, d’une part, l’existence
d’une corrélation positive non systématique entre fréquence et caractère fondamental attribué
par les locuteurs, d’autre part l’importance du critère du figement. En ce qui concerne le
premier aspect, nous avions noté qu’il n’y avait pas toujours de corrélation entre la fréquence
des associations et le score obtenu par les locuteurs natifs, et quand il y en avait une, elle était
faible et non systématique, à cause de la présence de cas particuliers s’écartant de la norme.
Ces cas représentent des associations très fréquentes mais peu sélectionnées par les locuteurs,
et inversement des associations plus rares mais souvent sélectionnées. En effet, nous avons
constaté que parfois des unités polylexicales très fréquentes ne sont pas jugées fondamentales
par les locuteurs. Par exemple, l’association être à une rencontre a une fréquence très élevée
(18786) mais elle n’est considérée comme fondamentale que par le 7 % des locuteurs natifs;
et nous constatons la même chose pour l’association avoir une rencontre (fréquence 14079,
score natifs 7 %).
Le second résultat de notre recherche montre que si la fréquence ne joue pas de rôle dans
l’attribution du caractère fondamental aux unités polylexicales, il faut en chercher la raison
dans leur figement. Par exemple l’association une conférence téléphonique – qu’on peut
considérer comme un terme, donc comme une association très figée – a une fréquence très
faible (fréquence 459) mais est traitée de fondamentale par l83 % des sujets. Cet aspect n’a
pas non plus été exploré par les auteurs du Français Fondamental (Gougenheim & al. 1964),
car ils n’ont pas réellement cherché à déterminer la cause du caractère fondamental attribué
aux mots. Dans le tableau suivant, nous présentons les associations fondamentales de
conférence triées par fréquence. Nous surlignons en gris les associations considérées comme
fondamentales. Nous marquons en capitales soulignées tous les points qui semblent avoir un
écart significatif entre fréquence et score obtenu par les locuteurs. Ensuite, nous considérons
comme fondamentales les associations les plus fréquentes sauf les points de score faible, et
seules les associations non fréquentes avec un score élevé. La ligne noire horizontale marque
Les collocations fondamentales : une piste pour l’apprentissage lexical 89

le seuil de significativité de la fréquence5 (désormais s.s.f.)6 établi au moment de l’extraction.


Pour conférence, le s.s.f. était 1043.

Tableau 1. Pivot conférence : liste des associations fondamentales


indiquées sur trame de fond grisé (seuil de significativité de la fréquence : 1043).

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
En capitales soulignées, les points singuliers.

Associations Fréquence Score natifs


une * de presse 14207 97 %
un maître de *s 14106 87 %
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

être à une * 10418 57 %


AVOIR une * 8069 20 %
organiser une * 5589 70 %
une * internationale 3729 73 %
donner une * 3487 83 %
un cycle de *s 3111 40 %
la salle de * 3045 93 %
F le thème de la * 2478 77 %
au cours de la * 2439 63 %
tenir une * 2045 57 %
le programme de la * 1749 50 %
faire une * 1674 37 %
animer une * 1331 73 %
participer à une * 1233 73 %
le PRESIDENT de la * 1203 17 %
à l’occasion de la * 1166 53 %
assister à une * 1130 93 %
la * DE RENTREE 1053 7%
une * annuelle 1043 43 %
l’animation de la * 809 27 %
une * de consensus 790 7%
une * épiscopale 609 17 %
prononcer une * 608 13 %
la * s’intitule... 595 23 %
une * mensuelle 569 27 %
D une * MINISTERIELLE 524 40 %
une * INTERGOUVERNEMENTALE 492 40 %
une * TELEPHONIQUE 459 83 %
le COMPTE-RENDU de la * 436 70 %
la tenue de la * 382 10 %
une * inaugurale 248 23 %
une * tripartite 147 17 %
une * introductive 102 17 %

5
Ce seuil sépare les unités fréquentes (F) des unités non fréquentes mais pertinentes (éventuellement
disponibles, indiquées avec D) que nous avions repérées comme candidates au statut de collocations
fondamentales.
6
Pour des précisions supplémentaires, voir Benigno (2012) et Benigno & al. (à paraître).
90 Veronica Benigno, Francis Grossmann & Olivier Kraif

4. Les collocations fondamentales : pistes didactiques

Nous voulons ici revenir pour finir sur l’importance des collocations fondamentales pour la
didactique des langues, maternelles et surtout étrangères7.

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
4.1. La sélection des collocations à enseigner

L’importance des usages stéréotypés de la langue est reconnue par la plupart des études
didactiques sur le lexique (Granger 2008). Comme nous l’avons mis en évidence dans ce
travail, la fréquence est liée à l’usage, elle facilite les procès de mémorisation et favorise les
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

items à haut rendement cognitif. Sur la base de cette observation, l’enseignant a tout intérêt,
dans la construction d’un inventaire lexical, à inclure les mots les plus fréquents ainsi que
leurs associations. Cependant, il ne doit pas réduire le sens de ‘fondamental’ uniquement à
‘fréquent’ : on a vu que certaines associations peu fréquentes mais plutôt figées sont choisies
par les locuteurs, et qu’à l’inverse, des associations très fréquentes mais libres ne présentent
aucun intérêt pour l’apprentissage. C’est à ce stade que l’analyse linguistique du ‟mode de
fabrication” des collocations, comme le fait par exemple la lexicologie combinatoire à travers
le concept de fonction lexicale (Mel’čuk 1998) devient utile : les principes qui permettent
d’expliciter le rôle du collocatif (par exemple dans une construction à verbe support, comme
dans donner une conférence) et s’il y a lieu sa motivation sémantique (par exemple
métaphorique, comme dans animer une conférence) fournissent les principes nécessaires à la
structuration sémantique et syntaxique.

4.2. Elargir le cadre d’apprentissage aux expressions polylexicales privilégiées

Bien que notre outil d’extraction ait été paramétré spécifiquement pour le repérage des
collocations, l’échantillon que nous avons obtenu ne se limite pas aux collocations, mais
inclut également de nombreuses associations libres, et même des expressions polylexicales
prépositionnelles, du type à l’occasion de, au cours de. Les composants des associations
libres se sélectionnent réciproquement si souvent qu’ils semblent avoir le même statut que les
collocations selon les mesures associatives, même si elles n’en ont pas le statut linguistique.
Si l’on admet que l’univers conceptuel de discours gravite autour d’un mot pivot donné
(comme le suggère Lo Cascio (2007)), on peut souligner l’importance de fonder la sélection
du vocabulaire à enseigner sur l’usage, au-delà des différenciations phraséologiques possibles
(associations libres, collocations, colligations, pragmatèmes, etc.). Dans le domaine de
l’enseignement, la solution la plus pratique est bien de partir du ‘voisinage combinatoire’ et
de modéliser à partir de là les réalisations lexico-grammaticales les plus prototypiques.

4.3. Prendre en compte l’interdépendance entre lexique et grammaire

Ce n’est pas un point nouveau mais il est essentiel de le rappeler : la connaissance des
régularités grammaticales permet d’identifier, dans les productions lexicales, ce qui relève de
mécanismes productifs. Grammaire et lexique ne sont pas séparés, mais se fondent l’un dans
l’autre, comme l’expliquent les tenants des lexiques-grammaires (par exemple Willis (1990)) :
le sens lexical s’actualise dans des patterns syntaxiques spécifiques et dans des contextes
d’occurrence typiques. Le principe du lexique-grammaire est donc à la base de la didactique

7
Une autre contribution de l’étude est la création d’une méthode pour le repérage automatique des
collocations fondamentales et une évaluation critique de l’utilisation de différentes mesures telles que la
fréquence et les mesures associatives (cf. Benigno & al. (à paraître) pour une présentation plus exhaustive
de ce volet).
Les collocations fondamentales : une piste pour l’apprentissage lexical 91

d’une langue étrangère : l’usage garantit que ce qu’on enseigne correspond bien à ce qui est
typiquement utilisé, partagé par la communauté des locuteurs natifs ; en outre, ce qui ressort
de l’usage peut être renforcé par le feedback des locuteurs natifs lorsque l’apprenant est
exposé à la langue cible. Comme le fait remarquer Sinclair (1991, 44), en anglais, par
exemple, le verbe to decline dans le sens de ‘refuser’ se présente toujours au prétérit comme

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
dans l’exemple He declined his invitation, et c’est dans cet usage qu’il doit être
prioritairement mémorisé.

4.4. Structurer les domaines sémantiques : l’exemple des ‟événements sociaux”


Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Plusieurs démarches intéressantes ont été proposées au plan didactique, pour préciser la
nature des associations sémantiques nécessaires à l’appropriation lexicale8 et nous pensons
qu’elles ont chacune permis d’éclairer une partie du problème. La structuration du domaine
nous semble représenter cependant l’élément essentiel, surtout dans les niveaux avancés, pour
lesquels l’apprentissage de vocabulaires plus spécifiques sont visés. Dans ce qui suit, nous
présentons la structuration du domaine sémantique qui nous a servi d’étude de cas, celui des
‘événements sociaux’.
Ce domaine est relativement hétérogène : en effet, séminaire, colloque, congrès,
conférence, réunion et rencontre forment un groupe assez homogène, désignant des
événements sociaux ayant lieu plutôt dans le domaine universitaire ; en revanche,
conversation, débat, interview et fête sont moins susceptibles d’être regroupés. Cependant, il
a été possible de repérer un noyau central de collocatifs communs à un nombre plus ou moins
grand de mots pivots. Nous avons considéré ce noyau sémantique commun comme
représentatif du domaine choisi. Nous le présentons dans le tableau 2 ci-dessous.

Tableau 2. Collocatifs partagés par les mots pivots, et ordonnés


selon le score des locuteurs natifs (du plus commun au moins commun).

8
Picoche (2006) regroupe les mots en partant des ‘mots polysémiques de haute fréquence’. Mel’čuk et
Polguère (2007) modélisent les liens sémantiques et syntagmatiques des collocations.
92 Veronica Benigno, Francis Grossmann & Olivier Kraif

Plus précisément, les collocatifs que nous venons de présenter sont :


a. des verbes
- transitifs ou intransitifs qui expriment la présence des actants à un événement social :
participer à, avoir, être à,
- transitifs qui expriment l’action des actants sur un événement social : organiser, faire,

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
animer, tenir,
- intransitifs qui expriment l’actualisation de l’événement social, le mot pivot étant en
position de sujet : avoir lieu, se dérouler,
b. des substantifs
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

- indiquant les actants de l’événement social : participant, ou résultant de l’action des


actants : organisation, participation,
- indiquant des objets liés à l’événement social (préparation ou résultat) : compte-rendu,
programme,
- indiquant l’objet, l’espace ou le temps de l’événement social: à l’occasion de, thème,
salle, au cours de, journée,
c. des adjectifs
- relationnels ajoutant une spécification à l’événement social : annuel, national,
international, mensuel,
- épithètes à valeur temporelle permettant d’apporter une précision : prochain.
Cette analyse plus fine nous permet de mieux définir le concept d’événement social, que nous
avons considéré comme étant ‘toute occasion de rencontre avec d’autres personnes ayant lieu
lors d’un processus temporel ayant un début et une fin’. Nous avons également pu remarquer
que les collocatifs partagés par les pivots du domaine sémantique traité sont peu spécifiques,
plutôt transparents, et qu’ils s’associent généralement aux pivots selon les règles de la libre
combinatoire lexicale. Le verbe participer est le plus partagé tandis que l’adjectif mensuel
semble s’associer seulement avec séminaire, conférence et rencontre.
Quels sont les collocatifs spécifiques à chaque mot pivot ? A titre d’exemple, considérons
quelques verbes, substantifs ou adjectifs exclusifs aux pivots traités :
- séminaire : ouvrir, de recherche, transversal,
- colloque : présenter, intervention, pluridisciplinaire,
- congrès : vote, adopte (3e per. sing.), extraordinaire,
- conférence : donner, maitre, internationale,
- réunion : se rendre à, de section, collective,
- rencontre : venir à la, site de, amicale,
- fête : souhaiter, de fin d’année, joyeuses,
- débat : relancer, cœur, télévisé,
- interview : accorder, intégralité, exclusive,
- conversation : interrompre, au fil de, en pleine.
Ce second type d’analyse nous a permis de repérer les collocatifs qui expriment les notions-
clés liées aux pivots traités, et en même temps de les distinguer l’un de l’autre. Dans certains
cas, le pivot a une acception plus essentielle que d’autres. Considérons par exemple
séminaire. Ce pivot a une acception principale : tous les collocatifs repérés concernent le sens
de ‘réunion pour étudier un problème ou un sujet’ (tenir un séminaire, séminaire de travail,
séminaire de recherche) ; les autres sens de séminaire, par exemple ‘l’établissement où l’on
fait son éducation ecclésiastique’ ou ‘le temps que l’on passe dans cet établissement’, ne sont
pas représentés. La même chose vaut pour débat, colloque et réunion : seulement le sens de
‘discussion autour d’un thème’ (animer le débat, débat télévisé ; la clôture du colloque,
colloque international ; réunion collective, réunion préparatoire) est représenté ; les autres
Les collocations fondamentales : une piste pour l’apprentissage lexical 93

acceptions, respectivement par exemple celles de ‘conflit intérieur’, de ‘entretien’ et de


‘rassemblement d’éléments’, ne sont pas fondamentales. Le pivot conversation a, lui aussi, un
sens primaire, celui de ‘échange’ (entamer une conversation), plus représenté que le sens de
‘entretien’ (une conversation avec le jury).
Dans d’autres cas, nous avons remarqué que les différentes acceptions d’un pivot sont

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
toutes des notions importantes et fondamentales. Considérons par exemple le pivot fête : nous
avons repéré fête tant dans l’acception de ‘solennité religieuse’ ou de ‘cérémonie
commémorative’ (souhaiter de bonnes fêtes, en période de fête, le comité des fêtes, fête
religieuse, etc.) que dans l’acception de ‘festin’ ou de ‘bal’ (organiser une fête, fête costumée,
une fête d’anniversaire, la salle des fêtes). Ces différents sens sont également représentés. La
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

même chose vaut pour congrès : le sens diplomatique et international (le congrès adopte une
réforme, congrès européen) semble tout autant représenté que le sens académique (congrès
scientifique, le thème du congrès). Enfin, le mot interview a, lui-aussi, deux sens
fondamentaux : il désigne ‘l’entretien’ visant à interroger quelqu’un (accorder une interview,
donner une interview) ; et ‘l’article’ issu de cet entretien (l’extrait d’une interview, publier
une interview).
Dans d’autres cas encore, il existe deux acceptions majeures, l’une étant cependant plus
représentée que l’autre, et une ou plusieurs acceptions mineures. Soit le pivot rencontre : le
sens de ‘entrevue’ ou de ‘conversation’ (une rencontre internationale, l’issue de la rencontre)
est légèrement plus représenté que le sens de ‘rencontrer quelqu’un’ (une rencontre
inattendue, une rencontre fortuite). A côté de ces deux sens primaires, il y a un sens
secondaire : celui de ‘compétition sportive’, moins représenté que les autres (une rencontre
sportive, disputer la rencontre). La même chose vaut pour conférence. Le sens diplomatique
et international (conférence intergouvernementale, conférence ministérielle) semble tout
autant représenté que le sens académique (assister à une conférence, le compte-rendu de la
conférence). Conférence a une troisième acception, celle de ‘exposé’, qui est moins
représentée mais tout aussi fondamentale (maître de conférences, tenir une conférence).

5. Considérations finales

Nous conclurons notre travail par une réflexion sur la façon dont le repérage des collocations
fondamentales dans un domaine sémantique spécifique peut servir la didactique du FLE ou
d’autres langues. L’aspect le plus intéressant nous semble être le fait qu’il devient possible, en
partant des collocations fondamentales d’un domaine, de mieux structurer l’apprentissage et
de préciser les priorités, sans exclure pour autant ce qui est ‘moins fondamental’. A partir de
mots pivots sélectionnés, qui peuvent être rencontrés au fil des discussions et des lectures, il
devient possible grâce à la méthodologie proposée, de mieux situer les éléments devant faire
l’objet d’un effort d’apprentissage particulier. Les notions convoquées peuvent être plus ou
moins spécialisées, mais un niveau suffisamment large – par exemple les ‘événements
sociaux’ – présente l’avantage de pouvoir traiter la polysémie au sein de chaque domaine
d’étude. Il est sans doute possible de s’inspirer des ontologies existantes – du type de celles
développées par Fillmore (Fillmore & al. 2003) autour du projet Framenet – pour constituer
le filet notionnel qui pourrait servir de fondement à un projet visant à recenser les collocations
fondamentales du français dans des genres diversifiés. Si l’on veut reprendre l’entreprise de
Gougenheim, il faut abandonner l’idée qu’il existe un seul noyau fondamental : ce sont les
français fondamentaux, tels qu’ils se parlent et s’écrivent, et non plus ‘le’ français
fondamental, qui devient le cœur de l’entreprise, ce qui montre aussi l’ambition et la difficulté
de l’entreprise, qui suppose tout à la fois une volonté politique et une mobilisation des
chercheurs.
94 Veronica Benigno, Francis Grossmann & Olivier Kraif

En attendant, la didactique du FLE, dont l’une des priorités est la sélection du vocabulaire à
enseigner, devrait selon nous exploiter la notion de collocation fondamentale, et prendre en
compte dans son approche méthodologique les facteurs qui conditionnent son identification.
La production du matériel didactique devrait également s’orienter vers cette direction. Nous
espérons avoir pu montrer qu’une approche intégrant la statistique lexicale à l’analyse

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
linguistique pourrait contribuer de manière efficace à améliorer l’apprentissage.

<veronica.benigno@pearson.com>
<francis.grossmann@u-grenoble3.fr>
<olivier.kraif@u-grenoble3.fr>
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Université Stendhal-Grenoble 3 / Lidilem (EA 609)


BP 25, 38040 Grenoble cedex 9

Références

Altenberg B., Granger S. (2002). Recent trends in cross-linguistic lexical studies. In Altenberg, B. &
Granger, S. (Eds), Lexis in contrast. Corpus-based approach, Vol. 7, Amsterdam, Benjamins, 3-48.
Baroni M., Bernardini, S., Ferraresi, A. & Picci, G. (2010). Web Corpora for Bilingual Lexicography: A
Pilot Study of English/French Collocation Extraction and Translation. In Xiao R. (Ed.), Using
Corpora in Contrastive and Translation Studies, Newcastle, Cambridge Scholars Publishing.
Bartsch, S. (2004), Structural and functional properties of collocations in English. Thèse de doctorat,
Tübingen, Gunter Narr Verlag.
Benigno, V. (2012). La notion de collocation fondamentale. Etude de corpus en vue d’une exploitation
didactique. Thèse de doctorat, Université de Grenoble.
Benigno V., Grossmann, F. & Kraif O. (à paraître). Etude de corpus sur la collocation fondamentale.
Cahiers de Lexicologie.
Carter, R. (1998). Vocabulary. Applied Linguistic Perspectives. London-New York, Routledge, 2e éd.
Carter, R. & Schmitt, N. (2004). Formulaic sequences in action. An introduction. In Schmitt, N. (Ed.),
Formulaic sequences. Acquisition, processing and use, Amsterdam, Benjamins, 1-22.
Catach, N. (1984). Les listes orthographiques de base du français (LOB) : les mots les plus fréquents et
leurs formes fléchies les plus fréquentes (avec la collab. de F. Jejcic et l'équipe HESO). Paris,
Nathan.
Cohen, M. (1955). Français élémentaire ? non. Paris, Editions sociales.
Cortier, C. & Parpette, C. (Eds) (2006). De quelques enjeux et usages historiques du Français
fondamental. Documents pour l’histoire du français langue étrangère ou seconde, 36.
Cowie, A. P. (1998). Phraseology. Theory, Analysis, and Applications. Oxford, Clarendon Press.
Croft, W. & Cruse, D.A. (2004). Cognitive linguistics. Cambridge, Cambridge University Press
Ellis, R. (1997). Second language acquisition. Oxford, Oxford University Press.
Fillmore C., Kay, P. & O’Connor, M.C. (1988). Regularity and idiomaticity in grammatical constructions:
the case of let alone. Language, 64-3, 501-538.
Fillmore, C.J., Johnson, C.R. & Petruck, M.R.L. (2003). Background to FrameNet. International Journal
of Lexicography, 16-3, 235-250.
Firth, J.R. (1957). A synopsis of linguistic theory, 1930-1955. In Firth J.R. & al. (Eds), Studies in
linguistic analysis, Special volume of the Philological Society, Oxford, Blackwell, 1-32.
Frath, P. & Gledhill, C. (2005). Qu’est-ce qu'une unité phraséologique ? In Bolly, C., Klein, J.R.,
Lamiroy, B. (Eds), La phraséologie dans tous ses états, Actes du Colloques Phraséologie, Cahiers
de l’Institut linguistique de Louvain, 31, 2-4, 11-25.
Galisson, R. (1971). Inventaire thématique et syntagmatique du français fondamental. Paris, Hachette-
Larousse, Collection Le Français dans le Monde/BELC.
Goldberg, A.E. (1995). Constructions : A Construction Grammar Approach to Argument Structure.
Chicago, University of Chicago Press.
Les collocations fondamentales : une piste pour l’apprentissage lexical 95

Gougenheim, G., Michéa, R., Rivenc, P. & Sauvageot, A. (1956). L’élaboration du français élémentaire.
Etude sur l’établissement d’un vocabulaire et d’une grammaire de base. Paris, Didier.
Gougenheim, G. (1958/1971). Dictionnaire fondamental de la langue française. Paris, Didier.
Gougenheim, G., Michéa, R., Rivenc, P. & Sauvageot, A. (1964), L'élaboration du français fondamental
(1er degré). Nouvelle édition refondue et augmentée. Paris, Didier.

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
Granger, S. & Paquot, M. (2008) Disentangling the phraseological Web. In Granger S. & Meunier, F.
(Eds), Phraseology. An interdisciplinary perspective, Amsterdam, Benjamins, 27-50.
Gross, G. (1988). Les expressions figées en français. Noms composés et autres locutions. Paris, Ophrys.
Grossmann, F. & Tutin, A. (Eds) (2003). Les collocations : analyse et traitement. Amsterdam, De Werelt.
Halliday, M.A.K. (1985). An introduction to functional grammar. London, Arnold.
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Hausmann, F.J. (1989). Le dictionnaire de collocations. In Hausmann, F.J., Reichmann, O. & al. (Eds),
Wörterbücher : ein internationals Handbuch zur Lexicographie. Dictionaries. Dictionnaires.
Berlin, De Gruyter, 1010-1019.
Haygood, J.D. (1937). Le vocabulaire fondamental du français. Etude pratique sur l’enseignement des
langues vivantes. Genève, Droz.
Hoey, M. (2005). Lexical priming. A new theory of words and language. London, Routledge.
Jackendoff, R. (2002). Foundations of Language : Brain, Meaning, Grammar, Evolution. Oxford, Oxford
University Press.
Kraif, O. (2011). Les concordances pour l’observation des corpus : utilité, outillage, utilisabilité. In
Chuquet, J. (Ed.), Le langage et ses niveaux d'analyse. Rennes, Presses Universitaires de Rennes,
67-80.
Lakoff, G. (1987). Women, fire, and dangerous things – What categories reveal about the mind. Chicago,
Chicago University Press.
Langacker, R. (1987). Foundations of cognitive grammar, Vol. 1 : Theoretical prerequisites. Standford,
Standford University Press.
Legallois, D. (2005). Du bon usage des expressions idiomatiques dans l’argumentation de deux modèles
anglo-saxons : la Grammaire de Construction et la Grammaire des Patterns. In Bolly, C., Klein,
J.R. & Lamiroy, B. (Eds), La phraséologie dans tous ses états, Actes du colloque Phraséologie,
Louvain-la-Neuve, Cahiers de l'Institut de Linguistique de Louvain, 31, 2-4, 109-127.
Legallois, D. (2012). La colligation : autre nom de la collocation grammaticale ou autre logique de la
relation mutuelle entre syntaxe et sémantique ? Corpus, 11, 31-54.
Legallois, D. & Tutin, A. (2013). Présentation : Vers une extension du domaine de la phraséologie.
Langages, 189, 3-25.
Lo Cascio, V. (1999). Standardisation and Collocations. In Telen M. & Lewandowska-Tomaszczyk B.
(Eds), Translation and meaning (part 5), Maastricht, Hoogschool Zuyd, 23-38.
Lo Cascio, V. (2000). La théorie des profils textuels et la compétence lexicale : les collocations. In
Collès, L., Dufays, J.L., Fabry, G. & Maeder, C. (Eds), Didactique des langues romanes : le
développement des compétences chez l’apprenant, Actes du colloque de Louvain-la-Neuve,
Bruxelles, De Boeck-Duculot, 349-359.
McCarthy, M. (1990). Vocabulary. Oxford, Oxford University Press.
Mel’čuk, I. (1998). Collocations and Lexical Functions. In Cowie, A.P. (Ed.), Phraseology. Theory,
Analysis, and Applications, Oxford, Clarendon Press, 23-53.
Mel’čuk, I. & Polguère, A. (2007). Lexique actif du français. L’apprentissage du vocabulaire fondé sur
20000 dérivations sémantiques et collocations du français. Bruxelles, De Boeck & Larcier.
Nattinger, J.R. & DeCarrico, J.S. (1992). Lexical Phrases and Language Teaching. Oxford, Oxford
University Press.
Ogden, C. K. (1930). Basic English, a general introduction, with rules and grammar. London, K. Paul.
Paradis, M. (2004). A neurolinguistic theory of bilingualism. Amsterdam, Benjamins.
Péchoin, D. (1991). Thésaurus Larousse, Des mots aux idées, des idées aux mots. Paris, Larousse.
Picoche, J. (1986). Structures sémantiques du lexique français. Paris, Nathan
96 Veronica Benigno, Francis Grossmann & Olivier Kraif

Richards, K. & Savard, J. (1970). Les Indices d’utilité du vocabulaire fondamental français. Québec, Les
Presses de l’Université Laval.
Schmitt, N., Grandage, S. & Adolphs, S. (2004). Are corpus-derived recurrent clusters psychologically
valid? In Schmitt, N. (Ed.), Formulaic Sequences, Amsterdam, Benjamins, 127-151.
Sinclair, J. (1991). Corpus, concordances, collocation. Oxford, Oxford University Press.

Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques
Sinclair, J., Jones, S. & Daley, R. (2004). English collocation studies : the OSTI report. London-New
York, Continuum.
Suso López, J. (2006). Vocabulaires logiques, vocabulaires simplifiés et Français élémentaire. Documents
pour l’histoire du français langue étrangère ou seconde, 36. Mis en ligne le 14 février 2012,
consulté le 28 mars 2015, <http://dhfles.revues.org/1195>.
Document téléchargé depuis www.cairn.info - Université Pierre-Mendes France - Grenoble - - 209.52.10.71 - 30/05/2015 13h44. © Pub. linguistiques

Thorndike, E.L. (1921). The Teacher's Word Book. New York Teachers College, Columbia University.
Thornton, A. M., Iacobini, C. & Burani C. (1997). BDVDB – Una base di dati sul vdb della lingua
italiana. Roma, Bulzoni.
Tomasello, M. (2003). Constructing a language. Usage-Based Theory of Language Acquisition.
Cambridge, Harvard University Press.
Tutin, A. (2013). Les collocations lexicales: une relation essentiellement binaire définie par la relation
prédicat-argument. Langages, 189, 47-63.
Vander Beke, G.E. (1929). French Word Book. Publications of the American and Canadian Committees
on Modern Languages, vol. XV, New York, The Macmillan Company.
West, M. (1953). A General Service List of English Words. London, Longman.
Willis, D. (1990). The Lexical Syllabus. London-Glasgow, Collins ELT.
Wray, A. & Perkins, M.R. (2000). The functions of formulaic language : an integrated model. Language
and Communication, 20, 1-28.
Wray, A. (2002). Formulaic language and the lexicon. Cambridge, Cambridge University Press.
Références complémentaires
Le Français élémentaire (1954). Ministère de l’Education nationale, Centre National de Documentation
Pédagogique, Paris.
Le français fondamental (1er degré) (1959). Ministère de l’Education nationale, Direction de la
coopération avec la communauté et l’étranger, Paris, Institut pédagogique national.
Le français fondamental (2e degré) (1959). Ministère de l’Education nationale, Direction de la
coopération avec la communauté et l’étranger, Paris, Institut pédagogique national.

View publication stats

Vous aimerez peut-être aussi