Vous êtes sur la page 1sur 178

La linguistique cognitive

Catherine Fuchs (dir.)

DOI : 10.4000/books.editionsmsh.7055
Éditeur : Éditions de la Maison des Édition imprimée
sciences de l’homme, Éditions Ophrys ISBN : 9782735110315
Année d'édition : 2004 Nombre de pages : 264
Date de mise en ligne : 4 juillet 2017
Collection : Cogniprisme
ISBN électronique : 9782735119233

http://books.openedition.org

Référence électronique
FUCHS, Catherine (dir.). La linguistique cognitive. Nouvelle édition [en ligne]. Paris : Éditions de la
Maison des sciences de l’homme, 2004 (généré le 17 août 2017). Disponible sur Internet : <http://
books.openedition.org/editionsmsh/7055>. ISBN : 9782735119233. DOI : 10.4000/
books.editionsmsh.7055.

Ce document a été généré automatiquement le 17 août 2017. Il est issu d'une numérisation par
reconnaissance optique de caractères.

© Éditions de la Maison des sciences de l’homme, 2004


Conditions d’utilisation :
http://www.openedition.org/6540
1

La linguistique a été l'une des disciplines pionnières participant dès le milieu des armées 1950 au
« programme cognitiviste », conjointement avec la psychologie et l'intelligence artificielle.

Le présent ouvrage a pour objectif de présenter les problématiques théoriques, les recherches
actuelles et les acquis de la linguistique cognitive. La première partie de l'ouvrage est consacrée à
un panorama des principaux courants contemporains, qui se réclament de deux grands
paradigmes théoriques : d'une part, le paradigme classique du cognitivisme (appelé paradigme
computo-représentationnel symbolique), qui a été adopté par les « grammaires formelles », et
notamment par la grammaire chomskienne ; et d'autre part, un paradigme alternatif encore en
émergence (parfois appelé paradigme constructiviste), représenté principalement par les
« grammaires cognitives », mais auquel se rattachent également certains tenants de la
linguistique fonctionnaliste, ainsi que des approches typologiques et diachroniques des langues.
La seconde partie de l'ouvrage est consacrée aux interactions entre la linguistique cognitive et
d'autres disciplines des sciences cognitives abordant le langage non plus à partir de l'étude
spécifique de la structure et du fonctionnement des langues, mais en tant que faculté supérieure
de l'espèce humaine mise en œuvre par des sujets (c'est l'objet de la psycholinguistique),
donnant lieu à l'activation de certaines zones du cerveau (c'est l'objet de la
neuropsycholinguistique), et susceptible d'être simulée sur ordinateur (c'est l'objet de
l'intelligence artificielle).

Signe incontestable de jeunesse, ce foisonnement des approches témoigne aussi de la vigueur de


la réflexion dans un domaine particulièrement complexe - celui des liens entre la diversité des
langues et la faculté de langage, et de leur inscription dans l'architecture et le fonctionnement de
l'esprit et du cerveau - où nombre de questions demeurent encore sans réponse, voire même
informulées.

CATHERINE FUCHS
Directeur de recherche au CNRS. Dirige le laboratoire « Langues, Textes, Traitements
informatiques, Cognition » (UMR 8094, CNRS/ENS-Ulm/Paris VII).
catherine.fuchs@ens.fr
2

SOMMAIRE

Les auteurs

Pour introduire à la linguistique cognitive


Catherine Fuchs
Langage, linguistique et cognition
De la linguistique générale à la linguistique cognitive
Les grandes problématiques de la linguistique cognitive
Le tournant cognitif et le paradigme cognitiviste en linguistique
Les avatars du cognitivisme : les nouveaux courants de la linguistique cognitive
Enjeux et perspectives
Pour aborder l’ouvrage

I. Les courants de la linguistique cognitive

Grammaire formelle• et cognition linguistique


Alain Rouveret
La perspective interne sur le langage
Paramètres, Grammaire Universelle et acquisition
Le Programme Minimaliste : une grammaire cognitive
Extensions
En guise de conclusion : cognitif vs. grammatical

Les grammaires cognitives


Bernard Victorri
Introduction
Le sens grammatical
Le sens lexical
Le sens syntaxique
La construction dynamique du sens
Conclusion

Le fonctionnalisme linguistique et les enjeux cognitifs


Jacques François
1. La notion d’explication dans la controverse entre fonctionnalisme et formalisme en
linguistique
2. Facteurs cognitifs dans la conception fonctionnaliste des universaux du langage
3. Le poids des motivations cognitives et celui des pressions sociales dans le changement
linguistique
4. L’ontogénèse : comment l’acquisition des relations sémantiques précède celle des relations
syntaxiques
5. La prise en compte de contraintes cérébrales dans le traitement et l’émergence du langage
6. Conclusion

Grammaire diachronique et cognition : l’exemple du chinois


Alain Peyraube
Évolution des structures locatives en chinois
Histoire des pronoms interrogatifs du chinois
Conclusion
3

II. Regards croisés sur le langage

Éléments de psycholinguistique cognitive : des représentations à la compréhension


Jean-François Le Ny
Les questions générales
Techniques et méthodes
Les sous-domaines de la psycholinguistique et les problèmes de la compréhension
Conclusion

Linguistique, pathologie du langage et cognition


Des dysfonctionnements langagiers à la caractérisation de l’architecture fonctionnelle du langage
Jean-Luc Nespoulous
De la linguistique à la psycholinguistique et à la neuropsycholinguistique : origines et évolution
De l’intérêt de l’étude des erreurs langagières pour l’appréhension de l’architecture structurale
et fonctionnelle du langage
De l’observation des comportements pathologiques à l’édification de l’architecture structurale et
fonctionnelle du langage chez le sujet normal
L’articulation « esprit » - « cerveau »
Conclusion : quelques orientations et défis de la neuropsycholinguistique pour le XXI e siècle

Intelligence artificielle, linguistique et cognition


Gérard Sabah
Historique
Informatique et communication homme-machine
Quelques objets centraux de l’intelligence artificielle
Conclusion

Bibliographie

Glossaire

Index
4

Les auteurs

1 Jacques FRANÇOIS
Professeur à l’université de Caen. Dirige le « Centre de recherche inter-langue sur la
signification en contexte » (UMR 6170, CNRS/Caen). jacques.francois@crisco.unicaen.fr
2 Catherine FUCHS
Directeur de recherche au CNRS. Dirige le laboratoire « Langues, Textes, Traitements
informatiques, Cognition » (UMR 8094, CNRS/ENS-Ulm/Paris
VII).
catherine.fuchs@ens.fr
3 Jean-François LE NY
4 Professeur émérite à l’université de Paris-Sud. Groupe « Cognition Humaine » du
Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur (UPR 3251,
CNRS/Université Paris XI, Orsay). http://jfleny@wanadoo.fr
5 Jean-Luc NESPOULOUS
6 Professeur à l’université de Toulouse-Le Mirail. Dirige le laboratoire Jacques Lordat (EA
1941) et l’Institut des Sciences du Cerveau de Toulouse (IFR 96). http://nespoulo@univ-
tlse2.fr
7 Alain PEYRAUBE
Directeur de recherche au CNRS et directeur d’études à l’École des hautes études en
sciences sociales, Centre de recherches linguistiques sur l’Asie Orientale (UMR 8563,
EHESS/CNRS, Paris). http://peyraube@ehess.fr
8 Alain ROUVERET
Professeur à l’université Paris 7-Denis Diderot. Laboratoire de « Linguistique formelle »
(UMR 7110, CNRS/Paris-VII).
http://alain.rouveret@linguist.jussieu.fr
9 Gérard SABAH
10 Directeur de recherche au CNRS. Laboratoire d’Informatique pour la Mécanique et les
Sciences de l’Ingénieur, (UPR 3251, CNRS/Université Paris XI, Orsay). http://
Gerard.Sabah@limsi.fr
11 Bernard VICTORRI
Directeur de recherche au CNRS. Laboratoire « Langues, Textes, Traitements
5

informatiques, Cognition » (UMR 8094, CNRS/ENS-Ulm/Paris VII). http://


bernard.victorri@ens.fr
6

Pour introduire à la linguistique


cognitive
Catherine Fuchs

1 Le présent ouvrage a pour objectif de présenter la linguistique cognitive, en caractérisant


les types de faits, les problématiques et les paradigmes théoriques qui relèvent de façon
spécifique d’une linguistique « cognitive » (par différence avec la linguistique générale),
et d’illustrer les collaborations interdisciplinaires dans lesquelles cette branche de la
linguistique se trouve engagée1

Langage, linguistique et cognition


2 Pour les sciences de la cognition, qui étudient le fonctionnement de l’esprit et du cerveau,
le langage constitue un objet d’investigation de première importance : l’espèce humaine
est en effet la seule à disposer de cette « faculté supérieure » particulièrement complexe.
Plusieurs disciplines engagées dans l’étude de la cognition s’intéressent donc au langage :
psychologues, philosophes, anthropologues, spécialistes de neurosciences ou
d’intelligence artificielle – pour ne citer qu’eux – s’attachent, chacun dans son ordre, à
caractériser la place de la faculté de langage dans la cognition naturelle ou artificielle, et
à en étudier le fonctionnement.
3 L’approche du langage opérée par la linguistique est, quant à elle, tout à la fois plus
centrale et plus spécifique que celle des diverses disciplines qui viennent d’être évoquées.
Plus centrale, car elle est la seule science à avoir le langage pour objet d’étude exclusif,
plus spécifique, car c’est à partir de l’étude de la structure des langues qu’elle aborde cet
objet : selon une définition devenue classique, la linguistique est « la science du langage
appréhendé à travers la diversité des langues naturelles ».
4 L’intérêt des spécialistes des langues pour des questions d’ordre cognitif (au sens large)
ne date pas d’aujourd’hui, et l’on ne saurait sous-estimer la longue tradition qui existe en
la matière : les grandes théories de linguistique générale qui ont vu le jour depuis plus
d’un siècle (cf. Fuchs et Le Goffic 2003) – sans parler des travaux des ancêtres
7

grammairiens, rhétoriciens et logiciens depuis l’Antiquité – ont, sans conteste, alimenté


de multiples façons la réflexion sur les rapports entre les langues, la pensée, le
raisonnement, l’action, etc. Pour autant, cette problématique générale et relativement
diffuse ne se confond pas avec celle, plus circonscrite, de ce que l’on est convenu
d’appeler la « linguistique cognitive ».

De la linguistique générale à la linguistique cognitive


5 La linguistique générale s’est donné pour mission d’étudier la structure des langues –
depuis les sons (les « signifiants », au plan de l’expression) jusqu’aux sens (les
« signifiés », au plan du contenu) – et de rechercher des invariants interlangues.
6 Par-delà les descriptions locales et parcellaires, de nombreuses théories linguistiques
générales ont été élaborées depuis le début du XXe siècle. Les unes cherchant
prioritairement à constituer des modèles d’ensemble de la langue, les plus opératoires
possible : c’est le cas, par exemple, des grammaires formelles, mais aussi de divers
modèles « onomasiologiques » (c’est-à-dire orientés des sens vers les sons), comme ceux
de Mel’chuk, Martin, Pottier, etc. Les autres se souciant principalement de comparer les
langues, afin de ; dégager des propriétés communes, par-delà les variations observées
d’une langue à l’autre : c’est le cas, notamment, des approches typologiques, comme celles
de Comrie, Lazard, Seiler, etc.
7 À cette double exigence, constitutive de toute démarche de linguistique générale, la
linguistique cognitive est venue en ajouter une troisième : lapertinence cognitive. Sous la
dénomination de « linguistique cognitive », on s’accorde en effet à regrouper un
ensemble de courants qui partagent – par-delà leurs différences – un objectif commun :
celui de proposer des théories de la langue qui soient non seulement opératoires et
générales, mais également susceptibles de s’articuler de façon explicite avec des modèles
généraux de l’architecture fonctionnelle de l’esprit et/ou de l’architecture neuronale du
cerveau. Dans cette perspective, le système des règles de la langue (intériorisé par les
locuteurs) est objet d’étude pour le linguiste en tant qu’il constitue une composante de
l’esprit humain et qu’il a, d’une manière ou d’une autre, une inscription physique dans le
cerveau : une telle approche est dite « naturaliste ».
8 Pour autant, la linguistique cognitive ne saurait se dissoudre dans la psychologie, les
neurosciences ou l’informatique : l’enjeu est, pour elle, d’affirmer la spécificité de son
objet (le langage à travers les langues), et de conserver la maîtrise de ses concepts et de
ses méthodes, tout en veillant à ce que ceux-ci puissent s’articuler avec ceux des
disciplines connexes, dans le cadre de paradigmes théoriques plus généraux partagés par
les différentes disciplines. C’est donc de l’intérieur même du système des langues et à
partir de l’étude de l’organisation structurale et signifiante de ce système que la
linguistique cognitive propose d’appréhender les liens entre langage, esprit et cerveau.
9 À cet égard, la linguistique cognitive ne remet pas en question la classique répartition des
rôles entre la linguistique (qui étudie le système de règles intériorisé par tout sujet
parlant) et d’autres disciplines, notamment la psychologie (qui étudie le fonctionnement
effectif ou les dysfonctionnements de ce système, chez des sujets, dans des situations
concrètes de production, de compréhension ou d’acquisition du langage). Cette
distribution des tâches remonte au début du XXe siècle, lorsque la linguistique s’est
affirmée comme discipline autonome en se démarquant de la psychologie : pour Saussure,
8

il était entendu que le linguiste étudie la « langue » (c’est-à-dire le code, envisagé alors
comme un phénomène social), indépendamment des sujets et des circonstances de la
« parole » individuelle. Dans l’approche chomskienne, où la linguistique est réputée
n’être en définitive qu’une branche de la psychologie, l’objet d’étude du linguiste (la
« compétence », entendue comme mécanisme génératif participant de l’équipement
biologique de l’espèce humaine) n’en reste pas moins distinct de l’objet d’étude du
psychologue (la « performance »). C’est précisément sur la base de distinctions de ce type
que se sont développées des sous-disciplines travaillant aux interfaces avec la
linguistique, comme la psycholinguistique (branche de la psychologie cognitive) ou la
neurolinguistique (branche des neurosciences cognitives) – qui tendent d’ailleurs
actuellement à se conjoindre en une neuropsycholinguistique.

Les grandes problématiques de la linguistique


cognitive
10 Adopter une perspective cognitive en linguistique, c’est s’interroger sur l’ensemble des
connaissances spécifiques que maîtrise l’esprit humain au travers de la faculté de langage,
elle-même appréhendée à partir du système des langues ; et c’est se demander comment
ces connaissances sont organisées pour pouvoir être acquises et mises en œuvre dans
l’activité de langage. De là découle toute une série de questions, auxquelles des éléments
de réponse différents seront apportés selon le type de paradigme épistémologique retenu
(voir plus loin).
11 Un premier ordre de questions concerne l’architecture structurelle des connaissances
linguistiques constitutives de la faculté de langage : combien de types et de niveaux
différents de connaissances (phonétiques, morphologiques, syntaxiques, sémantiques,...)
sont-ils intériorisés dans l’esprit des sujets parlants ? La pragmatique• (calcul de la
référence•, du sens non littéral, prise en compte du cotexte• linguistique dans le calcul du
sens, etc.) en fait-elle partie ? La syntaxe en constitue-t-elle le « noyau dur » ? Toutes ces
connaissances peuvent-elles à elles seules caractériser entièrement la faculté de
langage ?...
12 Un deuxième ordre de questions a trait à l’architecture fonctionnelle de ces connaissances
dans l’esprit et le cerveau humain : sous quelle forme sont-elles organisées ? S’il s’agit de
« modules » (c’est-à-dire de sous-systèmes fonctionnellement et informationnellement
spécialisés), ceux-ci sont-ils « encapsulés » (c’est-à-dire totalement autonomes) ou bien
sont-ils interdépendants ? Et le langage lui-même constitue-t-il un module
« périphérique » de simple entrée/sortie d’informations (comme les modules de
perception, ou d’action motrice), totalement indépendant du système « central » (qui
serait le siège de la pensée) ? Par ailleurs, à quels types de calculs la maîtrise effective de
ces connaissances correspond-elle, et comment ces diverses connaissances peuvent-elles
être représentées, simulées ou émulées artificiellement ?...
13 Un troisième ordre de questions touche à ce que l’on pourrait appeler « la dynamique du
langage », qui engage à plusieurs titres la dimension de la variabilité linguistique. Derrière
la diversité des langues, peut-on postuler l’existence d’universaux ou bien d’invariants
interlangues ? subsidiairement, quelle est la marge des variations interlangues et celles-ci
ont-elles un quelconque impact cognitif ? S’agissant de l’évolution des systèmes
linguistiques au cours du temps, quelle place faire à la diachronie• dans une perspective
9

cognitive ? et que peut-on dire de l’émergence de la faculté de langage au cours de


l’évolution phylogénétique ? Enfin, au plan ontogénétique, la rapidité et la relative
uniformité de l’apprentissage du langage par l’enfant s’expliquent-elles par la simple
répétition ou imitation, ou par le fait que les connaissances linguistiques seraient
constitutives de l’équipement biologique de l’espèce, ou bien encore pour d’autres
raisons ? À l’inverse, comment ces connaissances peuvent-elles se dégrader
accidentellement ou sous l’effet du vieillissement ?
14 Un quatrième ordre de questions est relatif aux liens entre le langage et d’autres facultés
humaines, caractéristiques du fonctionnement symbolique de l’esprit (pensée,
raisonnement, mémoire, etc.) : le langage est-il une condition nécessaire de la pensée ?
Les processus de traitement du langage sont-ils radicalement différents de ceux qui sont
engagés dans d’autres activités cognitives, notamment dans la perception (vision,
audition,...) ? Quels rapports peut-il y avoir, par exemple, entre la compréhension du
langage oral et la perception de la musique ? Les émotions interfèrent-elles avec la faculté
de langage ?...
15 Ces grandes questions engagent, on le voit, la façon dont la Linguistique s’articule aux
autres disciplines des sciences cognitives travaillant sur le langage (psychologie,
philosophie, neurosciences, intelligence artificielle...), et la nature du paradigme
épistémologique qu’elle partage avec celles-ci.
16 C’est précisément l’inscription de la linguistique au sein d’un vaste programme
pluridisciplinaire qui a marqué les débuts officiels de la linguistique cognitive. Il est
classiquement admis (cf. Rastier 1998) que ce « tournant cognitif » s’est produit au milieu
des années 1950 aux USA. On ne saurait toutefois oublier qu’en Europe à peu près à la
même époque, et de façon totalement indépendante de cette mouvance dite
« cognitiviste », des linguistes ont également joué un rôle pionnier en matière
d’interdisciplinarité et renouvelé l’approche théorique du langage et des langues, en
ouvrant résolument celle-ci sur des problématiques d’ordre cognitif, comme l’a fait par
exemple Jakobson ; que l’on songe également à Culioli, travaillant pendant de nombreuses
années avec le psychologue Bresson (lui-même inscrit dans la lignée théorique de Piaget)
et le logicien Grize, et aussi avec des spécialistes de pathologie du langage (Laplanche,
Bourguignon) dans le domaine de l’aphasie et de la schizophrénie : un tel travail
interdisciplinaire, profondément original, a sans conteste inspiré l’élaboration de la
« théorie des opérations énonciatives » (cf. les recueils d’articles réunis plus tard dans
Culioli 1990 et 1999), précurseur de maintes approches ultérieures en sémantique et en
pragmatique linguistiques.

Le tournant cognitif et le paradigme cognitiviste en


linguistique
17 Revenons à présent à ce que l’on est convenu d’appeler le « tournant cognitif » en
linguistique. En 1956 aux États-Unis, des représentants de plusieurs disciplines
scientifiques différentes se réunissaient (lors de deux conférences, l’une à Cambridge,
l’autre à Dartmouth) autour d’un projet épistémologique commun, connu sous le nom de
« programme cognitiviste » : le linguiste Noam Chomsky côtoyait le psychologue Herbert
Simon et le spécialiste d’intelligence artificielle Marvin Minsky dans cette entreprise
pluridisciplinaire, qui visait à caractériser le fonctionnement de l’esprit à travers les
10

facultés qu’il développe, et notamment à travers la faculté de langage. L’hypothèse


fondatrice de ce projet était que, de façon générale, la cognition humaine pourrait être
définie, à la manière d’une machine, en termes de calculs (« computations »),
correspondant au traitement des divers types d’informations reçues par l’humain.
18 C’est ainsi que la linguistique s’est trouvée – par l’intermédiaire des tenants d’une
approche formelle de la langue – partie prenante de l’entreprise « cognitiviste » dès ses
débuts, participant à ce que d’aucuns qualifient parfois de « révolution des sciences
cognitives » (selon les termes de Gardner 1985).
19 Il convient toutefois de rappeler que l’étape de 1956, réputée marquer la naissance de la
linguistique cognitive, avait été précédée, dès le tournant des années 1940, par la période
de la « cybernétique », dont les pères fondateurs ont pour noms von Neumann, Wiener,
Turing, McCulloch. La cybernétique visait à instaurer une nouvelle « science de l’esprit »
en s’appuyant notamment sur la logique mathématique (pour décrire le fonctionnement
du raisonnement), sur la théorie des systèmes (pour formuler les principes généraux
gouvernant tout système complexe) et sur la théorie de l’information (comme théorie
statistique du signal et des canaux de communication) : voir sur ce point les ouvrages
introductifs de Varela (1988) et de Dupuy (1994). L’idée même d’une pensée fonctionnant
comme un calcul, à l’instar d’une machine, et d’un cerveau dont les constituants
incarneraient des principes logiques, est constitutive de l’approche cybernétique : de là
procèdera l’invention de l’ordinateur, selon les principes de von Neumann. Or c’est à
cette tradition que se rattachent les tout débuts de la linguistique dite « computationnelle »,
c’est-à-dire du courant s’inspirant de l’étude des langages formels pour élaborer des
traitements automatiques des langues ; si, en la matière, on évoque habituellement la
grammaire generative de Chomsky (et notamment son article de 1956 sur la parenté entre
théorie des grammaires et théorie des automates), il ne faut pas oublier que c’est à Harris
(dont Chomky fut l’élève) que l’on doit la notion de « structures mathématiques du
langage » (reprise dans le titre d’un ouvrage ultérieur de 1968). La remarque n’est pas
aussi anecdotique qu’il pourrait sembler à première vue : les voies de recherche et les
intérêts respectifs de la grammaire chomskienne, d’un côté, et des spécialistes de
traitement automatique de la langue, de l’autre, ont en effet partiellement divergé au fil
des ans (bien que les deux soient souvent confondus sous l’étiquette ambiguë de
« linguistique computationnelle »), ce qui s’explique dans une certaine mesure par leurs
différences d’enracinement historique.
20 À l’approche cybernétique avait donc succédé le « cognitivisme » des années 1950. Si
celui-ci reprenait l’idée de calcul, en revanche la nature de ce calcul avait changé : il
s’agissait désormais d’un calcul sur des représentations symboliques ; d’où le nom de «
paradigme computo-représentationnel symbolique » donné au paradigme épistémologique
constitutif du courant cognitiviste classique. Les calculs y sont définis en termes
d’opérations sur des symboles, c’est-à-dire sur des éléments qui représentent ce à quoi ils
sont censés correspondre. Les symboles sont considérés comme ayant une réalité à la fois
physique (ils seraient « inscrits » dans le cerveau) et sémantique (ils « représenteraient »
le monde objectif). Dans cette perspective, la cognition se laisse caractériser comme un
traitement d’informations mettant en jeu (au niveau symbolique) des règles de
manipulation de symboles caractérisés comme des éléments physiques (au niveau
neurobiologique) et représentant adéquatement le monde réel (au niveau sémantique).
On remarquera au passage que si le cognitivisme des années 1950 se fondait largement
sur la métaphore de « l’esprit-machine » (partagée par la psychologie cognitive, la
11

philosophie cognitive, et l’intelligence artificielle), en revanche l’analogie avec le cerveau


– épisodiquement présente depuis McCulloch et Pitts, puis à travers certains
représentants comme Ashby ou Arbib – n’a été massivement exploitée que vers la fin des
années 1980, dans le cadre du rapprochement avec les neurosciences cognitives. Celles-ci,
de leur côté, avaient également connu un tournant cognitif vers la fin des années 1950 :
F.O. Schmitt organisa au MIT pendant une décennie des réunions pluridisciplinaires
autour des neuroscientistes internationaux les plus réputés, à l’origine des
« Neurosciences Research Programs » ; et en 1960 se tenait à Paris la première réunion de
l’« International Brain Research Organisation » : les neurosciences cognitives se sont
développées à mesure que progressait la connaissance des réseaux neuronaux.
21 Le paradigme computo-représentionnel symbolique est le paradigme théorique auquel se
rattachent, en linguistique, la grammaire chomskienne (Chomsky 1965, 1981, 1995) et, à sa
suite, un certain nombre d’autres modèles formels en grammaire (« grammaires
d’unification » : cf. Abeillé 1993) qui, tous, accordent une place centrale à la notion de
« système formel ». Les caractéristiques de cette approche peuvent être sommairement
résumées à grands traits comme suit. La démarche adoptée est de nature
hypothéticodéductive, et les exemples étudiés sont forgés par le linguiste sur la base de sa
compétence de la langue, en tant que sujet parlant. L’approche est « modulariste » (Fodor
1989) : il est fait l’hypothèse que le module « langue » est spécifique par rapport aux
autres modules cognitifs, et une place centrale est accordée à la syntaxe, conçue comme
devant assurer l’interface entre une représentation sémantique logique
vériconditionnelle et une représentation phonétique. La conception du langage est
représentationnelle : le langage est caractérisé comme instrument d’expression de la
pensée, permettant la transmission d’informations à propos du monde. Enfin, la
modélisation a, de façon classique, recours à des calculs d’ordre logico-algébrique. Cette
approche linguistique s’inscrit dans le cadre plus général du développement des sciences
cognitives et des neurosciences (en lien avec la biologie moléculaire et la génétique) ; la
« grammaire universelle » proposée par Chomsky fait écho, en matière de langage, à
l’idée d’un code génétique se transmettant de génération en génération : c’est « l’instinct
du langage » (selon les termes de Pinker 1994).

Les avatars du cognitivisme : les nouveaux courants


de la linguistique cognitive
22 Depuis l’émergence de ce premier courant, au milieu des années 1950, la linguistique
cognitive s’est progressivement diversifiée au fil des ans, à l’instar des autres disciplines
engagées dans l’étude de la cognition.
23 On sait en effet que, dans les différents secteurs des sciences cognitives, un certain
nombre de critiques à l’encontre du strict paradigme « cognitiviste » se sont fait jour (en
neurosciences, en psychologie, en informatique, en philosophie, en éthologie...) : voir, sur
ce point, Varela (1988). Dans ce débat, largement ouvert, la question du sens revêt une
importance capitale. Certaines approches récusent le traitement séquentiel et localisé de
l’information (constitutif du paradigme cognitiviste), au profit de traitements parallèles
et distribués. Sur cette lancée, diverses alternatives à l’orientation symbolique ont été
proposées en termes de réseaux massivement interconnectés, vecteurs de « propriétés
émergentes » globales identifiables à une faculté cognitive (à l’instar des systèmes « auto-
12

organisés » de la cybernétique) : dans cette perspective dite « sub-symbolique », le sens ne


résiderait pas dans les symboles, mais dans des schémas d’activité complexe émergeant
d’une interaction entre plusieurs symboles. D’autres critiques, plus radicales encore, se
sont portées sur la notion même de « représentation » : dans une perspective qualifiée de
« constructiviste• » (ou encore d’« enactiviste• »), la cognition est abordée comme une
activité consistant à faire émerger dynamiquement des significations, et non pas à traiter
ou à réfléchir des informations pré-existantes.
24 En écho à ces évolutions, de nouveaux courants sont apparus au sein de la linguistique
cognitive, se démarquant – plus ou moins fortement selon les cas – du paradigme
cognitiviste initial : il s’agit principalement du courant des « grammaires cognitives », nées
sur la côte Ouest des États-Unis (Lakoff 1980,1987 ; Langacker 1987,1991, 2000 ; Talmy
2000), mais également du courant « néo-fonctionnaliste » (représenté notamment par Givón
1989, 1995 ; voir aussi Heine 1997). Quelles que soient, par ailleurs, leurs différences
internes, ces courants se distinguent de l’approche chomskienne par les caractéristiques
suivantes. La démarche adoptée est plus inductive, et le recours aux corpus textuels n’est
pas exclu. L’approche est « interactionniste » : une place centrale est accordée à la
sémantique, réputée informer la syntaxe et le lexique avec lesquels elle interagit ;
l’hypothèse de la spécificité d’un module « langue » est récusée, et l’existence de
mécanismes cognitifs généraux (communs au langage, à la perception, à l’action...) est
postulée. La conception du langage est davantage « émergentiste » que
représentationnelle : le langage est envisagé comme instrument de conceptualisation
active du monde et/ou comme instrument de communication. Enfin, les types de
modélisation proposés recourent à la géométrie, aux systèmes dynamiques, au
connexionnisme, plutôt qu’à l’algèbre et à la logique mathématique. On aura compris que,
pour ces nouveaux courants de linguistique cognitive, qui s’intéressent principalement à
l’aspect dynamique des langues et du langage, le « noyau dur » réside moins dans les
règles de grammaire que dans les opérations de construction de la signification : d’où
l’importance accordée à des phénomènes comme la polysémie ou la métaphore, par
exemple.
25 On notera par ailleurs que ces courants entretiennent des liens assez étroits avec les
approches diachroniques des langues (Sweetser 1990 ; Croft 2000), ainsi qu’avec les
approches typologiques (voir Croft 1999) à la recherche d’« invariants inter-langues »
(Lazard 1994, 2004 ; Seiler 2000). Il est intéressant de remarquer, à ce propos, que si le
cognitivisme linguistique avait renoué d’une certaine façon avec l’approche naturaliste et
organiciste du langage, représentée au XIXe siècle par Schleicher et Hovelacque, les
nouveaux courants de linguistique cognitive tendent, de leur côté, à réactualiser la
question dite de la « relativité linguistique ». Cette question avait été, on le sait, soulevée
dans la première moitié du XXe siècle par Sapir (1949) puis par Whorf (1956), sur la lancée
du courant spiritualiste du siècle précédent (Humboldt ; Steinthal ; Paul), qui avait donné
naissance à l’ethnopsychologie (ou « psychologie des peuples »). La question, largement
occultée pendant plusieurs décennies de cognitivisme, a été remise au goût du jour sur
des bases théoriques et expérimentales renouvelées, aussi bien en linguistique cognitive
(Vandeloise 2003) qu’en psycholinguistique cognitive (Slobin 1996) et en neuro-
psycholinguistique (Nespoulous 1999) ; à l’heure actuelle, il s’agit là d’un enjeu majeur
pour une approche cognitive des invariants et de la variation inter-langues : sur ce point,
voir Fuchs 1999, 2003 ; Pütz et Verspoor 2000 ; Hickman 2002. Corrélativement, la
question des liens entre activité de langage et activité de pensée resurgit dans les débats
13

actuels, après avoir été longtemps reléguée par le cognitivisme (Carruthers et Boucher
1998 : voir plus bas).

Enjeux et perspectives
26 Le bref retour historique qui vient d’être proposé permet de comprendre les origines des
diverses approches qui se réclament, à l’heure actuelle, de la linguistique cognitive. Pour
présenter ces approches, il serait tentant d’opposer frontalement, au plan théorique et
épistémologique, d’un côté celles qui participent du paradigme computo-
représentationnel symbolique, et de l’autre celles qui s’en démarquent : les premières
correspondant aux grammaires formelles, les secondes à la mouvance plus large
constituée autour des grammaires cognitives et des grammaires néo-fonctionnalistes.
Révélateurs à cet égard sont les deux titres d’ouvrages suivants : Langage et cognition :
introduction au programme minimaliste de la grammaire generative (Pollock 1997 : illustratif de
l’approche chomskienne) et An Introduction to Cognitive Linguistics (Ungerer et Schmid
1996 : illustratif de l’approche des grammaires cognitives).
27 Mais, à y regarder de près, on constate que la situation actuelle est beaucoup plus
nuancée et évolutive que ne le laisserait penser une telle présentation schématique. En
effet, un certain nombre de développements récents ont conduit à assouplir le paradigme
cognitiviste classique, comme en témoigne, par exemple, la relative diversification des
points de vue (pourtant tous issus de ce paradigme originel) exposés dans Dupoux (2002).
Deux types de facteurs ont contribué à cette évolution : des facteurs internes, liés à la
dynamique propre de l’élaboration théorique au sein de la discipline, et des facteurs
externes, liés au développement des autres sciences de la cognition et au dialogue
interdisciplinaire.
28 À l’intérieur de la linguistique, la plupart des propositions novatrices qui ont été avancées
récemment ont trait à la question de l’architecture des connaissances linguistiques et de la
modularité. Depuis plusieurs années, divers auteurs, bien que tenants d’une linguistique
cognitive « modulariste », plaident pour un mode d’organisation des modules du langage
différent de celui de la grammaire chomskienne, et remettent en question la place
centrale accordée au module syntaxique au sein d’une architecture en série. Ainsi Kiefer
(1995), tout en prônant une « linguistique cognitive modulaire étendue », envisage-t-il
l’interface avec la structure conceptuelle comme devant se faire, non pas simplement
avec le module sémantique, mais en parallèle avec chacun des trois modules constitutifs,
selon lui, de la grammaire (à savoir la syntaxe, la morphologie et la sémantique). De son
côté, Jackendoff (2002), tout en se situant explicitement dans une perspective cognitiviste
computationnelle, propose un modèle fondé sur une architecture parallèle tripartite, avec
une syntaxe (à base lexicale) réduite et deux modules phonologique et sémantique
beaucoup plus importants. Cette évolution d’une partie de la linguistique cognitiviste en
direction de calculs parallèles et distribués rappelle l’évolution comparable en matière de
traitement automatique de la langue dans le domaine de l’intelligence artificielle ; elle
n’est pas sans écho non plus du côté des neurosciences (où les études sur l’activité des
réseaux corticaux ont montré que ceux-ci forment des assemblées qui fonctionnent de
façon totalement distribuée), ni du côté de la psychologie (Fodor lui-même, défenseur
inconditionnel d’une modularité généralisée dans les années 1980, en est venu à tenir une
position beaucoup moins tranchée concernant l’autonomie et l’indépendance des divers
modules : cf. Fodor 2000). Quant aux tenants d’une approche « interactiviste », pour
14

justifier cette option et le privilège accordé à la sémantique, ils se sont progressivement


attachés à caractériser les modes de réalisation, au plan des formes, des schèmes
sémantico-conceptuels. Les modèles qu’ils proposent, pour spécifier l’interpénétration de
la syntaxe et du lexique par la sémantique, recourent nécessairement à des notations
symboliques et, sur un certain nombre de points, rejoignent ceux qui viennent d’être
évoqués plus haut (voir par exemple les « grammaires de construction » : Fillmore et Kay
1993 ; Goldberg 1995 et 2003). Au sein de la linguistique cognitive, la distance entre les
deux paradigmes originairement opposés tend, on le voit, à se réduire ; comme le note
Langacker (1999), l’opposition entre formalisme et fonctionnalisme est en passe de
devenir caduque.
29 Par ailleurs, l’évolution récente des autres sciences de la cognition a également contribué,
de l’extérieur, à rapprocher les positions : voir par exemple, dans Dupoux (2002), le
constat de l’évolution des sciences cognitives « classiques » (d’obédience strictement
cognitiviste) vers des sciences cognitives qualifiées de « pas si classiques » par Piattelli-
Palmarini. Certes, le dialogue interdisciplinaire n’a pas été conduit sur les mêmes bases,
s’agissant des linguistes du paradigme classique (défenseurs de l’approche dite « interne »
du langage) ou des linguistes du paradigme émergent (attentifs aux analogies entre
cognition linguistique et non-linguistique). Chacun a privilégié, pour ainsi dire, « ses »
psychologues et psycholinguistes, « ses » neurobiologistes et neurolinguistes, et « ses »
informaticiens : très schématiquement, on pourrait dire que là encore, on a pu retrouver,
d’un côté, les tenants du modularisme, de la localisation cérébrale, du symbolique, du
discontinu et de l’algorithmique ; et de l’autre, les tenants de l’interactionnisme, des
réseaux distribués, du sub-symbolique, du continu et du connexionnisme.
30 Mais ici aussi, toute opposition frontale serait réductrice : tous les cas de figure
intermédiaires se rencontrent au plan théorique, et les résultats des travaux
expérimentaux ont conduit à assouplir chacune des deux positions. À cet égard, l’on ne
saurait trop insister sur le rôle essentiel de l’ expérimentation, pour tester les paradigmes
qui sous-tendent les diverses théories de linguistique cognitive : qu’il s’agisse des
expérimentations qui se pratiquent en neuropsycholinguistique (où l’on peut désormais
s’appuyer sur l’outil performant que constituent les diverses techniques d’imagerie
cérébrale), ou des expérimentations conduites en intelligence artificielle (où, à côté de la
réalisation de systèmes à visée applicative, existe également une activité de modélisation
à des fins de simulation, d’expérimentation et d’apprentissage automatique). À cet égard,
la position de la grammaire chomskienne ne laisse pas d’être quelque peu paradoxale : la
linguistique serait une branche de la psychologie, mais la seconde n’aurait pas de rôle à
jouer dans la validation des construits théoriques de la première ! Quoi qu’il en soit, force
est de reconnaître que les linguistes ont jusqu’à présent été assez peu présents dans des
collaborations effectives avec la psychologie – et encore beaucoup moins avec les
neurosciences : combien de linguistes engagés en neurolinguistique ? combien de
linguistes cherchant à construire une théorie « neuro-compatible » (à l’instar, par
exemple, de Lamb 1999) ? Or les acquis récents de ces disciplines en matière de
fonctionnement du langage ne sauraient manquer d’avoir un impact sur le
développement des approches théoriques de la linguistique cognitive : que l’on songe,
pour ne prendre qu’un exemple, au fait que chez le singe l’aire comparable à l’aire de
Broca (crucialement impliquée, chez l’homme, dans l’exercice du langage) est l’aire F5, où
l’on a découvert les fameux « neurones miroir » (essentiels pour l’imitation et la
15

communication), et que l’aire de Broca enregistre elle aussi les gestes des personnes avec
lesquelles un sujet humain communique (Rizzolati et al. 2002).
31 Une illustration tout à fait convaincante de la façon dont le dialogue interdisciplinaire
peut contribuer à réduire le fossé entre les deux grands paradigmes évoqués plus haut, se
trouve dans Carruthers et Boucher 1998 à propos de la question des liens entre le langage et
la pensée. Dans le chapitre introductif de ce recueil, les auteurs montrent comment, en
philosophie, en psychologie et en linguistique, deux thèses opposées au départ
(participant chacune de l’un des deux paradigmes) se sont trouvées rapprochées dans
maints travaux récents. La première (typique de l’option innéiste et modulariste du
paradigme classique), selon laquelle la pensée serait communicable indépendamment du
moyen de transmission – et donc du langage –, a été quelque peu bousculée par les
approches connexionnistes et les traitements parallèles distribués. La seconde (typique de
l’option « interactionniste » du paradigme émergent), d’après laquelle le langage serait la
condition nécessaire requise pour l’exercice de la pensée, a été elle aussi été remise en
question. Au total, une position « intermédiaire » affaiblissant les deux thèses initiales a
conduit à transcender l’opposition entre les deux : la pensée serait certes possible sans le
langage, mais le langage serait constitutivement requis dans la pensée, en ce sens qu’il
existerait une forme spécifiquement humaine de pensée construite à travers le langage (le
« thinking for speaking » de Slobin 1996, confirmé par ses expériences). C’est ainsi que
s’est trouvée réhabilitée par les recherches récentes en linguistique cognitive et dans les
disciplines connexes, cette vieille question philosophique, qui avait déjà reçu – on le
notera au passage – une réponse circonstanciée très comparable dans le cadre d’une
théorie linguistique pré-cognitive, la théorie « psycho-mécanique » de Guillaume (cf. son
ouvrage posthume de 1964) : la pensée, indépendante du langage, se saisirait elle-même
via la langue, et révélerait ainsi ses schèmes cognitifs (voir Valette 2003). Sous une forme
très différente, on retrouve là ce que certains neuroscientistes ont, depuis longtemps,
soutenu à l’encontre des tenants d’un strict « localisationnisme » : à savoir l’idée que c’est
l’ensemble du cerveau qui pense et qui raisonne, et que le langage constitue le moyen qui
permet à la pensée de se penser elle-même (voir Lecours et al. 1987).
32 Au point où elle en est arrivée aujourd’hui, la linguistique cognitive se doit de relever un
double défi : développer des modèles susceptibles d’être confrontés aux pratiques
expérimentales des disciplines connexes en sciences cognitives, tout en affermissant sa
posture théorique au sein même de la linguistique. S’il est clair que la linguistique
cognitive n’avait rien à gagner d’une crispation sur des positions dogmatiques et d’un
affrontement (souvent plus idéologique que véritablement scientifique) entre les deux
paradigmes évoqués plus haut, à l’inverse, elle n’a certainement rien à gagner non plus
d’un « effet de mode » laxiste qui conduirait à considérer comme approche cognitive du
langage « l’étude de la façon dont nous exprimons et échangeons des idées et des
pensées » (selon les termes de Dirven et Verspoor 1998), c’est-à-dire en définitive toute
entreprise onomasiologique ! En revanche, une réflexion ouverte tout à la fois aux acquis
des grandes théories de linguistique générale intégrables dans un modèle cognitif, et aux
apports de la linguistique cognitive pour les questions de linguistique générale, ne saurait
que profiter à la discipline.
16

Pour aborder l’ouvrage


33 Les contributions ici rassemblées émanent de linguistes se réclamant (à des titres divers)
d’une linguistique cognitive, et de spécialistes d’autres secteurs des sciences cognitives
interagissant avec la linguistique.
34 La première partie de l’ouvrage propose un panorama des principaux courants existant
actuellement au sein de la linguistique cognitive, vus de l’intérieur même de la discipline.
35 La contribution d’Alain Rouveret présente l’évolution récente de la théorie de Chomsky
(de l’approche dite des « principes et paramètres » des années 1980 à l’actuel
« programme minimaliste »). Dans ce cadre théorique, la langue est caractérisée en
termes de calculs (syntaxiques) sur des représentations mentales et ces connaissances
intériorisées dans l’esprit de chaque locuteur sont postulées participer de l’équipement
biologique de l’espèce humaine. La notion de « grammaire universelle » avancée par
Chomsky se propose d’expliquer la rapidité et l’uniformité de l’apprentissage du langage
par l’enfant, quelle que soit la langue, par l’existence de caractéristiques communes aux
langues (des « principes » universaux innés) : seule resterait à apprendre par l’enfant,
selon la langue, la sélection des valeurs des différents « paramètres » attachés aux
principes. Le « programme minimaliste » vise à épurer au maximum le modèle et à rendre
compte du caractère jugé « optimal » de l’organisation du langage – notamment des
principes d’économie contraignant le calcul syntaxique, en vue de permettre d’associer à
une configuration d’items lexicaux, d’une part une représentation phonétique (décodable
par le système acoustique-articulatoire), et d’autre part une représentation sémantique
(interprétable par le système conceptuel). Comme le souligne Alain Rouveret à la fin de
son article, la théorie chomskienne est appelée à se prononcer sur plusieurs questions
d’importance pour une linguistique cognitive, notamment celle du « minimalisme » de
l’ensemble du dispositif grammatical (non seulement du noyau dur syntaxique, mais aussi
de la morphologie, de la phonologie• et de la sémantique), et celle de l’interface entre ce
dispositif et chacun des deux systèmes acoustique articulatoire d’un côté, conceptuel de
l’autre.
36 La contribution de Bernard Victorri présente le courant des « grammaires cognitives »
qui se sont développées sur la côte Ouest des USA à partir des années 1980, et qui sont
historiquement issues d’un courant dissident du chomskisme (appelé « sémantique
générative » pour se démarquer de la « sémantique interprétative » de Chomsky).
Langacker, Lakoff, Talmy, Fauconnier sont les représentants les plus connus de ce
courant, dont les deux postulats principaux sont l’existence de mécanismes cognitifs
généraux régissant l’activité de langage (au même titre notamment que la perception
visuelle ou l’expérience sensori-motrice) et le caractère central de la sémantique (conçue
comme une activité de construction de structures symboliques complexes à partir
d’unités lexicales et grammaticales). Au sein de ce courant, les travaux menés en
sémantique grammaticale (Talmy) visent à établir les configurations cognitives (images
mentales, sortes de « mises en scène ») construites par les énoncés ; ces configurations
sont représentées à l’aide de diagrammes schématisant les relations topologiques et
cinématiques entre éléments, et il est fait appel à diverses notions directement
interprétables en termes psychologiques (comme par exemple l’opposition entre
« figure » et « fond », reprise de la théorie de la Gestalt, à propos du « profilage »). La
construction du sens d’un énoncé est décrite en termes d’unification des représentations
17

schématiques associées aux différents éléments, dans une perspective seulement


partiellement compositionnelle. Au plan lexical, la théorie du « prototype• » reprise de
Rosch constitue l’une des grandes sources d’inspiration, qui alimente notamment les
nombreux travaux sur la polysémie d’unités lexicales, donnant lieu à des représentations
géométriques du sens ; par ailleurs, une grande importance est accordée au phénomène
de la « métaphore » (Lakoff), considéré comme un mécanisme général de la pensée,
massivement présent dans les langues, permettant d’appréhender des concepts abstraits
à travers l’expérience sensorimotrice. Enfin, au plan du discours, la théorie des « espaces
men taux » (Fauconnier) se propose de représenter la construction progressive, au fil du
texte, de configurations cognitives structurées (à partir des « instructions » livrées par les
formes linguistiques) et interconnectées : de nombreux phénomènes sémantiques et
pragmatiques (systèmes modaux et temporels, anaphore’, métaphores, analogie
contrefactuelle•...) sont ainsi abordés en termes de relations entre les espaces construits.
37 La contribution de Jacques François est consacrée au « néo-fonctionnalisme »
linguistique, qui connaît un essor important depuis les années 1980, notamment en
matière de développement de grammaires et de typologie des langues. Se démarquant lui
aussi de l’approche des grammaires formelles, ce courant (dont Givón est le représentant
emblématique) met l’accent sur la fonction de communication du langage et s’efforce de
caractériser les relations de correspondance entre les formes d’un système linguistique et
les fonctions encodées par ces formes. Postulant que l’acquisition du langage repose sur
des principes généraux du développement cognitif et que l’activité de langage peut
façonner les systèmes linguistiques, les néofonctionnalistes insistent sur le rôle des
relations et catégories sémantiques pour l’acquisition des structures syntaxiques. Ils
abordent la problématique des universaux (linguistiques et cognitifs) et du changement
linguistique dans une perspective typologique, s’interrogeant notamment sur la nature
des liens entre schemes cognitifs universels et variété des moyens d’expression : la notion
de « grammaticalisation• » y occupe une place centrale. Comme l’indique Jacques François
à la fin de son article, les théories néo-fonctionnalistes proposent des pistes de réflexion
sur plusieurs questions essentielles pour une linguistique cognitive soucieuse de penser
les liens entre langage, esprit et cerveau : comme par exemple la question de la variabilité
interindividuelle dans le traitement du langage, ou celle de l’émergence phylogénétique
de la faculté de langage.
38 L’option « dynamiciste » que partagent les deux courants des grammaires cognitives et du
néo-fonctionnalisme explique qu’ils se trouvent également en phase avec certaines
études diachroniques (intimement liées aux approches typologiques), dont la
contribution d’Alain Peyraube propose une illustration. Développant de façon détaillée
deux exemples particuliers empruntés à l’histoire de la langue chinoise – l’évolution des
structures locatives et celle des pronoms interrogatifs –, cet article permet de saisir en
quoi la linguistique historique a pu bénéficier de certains développements théoriques des
grammaires cognitives (en particulier à travers le traitement de la polysémie et de la
métaphore, ou le recours à la notion de prototype), mais aussi pourquoi, inversement,
l’intégration de la dimension diachronique et typologique constitue un apport nécessaire
à la linguistique cognitive : comprendre l’évolution des structures linguistiques est en
effet une condition pour appréhender la nature du changement conceptuel qui, en retour,
éclaire l’organisation conceptuelle présente.
39 Les articles réunis dans la seconde partie de l’ouvrage sont consacrés aux interactions
entre la linguistique cognitive et d’autres disciplines des sciences cognitives abordant le
18

langage sous un angle différent de celui des linguistes : non plus à partir de l’étude
spécifique du fonctionnement des langues, mais en tant que faculté supérieure de l’espèce
humaine, mise en oeuvre par des sujets, localisée dans certaines zones du cerveau, et
pouvant donner lieu à des simulations sur ordinateur.
40 L’article de Jean-François Le Ny introduit à la démarche du psychologue travaillant sur le
langage dans une perspective cognitive. La psycholinguistique, en tant que branche de la
psychologie cognitive, s’est constituée en plusieurs étapes historiques et est traversée par
divers grands courants théoriques, mais ce qui fonde cette (sous-) discipline, c’est la place
centrale qu’elle accorde à l’expérimentation pour aborder la question des bases
cognitives du langage dans l’esprit des locuteurs. Son objectif est en effet de spécifier
l’« architecture fonctionnelle » sous-jacente du langage, en s’attachant à l’étude des
représentations mentales (qui rendent possible l’existence du langage) et à celle des
processus mentaux (qui traitent le langage). Diverses techniques et méthodes
expérimentales sont utilisées pour étudier ces questions : qu’il s’agisse du recueil de
données sur des compétences linguistiques explicitement interrogées, ou surtout de
l’exploration indirecte d’activités internes implicites (comme par exemple le phénomène
« d’amorçage• ») par calcul des temps de réponse pour effectuer une tâche linguistique. La
position intermédiaire de la psychologie, dans le travail interdisciplinaire avec la
neurobiologie et la linguistique, apparaît ici clairement : pour tenter d’appréhender un
processus neurobiologique se produisant dans le cerveau (l’activation et sa propagation
dans des configurations de neurones, lors d’un amorçage) et censé affecter des
« représentations mentales » définies sur la base de significations linguistiques, le
psychologue observe et mesure un indice indirect, le temps de réponse. Les sous-
domaines de la psycholinguistique sont nombreux (acquisition du langage, production du
langage, troubles du langage, etc.), mais c’est plus particulièrement à la problématique de
la compréhension du langage que Jean-François Le Ny consacre la dernière partie de son
article. Si comprendre un énoncé c’est construire du sens, ce fonctionnement cognitif
repose sur un ensemble de processus largement automatiques et non-conscients, qui se
déroulent dans la mémoire de travail et engagent une série d’échanges entre perception
et mémoire à long terme (où, entre autres, les significations de mots sont supposées être
stockées dans un « lexique mental »). Pour les tenants des approches « interactionnistes »
aujourd’hui très répandues, la construction du sens procède par combinaison et
assemblage d’informations sémantiques complexes et diverses (informations issues des
connaissances lexicales mais aussi des données grammaticales, informations calculées par
inférences, informations extra-linguistiques livrées par la situation d’énonciation•).
41 L’article de Jean Luc Nespoulous présente les réflexions d’un neuropsycholinguiste
s’interrogeant sur les structures cérébrales ou réseaux neuronaux mobilisé(e)s lors du
traitement cognitif d’une composante de « l’architecture fonctionnelle du langage » dans
une activité langagière donnée ; son angle d’approche spécifique de cette problématique
de « l’architecture cérébrale » est celui des dysfonctionnements observés en pathologie
du langage. Chez les aphasiques, une lésion cérébrale focale induit des perturbations
sélectives, dont l’observation constitue une voie d’approche privilégiée des composantes
et sous-composantes (« modules ») de la faculté de langage qui, dans le fonctionnement
verbal normal, interagissent constamment et peuvent donc difficilement être
appréhendées de façon isolée. Trois grands types de phénomènes symptomatologiques
sont particulièrement recherchés en aphasiologie : les « doubles dissociations », les
« dissociations simples » et les « associations ». Le premier type correspond au cas où,
19

chez un sujet, une composante A (par exemple le traitement des noms) est perturbée et
une composante Β (par exemple le traitement des verbes) est préservée, alors que, chez
un autre sujet, A est préservée et Β perturbée. Ce cas semble privilégié pour conclure à
l’autonomie de A et de B, et donc pour conforter la thèse « modulariste » ; néanmoins la
variabilité des performances d’un même sujet selon la tâche (par exemple dénomination
ou discours continu), et surtout le manque de finesse des matériaux linguistiques
généralement utilisés (par exemple noms d’objets et verbes d’action) ne permettent pas
vraiment de tirer de conclusion définitive sur la nature exacte – syntaxique ou lexico-
sémantique – de la composante impliquée. Le second type (traitement d’un sous-
ensemble de phénomènes linguistiques ou d’une tâche A perturbé et d’un autre sous-
ensemble ou d’une autre tâche Β préservé, mais pas de dissociation inverse attestée)
permet de postuler, non pas l’existence de modules autonomes, mais des degrés de
complexité relative intra-modulaire ou inter-tâches. Le troisième type, quant à lui,
concerne les associations de plusieurs symptômes, intra-langagiers ou non (par exemple
aphasie et désorientation spatiale, ou aphasie et apraxie), qui posent la question cruciale
de savoir si l’on a affaire à plusieurs systèmes cognitifs distincts ou bien à un seul système
représentationnel profond commun à des domaines apparemment différents. La
problématique de la localisation de la « zone du langage » dans le cerveau a été
considérablement renouvelée ces vingt dernières années : l’activité linguistique apparaît
désormais comme largement distribuée, non seulement dans l’hémisphère gauche (sans
doute heu privilégié, sinon de la « grammaire », du moins du traitement des aspects les
plus formels du langage) mais aussi dans l’hémisphère droit (mobilisé pour traiter les
aspects les plus élaborés, y compris la pragmatique). En conclusion de son article, Jean-
Luc Nespoulous ouvre diverses pistes nouvelles auxquelles la recherche
neuropsycholinguistique devrait désormais s’ouvrir, comme par exemple observer la
gestion des éléments du lexique mental en contexte (et non plus isolés), étudier les
stratégies langagières palliatives des sujets cérébrolésés (mais aussi des sujets sains en
situation difficile), et prendre en compte les variabilités inter-sujets, inter-tâches et
même intra-tâche.
42 Enfin, l’article de Gérard Sabah propose un tour d’horizon des problèmes qui se posent au
spécialiste d’intelligence artificielle confronté au traitement automatique de la langue.
Après l’optimisme des débuts de l’intelligence artificielle au début des années 1950, qui
espérait pouvoir simuler par des programmes d’ordinateur tous les aspects de
l’intelligence humaine (et notamment l’activité de langage) en prenant appui sur la
théorie de l’information, et les premiers systèmes traitant les textes par mots-clés, la
question s’est très vite posée de savoir comment représenter les divers types de
connaissances (linguistiques et extra-linguistiques) nécessaires au traitement du langage.
Si les grammaires formelles, dans leurs nombreuses versions, ont pu fournir des bases
pour le traitement syntaxique, la nécessité de modèles sémantiques et discursifs s’est
rapidement fait sentir ; à cet égard, la diversité et l’hétérogénéité des sources
linguistiques auxquelles se sont alimentés les traitements automatiques mérite d’être
signalée. La nécessité de construire des systèmes robustes et totalement explicites impose
en effet des types des contraintes bien souvent ignorées des linguistes théoriciens, et
l’orientation récente vers le traitement de très gros corpus infléchit encore davantage les
travaux vers la recherche d’heuristiques efficaces. Par ailleurs, l’élaboration de systèmes
de communication homme-machine en langue naturelle oblige les concepteurs à prendre
en compte non seulement toutes les composantes linguistiques du message mais aussi le
20

contexte cognitif de l’humain qui dialogue avec la machine (ses attentes, ses
interprétations préférentielles, ses inférences, etc.). Dans cette perspective, la question de
l’architecture des systèmes et du mode de coopération des différents types de
connaissances revêt une importance primordiale. Au total, le paradigme symbolique,
constitutif du cognitivisme, et l’analogie postulée entre représentations mentales et
représentations de l’intelligence artificielle se trouvent questionnés dans diverses
réalisations récentes (systèmes multiagents, intelligence distribuée, systèmes hybrides
symboliques-connexionnistes, etc.).
43 Au terme de ce parcours, le lecteur aura – nous l’espérons – pu mesurer combien la
position pionnière occupée historiquement par la linguistique (conjointement avec la
psychologie et l’intelligence artificielle) au sein des sciences cognitives naissantes a
permis à cette discipline de renouveler profondément ses problématiques théoriques au
fil des ans, et de s’engager dans des collaborations inter disciplinaires fécondes visant à
explorer le fonctionnement du langage et des langues dans l’esprit et le cerveau humains.

NOTES DE FIN
1. Je remercie François Clarac, Daniel Kayser et Jean-Luc Nespoulous pour leurs remarques et
suggestions à la lecture d’une première version de cette présentation. Je dois en particulier à F.
Clarac les précisions historiques concernant le tournant cognitif des neurosciences, ainsi que la
référence aux travaux récents de Rizzolati.

AUTEUR
CATHERINE FUCHS
Directeur de recherche au CNRS. Dirige le laboratoire « Langues, Textes, Traitements
informatiques, Cognition » (UMR 8094, CNRS/ENS-Ulm/Paris VII).
21

I. Les courants de la linguistique


cognitive
22

Grammaire formelle• et cognition


linguistique
Alain Rouveret

1 En 1968, dans un recueil qui a fait date, Oswald Ducrot, Moustafa Safouan, Dan Sperber,
Tzvetan Todorov et François Wahl demandaient « Qu’est-ce que le structuralisme ? ».
Plusieurs livres collectifs posent aujourd’hui la même question pour les sciences
cognitives, l’un des plus récents étant celui d’Ernest Lepore et Zenon Pylyshyn, publié en
1999 et intitulé précisément « What is Cognitive Science ? ». Il existe une certaine
analogie entre les deux mouvements. Comme le structuralisme, le mouvement cognitif
regroupe dans un même projet plusieurs domaines disciplinaires. La linguistique figure
comme composante essentielle dans l’un et dans l’autre. Mais les disciplines partenaires
ne sont plus les mêmes – sciences humaines hier, sciences dures aujourd’hui. Le
développement du projet cognitif correspond en fait à un changement de perspective
majeur dans le paysage épistémologique, à une recomposition des champs disciplinaires
qui a une incidence directe sur le statut de la linguistique comme science.
2 Contrairement au structuralisme, ce programme a constitué d’emblée une entreprise
collective, impliquant plusieurs disciplines. On connaît l’importance de l’enjeu. Il s’agit de
parvenir à une meilleure connaissance du fonctionnement de l’esprit, à travers une
meilleure compréhension des différentes facultés qu’il développe et des systèmes de
connaissances qu’il maîtrise, des conditions de leur mise en œuvre, de leur acquisition,
éventuellement de leur origine. La spécificité du projet cognitif est de chercher à
atteindre cet objectif en convoquant toutes les disciplines susceptibles, potentiellement,
de jeter une lumière nouvelle sur les phénomènes mentaux et leur structure. C’est le cas
de l’informatique et de l’intelligence artificielle, puisque l’on peut utiliser les ordinateurs
pour simuler des processus habituellement attribués à l’intelligence humaine (il faut se
souvenir que le programme cognitif a émergé au début des années 1950 « dans un climat
fortement marqué par la naissance de l’informatique et le développement des notions et
des techniques de traitement formel de l’information », cf. Andler 1992). C’est aussi le cas
des neurosciences qui, depuis leur entrée en scène dans les années 1980, ont permis des
progrès considérables dans notre compréhension du fonctionnement et de l’architecture
23

du cerveau humain. La linguistique et la philosophie de l’esprit se trouvent donc coexister


dans le projet cognitif avec une « science de la vie » – la psychologie expérimentale –, et
avec des « sciences dures » – les neuro-sciences –, auxquelles il faut adjoindre plusieurs
disciplines-charnières – dans le domaine qui nous intéresse, la psycholinguistique et la
neurolinguistique. Il est clair que la linguistique n’occupe pas dans cet ensemble une
place privilégiée et que ses méthodes et ses concepts ne sont pas empruntés ou détournés
par les autres disciplines. En fait, c’est une condition inhérente au programme cognitif
que chaque discipline partenaire y conserve son individualité. Il revient à chacune de
définir son appareillage notionnel et ses méthodes et, sur ce point, il faut admettre que
l’éclectisme règne. Cette dernière caractéristique établit une distinction tranchée entre
l’entreprise cognitive et le paradigme• structuraliste qui, à partir de l’objet « langue »,
s’était attaché à définir des procédures d’analyse transposables d’un champ disciplinaire
à l’autre.
3 Il reste que, même si elles diffèrent d’une discipline à l’autre, les méthodes de description
adoptées, la mise en place des procédures expérimentales et la construction des théories
doivent procéder d’une conception commune et partagée de ce qu’est la cognition. Dans
le cas contraire, la notion même de programme cognitif serait vide de sens. Puisque l’on
s’intéresse à ce qui se passe dans la « boîte noire » quand une faculté cognitive s’exerce et
aux tâches qu’elle accomplit, on doit se demander quelle est la nature de l’activité de
pensée, consciente ou inconsciente, qui est ainsi engagée. Soit la caractérisation
suivante :
(1) L’activité cognitive doit être conçue comme un traitement de l’information,
c’est-à-dire comme un ensemble de processus computationnels opérant sur des
séquences de symboles et dérivant des représentations1.
4 Dans cette conception computationnelle et symbolique, la cognition accomplit
essentiellement la même chose que les ordinateurs qui ne font rien d’autre que manipuler
des symboles en suivant les règles formelles que leur fixent les programmes qui leur sont
intégrés. Un autre aspect de la conception computationnelle est que les systèmes
cognitifs, les systèmes perceptuels en particulier, sont modulaires, c’est-à-dire constitués
d’un ensemble de sous-systèmes distincts, fonctionnellement et informationnellement
spécialisés. Cette position, soutenue en particulier par Fodor (1989), implique par
exemple que les processus perceptuels et les tâches qu’ils accomplissent ne peuvent être
influencés par les processus mentaux supérieurs mettant en jeu la pensée consciente.

La perspective interne sur le langage


5 Dans la constellation disciplinaire formée par les sciences cognitives, la linguistique se
trouve intégrée avec les autres sciences humaines et certaines sciences sociales à un
paradigme incluant aussi des sciences dites « exactes » ou « dures ». Or cette cohabitation
soulève la question du statut de la linguistique et de sa place au sein de la constellation.
6 La linguistique s’occupe en effet d’un objet empirique, le langage, sur lequel
l’expérimentation n’est pas possible dans les mêmes conditions qu’ailleurs. Elle n’a pas un
accès direct au type de phénomènes qui intéressent la recherche cognitive dure puisque
si elle traite des objets de langue, les phrases, les énoncés, elle n’est aucunement préparée
à aborder les processus mentaux qui gouvernent leur production. Le décalage est encore
accentué par le développement, durant les deux dernières décennies, de techniques
d’observation nouvelles, extrêmement sophistiquées, permettant une meilleure
24

compréhension du système nerveux : enregistrement de l’activité des neurones


individuels et de l’ensemble du cerveau, explication des processus perceptuels et cognitifs
en terme d’activité biochimique, modélisation computationnelle de ces processus. Le fait
que le projet cognitif intègre comme pièce maîtresse à son dispositif cette dimension
expérimentale et technologique amène à se demander si la linguistique cognitive peut
être autre chose qu’une psycholinguistique ou une neurolinguistique.
7 La position soutenue par Chomsky depuis la fin des années 1950, réaffirmée dans les
articles réunis dans New Horizons in the Study of Language and Mind (Chomsky 2000),
consiste à défendre la légitimité de la « linguistique interne ». Est dite « interne » une
approche qui prend les énoncés de la langue comme autant de phénomènes autonomes
dont on peut isoler, étudier et représenter les propriétés structurales et la signification
hors des caractéristiques du contexte situationnel, discursif et sociolinguistique dans
lequel il prend place. Dans cette conception, le langage n’est pas un objet public et social,
dont les locuteurs individuels n’auraient qu’une connaissance partielle, mais un objet
strictement individuel, dont la connaissance est interne à l’esprit humain. Ce qui, selon
Chomsky, doit intéresser le linguiste, c’est l’étude de cet objet mental, une entité à
laquelle il réfère sous l’étiquette de I-language (où I-vaut pour « interne », mais aussi pour
« individuel ») et qui doit être prise comme un aspect du monde pouvant être soumis à
une enquête rationnelle. Plus précisément, le langage humain est un objet
« psychologique », composante de l’esprit humain, physiquement représenté dans le
cerveau, et faisant partie de l’équipement biologique de l’espèce, qui, précisément parce
qu’il est ce type d’objet, peut et doit être analysé suivant les mêmes méthodes
d’investigation que celles qui sont en œuvre dans les sciences de la nature.
8 Cette thèse « naturaliste » a plusieurs conséquences. Si elle est adoptée, il n’y a aucune
raison de supposer que les langues naturelles doivent recevoir le même traitement que
les langages formels de la logique ou des mathématiques qui sont des langages inventés,
ou que les règles linguistiques attribuées aux individus par la théorie doivent être
directement accessibles à la conscience et ne peuvent relever d’une connaissance tacite.
En fait, la science du langage doit tenter de se construire comme une science galiléenne,
c’est-à-dire une science émettant des propositions réunissant les trois caractéristiques
suivantes : être formalisées (mathématisées), être dotées de contenu empirique et de
pouvoir prédictif, être falsifiables expérimentalement. Une autre conséquence de la thèse
naturaliste concerne la relation de la linguistique aux autres sciences et à la philosophie.
Contrairement à ce que voudraient certains des philosophes intéressés, comme Putnam,
au problème de la relation entre l’esprit et le corps, il est nécessaire et suffisant, selon
Chomsky, que l’étude du langage satisfasse les contraintes qui gouvernent toute enquête
rationnelle sur un objet empirique, et n’a pas à satisfaire des exigences supplémentaires.
9 Chomsky attache enfin une grande importance à ce qu’il appelle le « problème de
l’unification » (voir les articles réunis dans Chomsky 2000). Science de la nature, la
linguistique ne peut, dans l’état actuel de nos connaissances, être unifiée avec aucune
autre science de la nature, encore moins être « réduite » à une autre activité scientifique.
Seule une approche naturaliste qui traite le langage dans une perspective interne, comme
un ensemble de computations sur des représentations mentales, est à même de rendre
compte de toute sa complexité.
10 Il est souhaitable de chercher à établir des passerelles entre ce que l’on sait des processus
mentaux, du langage en particulier, et les théories du cerveau, mais l’unification entre les
deux domaines est un objectif à très long terme et, pour être effective, cette unification
25

ne peut être une réduction. Le fait, révélé par les techniques nouvelles d’imagerie
cérébrale fonctionnelle, que les écarts par rapport aux principes généraux de la
grammaire ont pour corrélats des comportements particuliers dans l’activité électrique
du cerveau ne signifie pas que les phénomènes linguistiques doivent être expliqués en
termes neurologiques. Nul ne sait à ce jour comment les propriétés qui semblent être
définitoires des langues naturelles – caractère combinatoire, infinité discrète,
dépendance structurale – sont implantées physiquement dans les structures cellulaires et
neuronales. Et les questions phonologiques, morphologiques, syntaxiques ou sémantiques
qui constituent le fonds commun des recherches linguistiques – les pluriels brisés de
l’arabe, le système casuel de l’islandais, le déplacement de l’objet dans les langues
germaniques, la généricité – n’auraient aucune place dans un programme à orientation
neurologique.
11 La linguistique peut donc s’articuler au projet cognitif sans se confondre avec celles des
sciences dures qui, comme la neurolinguistique, sont spécifiquement intéressées au
langage. Cette conclusion rejoint la conception qui sous-tend le projet cognitif dans son
essence. Chaque discipline partenaire possède déjà son objet et ses méthodes
d’investigation propres et, pour aucune, il n’est question de fondation ou de refondation.
Ce qui est demandé à chacune, c’est au contraire de contribuer, dans la mesure de ses
ressources, à faire du fonctionnement de l’esprit une question empirique.
12 Dans ce qui suit, je m’attacherai à montrer que les grammaires formelles• définissent des
modèles adéquats de la cognition linguistique. Sous cette étiquette, on peut regrouper les
différents modèles chomskiens qui se sont succédé depuis Aspects of the Theory of Syntax
(1965) jusqu’au Programme Minimaliste (The Minimalist Program, 1995), ainsi que les
grammaires dites d’unification• qui se sont développées depuis le début des années 1980.
C’est dans les textes de Chomsky que l’ancrage cognitif de la théorie linguistique est le
plus nettement affirmé, c’est donc à eux que je me référerai dans cet essai. Je ferai surtout
porter l’effort sur le modèle des Principes et Paramètres et sur le Programme
Minimaliste. Il s’agira de montrer comment est conçue dans les grammaires génératives•
l’articulation du grammatical et du cognitif, d’évaluer l’apport de la linguistique
chomskienne à la réflexion• cognitive (plutôt que de faire comme si cet apport allait de
soi), mais aussi de déterminer si les questions rendues accessibles par la linguistique
chomskienne et les résultats qu’elle a obtenus sont à la portée de la recherche cognitive
ou au contrainte hors de son atteinte.

Paramètres, Grammaire Universelle et acquisition2


13 Ce sont essentiellement deux objectifs qui, par-delà leurs différences, unissent les
versions successives du modèle génératif depuis la fin des années 1970 :
(2) construire des modèles explicites, c’est-à-dire formalisables, des langues
naturelles ;
(3) proposer une théorie explicative de la compétence des individus, offrant une
caractérisation de ce savoir et précisant comment il est acquis.
14 (2) définit la linguistique comme une science galiléenne si l’on ajoute que la validité d’un
modèle doit être contrôlée expérimentalement. (3) définit la linguistique comme une
science cognitive puisque le comportement langagier repose à l’évidence sur des
capacités mentales. Il s’agit de caractériser à la fois la capacité cognitive qui permet à
l’enfant d’apprendre une langue naturelle dans un temps relativement court, hors de tout
26

enseignement explicite, à partir d’une expérience par définition variable et fragmentaire,


et le savoir linguistique qui en résulte. Or les savoirs résultants, les langues naturelles,
varient considérablement d’une communauté linguistique à une autre. Dans la mesure où
l’on ne peut appréhender le langage qu’à travers cette diversité, celle-ci va déterminer la
façon dont, dans le modèle, s’articulent l’universel et le particulier.

La Grammaire Universelle

15 Chomsky n’a cessé de répéter dans ses écrits que la rapidité et l’uniformité du processus
d’apprentissage, ainsi que l’exceptionnelle complexité de ce qui est appris, ne peuvent
être pleinement expliquées sans l’hypothèse d’un équipement inné préspécifié. L’une des
premières formulations de cette idée se trouve dans son ouvrage publié en 1965, Aspects of
the Theory of Syntax :
« Il semble évident que l’acquisition linguistique est fondée sur la découverte par
l’enfant de ce qui, d’un point de vue formel, constitue une théorie profonde et
abstraite une grammaire générative de sa langue – dont les concepts ne sont reliés
à l’expérience que de loin, par des chaînes longues et complexes d’étapes
inconscientes de type quasiment déductif. (...) tout cela [les propriétés du processus
d’apprentissage] ne permet pas d’espérer que la structure de la langue puisse être
apprise par un organisme qui ne disposerait d’aucune information préalable sur son
caractère général. » (Chomsky 1971 : 83-84).
16 À cette information préalable, Chomsky donne dans Aspects le nom de Grammaire
Universelle (Universal Grammar). D’abord définie comme l’ensemble des caractéristiques
partagées par toutes les langues et qui, de ce fait, n’ont pas besoin d’être mentionnées
dans les grammaires particulières, la Grammaire Universelle (abrégé en G.U.) en vient
très vite à désigner l’« état initial » de l’apprenant, la structure cognitive « instinctive »
servant de base à l’acquisition, qui fait que l’enfant, plongé dans un environnement
linguistique, n’a d’autre choix que d’apprendre à parler et qui, conjointement, explique
que les langues partagent les propriétés qu’elles partagent.
17 Pour se faire une idée plus exacte de la nature et de la forme de G.U., c’est-à-dire des
hypothèses initiales sur la nature du langage avec lesquelles l’enfant aborde
l’apprentissage, on doit considérer les caractéristiques de ce qui est appris. On sait par
exemple que les langues humaines ont un caractère doublement articulé, que ce sont des
organisations hiérarchiquement structurées qui s’expriment en linéarité et en
successivité, que les opérations qui les affectent sont crucialement dépendantes de la
structure et obéissent à des contraintes de localité, qu’elles distinguent les verbes et les
noms... On peut concevoir G.U. comme un ensemble structuré de règles et de principes,
préspécifiant la forme des grammaires possibles et incorporant une information
minimale sur ce que sont les langues naturelles. On sait que, dès Aspects, Chomsky
proposait de distinguer deux types d’universaux linguistiques, les universaux de
substance qui renvoient aux matériaux basiques dont sont faites les langues, les traits
distinctifs de la phonologie, les parties du discours de la syntaxe, matériaux sans lesquels
aucune langue naturelle ne peut être construite, et les universaux formels, répertoire de
règles et de principes qui déterminent l’architecture générale du dispositif grammatical
et le fonctionnement des dérivations•.
18 En même temps, s’il est clair que G.U. doit être structurée, la diversité même des langues
exclut que cette structure soit trop spécifiée. Dans le cas contraire, l’enfant rencontrerait
constamment dans la langue à laquelle il est exposé des phénomènes hors d’atteinte des
27

règles et des principes mis à disposition par G.U. (sur ce point, voir par exemple Chomsky
1971 :46). L’hypothèse que fait sienne le modèle des Principes et Paramètres est que les
langues sont moins différentes les unes des autres qu’elles ne paraissent, qu’elles
partagent infiniment plus que la « double articulation » et que ces propriétés partagées
ont le statut d’universaux linguistiques. On est évidemment là aux antipodes de l’idée de
l’infinie variabilité des langues humaines soutenue par les fonctionnalistes, par Martinet
(1960) en particulier.

Paramètres et architecture fonctionnelle

19 Si les principes capturent ce qu’il y a d’universel dans le langage, ce sont les paramètres
qui, dans ce modèle, caractérisent l’espace restreint dans lequel s’inscrit la variation
possible. Les principes sont essentiellement inviolables et rigides, les choix paramétriques
définissent des mesures d’accompagnement protocolaires, déterminant dans chaque
système comment tel ou tel principe est mis en œuvre.
20 Les paramètres isolés au début des années 1980 – le paramètre du « sujet nul » caractérisé
par Rizzi (1982), le paramètre directionnel associé au marquage casuel et au marquage
thématique proposé par Travis (1984), celui qui distingue entre les langues où le
mouvement des expressions interrogatives est explicite et celles où il intervient en Forme
Logique• et n’est donc pas manifesté par une modification de l’ordre linéaire (Huang 1982)
– illustrent bien le fonctionnement de la notion dans l’économie générale de G.U. Un petit
nombre de paramètres fondamentaux fixés différemment dans des systèmes linguistiques
relativement proches peuvent entraîner des variations considérables entre ces systèmes.
Quand la valeur d’un paramètre est fixée, la riche structure déductive de G.U. permet de
dériver tout un réseau des propriétés corrélées. Dans cette approche, les données
comparatives et typologiques permettent de préciser les limites relativement étroites
dans lesquelles s’inscrit la variation et, du même coup, d’accéder à l’invariant, c’est-à-dire
de préciser le contenu des principes universels.
21 Très tôt, cependant, la caractérisation des paramètres comme des dimensions de
variation attachées aux principes syntaxiques est apparue comme à la fois trop restrictive
et trop lâche. Dès 1984, Borer a suggéré que la variation paramétrique affecte
exclusivement le système flexionnel• des langues et que les paramètres sont attachés aux
morphèmes et aux mots fonctionnels individuels, comme partie intégrante de
l’information contenue dans leur entrée lexicale. Cette approche est dotée d’un pouvoir
explicatif potentiellement plus grand que la précédente puisqu’elle localise la variation
dans une propriété définitoire des langues naturelles, l’existence sur les mots fléchis
d’une morphologie nominale et verbale. Elle est aussi plus restrictive puisqu’elle exclut la
possibilité qu’un paramètre ne soit pas la propriété d’un trait d’un élément contenu dans
le lexique•. Chomsky et Lasnik (1993) développent la même idée en posant que les
paramètres sont exclusivement associés aux têtes fonctionnelles, c’est-à-dire aux
catégories qui codent les spécifications de temps, de mode, de personne, de nombre, de
définitude des domaines flexionnels, proposition et groupe nominal. De fait, la dimension
fonctionnelle/morphologique est directement impliquée dans un phénomène découvert
par Emonds (1978) et réanalysé par Pollock (1989), celui du site de réalisation variable du
verbe en fonction de la langue et du type propositionnel. Ces deux auteurs, en comparant
la distribution des modificateurs adverbiaux dans les propositions finies du français et de
l’anglais, ont montré que les formes verbales fléchies occupent dans l’arborescence des
28

positions plus hautes dans les langues dotées d’une flexion riche (c’est le cas du français,
qui sur ce point se comporte comme les langues romanes à sujet nul disposant d’une
forme distincte aux six personnes de la conjugaison) que dans celles où la morphologie
d’accord est pauvre ou absente (c’est le cas de l’anglais). Les énoncés suivants montrent
que certains adverbes s’intercalent entre le verbe et l’objet en français, mais pas en
anglais où, par contre, ils apparaissent entre le sujet et le verbe :
(4) a. Jean rencontre souvent Marie dans les cafés
b. *John meets often Mary
c. *Jean souvent rencontre Marie dans les cafés
d. John often meets Mary
22 Plutôt que de supposer que la position de l’adverbe varie d’une langue à l’autre, les
auteurs font l’hypothèse que c’est le site de réalisation du verbe qui change dans une
configuration structurale et catégorielle qui pour l’essentiel demeure invariante.
Admettons que la structure fonctionnelle de la proposition inclue une catégorie Temps
(T), intermédiaire entre le domaine lexical qui coïncide avec le groupe verbal, et la
périphérie, site de réalisation des marqueurs de subordination et des interrogatifs. Si les
adverbes qui, comme souvent, quantifient l’événement sont insérés à la périphérie gauche
du groupe verbal, (4) indique qu’en français le verbe fléchi se déplace au-delà de l’adverbe
pour s’adjoindre à T, alors qu’en anglais il conserve sa position originelle.
(5) a. [Jean T [souvent [rencontre Marie]]]
b. [Jean rencontre + T [souvent [t Marie]]]
(6) [John T [often [meets Mary]]]
23 Pollock (1989) établit que la distribution de la négation dans les deux langues, distincte de
celle des adverbes, et la prise en compte des infinitives où ces distributions sont
différentes de ce qu’elles sont dans les propositions finies imposent de conclure à
l’existence de deux têtes fonctionnelles distinctes dans le domaine flexionnel, que l’on
peut identifier comme Temps (T) et Accord (Agreement, abrégé en Agr). (7) reprend la
structure fonctionnelle de la proposition adoptée par Belletti (1990), dans laquelle Agr est
plus haute que Τ :
(7) [... C [... Agr... [Neg [... Τ [... V...]]]]]
24 En français, le verbe lexical• peut conserver sa position originelle V ou accéder à la
catégorie Τ dans les infinitives. Dans les propositions finies, il précède le marqueur de
négation pas et est réalisé dans Agr. Dans les interrogatives directes, il monte dans la
périphérie de la proposition jusqu’à C. En anglais, le verbe lexical (contrairement aux
auxiliaires) ne quitte jamais le domaine lexical. Cette analyse suppose que la structure
fonctionnelle des propositions est uniforme d’une langue à l’autre et d’un type
propositionnel à un autre et inclut les mêmes catégories organisées suivant la même
hiérarchie. Dans les structures où le verbe lexical est réalisé en surface dans T, dans Agr
ou dans C, il est nécessaire de définir une opération de mouvement de tête, affectant V et
l’adjoignant aux catégories supérieures. Les variations observées reflètent des variations
dans l’espace syntaxique parcouru par le verbe déplacé.
25 Ce type d’approche a été étendu à l’étude de la structure interne du groupe nominal,
désormais analysé comme une projection de la catégorie fonctionnelle D (Déterminant) et
incluant une tête intermédiaire entre D et N, la catégorie Nombre (Ritter 1991). C’est,
dans ce cas, la distribution des épithètes adjectivales qui sert de révélateur de la position
occupée par la tête nominale. La variation observable dans la position du nom à
l’intérieur de l’expression nominale – en anglais, le nom suit systématiquement tous les
29

modificateurs adjectivaux ; dans les langues celtiques, il les précède tous à quelques
exceptions près ; dans les langues romanes, il s’intercale dans les séquences adjectivales –
peut être ramenée à une différence dans la portée du mouvement du nom (Cinque 1994 ;
Longobardi 1994 ; Rouveret 1994).
26 La distribution des arguments• nominaux dans différents types de langues et dans
différents types de propositions se prête au même type d’analyse. On peut montrer par
exemple que dans les langues celtiques, langues VSO, l’argument sujet quitte bien sa
position originelle interne au groupe verbal, mais parcourt un espace syntaxique plus
restreint qu’en français : il occupe le spécificateur de T, non celui de Agr. Par contre,
comme en français, la tête verbale atteint la tête• flexionnelle la plus haute Agr. L’ordre
linéaire résultant est donc VSO (Rouveret 1994). Dans certaines constructions contenant
un auxiliaire, le verbe et l’argument objet forment manifestement un constituant, ce qui
confirme à la fois la généralité du schéma propositionnel (7) et l’hypothèse que dans les
séquences VSO, la position initiale du verbe résulte d’un déplacement.
27 L’étude par Rizzi (1997) de la périphérie gauche de la proposition a révélé qu’elle
constitue elle aussi un domaine relativement complexe, hautement structuré et associant
plusieurs projections fonctionnelles articulées hiérarchiquement – les projections des
têtes que Rizzi baptise Finitude, Topique, Focus, Force–, et que ces ressources
catégorielles sont disponibles dans des systèmes linguistiques typologiquement
différents, comme le révèlent la morphosyntaxe des complémenteurs•, la distribution des
adverbes « topicalisés », la place du verbe dans les propositions finies des langues
germaniques, la syntaxe des interrogatives dans les langues romanes... Enfin, Cinque
(1999) pousse la logique de cette approche à ses plus extrêmes conséquences et identifie
dans la structure de la proposition autant de catégories fonctionnelles que de classes
d’adverbes – chaque adverbe occupant le spécificateur de la tête correspondante.
28 Les résultats empiriques considérables accumulés par la syntaxe paramétrique depuis une
vingtaine d’années constituent un progrès essentiel dans la connaissance du langage et
dans la caractérisation du savoir linguistique tacite des individus. Comme nous le verrons
plus loin, ce sont aussi ces résultats qui servent de base à la théorisation minimaliste.

La relation de la syntaxe à la morphologie

29 Reconsidérons le squelette fonctionnel schématisé en (7). Si l’hypothèse de l’uniformité


est adoptée, il faut, pour rendre compte de la variation syntaxique, supposer que la même
catégorie fonctionnelle peut ou non « attirer » la tête verbale. Quelle dimension
grammaticale détermine le choix de l’une ou l’autre option ? Le type de réponse qui a été
donné à cette question consiste à proposer qu’au moins certains mouvements de têtes
sont motivés par une exigence morphologique. Plus précisément, on a admis que les
catégories fonctionnelles de la syntaxe constituent une source plausible pour les affixes•
exprimant les dimensions correspondantes, qu’ils soient dérivationnels• (cf. Baker 1988)
ou flexionnels (cf. Pollock 1989). Si l’on fait l’hypothèse que l’affixe de temps réside dans
T, l’affixe de personne-nombre dans Agr et que la deuxième catégorie occupe une position
plus haute dans l’arborescence que la première, il devient possible d’établir une
corrélation simple et immédiate entre l’ordre des affixes dans les mots construits et la
hiérarchie des catégories fonctionnelles dans le domaine flexionnel (cf. Belletti 1990). La
plausibilité initiale de cette approche vient de l’observation que dans le paradigme (4), le
verbe fléchi a un parcours syntaxique plus long dans une langue à morphologie
30

relativement riche comme le français que dans une langue où la morphologie verbale est
quasiment absente, comme l’anglais. Dans cette perspective, un lien direct est établi
entre, d’une part, la collection de catégories fonctionnelles et les ressources
morphologiques dont dispose une langue L et, d’autre part, la structure en constituants et
l’ordre des mots observables dans L. Les différences dans l’ordre des mots résultent de la
capacité variable qu’ont les différentes catégories fonctionnelles de déclencher le
mouvement, propriété elle-même déterminée pour une part par les affixes
morphologiques abrités par ces catégories.
30 Mais on notera, touchant les phénomènes évoqués, des situations de décalage. Des
langues qui ont les mêmes ressources morphologiques peuvent avoir des syntaxes
différentes. L’allemand dispose de paradigmes verbaux aussi riches que ceux de l’italien,
mais le verbe conserve sa position d’origine dans les subordonnées. Inversement, des
langues qui disposent de ressources morphologiques différentes peuvent avoir des
syntaxes identiques – le verbe a la même syntaxe en allemand et dans les langues
Scandinaves continentales où il n’est spécifié ni pour le nombre, ni pour la personne. Le
pouvoir explicatif de l’approche paramétrique dépend donc de la possibilité de replacer
ces phénomènes d’interaction entre syntaxe et morphologie dans une perspective
théorique plus large, rendant pleinement explicite la nature de cette interaction et
apportant en particulier une réponse à la question suivante :
(8) Les propriétés morphologiques d’une langue L
déterminent-t-elles les processus syntaxiques dans L
ou sont-elles le réflexe de ces processus ?
31 La question posée touche aux fondements mêmes de la faculté de langage. Des
corrélations entre variation syntaxique et variation morphologique sont observables dans
le domaine de la typologie, de la comparaison et de la diachronie. Mais ces corrélations
doivent-elles être interprétées comme une indication forte que les opérations
syntaxiques, les déplacements en particulier, sont motivées par la nécessité de satisfaire
les exigences morphologiques des différents éléments qui composent la phrase, comme le
supposent l’approche paramétrique et le Programme Minimaliste ? Ou, au contraire, sont-
elles mieux interprétées dans les termes d’une théorie qui considère la morphologie
comme étant non pas la cause, mais le réflexe des opérations syntaxiques ?
Contrairement à la conception selon laquelle la syntaxe est « guidée » (driven) par la
morphologie, la seconde théorie, défendue par Bobaljik (2000), est compatible avec des
situations dans lesquelles une variation syntaxique se laisse observer en l’absence de
toute variation morphologique. Il existe dans les langues de nombreux exemples de cette
situation. Ainsi, rien ne distingue la morphologie verbale du portugais européen de celle
des autres langues romanes à sujet nul. Pourtant, la syntaxe de la cliticisation en
portugais européen diffère sensiblement de celle des langues voisines3.

Paramètres et acquisition

32 J’ai rappelé au début de cette section quelle est la solution proposée par le modèle des
Principes et Paramètres pour résoudre le problème logique de l’acquisition du langage et
le rôle décisif joué par la notion de paramètre dans l’explication. La destination première
de la notion de paramètre est d’opérer le départ entre ce que l’enfant n’a pas à apprendre
parce qu’il le sait déjà (sans savoir qu’il le sait) et ce qu’au contraire il doit acquérir pour
construire la grammaire de sa langue. L’idée qui sous-tend cette présentation est que
31

l’essentiel de la connaissance linguistique est présente avant toute expérience et que le


système de savoir est plus simple qu’il n’apparaît superficiellement. En même temps, si
les différents loci de variation sont désignés par G.U. (au principe x est associé le
paramètre y), la tâche essentielle de l’enfant au cours de l’apprentissage est
l’identification et la fixation de la valeur de tous les paramètres en jeu dans la grammaire
de sa langue. La tâche d’apprentissage est encore facilitée par l’organisation modulaire du
dispositif grammatical. Une théorie modulaire• est une théorie dans laquelle les
dimensions de variation sont réparties entre différents sous-systèmes (théorie du Cas,
théorie thématique, théorie du liage...). Il est clair que plus une théorie est modulaire,
plus la variation autorisée dans chaque module est restreinte.
33 Mais si l’on adopte la perspective de la psychologie du développement, le problème se
pose dans des termes différents puisqu’il s’agit de rendre compte du processus
d’apprentissage en temps réel et de préciser comment le développement des capacités
cognitives générales chez l’enfant interagit avec la tâche d’apprentissage. Les linguistes
générativistes intéressés à l’acquisition se sont demandé si (tous) les principes de G.U.
étaient présents et « actifs » dès le début de l’apprentissage, si certains d’entre eux
étaient programmés génétiquement pour ne devenir opératoires qu’à des étapes
ultérieures du processus d’acquisition, ou si les grammaires initiales échappaient, au
moins par certains de leurs aspects, à une caractérisation dans les termes de G.U. Ils se
sont aussi demandé si la valeur des paramètres était fixée de façon quasi immédiate, ce
qui « s’accorderait avec l’idéalisation classique de l’acquisition instantanée défendue dans
Aspects » (Jakubowicz 1995), ou si chaque paramètre recevait une valeur initiale qui, au
contact de l’expérience, était soit maintenue, soit modifiée4. Sur toutes ces questions et
sur d’autres qui ne sont pas évoquées ici, je me permets de renvoyer à la présentation
deJakubowicz (1995).

Microparamètres vs. macroparamètres

34 On peut se demander aujourd’hui si l’approche paramétrique initiée au début des années


1980 a pleinement atteint son objectif et ouvert la voie à une meilleure compréhension de
l’articulation entre l’universel et le particulier dans le langage. Une première
constatation se fait jour, étroitement corrélée à ce qui vient d’être dit de la relation entre
syntaxe et morphologie. S’il a été possible dans les deux dernières décennies d’isoler
quelques macroparamètres, subsumant des paquets de propriétés corrélées organisées en
réseau, la situation rencontrée le plus fréquemment, lorsqu’on compare deux systèmes
génétiquement reliés et géographiquement proches, est celle d’une collection de
propriétés ponctuelles variant indépendamment les unes des autres. Les études
comparatives des dialectes italiens menées par Manzini et Savoia (à paraître), celle de la
morpho-syntaxe de la relativisation dans les langues celtiques par Rouveret (2002)
appuient une conception microparamétrique dans laquelle chaque locus de variation est
caractérisé sur la base d’une seule propriété fonctionnelle, c’est-à-dire d’un trait unique.
La notion originale de paramètre, comme dimension de variation induisant une cascade
d’effets empiriques, est supplantée par une autre conception dans laquelle les paramètres
codent individuellement, dans le lexique, les exigences morphosyntaxiques des têtes
fonctionnelles.
35 Le scepticisme des chercheurs à l’encontre de la notion classique de paramètre a en partie
sa source dans l’observation que certains des macroparamètres qui avaient été
32

initialement proposés soit ne constituent pas des dimensions de variation unitaires, soit
ne correspondent pas à des dimensions primitives. Le premier cas est illustré par la
propriété « sujet nul ». Il existe des langues dans lesquelles le verbe est uniformément
dépourvu de morphologie personnelle, mais qui néanmoins possèdent cette propriété –
c’est le cas du chinois et d’autres langues de l’Asie orientale. Cette situation montre que la
richesse de la flexion verbale ne peut être la seule dimension impliquée dans le
phénomène et que d’autres propriétés – syntaxiques celles-là – jouent un rôle
discriminant. Le deuxième cas est illustré par le « paramètre de la tête », évoqué plus
haut, fixant dans chaque domaine la position de la tête par rapport à son complément.
Dans un travail de grande portée, Kayne (1994) propose une théorie de la structure en
constituants, la théorie de l’antisymétrie, dans laquelle l’organisation hiérarchique des
catégories détermine intégralement l’ordre linéaire des éléments lexicaux
correspondants. Il intègre à sa théorie un axiome de correspondance linéaire qui garantit
que si α c-commande asymétriquement β, alors α précède ß. Située dans une perspective
cognitiviste, cette hypothèse a une importance considérable puisqu’elle réduit de façon
appréciable le nombre d’options structurales que l’enfant doit considérer dans l’analyse
des séquences. Mais elle a pour nous un intérêt plus immédiat puisqu’elle implique que
des ordres linéaires différents recouvrent toujours des structures hiérarchiques
différentes. Ainsi, les configurations VO et OV ne sont pas structuralement identiques.
Kayne suppose que toutes les langues présentent un ordre sous-jacent spécificateur-tête-
complément. Dans le cas qui nous intéresse, cela signifie que les configurations VO sont
basiques, alors que les configurations OV sont dérivées et mettent au moins en jeu un
déplacement du complément par-dessus le verbe. On sait par exemple qu’en japonais les
expressions interrogatives n’occupent pas la position initiale de proposition et que les
éléments complémenteurs sont réalisés en position finale. Kayne propose que la
deuxième propriété résulte du déplacement dans le spécificateur de la catégorie C de la
proposition complément. Si c’est le cas, les expressions interrogatives ne sauraient être
réalisées dans le spécificateur de C, qui est occupé par la proposition elle-même. En bref,
l’ordre complément + verbe, illustré par le japonais, le turc, est selon Kayne corrélé à des
choix morphologiques et dérivationnels spécifiques. Il n’existe pas de « paramètre de la
tête », mais plutôt un ensemble complexe de facteurs syntaxiques et morphologiques qui
conspirent pour déclencher le déplacement du complément par-dessus la tête qui le
sélectionne.
36 Certains auteurs maintiennent que, pour rendre compte de l’étendue effective de la
variation, la théorie doit accueillir conjointement les notions de macroparamètre et de
microparamètre. Les premiers conservent toute leur puissance explicative lorsqu’on
étudie des langues typologiquement éloignées et non reliées génétiquement. Au
contraire, on a toutes les chances de découvrir des microparamètres lorsqu’on compare
des dialectes proches les uns des autres qui, par définition, ont fait les mêmes choix
macroparamétriques. Baker (1996) soutient qu’il existe un paramètre unique isolant les
langues polysynthétiques de toutes les autres. Une question analogue se pose pour le
paramètre configurationnel/non configurationnel, proposé jadis par Ken Hale. Touchant
le second, je crois que le scepticisme est de mise et qu’une langue que l’on est tenté de
caractériser comme non configurationnelle est simplement une langue que l’on n’a pas
encore suffisamment analysée.
37 Inversement, on peut admettre que la seule notion syntaxiquement pertinente est celle
de microparamètre et que, très générale ment, plusieurs microparamètres interviennent
33

dans l’explication des macropropriétés. Plusieurs travaux récents sur les langues romanes
médiévales ont montré par exemple que la phénoménologie V2 « romane » ne coïncidait
pas avec celle qui s’observe dans les langues germaniques contemporaines, la seule
caractéristique absolument commune étant l’existence d’une « inversion germanique »
plaçant le sujet immédiatement derrière le verbe fini lorsque la position initiale est
occupée par un autre élément. D’autres dimensions sont incluses dans la caractérisation
classique du paramètre V2 germanique, qui apparaît ainsi relever d’une concomitance de
facteurs non spécifiques. Chacune de ces autres dimensions pourrait être endossée par un
microparamètre.

Le Programme Minimaliste : une grammaire cognitive5


38 Le Programme Minimaliste, s’il maintient fermement les objectifs (2) et (3), marque une
tentative pour réévaluer les fondements même de la discipline et pour éradiquer tous les
concepts dont la présence dans le dispositif n’est imposée ni par la nécessité conceptuelle,
ni par l’évidence empirique. En simplifiant beaucoup, on peut dire que le modèle des
Principes et Paramètres est construit sur une critique des notions de règle grammaticale
spécifique et de construction particulière, la complexité des phénomènes étant rapportée
à l’interaction des paramètres avec les principes généraux de G.U., et que dans le
Programme Minimaliste, ce sont les principes eux-mêmes qui sont soumis à la critique.

Minimalisme méthodologique/minimalisme de substance

39 Le Programme Minimaliste recouvre en réalité deux entreprises parallèles. Il s’agit tout


d’abord de construire une théorie du langage élégante, n’intégrant que les concepts, les
principes et les mécanismes minimalement nécessaires à la description et à l’explication
des données observables. Ce minimalisme-là ne fait que refléter une exigence
méthodologique qui sous-tend toute enquête rationnelle et ne constitue en aucun cas une
nouveauté dans le paradigme génératif, puisqu’il a toujours joué un rôle moteur
déterminant dans la pratique des chercheurs et dans l’évolution des modèles. Mais
l’ambition du Programme Minimaliste va bien au-delà. La visée n’est pas seulement de
construire la meilleure théorie, celle qui remplit de façon optimale les exigences
d’adéquation empirique et d’élégance conceptuelle, mais aussi de vérifier si l’objet
« langage » est lui-même articulé de façon optimale ou, ce qui revient au même, de
déterminer pourquoi il est comme il est. On n’a plus affaire alors à une question de
méthode, mais à une question portant sur la substance même de l’objet étudié.
40 La question minimaliste par excellence, celle dont procèdent toutes les autres, est en effet
la suivante : pourquoi G.U. est-elle configurée comme elle l’est ? Peut-on expliquer qu’elle
ait précisément les propriétés qu’elle a ? À cette question, Chomsky donne une forme
inattendue : le langage est-il un système parfait ? Et l’hypothèse de travail qu’il adopte est
que le langage est, de fait, proche de la perfection. Réponse aussi surprenante que la
question, si l’on continue à caractériser le langage humain comme un système biologique.
La perfection en question ne peut donc être évaluée qu’en relation avec une propriété
intrinsèque du langage. Or, de façon inhérente, une langue établit un lien nécessaire
entre son et sens. La tâche première de toute théorie linguistique est de caractériser ce
lien entre la représentation de la parole – la Forme Phonétique (F.P) – et la représentation
des propriétés logiques et sémantiques des mots et des phrases – la Forme Logique (F.L.).
34

Une autre caractéristique de la faculté de langage est que les deux pôles qu’elle relie, celui
du son et celui du sens, se trouvent eux-mêmes à l’interface avec d’autres facultés
cognitives, le système acoustique-articulatoire et le système cognitif-intentionnel. Il est
légitime de se demander si ces deux conditions d’adéquation externes – la nécessité de
dériver une représentation phonétique décodable par le système articulatoire et une
représentation sémantique interprétable par le système conceptuel – ne sont pas ce qui
détermine pour une bonne part les caractéristiques internes de l’objet et, par suite, la
forme de la théorie adéquate.
41 La thèse minimaliste forte consiste à poser que les grammaires des langues naturelles
représentent effectivement des solutions optimales à la fois au problème de l’association
du son et du sens et de la mise en relation de la faculté de langage avec les deux autres
capacités cognitives avec lesquelles elle se trouve en relation d’interface.
42 En d’autres termes :
(9) Le langage est un système configuré de façon optimale pour connecter entre
elles des représentations phonétiques lisibles par le système acoustique-
articulatoire et des représentations sémantiques lisibles par le système cognitif-
intentionnel.
43 La syntaxe minimaliste elle-même est conçue comme un mécanisme computationnel,
contraint exclusivement par des principes d’économie qui ont pour effet de limiter les
options possibles aux opérations qui sont les moins coûteuses et, en même temps,
permettent de créer des structures convergentes. Elle n’invoque que des règles et des
opérations dont la présence est imposée par des considérations d’interface ou par
l’hypothèse que le langage est configuré de façon optimale.
44 Cette approche, comme le souligne Uriagereka (1999), tranche avec la conception
fonctionnaliste. Là où le fonctionnalisme demande si le langage est organisé de façon
optimale à des fins de communication, le minimalisme demande si le langage est organisé
de façon optimale pour décrire l’interaction avec les autres systèmes cognitifs. Elle
tranche aussi avec celle qui est défendue dans le modèle des Principes et Paramètres
puisqu’elle implique qu’une grammaire satisfaisant de façon optimale les conditions
d’adéquation descriptive et explicative n’est pas nécessairement la plus adéquate. Une
grammaire ne peut être pleinement évaluée sans que soit prise en compte sa capacité à
satisfaire les conditions imposées par les autres systèmes cognitifs avec lesquels elle est
en relation d’interface. En d’autres termes, des écarts sont possibles par rapport à ce
qu’impose la nécessité conceptuelle, mais ces écarts doivent être motivés par les
conditions d’interface imposées par l’extérieur.
45 Son caractère radical rend difficile l’évaluation de la thèse minimaliste forte. Chomsky
prend soin de souligner que le minimalisme n’est pas (encore) une théorie, seulement un
programme définissant une stratégie de recherche. Cette stratégie consiste à débusquer
et à éliminer de l’appareillage théorique complexité et stipulations, à rechercher les
configurations ou les connexions « parfaites » et à contrôler et valider l’argument de la
nécessité conceptuelle posant que, toutes choses égales par ailleurs, le langage a
exclusivement recours à des procédés qui permettent de connecter le son et le sens6.

Imperfections, interprétabilité et mouvement

46 Pour que la notion de perfection appliquée au langage ne soit pas empiriquement vide, il
convient d’identifier les imperfections possibles. Et de fait, le langage semble bien, au
35

premier abord, renfermer des imperfections, petites ou grandes. Au nombre des petites,
on doit compter diverses redondances, le fait par exemple que dans les formes
morphologiquement complexes, une seule et même dimension flexionnelle puisse avoir
plusieurs réalisations morphologiques.
47 En grec ancien, la dimension « parfait » a dans la forme lé-lu-ka trois exposants distincts.
Inversement, certaines formes sont ambiguës au sens où elles peuvent réaliser
morphologiquement plusieurs dimensions. C’est le cas par exemple du latin insul-is qui
recouvre à la fois le datif et l’ablatif pluriel de insula « île ». D’autres aspects de la
morphologie flexionnelle – existence de verbes irréguliers, présence de systèmes casuels
morphologiques extraordinairement complexes dans certaines langues, absence totale de
marques casuelles dans d’autres – paraissent difficilement conciliables avec la nécessité
conceptuelle et ne peuvent guère être pris en compte par des conditions d’interface.
L’existence même de la morphologie flexionnelle, c’est-à-dire la présence d’affixes de
personne et de nombre sur les verbes et de marques de nombre et de cas sur les noms,
semble être une imperfection majeure, en même temps qu’une propriété définitoire des
langues naturelles.
48 Une seconde caractéristique paraissant constituer une imperfection manifeste concerne
le site de réalisation des expressions nominales : celles-ci peuvent en effet ne pas être
réalisées dans les positions où elles reçoivent leur interprétation thématique. On peut de
ce point de vue opposer les énoncés suivants :
(10) a. Il semble que Pierre parle le chinois couramment,
b. Pierre semble parler le chinois couramment.
(11) a. Cicéron a écrit cette lettre en 52 avant J.-C.
b. Cette lettre a été écrite par Cicéron en 52 avant J.-C.
49 Les deux membres de chaque paire partagent la même valeur de vérité. Mais dans les
exemples (b), Pierre et cette lettre n’occupent pas la position qui leur confère un rôle
thématique, alors qu’ils l’occupent dans les exemples (a). Pourquoi les langues disposent-
elles conjointement de ces deux types de structures ? Et si la mise en relation des
structures (b) avec les structures (a) est assurée par une opération de déplacement,
pourquoi les langues ont-elle recours à un procédé qui semble ne pas être
conceptuellement motivé ?
50 Touchant la première imperfection, Chomsky observe que le statut d’un affixe
morphologique varie selon la catégorie lexicale à laquelle il est attaché. Il faut distinguer
par exemple la marque de nombre apparaissant sur les noms et celle qui apparaît sur les
verbes et les adjectifs. La première n’est pas une imperfection puisqu’elle véhicule un
contenu sémantique – elle dénote la pluralité et contribue de ce fait à la construction de
la référence ; la seconde est redondante puisqu’elle ne fait que redupliquer la première.
Des remarques analogues valent pour les cas dans les langues qui disposent d’un système
de cas morphologiques. Dès Lectures on Government and Binding, Chomsky (1981) avait
observé que le datif, l’ablatif, les autres cas obliques ne doivent pas recevoir le même
statut que le nominatif et l’accusatif. Les premiers sont des cas inhérents, les seconds des
cas structuraux. La réinterprétation minimaliste de cette opposition est que les premiers
sont sémantiquement interprétables, puisqu’ils manifestent le rôle thématique du nom
qui les porte et, du même coup, lui confèrent un rôle syntaxique. Les seconds ne le sont
pas et constituent de fait des imperfections. Mais – et c’est là exactement la position de la
grammaire traditionnelle–, ils permettent de construire ou de manifester une relation
entre deux termes. Sur ce point, ils remplissent un rôle analogue aux marques de nombre
36

évoquées plus haut qui, attachées aux verbes et aux adjectifs, constituent des marques
d’accord non interprétables, mais permettant la construction d’une relation avec des
entités sur lesquelles ces dimensions sont interprétables.
51 Ce qu’indique la discussion précédente, c’est que certaines dimensions flexionnelles
peuvent être interprétables ou ne pas l’être, et que leur interprétabilité dépend de la
catégorie sur laquelle elles sont réalisées. Admettons qu’une représentation d’interface
est mal formée si elle contient des objets non interprétables au niveau concerné (F.P ou
F.L.)7. Ces traits devront donc nécessairement être éliminés avant que la dérivation
n’atteigne le niveau d’interface pertinent.
52 La proposition de Chomsky est que, si l’on raisonne dans ces termes, il est possible de
réduire les deux imperfections mentionnées précédemment à une seule. Le mouvement
est par excellence la stratégie permettant d’établir une relation entre deux objets. Il
permet donc de placer les traits non interprétables au contact des traits interprétables
qui leur correspondent et donc de vérifier et d’éliminer les premiers au moyen des
seconds. On se souvient que dans cette approche, la notion d’interprétabilité aux
interfaces joue un rôle crucial. L’hypothèse avancée est que les déplacements syntaxiques
sont motivés par la nécessité d’éliminer les traits non interprétables. Les cibles des
déplacements sont identifiées par le fait qu’elles portent de tels traits. Les imperfections
constatées ont donc une fonction computationnelle.
53 Le déplacement, tel qu’il vient d’être caractérisé, représente la solution optimale au
problème suivant : comment assigner deux types de propriétés à la même expression, des
propriétés sémantiques (thématiques) et des propriétés syntaxiques (grammaticales et
informationnelles) ? Dans les structures suivantes (où les sites d’origine contiennent une
trace du terme déplacé, symbolisée t) :
(12) a. [Jean] est arrivé [t]
b. [Jean] est facile à contenter [t]
54 On peut poser que la position la plus basse est exclusivement dédiée à la propriété
Patient, la plus haute à la propriété Sujet/Topique. Le déplacement de la première dans la
seconde est une opération permettant d’associer au même argument ces deux
caractéristiques – en fait une opération de « dernier recours », car la seule qui permette
de dériver le résultat cherché. Techniquement, le déplacement sera déclenché par la
nécessité d’éliminer les traits non interprétables attachés à la catégorie d’accueil.
Adoptons une représentation propositionnelle simplifiée dans laquelle la catégorie T est
l’unique tête fonctionnelle du domaine flexionnel et posons que T est doté d’un trait de
Cas [nominatif] et du trait [EPP] qui note la propriété Sujet/Topique, l’un et l’autre
ininterprétables sur cette catégorie. Seul le déplacement du contenu argumental Jean
dans le spécificateur de T permet de satisfaire ces deux traits et donc de les éliminer.
55 En bref, si l’on poursuit la logique minimaliste, on doit conclure que les imperfections du
code linguistique – apparition de marques morphologiques là où elles ne sont pas
interprétables, occurrence des arguments nominaux dans des positions autres que celles
où ils reçoivent leur interprétation thématique – cessent d’être des imperfections
lorsqu’on les replace conjointement dans le fonctionnement global du système
linguistique.
37

La forme du dispositif

56 L’adoption de la perspective minimaliste a conduit à l’abandon de plusieurs notions et


principes intégrés aux modèles précédents. Deux des niveaux de représentation
précédemment incorporés au dispositif – la structure D (la « structure profonde• » des
premiers modèles génératifs) et la structure S (« structure superficielle• ») – sont éliminés
parce que leur existence ne relève pas d’une nécessité conceptuelle et n’est pas non plus
motivée par des conditions externes. Seuls sont maintenus les deux niveaux d’interface,
la forme logique F.L. et la forme phonologique F.P., parce que le système conceptuel
exploite les représentations mises à disposition par le premier et que le système
acoustique-articulatoire utilise celles qui sont fournies par le second. De fait, les trois
composantes que doit minimalement intégrer toute théorie grammaticale sont d’une part
le lexique, d’autre part les deux interfaces, F.L. et F.R (on peut considérer le lexique
comme une troisième interface en relation avec le dispositif grammatical). Dans la
tradition générative, c’est une dérivation qui assure la mise en relation de ces trois
composantes. Les deux interfaces sont composées d’items empruntés au lexique et le rôle
de la dérivation est précisément d’associer et de combiner entre eux les items lexicaux.
57 Les modèles précédents intégraient des systèmes de règles (phrase structure rules) mettant
en place la structure en constituants. Le statut de ces règles est assez indécis puisqu’elles
répètent des informations déjà contenues dans les entrées lexicales des items, leur cadre
de sous-catégorisation, leur sélection argumentale et thématique (cf. Stowell 1981). Mais
aucune proposition spécifique n’avait été avancée sur la façon de construire la structure
en constituants sans recourir à ce type de règles. Dans le Programme Minimaliste, ce rôle
est dévolu à une opération élémentaire, Merge, qui se saisit de deux objets syntaxiques –
items lexicaux ou/et combinaisons d’éléments lexicaux – et leur substitue un objet
syntaxique unique qui correspond à un constituant, c’est-à-dire à un morceau de
structure. C’est en ce sens que la représentation de la structure en constituants peut être
dite « nue » (bare phrase structure) : elle se compose exclusivement d’objets présents dans
la numération.
58 Les principes de composition et de manipulation qui constituent le système
computationnel (CS) spécifient aussi dans quelles conditions le mouvement est possible.
Nous savons déjà qu’autre chose que la simple combinaison des têtes et des constituants
est nécessaire et que la grammaire doit disposer d’une opération de déplacement. Soit
Move l’opération qui déplace les éléments et expressions lexicales pourvus de traits
« actifs », c’est-à-dire non interprétables, ou capables d’éliminer les traits non
interprétables des catégories fonctionnelles. Move correspond à la combinaison de deux
opérations élémentaires, Copy et Merge. Copy cible un constituant et produit une copie qui
est ajoutée à l’objet syntaxique déjà construit.
59 CS construit la structure de l’intérieur vers l’extérieur et de bas en haut, par la mise en
œuvre des opérations Merge et Move. Un groupe verbal combinant un verbe et un
complément propositionnel comme croire que la terre est ronde, ne peut être construit
avant que la complétive elle-même l’ait été.
60 Merge et Move partagent une propriété essentielle : ces deux opérations doivent l’une et
l’autre étendre la structure. Cette condition implique par exemple qu’un déplacement ne
peut sélectionner comme cible la position complément d’une tête déjà projetée (qui par
définition est de même niveau qu’elle). Et il n’est pas sûr que l’adjonction par mouvement
38

d’une tête à une autre tête (par exemple, l’adjonction d’une racine verbale à un affixe de
temps), qui n’étend pas la structure, soit une opération syntaxique.
61 En résumé, dans le Programme Minimaliste, les structures syntaxiques sont construites
au moyen d’une dérivation qui inclut un mécanisme pour mettre en place la structure en
constituants (Merge) et un mécanisme pour dériver les dépendances syntaxiques (Move) 8.
Sans entrer plus avant dans le détail, on voit en quoi cette approche à la formation des
structures se distingue des précédentes. Il y a mise en œuvre simultanée du lexical, du
structural et du relationnel. On ne postule plus un cadre syntaxique vide, constitué par un
ensemble de positions syntaxiques catégoriellement étiquetées et hiérarchiquement
ordonnées, dans lequel seraient insérées, puis déplacées, les unités lexicales. Une position
n’est créée qu’au moment où l’item lexical qui lui correspond est combiné avec un autre
item ou avec une structure déjà construite. Il n’existe pas de structure profonde qui
constituerait le point de départ de la dérivation. On a désormais affaire à un système
dynamique où des morceaux de structure sont fusionnés et déplacés, au fur et à mesure
que le cycle se déploie.

Économie/Localité

62 Dans le modèle des Principes et Paramètres, la réalité du construit théorique était


garantie par les prédictions qu’il autorise touchant non seulement les regroupements
typologiques et le changement diachronique, mais aussi l’acquisition. Dans les différents
articles qui fondent le Programme Minimaliste, Chomsky fait l’hypothèse que la faculté
de langage est configurée de façon optimale et que son fonctionnement est réglé par des
principes d’économie. S’il en est bien ainsi, la tâche d’apprentissage s’en trouve
grandement facilitée puisque le nombre d’options que l’apprenant doit prendre en
compte dans la construction de la grammaire de sa langue est considérablement réduit, la
situation idéale étant celle où l’apprenant n’a en réalité aucun choix puisqu’à chaque
étape, une seule option se présente à lui.
63 La référence à la notion d’économie n’est pas absolument nouvelle dans le champ
linguistique. Plusieurs linguistes structuralistes ou fonctionnalistes y ont eu recours. Le
point important pour nous est que ces chercheurs ont construit les notions d’économie et
de simplicité comme des principes constitutifs de l’objet « langage », de son architecture,
de son fonctionnement, et pas seulement comme des caractéristiques vers lesquelles doit
tendre toute théorie scientifique.
64 Conférant à la construction de la théorie un contenu réaliste, ils ont posé que ce qui est
préférable pour le linguiste est aussi ce qui est préférable pour le locuteur ou l’auditeur,
ou encore pour l’enfant en situation d’apprentissage. C’est bien ainsi que procède
Jakobson lorsqu’il fait valoir la supériorité de l’analyse componentielle• et postule la
réalité du système dichotomique binaire en phonologie (cf. Jakobson et Halle 1956 ;
Jakobson 1976). L’organisation phonologique fondée sur les traits distinctifs et le principe
binaire qui correspond à la caractérisation la plus simple et la plus économique pour le
linguiste doivent nécessairement faire partie de la connaissance inconsciente du
locuteur-auditeur et sous-tendre les opérations qu’il effectue. Ils allègent en effet
considérablement la tâche de ce dernier, en le plaçant devant d’« avantageuses situations
de choix binaires ». L’analyse componentielle permet en particulier de substituer aux 325
oppositions rendues disponibles par les 28 ou 29 phonèmes non-syllabiques de l’arabe
classique 9 oppositions binaires.
39

65 Bien que le style d’exposition et le modèle proposé diffèrent considérablement, Chomsky


n’envisage pas autrement la construction de la théorie syntaxique. Dès le début des
années 1980, la théorie générative a incorporé certains principes à connotation
économique. C’est ainsi qu’il faut interpréter le principe Éviter les pronoms qui imposait,
partout où c’était possible, de donner la préférence aux pronoms nuls• sur les pronoms
explicites, et aussi aux pronoms clitiques• sur les pronoms forts•. Les premiers articles
minimalistes ont marqué l’apparition des concepts d’économie des dérivations et
d’économie des représentations. Dans les termes de (9), les représentations d’interface,
F.L. et F.E, ne doivent contenir aucun élément que les autres systèmes ne peuvent
interpréter. Le Principe de l’Interprétation Intégrale (Principle of Full Interpretation), posant
que tout élément figurant à un niveau d’interface doit pouvoir être interprété à ce niveau,
peut être considéré comme un principe d’économie représentationnelle. Ainsi, une
représentation phonologique Ρ ne peut contenir un morphème lié qui n’a été associé à
aucun support lexical, parce qu’un tel élément ne peut recevoir d’interprétation à ce
niveau. De même, une représentation logique L ne peut pas contenir d’objets non
interprétables à ce niveau, par exemple des éléments explétifs• (comme le il impersonnel
du français) qui sont par définition dépourvus de tout contenu sémantique. Si c’est le cas,
le Principe de l’Interprétation Intégrale est violé. On admet que dans l’énoncé (13),
l’explétif il dont la présence est requise par (i) le Principe de Projection Étendu (EPP), et par
(ii) l’impossibilité en français de réaliser les sujets par un pronom nul, est « remplacé » en
Forme Logique par l’argument sujet, par l’effet d’une opération de substitution qui
produit la même configuration et obéit à la même condition de localité que la relation
construite en (11b) ou en (12a) entre l’argument sujet et sa trace (cf. Chomsky 1986) :
(13) a. Il est arrivé quelque chose de grave
b. [quelque chose de grave] est arrivé [t]
66 L’idée que tout élément présent dans une représentation d’interface doit être
interprétable par le système cognitif qui l’utilise détermine pour une part l’architecture
du dispositif et joue un rôle crucial dans le fonctionnement des dérivations. Si l’une des
deux représentations d’interface contient des traits non interprétables, la dérivation
échoue. Si par contre les deux représentations d’interface n’incluent que des traits
interprétables, la dérivation « converge ». La motivation quasiment unique des
opérations syntaxiques, des déplacements en particulier, est donc l’élimination des traits
non interprétables.
67 Poser d’autre part que les dérivations, comme les représentations, doivent satisfaire une
exigence d’économie signifie qu’à chaque étape, c’est l’option la plus économique qui doit
être sélectionnée. Cette restriction affecte tout particulièrement les opérations de
déplacement qui doivent « avoir lieu pour une raison ». Puisque l’absence de mouvement
est nécessairement moins coûteuse que le mouvement lui-même, un déplacement ne peut
avoir lieu que s’il est nécessaire à la « convergence » de la dérivation, c’est-à-dire s’il a le
statut d’une opération de « dernier recours », permettant de satisfaire l’exigence
morpho-syntaxique d’une catégorie fonctionnelle et d’effacer un trait non interprétable à
l’un des niveaux d’interface.
68 La Condition du Lien Minimal est une seconde contrainte d’économie dérivationnelle qui
énonce que, si à une étape de la dérivation, le choix existe entre deux applications de la
même opération, c’est l’option la plus « courte », celle qui met en jeu l’espace syntaxique
le plus restreint, qui doit être sélectionnée.
40

(14) Condition du Lien Minimal (MLC, cf. Chomsky 1995 : 296) α peut monter vers
une cible Κ seulement s’il n’existe pas d’opération Move β, satisfaisant le dernier
recours et prenant Κ pour cible, où β est plus près de K.
69 Chomsky discute l’exemple (15a), dans lequel le groupe nominal John s’est déplacé hors de
la proposition enchâssée en ciblant la catégorie Τ de la proposition matrice. Au point de la
dérivation où intervient cette opération, la structure de (15a) est à peu près (15b) :
(15) a. *John seems that it was told t that Mary left
b. Τ seems that it was told John that Mary left
70 Dans l’enchâssée, it vérifie le trait de Cas et le trait EPP de T. La difficulté est que it est
plus proche du Τ matrice que John. Par suite, le déplacement de John dans la proposition
racine pour satisfaire le trait EPP et le trait de Cas du Τ matrice est bloqué par MLC. On
voit que dans ce raisonnement, le calcul de la localité est opéré à partir de la catégorie Τ
dont un ou plusieurs traits doivent être vérifiés. De fait, Chomsky propose d’intégrer MLC
dans la définition même du mouvement, conçu comme Attract (ce sont les traits non
interprétables sur la catégorie cible du déplacement qui attirent les traits du terme
déplacé).
71 On peut aborder dans les mêmes termes l’agrammaticalité• de l’énoncé suivant,
impliquant le déplacement long d’un adjoint interrogatif pardessus l’argument
interrogatif sujet de la proposition enchâssée :
(16) *Comment ne sais-tu pas [qui a résolu le problème t] ?
72 L’idée générale sous-jacente à MLC est que les relations locales doivent être établies dans
l’espace syntaxique minimal dans lequel elles peuvent être satisfaites. Cette idée peut être
interprétée en termes cognitifs : la quantité de structure qui doit être explorée dans le
calcul et l’établissement d’une relation locale doit être minimisée le plus possible 9.
73 Un autre principe contraignant le fonctionnement des dérivations et explicitement
formulé par Chomsky comme un principe d’économie est que dans toutes les situations
où les opérations Merge et Move sont l’une et l’autre des options disponibles pour
satisfaire une exigence computationnelle, c’est Merge qui a la préférence. L’hypothèse que
Merge est un processus moins coûteux que Move est naturelle, puisque Move est une
opération complexe mettant en jeu deux opérations Copy et Merge. L’un des phénomènes
pour lequel cette condition est pertinente est la distribution des explétifs dans les
constructions à montée (cf. Chomsky 1995, 2001).
74 Enfin, le dispositif minimaliste inclut une notion supplémentaire réglant le
fonctionnement du cycle dérivationnel. Il s’agit de la notion de phase, introduite par
Chomsky (2001). Les phases marquent les étapes de la dérivation auxquelles les parties
internes d’un objet syntaxique deviennent inaccessibles à toute manipulation syntaxique
ultérieure. L’impénétrabilité des phases implique en particulier que tous les traits non
interprétables doivent avoir été vérifiés et éliminés au cours de la phase qui inclut la
catégorie qui les porte. Deux projections syntaxiques sont identifiées comme définissant
des phases : CP (correspondant aux propositions dans lesquelles la périphérie est activée
par la présence d’un marqueur de subordination ou d’une expression interrogatives) et vP
(v est la tête la plus haute des groupes verbaux). Seuls les termes occupant la frange de
ces domaines – la tête ou le spécificateur – sont accessibles à la computation intervenant
au cours de la phase suivante. L’hypothèse que les dérivations procèdent par phase a
évidemment pour effet de restreindre l’espace syntaxique que doit prendre en compte la
41

computation à chaque étape, pour produire des représentations d’interface bien formées
10.

75 D’autres principes d’économie ont été proposés dans la littérature. Certains chercheurs,
par exemple, ont défini un principe d’économie des structures qui impose d’associer à
chaque collection d’items lexicaux la représentation structurale la plus parcimonieuse,
celle qui implique un nombre minimal de catégories et de projections. Cette proposition
n’est pas directement compatible avec l’hypothèse de l’uniformité.
76 En bref : la grammaire est conçue comme un système computationnel permettant de faire
correspondre, à un choix d’éléments lexicaux – la numération–, par le biais d’une
dérivation optimale sélectionnant à chaque étape les opérations les plus économiques,
deux interfaces (F.L. et F.P.) avec les modules cognitifs conceptuel et phonétique. Dans ce
dispositif, les considérations d’économie fonctionnent non seulement comme principe
heuristique, guidant la construction des théories, mais aussi comme principe constitutif
de l’architecture du langage, une propriété de l’objet lui-même.

En résumé

77 La caractérisation minimaliste du langage comme un objet « parfait » est au premier


abord difficilement conciliable avec l’idée, intégrée au modèle des Principes et
Paramètres, que les principes contraignant les grammaires possibles et l’objet construit
lui-même doivent être référés à la biologie. On peut en effet se demander ce qu’il y a de
biologique dans les caractéristiques parfaites que Chomsky décèle dans le langage –
l’économie dérivationnelle, l’économie structurale, le caractère motivé de toute
opération... Dans un entretien avec Adriana Belletti et Luigi Rizzi, Chomsky envisage deux
réponses possibles à cette objection (cf. Chomsky 2002). La première consisterait à
prendre pour acquis que le langage, bien qu’étant un objet naturel, se distingue des autres
systèmes biologiques par des propriétés spécifiques, propriétés qui pourraient en
définitive être rapportées à son caractère combinatoire. La seconde, plus ambitieuse et
plus risquée, serait que le minimalisme de substance est également pertinent pour les
autres systèmes biologiques et que les questions minimalistes peuvent également être
posées à propos de ces systèmes.

Extensions
78 Quelle forme peut ou doit prendre le programme cognitif lorsqu’il prend le langage pour
objet ? On sait qu’il n’existe aujourd’hui sur cette question aucun consensus entre les
linguistes, les psychologues et les neurolinguistes, ni même entre les linguistes eux-
mêmes. Parmi eux, certains ont considéré qu’aucune théorie existante ne satisfaisait
l’exigence cognitive et qu’un champ d’étude spécifique, entièrement nouveau, devait être
défini. C’est la position adoptée par Langacker (1987) qui a développé un modèle de
description, la « grammaire cognitive », laquelle s’impose de ne recourir qu’à des notions
et à des principes directement interprétables en termes psychologiques et mentaux. Il
faut admettre que la distinction « figure »/« ground » que l’on trouve dans son dispositif
comme principe psychologique moteur de l’activité langagière ou sa théorie de la
catégorisation ne suffisent pas à fonder une linguistique nouvelle. Il doit être clair
également que pour décider de la pertinence cognitive d’une théorie, c’est l’ensemble du
dispositif qu’il faut considérer, et non pas telle ou telle caractéristique isolée. Or, la
42

grammaire de Langacker dit fort peu sur le rôle de la morphologie, sur la variation
linguistique, sur le processus d’acquisition.
79 La présentation qui précède a montré que, par bien des aspects, les questions
minimalistes sont aussi des questions cognitivement pertinentes et que les solutions
proposées sont le plus souvent interprétables en termes cognitifs. Ce que propose le
Programme Minimaliste peut donc légitimement être considéré comme un modèle
(abstrait) de la cognition linguistique. Dans cette section, je me propose d’évoquer
certaines directions de recherche, potentiellement pertinentes dans une perspective
cognitive, qui ont été jusqu’ici laissées en suspens ou ignorées par la recherche
minimaliste.

Traits formels vs. catégories syntaxiques

80 Il est parfois difficile d’évaluer la portée de certaines modifications introduites par le


Programme Minimaliste : transpositions d’une hypothèse classique dans un cadre plus
contraint ou innovations réelles ? L’évaluation ne peut se faire, dans chaque cas
particulier, qu’en étudiant les prédictions empiriques ou les solutions nouvelles rendues
accessibles par le modèle. La théorie du mouvement par copie, par exemple, même si elle
développe une idée ancienne, fait partie de la deuxième catégorie (cf. Chomsky 1993).
Mais il n’est pas certain que les diverses questions posées dans le cadre du modèle
précédent, et résolues en faisant appel à l’interaction de principes généraux avec une
collection de paramètres attachés aux catégories fonctionnelles, puissent recevoir une
solution satisfaisante s’inscrivant dans les limites conceptuelles et techniques étroites
que s’est fixées l’approche minimaliste : vérification phasale et élimination de traits non
interprétables par mouvement ou insertion d’items portant les mêmes traits. On doit se
demander si l’adoption d’une syntaxe fondée sur les traits n’est qu’un artifice ou au
contraire ouvre la voie à des analyses substantiellement différentes.
81 Uriagereka (1999) fournit un premier élément de réponse à cette question. Il observe que,
dans le Programme Minimaliste, la notion de module perd de sa pertinence et que la
distinction entre les différents modules est remplacée par une distinction entre différents
types de traits. Or ce déplacement n’est pas sans conséquence :
« Alors qu’un module du Cas permet de dire ce que l’on veut sur son
fonctionnement interne – s’il invoque la c-commande, l’adjacence•, la
directionnalité –, un trait de Cas est un formatif du système et ne peut être
manipulé qu’en fonction des lois, quelles qu’elles soient, auxquelles le système dans
son entier est soumis. Ainsi, cela n’aurait aucun sens de dire que (seuls) les traits de
Cas sont assignés sous adjacence ; par contre, cela avait un sens de dire qu’une
configuration d’assignation casuelle• qui ne satisfait pas l’adjacence entre le terme
assigneur et le terme marqué est mal formée. La conception minimaliste est
dramatiquement plus limitée. » (Uriagereka 1999 : 268)
82 Ce qui vaut pour les traits de Cas vaut aussi pour les autres traits manipulés par le
système computationnel.
83 Un autre aspect par lequel une syntaxe fondée sur les traits se distingue potentiellement
des autres approches concerne la définition même de catégorie grammaticale. Si les traits
formels interprétables ou non interprétables sont les unités directement impliquées dans
le fonctionnement syntaxique, il devient possible de reconsidérer la conception des
catégories syntaxiques adoptée dans le modèle des Principes et Paramètres, qui est pour
l’essentiel la conception traditionnelle.
43

84 Les traits, non les catégories, sont en effet désormais les unités qui se déplacent
(lorsqu’elles sont attirées par un autre trait, entraînant avec elles l’expression qui les
porte). Ce sont aussi les unités qui sont effacées, ce qui suppose qu’une catégorie conserve
son identité et donc son label lorsqu’elle s’est défaite des traits non interprétables qui lui
avaient été assignés.
85 Cette conception ouvre des perspectives nouvelles sur l’acquisition, le changement
linguistique, la variation. Le processus d’acquisition consiste à identifier la collection de
traits fonctionnels assignés à chaque item lexical et formant grammatical, à découvrir
leurs exigences et leur capacité à déclencher le mouvement. Le changement diachronique
se ramène au fait que la composition en traits d’un item ou les propriétés de ces traits se
sont modifiées. Si ce point de vue est correct, un changement ne peut être exclusivement
syntaxique, il est aussi lexical et morphologique. La variation typologique peut également
être prise en charge sur cette base.
86 Un prolongement naturel de ces idées consisterait à adopter l’une des propositions de la
morphologie distribuée (cf. Marantz 1997) et à poser que la variation tient aux diverses
combinaisons de traits réalisées par les langues sur telle ou telle catégorie fonctionnelle.
Toute langue en effet opère un choix dans un ensemble de propriétés ou de traits
universellement disponibles. La catégorie du nombre en latin distingue seulement entre
singulier et pluriel et ignore le duel. Il n’y a aucune raison, conceptuelle ou empirique, de
supposer que la catégorie du duel est présente de façon sous-jacente dans le système
nominal du latin. Mais la langue choisit aussi la façon dont certains traits vont être
compactés en morphèmes occupant les nœuds terminaux de la syntaxe. Par exemple, les
désinences nominales du latin présentent une combinaison des traits de cas, de genre et
de nombre. Une part de la variation linguistique peut être dérivée de la réalisation d’un
trait sur une catégorie fonctionnelle plutôt que sur une autre, dans un modèle où des
comportements syntaxiques spécifiques sont associés à la présence ou à l’absence d’un
trait donné11. Cette approche se distingue d’une analyse fondée sur l’hypothèse de
l’uniformité, dans laquelle à chaque dimension grammaticale correspond une catégorie
fonctionnelle autonome.

L’architecture de la faculté de langage

87 Parmi les exigences imposées au linguiste par la perspective cognitive, il y a, me semble-t-


il, celle de découvrir l’architecture de la faculté de langage. Il ne peut plus désormais
éviter de prendre en compte la diversité des composantes et leur articulation. C’est pour
cette raison qu’il est difficile aujourd’hui d’évaluer l’incidence cognitive du Programme
Minimaliste. Il faudrait pour mener à bien cette évaluation adjoindre à la théorie
syntaxique une théorie morphologique et phonologique et une théorie sémantique
compatibles et se demander si, à propos de ces domaines, il est possible de poser des
questions minimalistes d’économie des dérivations et des représentations. En bref, pour
que ce programme puisse être considéré comme un modèle adéquat de la cognition
linguistique, c’est l’ensemble de la grammaire, et pas seulement la syntaxe, qui doivent
satisfaire aux exigences minimalistes.
44

L’articulation de la morphologie à la syntaxe

88 Le fonctionnement de la composante morphologique et son mode d’articulation à la


syntaxe soulèvent aussi des questions spécifiques cognitivement pertinentes. On sait que
les concepts impliqués dims la description et le raisonnement morphologiques n’ont
souvent pas d’équivalent dans la pratique syntaxique. C’est le cas par exemple des notions
de « paradigme », de « supplétion• », d’« allomorphie• », de « productivité• ». À l’origine
du travail du morphologue, il y a l’observation que les mots varient formellement. Le
syntacticien (s’il est chomskien) ne considère pas qu’une même phrase puisse prendre
plusieurs formes différentes, il ne construit pas davantage des « paradigmes de phrases »
et se demande rarement si une construction est plus fréquente qu’une autre. Ces
divergences méthodologiques, loin d’être superficielles, reflètent des différences de
substance entre les objets étudiés. Il semble que, confronté à la langue maternelle,
l’enfant n’ait d’autre choix que d’en apprendre les paradigmes. C’est dire que l’argument
de la pauvreté du stimulus qui, dans le domaine syntaxique, sert à fonder l’hypothèse de
la G.U., n’a pas cours en morphologie. Il paraît absolument impossible d’isoler des
universaux morphologiques à partir des données d’une seule langue et, inversement, la
notion même d’universel paraît de peu d’utilité dans la caractérisation du processus
d’apprentissage morphologique.
89 Il faut se garder de conclure, cependant, que les comportements et les régularités
morphologiques ne peuvent rien révéler de G.U. Hors de la mouvance générativiste, les
chercheurs ont fait porter l’effort sur la nature et l’organisation des classes flexionnelles•.
La seule existence de plusieurs paradigmes de déclinaisons ou de conjugaisons indique
déjà qu’à une même dimension grammaticale peuvent être associés des codages
morphologiques différents. Inversement, il existe dans les langues des « morphèmes-
valises » qui réalisent conjointement plusieurs dimensions grammaticales – c’est le cas
des déclinaisons nominales du latin. Or il semble exister dans une langue donnée L une
limite supérieure sur le nombre de paradigmes compatibles avec les ressources
flexionnelles dont dispose L, caractérisée par la condition que Carstairs (1983) appelle
Paradigm Economy. Une condition analogue contribue à limiter les situations d’homonymie
fonctionnelle dans les paradigmes. Ces résultats indiquent que des questions minimalistes
peuvent être posées à propos de la morphologie et qu’il est possible, dans ce domaine
aussi, de donner un contenu à la notion d’économie. Leur pertinence ne peut pas non plus
être ignorée par la recherche cognitive. Ils posent en effet la question du mode de
stockage des paradigmes dans le cerveau et de leur accessibilité. Les paradigmes sont-ils
emmagasinés tels quels dans la mémoire à long terme, sous la forme de listes structurées
de formes morphologiquement complexes – ce qui devrait constituer une surcharge
importante pour cette dernière – ou les objets stockés sont-ils les racines et les affixes ?
Sous quelle forme sont-ils accessibles à la mémoire active ?
90 On sait que toutes les théories contemporaines de la morphologie n’accordent pas une
importance décisive à la notion de paradigme. C’est le cas des analyses fondées sur les
morphèmes, à laquelle se rattachent la plupart des recherches génératives en
morphologie. Or, au sein de ce courant, deux conceptions s’affrontent touchant la
structure interne des mots complexes et leur dérivation. Selkirk (1982) insiste sur le fait
que les principes réglant la syntaxe interne des mots ne coïncident pas avec ceux qui
règlent la syntaxe des phrases. Selon Marantz (1997), au contraire, on peut établir un
parallélisme entre les « places » accueillant les affixes à l’intérieur des mots et les
45

positions occupées par les mots à l’intérieur des phrases. Dans cette conception défendue
par la morphologie distribuée, la syntaxe ne manipule pas des mots, mais des morphèmes
fonctionnels et des racines (en fait, elle manipule les matrices de traits correspondant aux
morphèmes et aux racines, l’insertion lexicale n’intervenant que tardivement).
Dérivation et flexion sont elles-mêmes des processus syntaxiques, traités par le système
computationnel. C’est au cours de la dérivation syntaxique que sont construits les mots
morphologiquement complexes, par la même opération élémentaire, Merge, qui est à
l’œuvre dans la construction des constituants et des phrases et qui se borne à combiner
deux nœuds terminaux (ou un nœud terminal et un constituant déjà construit) pour
former une structure binaire branchante. Dans plusieurs travaux récents, Marantz
s’attache à montrer que les approches dans lesquelles la notion de « morphème »
constitue l’unité fondamentale de la langue et où tous les mots se décomposent
obligatoirement en racines et éléments fonctionnels se trouvent indirectement
confirmées par les expériences neurolinguistiques portant sur la reconnaissance des
mots. La technique MEG (magnétoencéphalographie), en particulier, permet de mesurer
une opération mentale automatique, comme l’accès au lexique, et de tester des
hypothèses sur le traitement de l’information lexicale. Utilisant cette technique,
Pylkkänen et Marantz (2003) établissent qu’il faut distinguer plusieurs étapes dans la
reconnaissance des mots (qui mettent en jeu des régions différentes du cerveau et
n’excèdent pas conjointement une durée de 400 nanosecondes) : une première étape,
sensible à la fréquence et à la séquence des sons dans le mot, mais pas à la fréquence
lexicale, une deuxième étape correspondant à l’activation du lexique mental, sensible à la
fréquence lexicale, c’est-à-dire au nombre des mots voisins qui « sonnent » comme le
mot-cible. Il apparaît que si la probabilité phonotactique• facilite le traitement des unités
de niveau inférieur au mot, une densité élevée de mots proches inhibe au contraire la
reconnaissance du mot-cible. Leur découverte est qu’une caractérisation adéquate des
familles pertinentes dans la deuxième étape du processus suppose qu’une distinction soit
opérée entre les items lexicaux qui sont morphologiquement reliés – comme acid, acidic,
acidity – et ceux qui n’ont de ressemblance que phonologique – cut, cup ou brand, brandy.
Lorsqu’il appartient à une famille morphologique authentique dont l’un des membres a
été évoqué de façon récente, la reconnaissance du mot-cible n’est pas retardée, elle est au
contraire facilitée. Par contre, une densité élevée de mots sans lien morphologique inhibe
plutôt la reconnaissance du mot-cible.

Interfaces

91 Il est à peu près certain d’autre part que les interfaces du Programme Minimaliste
recouvrent non pas un niveau unique, comme le laisse entendre la présentation ci-dessus,
mais un ensemble de niveaux reliés entre eux par des règles de correspondance, de
nature dérivationnelle ou non. Prenons l’exemple de l’interface de la faculté de langage
avec le système acoustique-articulatoire. Le mapping• des signaux acoustiques sur les
représentations lexicales est un procesus complexe dont on peut penser qu’il est
médiatisé par plusieurs niveaux de représentation. Dans ce processus, il est nécessaire de
distinguer clairement les propriétés des niveaux phonétiques et phonologiques. Comme
le note Phillips (à paraître) :
« À un bout du processus de perception de la parole, dans le système auditif
périphérique, on trouve une représentation relativement fidèle de l’acoustique de
la parole, dont on s’attend à ce qu’elle ne soit pas substantiellement modifiée par
une exposition à des langues différentes. À l’autre bout du processus, on trouve les
46

représentations phonologiques abstraites discrètes, qui peuvent être manipulées


par des processus symboliques. Les représentations phonologiques diffèrent
substantiellement entre les locuteurs de langues différentes et ne peuvent être
dérivées par simple transformation des représentations acoustiques ou phonétiques
12

92 Le point important pour notre propos est que certaines expériences ont établi avec succès
que les catégories phonologiques sont accessibles au cortex auditif (même si on ne peut
pas dire comment elles sont codées dans le cerveau). On sait par exemple que les syllabes
du japonais se conforment à une structure (C) V (N) stricte, alors que le français et
l’anglais s’autorisent une liberté beaucoup plus grande dans la syllabification. Cette
propriété explique directement le traitement japonais des mots d’emprunt dans lesquels
des voyelles sont insérées entre chaque consonne. Or Dupoux et alii (1999) ont pu établir
que les locuteurs du japonais perçoivent le mot inventé ebzo comme ebuzo, alors que les
locuteurs du français ne manifestent aucune difficulté perceptuelle dans la
différenciation de ces deux mots. Cette asymétrie est le reflet des gabarits phonologiques
syllabiques mis à la disposition des locuteurs par la langue maternelle. Ce phénomène de
« surdité phonologique » est interprété par Dupoux et ses étudiants comme un indice que
l’apprentissage d’une langue recouvre en réalité l’oubli définitif des options rendues
disponibles par G.U., mais non sélectionnées par la langue à laquelle l’enfant est exposé.
Mais il a pour nous un intérêt plus immédiat. Il indique en effet que les catégories
phonologiques interviennent directement dans le processus de perception de la parole, ce
qui ne doit pas étonner outre mesure, mais montre que l’interface F.P du Programme
Minimaliste se compose d’un ensemble de niveaux de représentation incluant le niveau
acoustique lui-même et ne saurait se réduire à une représentation unique de nature
phonologique.
93 La discussion qui précède a montré que sur certaines questions fondamentales qui
engagent l’architecture même du dispositif – l’articulation de la syntaxe et de la
morphologie, la nature de l’interface entre la faculté de langage et le système
articulatoire-perceptif –, des incertitudes demeurent. Plusieurs conceptions théoriques
s’affrontent, entre lesquelles il est difficile de trancher empiriquement. Or il est clair que
chacune de ces questions, cruciale si l’on adopte une perspective minimaliste, a aussi
potentiellement des implications cognitives de grande portée13. Si l’on veut satisfaire les
exigences minimales d’une théorie cognitive, il est absolument essentiel de décider si les
interfaces constituent des niveaux uniques ou au contraire des superpositions de niveaux.
Ou si la morphologie détermine les comportements syntaxiques ou ne fait qu’en donner
une interprétation ou une représentation. Ou si la syntaxe des phrases et la syntaxe des
mots obéissent à des principes organisationnels identiques. Si l’on admet, comme le font
les grammaires chomskiennes depuis les origines, que les langues naturelles impliquent
des fonctions génératives récursives, cette dernière question revient à se demander si la
syntaxe est la seule source de générativité dans le langage. Nous avons vu plus haut que
Marantz donne à cette question une réponse positive et admet que syntaxe et
morphologie mettent en jeu la même dérivation et recourent aux mêmes opérations,
Merge en particulier. Jackendoff (2002) répond par la négative et propose que le dispositif
grammatical se présente comme un ensemble de composants génératifs autonomes,
fonctionnant en parallèle et interagissant par des relations d’interface14.
47

En guise de conclusion : cognitif vs. grammatical


94 On sait que pour les linguistes fonctionnalistes, la structure interne des langues et leur
grammaire sont pour une large part déterminées par les fonctions de communication et
d’interaction qu’elles remplissent. Puisqu’il s’agit de clarifier la relation entre formes et
fonctions et que seules les fonctions influent sur la structure grammaticale, le
fonctionnalisme est conduit, à travers le langage, à traiter de la signification et des
représentations symboliques ou mentales. C’est pouquoi, selon ses représentants, il prend
place naturellement dans la constellation cognitive. Une linguistique centrée sur l’étude
du sens et de la signification est même la seule, selon eux, à posséder une légitimité
cognitive. Le privilège accordé à la dimension sémantique dans l’approche fonctionnaliste
de la cognition linguistique se marque dans l’importance considérable attachée à
certaines questions, comme celle qui a intéressé au siècle dernier Sapir et Whorf mais qui
fait partie du débat philosophique sur le langage depuis au moins Humboldt et Herder :
dans quelle mesure l’acquisition d’une langue particulière plutôt que d’une autre affecte
la façon dont l’enfant et l’adulte structurent et conceptualisent les différents aspects du
monde ? En particulier, puisque la plupart des mots dans les langues naturelles sont
« catégorisants », le projet est d’essayer d’atteindre et de reconstruire à travers eux des
catégories cognitives sous-jacentes. L’intérêt de ces recherches n’est pas en question.
Mais elles n’épuisent pas la complexité de l’objet langage. Et surtout, l’autre dimension
définitoire du projet cognitiviste – le rôle de la computation dans le traitement de
l’information – est quasi absente.
95 Dans la conception qui a été défendue ici, la complexité des phénomènes linguistiques est
rapportée aux catégories conceptuelles et formelles qui sont mises à disposition par la
faculté de langage et au dispositif complexe qui les organise. La cognition linguistique
englobe les processus – syntaxiques, morphologiques, sémantiques et aussi lexicaux – qui
partagent la propriété de non-perméabilité aux croyances, aux informations, aux
intentions qui relèvent des autres capacités cognitives. En bref, il faut distinguer
soigneusement entre le grammatical et le cognitif (au sens où l’entendent les
fonctionnalistes), entre le syntaxique et le conceptuel. Poser que cette distinction est
nécessaire, c’est du même coup reconnaître qu’il existe une organisation linguistique
spécifique, distincte en particulier des autres systèmes cognitifs et des systèmes
biologiques.

NOTES
1. À (1), on peut opposer la caractérisation proposée par le Nouveau Petit Robert (2002),
d’essence fonctionnaliste : « processus par lequel un organisme acquiert la conscience des
événements et objets de son environnement. »
2. Le texte fondateur du modèle des Principes et Paramètres est Chomsky (1981). L’article de
Chomsky et Lasnik dans Chomsky (1995) présente un état final de cette théorie, intégrant les
48

développements des années 1980 et 1990. Pour une introduction, on peut consulter en français la
préface et le postscript de Chomsky (1987), et, en anglais, Ouhalla (1999).
3. Pour une solution à ce paradoxe, cf. Nash et Rouveret (2002).
4. Une difficulté, purement pratique, rencontrée par l’approche paramétrique a été soulignée par
Clark (1992). Elle réside dans le fait que la grammaire servant d’input est ambiguë. Les
chercheurs travaillant sur l’acquisition ont donc tenté d’identifier pour la fixation de la valeur de
chaque paramètre des déclencheurs non ambigus, permettant à l’enfant de construire la
grammaire-cible le plus rapidement possible (voir par exemple le travail de Watanabe 1994 sur
l’acquisition des paramètres syntaxiques déclenchant le mouvement du verbe vers T et/ou vers
Agr). La tâche n’est pas toujours facile.
5. L’article qui donne le tableau le plus complet du Programme Minimaliste est le chapitre 4 de
Chomsky (1995), « Categories and Transformations ». Il doit être complété par Chomsky (2001),
« Derivation by Phase ». Pour une bonne introduction au minimalisme, on se reportera à Ouhalla
(1999), part IV. Le beau livre de Jean-Yves Pollock (1997) est plus qu’une introduction, un état des
lieux de la théorie à la fin des années 1990.
6. La présentation précédente doit être nuancée. C’est en effet une épistémologie antiminmaliste
qui est développée dans le passage suivant d’Aspects, cité par Milner (2002 : 229) : « Lorsque les
empiristes s’efforcent de montrer comment les hypothèses touchant un dispositif d’acquisition
linguistique peuvent être réduites au minimum conceptuel, leur tentative est tout à fait hors de
propos. Le vrai problème est justement de développer sur la structure une hypothèse qui soit
assez riche pour rendre compte de l’acquisition linguistique... » (Chomsky 1971 :84-85). Milner
observe que cette critique ne concerne pas seulement le processus d’acquisition et pas seulement
l’empirisme ; elle concerne également la construction de la théorie grammaticale, et vise aussi
certaines versions du structuralisme. Leur parcimonie conceptuelle condamnait ces dernières à
l’impuissance dans toutes les situations où les relations étudiées, les relations syntaxiques par
exemple, ne pouvaient pas s’inscrire dans un simple tableau d’oppositions. On peut noter qu’à
l’époque d’Aspects, il s’agissait surtout de sauver les phénomènes, quitte à s’écarter de l’idéal
minimaliste, en « construisant des systèmes d’hypothèses à la fois nombreuses et réfutables ».
C’est bien là la stratégie que suivent les sciences gailéennes. C’est aussi celle qui a été adoptée
tout au long des années 1980 et 1990 par les chercheurs travaillant dans le cadre du modèle des
Principes et Paramètres. Le Programme Minimaliste représente donc bien un renversement
majeur. Mais la situation est aujourd’hui à l’opposé de ce qu’elle était dans les années 1960. Du
fait de l’accumulation de généralisations empiriques sur une multiplicité de langues et de la
multiplication d’outils conceptuels sophistiqués, l’épistémologie minimaliste retrouve sa
légitimité. C’est sur ces résultats que s’exerce la théorisation minimaliste. L’exigence minimaliste
a donc toujours été présente, mais elle est limitée de façon absolue par la nécessité de préserver
le contenu empirique de la linguistique, science galiléenne. Milner défend un point de vue
différent du nôtre, puisque pour lui, « le minimalisme épistémologique est radicalement
antigaliléen », cf. Milner (2002 : 229).
7. C’est là le contenu du Principe de l’Interprétation Intégrale mentionné page 56.
8. Une autre opération élémentaire s’est adjointe Move à dans les développements récents - Agree
(« Accorder ») - dont nous ne dirons rien ici.
9. La MLC est la transposition en termes dérivationnels de la Condition de Minimalité que Rizzi
(1990) avait formulée en termes représentationnels. Cinque (1990) et Rizzi (1990) ont montré
qu’au regard de cette condition de localité, tous les termes « intervenants » n’ont pas le même
effet de blocage. Les expressions interrogatives contenant une expression nominale, telles que
quel livre, dans quelle librairie sont plus facilement extractables que les quantificateurs·
interrogatifs (quoi, où). D’autre part, un argument objet interrogatif intervenant bloque le
déplacement d’un adjoint interrogatif, mais l’inverse n’est pas vrai :
(i) a. Quel problème ne sais-tu pas [comment résoudre tt] ?
49

b. *Comment ne sais-tu pas [quel problème résoudre tt] ?


Telle qu’elle est formulée en (14), la MLC n’est pas à même d’opérer ces distinctions.
10. Dans les versions les plus récentes, procèdent par phases non seulement la dérivation
syntaxique proprement dite, mais aussi l’épellation phonologique, la construction de la Forme
Logique et l’accès à la numération.
11. Voir Nash et Rouveret (2002) pour une analyse de la cliticisation fondée sur cette conception.
12. Phillips (à paraître) observe que les représentations des catégories phonologiques, unités
symboliques et discrètes, sont beaucoup plus abstraites que les représentations phonétiques, plus
uniformes d’une langue à l’autre et soumises à peu près aux mêmes processus dans des langues
différentes (effacement, neutralisation, assimilation, dissimilation...). S’interrogeant sur l’apport
de la technique EEG (électroencéphalographie), il observe qu’elle révèle une grande diversité
dans le codage phonétique et la représentation des sons de la parole dans le cerveau, mais nous
apprend beaucoup moins sur le codage des propriétés phonologiques. Il conclut qu’avant de faire
des tests sur les locuteurs, il est nécessaire de se faire une idée plus exacte sur la forme que
pourraient prendre éventuellement les représentations phonologiques dans le cerveau.
13. Deux questions fondamentales qui intéressent directement la cognition linguistique n’ont pas
été abordées ici faute de place. La première concerne la « réalité » des dérivations syntaxiques. Le
système computationnel des syntacticiens crée les arbres de bas en haut et donc (pour le
français) de droite à gauche. L’analyseur syntaxique doit au contraire procéder de gauche à
droite. Phillips (1996) développe une théorie ambitieuse qui permet de résoudre le paradoxe.
Pour une présentation, voir Rouveret et Schlenker (1998 :1517). Plus généralement, des
recherches récentes ont montré qu’il n’est pas souhaitable de dissocier la caractérsation du
savoir syntaxique abstrait des individus des procédures de construction de la structure dans la
compréhension et la production en temps réel. Or ces procédures sont clairement de nature
dérivationnelle. La seconde question est celle de l’origine et de l’évolution du langage. Chomsky
s’est exprimé pour la première fois sur ce point dans Hauser, Chomsky et Fitch (2002).
14. Selon Jackendoff, la syntaxe, la morphologie, la sémantique constituent des composants
autonomes, mis en relation par des règles de correspondance analogues à celles qui associent les
représentations phonétiques et le système perceptuel-moteur ou les représentations logiques et
le système conceptuel. Malheureusement, ces règles de correspondance sont rarement
explicitées. Et, contrairement au Programme Minimaliste qui s’attache à réduire drastiquement
le nombre des possibilités, la proposition de Jackendoff les accroît et génère de multiples
redondances entre les différentes dérivations œuvrant en parallèle.

AUTEUR
ALAIN ROUVERET
Directeur de recherche au CNRS et directeur d’études à l’École des hautes études en sciences
sociales, Centre de recherches linguistiques sur l’Asie Orientale (UMR 8563, EHESS/CNRS, Paris).
50

Les grammaires cognitives


Bernard Victorri

Introduction
1 On regroupe sous l’appellation « grammaires cognitives » un courant de recherche en
linguistique qui est né dans les années 1980, sur la côte Ouest des Etats-Unis. Les
principaux tenants de ce courant l’appellent plus volontiers « linguistique cognitive »,
mais nous avons ici préféré éviter ce terme, qui peut porter à confusion puisque d’autres
courants, radicalement opposés, comme celui des grammaires génératives, revendiquent
aussi cette étiquette1.
2 Ce courant a rapidement acquis une large audience internationale, grâce notamment aux
textes fondateurs de quatre auteurs : Ronald Langacker, avec le premier tome de
Foundations of Cognitive Grammar (Langacker 1987) ; Leonard Talmy, avec deux articles
essentiels : « Lorce Dynamics in Language and Thought » et « The Relation of Grammar to
Cognition » (Talmy 1988a et 1988b), articles repris dans l’ouvrage récent Towards a Cognitive
Semantics (Talmy 2000) ; Georges Lakoff, avec Women, Fire and Dangerous Things (Lakoff
1987) ; et enfin Gilles Fauconnier, avec un ouvrage écrit d’abord en français, Espaces
mentaux (Fauconnier 1984), aussitôt traduit en anglais (Fauconnier 1985), et réédité par la
suite avec une nouvelle préface (Fauconnier 1994).
3 Ce courant s’est solidement structuré avec notamment la création d’une association
(International Cognitive Linguistics Association) qui organise une conférence
internationale régulière, édite une revue (Cognitive Linguistics) depuis 1990, et une
collection (« Cognitive Linguistics Research », une quinzaine d’ouvrages parus à ce jour).
Il s’est étendu et renforcé, avec un grand nombre d’études portant sur les langues les plus
diverses, et aussi de nouvelles contributions théoriques qui ont élargi les approches
fondatrices : on peut ainsi citer, entre autres, les ouvrages d’Eve Sweetser (From Etymology
to Pragmatics, 1990), d’Adele Goldberg (Constructions – a Construction GrammarApproach to
Argument Structure, 1995), ou de Mark Turner (The Literary Mind, 1996).
51

4 Les fondements théoriques des grammaires cognitives reposent sur quelques principes,
lesquels donnent à ce courant son unité et son originalité. En premier lieu, l’activité de
langage, tout en ayant ses spécificités, doit être régie par des mécanismes cognitifs généraux,
à l’œuvre dans toutes les activités cognitives. Ainsi, par exemple, comme nous aurons
l’occasion de le voir plus en détail, l’opposition gestaltiste entre figure et fond se retrouve
dans l’organisation des énoncés linguistiques. Plus généralement, la perception visuelle et
l’expérience sensori-motrice jouent un rôle central dans la compréhension de la structure
sémantique du langage.
5 Il y a donc sur ce point une opposition radicale avec les conceptions fodorienne et
chomskienne des relations entre langage et cognition. Le langage n’est pas une faculté
autonome innée, dont les propriétés computationnelles seraient uniques et singulières,
sans équivalent dans le reste du système cognitif. Comme l’écrit Langacker (1987 : 12-13) :
« Le langage est partie intégrante de la cognition humaine. Pour rendre compte de
la structure linguistique, il faut donc se rattacher à ce que l’on connaît des
processus cognitifs en général, même si l’on fait l’hypothèse d’un « module »
spécifique du langage (Fodor 1983) ou d’une faculté de langage [en français dans le
texte] innée. Si une telle faculté existe, elle est malgré tout englobée dans un cadre
général de nature psychologique, car elle est le fruit de l’évolution et de la mise en
place de structures d’origine moins spécialisée. Même si les plans d’élaboration des
capacités langagières sont génétiquement codés dans l’organisme humain, leur
réalisation comme système linguistique complètement spécifié au cours de
l’acquisition du langage et leur implementation dans l’utilisation quotidienne du
langage dépendent clairement de l’expérience et sont inextricablement liées à des
phénomènes psychologiques de nature non spécifiquement linguistique. Il n’y a
donc aucun argument solide en laveur d’une dichotomie radicale entre l’aptitude
linguistique et les autres aspects de l’activité cognitive. Au lieu de se raccrocher au
moindre indice confortant à première vue la thèse de la singularité et de
l’isolement du langage, il vaudrait mieux travailler plus sérieusement à
l’intégration des acquis de la linguistique et de la psychologie cognitive. » (Traduit
par B. Victorri)
6 En conséquence, les grammaires cognitives rejettent totalement la primauté et
l’autonomie accordées par les grammaires génératives à la syntaxe. L’étude des structures
syntaxiques n’est pas une finalité en soi, qui permettrait de découvrir l’essence même du
langage. Au contraire, les constructions syntaxiques sont, au même titre que les autres
éléments constitutifs des langues (les unités lexicales et grammaticales), des structures
symboliques, porteuses de sens, qui contribuent à la signification globale des énoncés.
7 C’est donc la sémantique qui est placée au cœur du dispositif. La finalité du langage est de
construire des structures sémantiques complexes, que Talmy appelle « représentations
cognitives », Langacker « structures conceptuelles » et Fauconnier « espaces mentaux ».
L’étude de la grammaire consiste à rendre compte de la manière dont les unités
linguistiques, sortes de « briques » élémentaires symboliques, se combinent pour
produire des représentations complexes. Chaque différence de forme correspond à des
différences dans la représentation construite. Ainsi, pour Langacker (1987 : 39), les deux
énoncés suivants n’ont pas le même sens :
(1) He sent a letter to Susan
(2) He sent Susan a letter
8 Même s’ils décrivent le même événement, ils ne le présentent pas de la même manière :
l’énoncé (1), à cause de la préposition to, met en relief la trajectoire de la lettre, alors que
l’énoncé (2) met l’accent sur le résultat de l’action, la possession de la lettre par Susan.
52

Ces différences de focalisation (de « profilage », dans la terminologie de Langacker)


doivent faire partie intégrante de la description sémantique de ces deux énoncés. Deux
paraphrases, aussi proches soient-elles, n’ont donc pas la même représentation
sémantique associée. A fortiori, deux énoncés de deux langues différentes sont
irréductibles l’un à l’autre : comme on le voit, on est à cent lieux de la thèse chomskienne
d’une « grammaire universelle » commune à toutes les langues, dont la diversité
apparente se réduirait à de simples différences de valeurs d’un petit nombre de
paramètres. Cela étant, il existe aussi pour les grammaires cognitives des aspects
universels du langage : ce sont ces mécanismes cognitifs généraux qui sont à l’œuvre
quelle que soit la langue, et qui s’appliquent au matériau linguistique spécifique de
chacune d’elles.
9 Les relations entre langage et cognition ne sont pas à sens unique. Si la connaissance
d’autres activités cognitives, comme la perception, permet de mieux comprendre des
phénomènes purement linguistiques, inversement l’étude du langage peut révéler des
modes de fonctionnement qui s’appliquent à d’autres activités cognitives. La linguistique
peut donc aider, en retour, à mieux comprendre le fonctionnement de l’esprit. C’est ainsi
notamment que Lakoff défend l’idée que le mécanisme de la métaphore, loin de se limiter à
un phénomène observable dans le langage, constitue en fait un mécanisme cognitif très
général, à l’œuvre dans tous les domaines de la pensée, y compris le développement des
sciences mathématiques (Lakoff et Nuñez 2000). De même, Fauconnier (1997) considère
que sa théorie des espaces mentaux peut rendre compte des opérations impliquées dans
le raisonnement en général.
10 Il n’est bien sûr pas possible ici de décrire l’ensemble des travaux développés ces vingt
dernières années dans le cadre des grammaires cognitives. Nous avons donc choisi de
nous centrer sur quelques aspects, particulièrement significatifs, qui, du moins nous
l’espérons, donnent un aperçu de l’étendue et de la richesse de cette approche. Il n’est pas
possible non plus de présenter individuellement les travaux des divers auteurs ; nous
allons nous appuyer tantôt sur l’un, tantôt sur un autre, de manière à montrer avant tout
la cohérence et l’unité de ce courant de pensée, au risque de gommer les différences,
parfois importantes, entre leurs approches respectives.

Le sens grammatical
11 S’appuyant sur la distinction classique pour les unités linguistiques entre classes ouvertes
(noms, verbes, etc.) et classes fermées (prépositions, déterminants, etc.), Talmy (2000, vol.
I : 21) définit deux « sous-systèmes » au sein des langues, qui ont des fonctions
sémantiques nettement différenciées : le sous-système grammatical, qui détermine la
structure de la représentation cognitive évoquée par un énoncé, et le sous-système
lexical, qui en détermine le contenu.
12 Le sous-système grammatical, qui fait l’objet de cette section, contient donc les
morphèmes grammaticaux (libres ou liés), tels que les prépositions, les conjonctions, les
flexions nominales et verbales, etc. Mais il ne se limite pas à ces morphèmes. Il comporte
aussi des éléments plus abstraits, tels que les catégories grammaticales (parties du
discours), les sous-catégories (le fait pour un nom d’être massif ou comptable, par
exemple), les fonctions syntaxiques (sujet, objet, etc.) et les constructions syntaxiques
(l’ordre des mots, notamment). Ainsi, la distinction est plus subtile que celle qui est
53

opérée traditionnellement. Un mot comme chien, par exemple, présente à la fois des
aspects grammaticaux et lexicaux. En tant que nom comptable (caractéristique qu’il
partage avec des mots comme chat, table, arbre, etc.), il relève du sous-système
grammatical. Et c’est uniquement en tant que lexème• possédant un contenu sémantique
qui l’oppose aux autres noms comptables qu’il fait partie du sous-système lexical. Le point
clé, qui fait tout l’intérêt de cette approche, c’est de considérer que les aspects
grammaticaux sont aussi porteurs de sens en eux-mêmes, indépendamment des aspects
lexicaux. La même remarque s’applique aux autres classes ouvertes (verbes, adjectifs,
etc.). Notamment, pour un bon nombre de verbes de mouvement, c’est pratiquement
l’intégralité de leur sens qui relève de la sémantique grammaticale, comme on le verra ci-
dessous avec un exemple (le verbe anglais arrivé).
13 Cette sémantique grammaticale est essentiellement configurationnelle : le rôle du sous-
système grammatical est d’organiser les différents éléments évoqués par un énoncé les
uns par rapport aux autres en une scène complexe cohérente. C’est sans doute dans ce
domaine que les apports des grammaires cognitives ont été les plus riches et les plus
profonds, grâce essentiellement aux travaux de Langacker et Talmy. Ces deux auteurs ont
élaboré, chacun avec sa propre terminologie, un cadre théorique et un outillage
conceptuel novateurs, du moins dans le champ) de la linguistique nord-américaine. Il faut
en effet noter que ces travaux sont assez proches, par bien des aspects, des théories
énonciatives, issues d’une tout autre tradition, qui ont été développées de ce côté-ci de
l’Atlantique, notamment par Antoine Culioli (1990, 1999).
14 Le sens grammatical est d’abord conçu en termes de propriétés et de relations
topologiques• et cinématiques•, représentées chez Langacker par des schémas
diagrammatiques.
15 Ainsi, l’entité évoquée par un nom est représentée par une région dans un espace
multidimensionnel que l’on appelle son domaine (et qui dépend bien sûr du contenu
sémantique du nom). L’opposition entre comptable et massif se traduit par une propriété
topologique : la région est bornée (c’est un fermé) dans le cas d’un nom comptable, alors
qu’elle ne l’est pas (c’est un ouvert) dans le cas d’un massif.
16 Les unités linguistiques relationnelles, comme les prépositions, sont représentées dans
ces diagrammes par des relations géométriques statiques entre les régions correspondant
aux entités. Ces relations sont en général asymétriques : l’une des entités, appelée
« trajecteur » (trajector), joue un rôle particulier par rapport aux autres, appelées
« repères » (landmarks), qui servent de points de référence pour localiser le trajecteur.
Pour prendre un exemple simple, les deux prépositions above et below correspondent à un
même diagramme représentant deux entités X et Y disposées le long d’un axe vertical
dans le domaine constitué par l’espace physique orienté. La différence entre les énoncés X
is above Y et Y is below X consiste en une inversion du trajecteur et du repère : dans le
premier énoncé, X est le trajecteur, alors qu’il est le repère dans le second.
17 Les procès, évoqués par des verbes, sont représentés par des schémas qui comportent une
dimension supplémentaire : le temps. Autrement dit, un procès sera représenté par la
succession le long de l’axe du temps d’une série de diagrammes statiques, le premier
correspondant à la situation au début du procès, et le dernier à la situation résultante.
L’opposition entre procès perfectifs et imperfectifs est rendue, comme pour l’opposition
massif/comptable, par l’existence ou non de bornes, cette fois sur l’axe temporel.
54

18 Une notion importante est celle du « profilage », directement inspirée de l’opposition


figure/fond de la théorie de la Gestalt. Dans un schéma, certains éléments sont plus
saillants que les autres parce qu’ils sont plus directement évoqués par l’expression
étudiée : ils constituent le « profil » (profile), qui se détache de la « base » (basé). Pour
expliquer cette notion, Langacker prend, entre autres, l’exemple du nom relationnel
uncle. Le domaine impliqué est ici celui des relations de parenté, que Langacker symbolise
par un arbre généalogique. La représentation du sens de uncle réclame la prise en
considération de toute une région d’un tel arbre, permettant d’illustrer la relation entre
deux nœuds : l’oncle et le neveu. C’est l’ensemble de cette région qui compose la base, le
profil étant constitué par le seul nœud oncle. Ainsi la représentation du nom nephew
possédera la même base, mais c’est cette fois le nœud neveu qui sera profilé.
19 Loin de se limiter à la représentation des noms relationnels, le profilage se révèle un outil
très puissant qui permet effectivement de différencier des expressions linguistiques de
toute sorte se rapportant à un même champ conceptuel. Notamment, sans entrer dans les
détails ici, cela permet de distinguer un verbe évoquant un procès, un participe passé
associé à l’état résultant de ce procès, une nominalisation de ce même procès, etc.
20 Pour résumer l’ensemble de ces notions, on trouvera à la figure 1 la représentation que
donne Langacker (1987 : 247) du verbe arrive. Le schéma comporte une série temporelle
au cours de laquelle le trajecteur tr (typiquement : le sujet du verbe) se déplace, dans le
domaine spatial, vers le repère lm (typiquement le locuteur, du moins dans des énoncés
du type Peter arrives). Un contour indique la zone proximale autour du repère
(typiquement : son champ de vision). Les éléments en gras matérialisent le profil dans ce
schéma. Ce profilage indique que le sens du verbe est limité à une partie du processus
représenté : l’entrée du trajecteur dans la zone proximale du repère, ce qui constitue
effectivement une bonne définition de arrive. Comme on peut le constater, cette
schématisation permet donc une certaine précision dans la description sémantique de ce
verbe, tout en préservant les aspects qualitatifs et continus inhérents à son sens.

Fig. 1 - Représentation de arrive.

21 À ces notions topologiques et cinématiques, Talmy ajoute un ingrédient supplémentaire,


qui augmente considérablement le potentiel descriptif de ce dispositif : la notion de force,
et donc de dynamique au sens « physique » du terme. Il s’agit avant tout (cf. Talmy 2000,
vol. I : 409) d’une généralisation et d’un raffinement de la notion, traditionnelle en
linguistique, de causatif•. Mais cette dynamique des forces joue aussi un rôle structurant à
d’autres niveaux du langage. Talmy montre qu’un grand nombre de marques
grammaticales servent à mettre en scène un système de forces opposées exercées par les
entités évoquées par l’énoncé, entités appelées « agonistes » ou « antagonistes » (l’entité
55

agoniste étant l’entité focalisée par l’énoncé). Ces forces sont aussi différenciées suivant
que la tendance intrinsèque des entités est orientée vers l’action ou le repos. Prenons un
exemple :
(3) The ball was rolling along the green
(4) The ball kept (on) rolling along the green.
22 L’apport du modal keep dans l’énoncé (4) consiste à mettre en scène l’herbe comme un
antagoniste exerçant une force supposant à la force, plus puissante, sous-tendant le
mouvement de la balle (l’agoniste).
23 De même, on peut rendre compte de l’opposition entre les causatifs made et let dans des
énoncés tels que :
(5) The ball’s hitting it made the lamp topple from the table
(6) The plug’s coming loose let the water flow from the tank.
24 Dans (5), l’emploi de made s’explique par la mise en œuvre d’un antagoniste (la balle)
l’emportant sur l’agoniste (la lampe) tendant au repos. Dans (6) au contraire,
l’antagoniste (la bonde) exerce une force plus faible sur l’agoniste (l’eau) qui tend au
mouvement.
25 Les mêmes mécanismes s’appliquent aussi à des situations plus abstraites dans lesquelles
les forces ne sont plus de nature physique : elles peuvent être d’ordre psychologique,
sociale, argumentative, etc. Talmy rend compte ainsi, notamment, de la sémantique de
marqueurs aspectuels (tels que try, finally, etc.) et modaux (should, have to, etc.).
26 Contrairement à ce que cette présentation beaucoup trop rapide pourrait laisser penser,
Langacker et Talmy ne limitent pas leurs analyses à l’anglais. Ils les étendent au contraire
à une grande variété de langues (notamment amérindiennes), y compris les langues des
signes, montrant ainsi l’universalité de leur cadre théorique.
27 Cette sémantique configurationnelle mérite donc bien son appellation de « cognitive ».
C’est une théorie dans laquelle les marques grammaticales, au sens large, servent à
construire de véritables images mentales forgées par le langage. Les entités et
événements évoqués par les énoncés ne sont pas simplement décrits : ils sont mis en
scène, présentés selon un certain point de vue, avec des éléments saillants et un arrière-
plan, dans des configurations dynamiques qui évoluent dans le temps en fonction des
forces qui animent les entités représentées. Le parallèle avec la perception visuelle,
omniprésent, correspond bien à une conception unifiée du système cognitif : même
quand les domaines représentés sont plus abstraits que l’espace perceptif dans lequel se
meuvent les objets physiques, ce sont les mêmes mécanismes qui sont à l’œuvre pour
donner « à voir » ces configurations abstraites.

Le sens lexical
28 En ce qui concerne la sémantique lexicale, nous retiendrons deux aspects essentiels :
d’une part la théorie du prototype, directement inspirée de travaux de psychologie
cognitive, et d’autre part le mécanisme de la métaphore, à laquelle il est donné un rôle
fondamental.
29 La notion de prototype a été popularisée par la psychologue Eleanor Rosch (cf. Rosch
1975, 1978 ; Rosch et Mervis 1975). Le point de départ consiste à remarquer que, au plan
cognitif, l’appartenance d’un élément à une catégorie n’est pas traitée de manière binaire,
en tout ou rien, mais plutôt de manière graduelle. Il existe, comme le confirment les
56

études expérimentales, de « bons » exemplaires et de moins bons, pour les catégories des
oiseaux, des meubles, des couleurs, des formes, etc. Cela conduit à refuser de définir les
sens d’un mot comme on le fait en logique, par un ensemble de conditions, nécessaire et
suffisant, qu’une entité doit satisfaire pour pouvoir être désignée par le mot en question.
Il faut plutôt le définir comme un ensemble de traits, plus ou moins caractéristiques : plus
une entité possède de traits associés au mot, plus elle a vocation à être désignée par ce
mot.
30 On aboutit donc, là aussi, à une représentation géométrique du sens. On peut en effet
définir une distance entre entités désignées par un même mot, distance plus ou moins
grande suivant le nombre de traits qu’elles partagent. Le sens du mot est alors représenté
par une région, au centre de laquelle se trouvent les meilleurs exemplaires (ceux qui
possèdent le maximum de traits) : plus on s’éloigne de ce centre, moins le mot est
pertinent. Les frontières de cette région sont donc floues, ce qui correspond aux
hésitations des locuteurs (et aux désaccords entre locuteurs) sur la désignation
d’exemplaires particulièrement atypiques. C’est le centre de la région associée à un mot
que l’on appelle le prototype.
31 Lakoff (1987 : 74-76), par exemple, analyse dans ce cadre les différents sens du nom
mother, montrant que les traits prototypiques (la femme qui a donné naissance à l’enfant,
qui a fourni le matériel génétique, qui le nourrit et l’élève, qui est l’épouse du père) ne
sont pas des conditions nécessaires à l’emploi de ce mot. Quand ces diverses conditions
sont remplies par des femmes différentes, on peut appeler mother n’importe laquelle
d’entre elles.
32 Deux remarques importantes s’imposent :
• Comme le font remarquer Ungerer et Schmid (1996 : 39)2, il existe une certaine ambiguïté
sur la nature précise des prototypes, notamment chez Lakoff (1986) : tantôt ils sont
identifiés aux meilleurs exemplaires, les plus « typiques », ceux qui viennent les premiers à
l’esprit des locuteurs, tantôt ils ont le statut plus abstrait d’une représentation mentale,
d’une image cognitive associée au mot ou à la catégorie évoquée par le mot.
• Les traits définitoires, dans ce cadre théorique, n’ont rien à voir avec les traits différentiels
(les « sémèmes ») des sémantiques lexicales issues du structuralisme. Ce ne sont pas des
éléments minimaux rendant compte des oppositions entre lexèmes. Au contraire, pour les
grammaires cognitives, ce sont toutes les propriétés cognitivement pertinentes qui doivent
être prises en compte dans la définition d’un mot. Langacker, notamment, récuse toute
séparation entre connaissances lexicales et connaissances encyclopédiques (cf. Langacker
1987 : 154-161) : certains traits sont bien sûr plus centraux que d’autres, mais là encore ce
n’est qu’une question de degré sur un continuum impliquant tout le réseau des
connaissances associées à un concept donné.
33 Pour rendre compte de la polysémie lexicale, la théorie du prototype telle que nous
venons de la présenter doit être sérieusement amendée. En effet, une même unité lexicale
peut évoquer des entités appartenant à des catégories conceptuelles nettement distinctes,
même si elles entretiennent des relations de voisinage sémantique. Ces différences ne
sauraient être ramenées à un simple éloignement par rapport à un même prototype,
chaque catégorie étant elle-même justifiable d’un traitement autonome en terme de
prototypie. La solution proposée par des auteurs comme Lakoff (1987) est directement
inspirée de la notion de « ressemblance de famille » introduite par Ludwig Wittgenstein
dans sa célèbre analyse du mot Spiel (jeu, cf. Wittgenstein 1958 : 6667). On aboutit alors à
57

ce que Georges Kleiber (1990) a appelé la « version étendue de la sémantique du


prototype ».
34 Traduite en termes géométriques, cette théorie revient à représenter le sens d’un mot par
une région connexe décomposable en un ensemble de sous-régions (cf. figure 2). Chaque
sous-région possède son propre centre et donc son propre prototype (notés A, B, C,... sur
la figure). Des sous-régions voisines possèdent une intersection non vide, ce qui signifie
que les prototypes correspondants (A et Β, Β et C, etc.) partagent des traits communs,
mais des sous-régions plus éloignées (A et D, par exemple) n’ont plus aucune raison d’en
avoir : on peut ainsi décrire la diversité des sens d’une unité polysémique, en
représentant à la fois ce qui les relie et ce qui les différencie.

Fig. 2-La version étendue de la sémantique du prototype.

35 Même si cette théorie a été forgée avant tout pour les unités lexicales, elle a été aussi
appliquée à des unités grammaticales, comme les classifieurs du Dyirbal (langue
aborigène australienne) analysés par Lakoff (1987). Pour prendre un autre exemple, les
prépositions du français, Claude Vandeloise (1993, 1995) définit pour chaque préposition
un ensemble de traits définitoires dont aucun, à lui seul, n’est nécessaire : chaque emploi
de la préposition fait appel à un sous-ensemble de traits qui définit le sens de la
préposition dans cet emploi particulier. La préposition peut donc changer de sens d’un
emploi à l’autre, du moins en partie, si ce n’est pas le même sous-ensemble de traits qui
est utilisé dans les deux cas. Par exemple, pour l’analyse de la préposition dans dans des
expressions de la forme X dans Y, Vandeloise propose les traits suivants :
(a) Y contrôle la position de X.
(b) S’il y a déplacement, X se déplace vers Y plutôt que l’inverse.
(c) X est inclus (ou inclus partiellement) dans Y ou dans la fermeture convexe de la
partie contenante de Y.
(d) Y protège X.
(e) Y cache X.
36 Comme on peut le constater, ces traits ne font appel à des relations géométriques
(« configurationnelles ») que marginalement : ils sont plutôt de nature fonctionnelle. À
cet égard, la ressemblance de famille de tous ces traits est caractérisée, pour Vandeloise,
par une relation fonctionnelle générale, qu’on peut appeler la « contenance » (containment
en anglais). De même, la ressemblance de famille pour les traits associés à la préposition
sur s’inscrit aussi dans une relation fonctionnelle générale, le « support ». Ces exemples 3
montrent que, dans le foisonnement des propositions théoriques au sein des grammaires
cognitives, la coupure entre sémantique grammaticale et sémantique lexicale n’est pas
toujours revendiquée : certains s’en tiennent à une vision purement configurationnelle
des marqueurs grammaticaux, alors que d’autres font aussi appel à des propriétés
fonctionnelles, voire socio-anthropologiques, pour décrire ces mêmes marqueurs.
58

37 Si la théorie du prototype étendu est utilisée pour traiter une partie des phénomènes de
polysémie, d’autres mécanismes viennent compléter le dispositif, et, en premier lieu, la
métaphore, qui, comme nous l’avons annoncé, joue un rôle capital en sémantique lexicale
pour les tenants des grammaires cognitives. En effet, à la suite de Lakoff et Johnson
(1980), la métaphore est considérée comme un mécanisme général de la pensée,
permettant d’utiliser le domaine de l’expérience sensori-motrice pour appréhender des
concepts plus abstraits. Nous ne sommes généralement pas conscients des métaphores
dans lesquelles nous pensons, mais nous pouvons les mettre en évidence en étudiant les
traces qu’elles ont inscrites dans les langues. Cette étude permet donc de remplir un
double objectif : d’une part, au plan linguistique, de rendre compte d’une grande partie de
la polysémie lexicale, et d’autre part, au plan cognitif, de mieux comprendre un
mécanisme central de la pensée.
38 Prenons un exemple : la métaphore, très répandue dans les langues, qui projette sur l’axe
vertical le domaine de variation de n’importe quelle variable quantitative. On dit ainsi en
français que les prix « montent », qu’ils « atteignent des sommets », qu’ils
« dégringolent », etc. Cette métaphore, ancrée dans l’expérience perceptive quotidienne
(le niveau de l’eau monte dans un récipient quand sa quantité augmente), explique la
lexicalisation de sens quantitatifs d’un grand nombre d’unités linguistiques exprimant le
mouvement vertical et l’altitude (monter, descendre, niveau, sommet, élevé, bas, au-dessus de,
etc.). Mais au-delà du langage, c’est le raisonnement sur le concept même de variation
quantitative qui s’appuie sur cette métaphore, comme le montre la représentation
graphique des fonctions mathématiques où la valeur de la fonction est indiquée sur un
axe orienté conçu et présenté comme l’axe vertical.
39 La métaphore s’exerce sur tous les champs de l’expérience. Tout nouveau domaine,
notamment, est immédiatement investi par le lexique du domaine le plus apte à
développer une correspondance analogique opératoire : ainsi a-t-on pu assister
récemment à l’introduction d’un vocabulaire biologique et médical en informatique, avec
l’apparition des « vers » et des « virus » informatiques, plus ou moins « bénins » ou
« virulents », qui « contaminent » les ordinateurs insuffisamment « immunisés » contre
ces « infections » (cf. l’analyse de cet exemple par Fauconnier 1997 : 18-24).
40 Parmi les métaphores les plus structurelles, Lakoff insiste sur l’universalité de la
conception du temps comme un double déplacement spatial : nous « avançons » vers
l’avenir et l’avenir « vient vers nous ». Les événements passés « sont derrière nous », ils
« s’éloignent », alors que d’autres « arrivent » à grands pas (l’observateur est fixe et le
temps « passe »). Mais nous pouvons aussi dire que nous « entrons » dans une nouvelle
ère, et que nous « nous rapprochons » d’une échéance (le temps est immobile et
l’observateur se déplace). Ces métaphores structurelles sont aussi à l’origine de
phénomènes de grammaticalisation : par exemple, le fait que des verbes de déplacement,
comme le verbe aller, en français, soient devenus des marqueurs temporels (Il va faire beau
) est expliqué par la métaphore du temps comme déplacement spatial.
41 D’une manière générale, les métaphores ne sont pas limitées, là encore, à la sémantique
lexicale. Elles sont aussi invoquées pour rendre compte de la polysémie des unités
grammaticales. C’est ainsi qu’Eve Sweester (1990, chap. 3) propose pour les verbes
modaux (may, must, can, etc.) une évolution diachronique des emplois déontiques (John
may go) aux emplois épistémiques John may be there) et énonciatifs (« speech-act modalities
» : He may be a university professor, but he sure is dumb) qui serait due à un mécanisme
métaphorique. Partant d’une analyse en termes de forces et d’obstacles, proche de la
59

théorie de Talmy, elle présente cette évolution comme une extension de l’application de
ces forces du domaine physique et social (déontique) au domaine des processus mentaux
et du raisonnement (épistémique), et au domaine des actes de langage et de
l’argumentation (énonciatif).

Le sens syntaxique
42 Comme on l’a vu, dans l’optique des grammaires cognitives, chaque unité grammaticale
ou lexicale est porteuse de sens. Il en est de même des constructions syntaxiques qui
contribuent elles aussi à l’élaboration du sens global d’un énoncé, de manière autonome
par rapport aux unités qu’elles agencent. Comme l’écrit Langacker (1987 : 12) :
« Je soutiens que la grammaire elle-même, c’est-à-dire les modes de regroupement
de morphèmes en configurations de plus en plus grandes, est intrinsèquement
symbolique, et donc porteuse de sens. Il est dès lors aussi dénué de sens de postuler
une séparation entre une composantes lexicale et une grammaticale que de diviser
un dictionnaire en deux parties, l’une listant les entrées lexicales et l’autre les
définitions. » (Traduit par B. Victorri).
43 On doit donc attribuer à chaque construction syntaxique un sens qui lui soit propre et qui
permette de rendre compte des effets différentiels obtenus par des permutations de
construction sur un même matériau sémantique. Ainsi, reprenons le couple d’exemples
que nous avons donné dans l’introduction :
(7) He sent a letter to Susan
(8) He sent Susan a letter.
44 Pour caractériser la différence de sens entre les deux constructions, Langacker (1987 : 40)
introduit les deux autres couples suivants :
(9) The shortstop threw a ball to the fence
(10) * The shortstop threw the fence a ball
(11) ? Your cousin gave a new coat of paint to the fence
(12) Your cousin gave the fence a new coat of paint.
45 Ce sont les différences d’acceptabilité de ces couples qui lui permettent d’avancer que la
construction oblique (Χ V Y to Ζ) profile la trajectoire de Y allant de X vers Z, expliquant
la moins grande acceptabilité de (11), alors que la construction ditransitive (Χ V Ζ Y)
profile l’état résultant : la possession de Y par Z, d’où l’inacceptabilité de (10).
46 Prenons un autre exemple, le problème classique connu sous le nom de la « montée du
sujet » (subject raising, Langacker 2000, chap. 11). Soit l’énoncé suivant :
(13) Don is likely to leave.
47 Constatant que Don n’est pas le « sujet logique » de likely, les analyses les plus courantes
(notamment dans le cadre des grammaires génératives) consistent à supposer une
structure logique de la forme : [Don leave] is likely dont l’énoncé (13) dériverait par montée
du sujet de la subordonnée vers la proposition principale. Cet énoncé serait donc
parfaitement « équivalent » à l’énoncé plus « normal » :
(14) That Don will leave is likely.
48 Langacker récuse cette analyse pour différentes raisons. Notamment, il note que les deux
constructions ne sont pas toujours équivalentes, dans la mesure où des différences
sémantiques sensibles peuvent se constater, comme dans le couple d’énoncés4 :
(15) Julius Caesar struck me as honest
(16) It struck me that Julius Caesar was honest.
60

49 Le locuteur de l’énoncé (15) est forcément un contemporain de Jules César, contrainte


totalement absente de l’énoncé (16). Même pour les énoncés (13) et (14), on peut relever
une différence sémantique : dans (13), l’accent est mis sur l’état psychologique de Don (sa
volonté de partir), alors que (14) est beaucoup plus neutre sur ce plan.
50 De plus la proposition infinitive, qui comporterait donc le site initial du sujet avant le
déplacement, peut être carrément absente, comme dans les exemples suivants :
(17) Who is coming to your party ? Well, Don is likely, and Sally is certain.
(18) Another war is likely.
51 Langacker montre que l’on n’a pas besoin, pour analyser ces phénomènes, de supposer un
quelconque « mouvement » à partir d’une forme canonique présumée. Il propose des
représentations schématiques de likely (figure 3) qui le définissent comme attribuant à un
événement (comportant, comme d’habitude, un trajecteur et un repère évoluant au cours
du temps) une valeur élevée sur une échelle de probabilité. Les deux constructions
possibles sont traitées comme de la polysémie : likely1 (figure 3a) admet un sujet nominal,
le trajecteur de l’événement, qui est donc profilé (les autres éléments composant
l’événement étant en arrière-plan, ce qui explique qu’ils puissent être omis), alors que
likely2 admet un sujet propositionnel : c’est donc l’événement qui est profilé dans son
ensemble, et qui joue le rôle de trajecteur pour likely. En combinant cette représentation
avec le reste du matériel linguistique présent, on obtient pour les deux énoncés (13) et
(14) deux représentations (figure 3c et 3d), qui rendent compte à la fois de la proximité et
des différences entre ces deux énoncés. En particulier, dans (13), c’est le fait que Don soit
profilé qui pousse à une interprétation centrée sur la volonté de Don de partir.
52 Comme le montre cet exemple, le processus de construction du sens d’un énoncé est un
processus d’unification (Langacker 1987 : 466) : les différents éléments constitutifs de
l’énoncé (unités grammaticales et lexicales et constructions syntaxiques) apportent leur
contribution au sens global qui est obtenu en fusionnant les représentations
schématiques associées à chacun d’eux. Cette unification peut être parfaitement fidèle,
l’apport de chaque élément étant aisément reconnaissable au sein de la représentation
globale : le processus est pleinement compositionnel•. Mais fréquemment, certains
éléments entrent en conflit pendant le processus d’unification.
53 La cohérence de la représentation globale ne peut alors être atteinte qu’en déformant
certains de ces éléments, ou en enrichissant la structure. La compositionnalité n’est, dans
ce cas, que partielle : le tout est plus que la somme des parties.
61

Fig. 3-Représentations schématiques de likely et des énoncés (13) et (14).

54 Notamment, comme l’a particulièrement bien montré Adele Goldberg, les constructions
syntaxiques peuvent compléter une structure globale qui n’est que partiellement remplie
par les unités lexicales présentes dans l’énoncé. Il est alors indispensable de prendre en
compte pleinement le sens de la construction syntaxique pour pouvoir expliquer le sens
global obtenu. Pour illustrer ce point, observons les énoncés suivants (Goldberg 1995 :
152) :
(19) They laughed the poor guy out of the room
(20) Frank sneezed the tissue off the table
(21) Mary urged Bill into the house
(22) Sue let the water out of the bathtub
(23) Sam helped him into the car
(24) They sprayed the paint onto the wall.
55 Le mouvement qui est évoqué par chacun de ces énoncés ne peut raisonnablement être
attribué ni au verbe lui-même, ni à une compositionnalité qui ne prendrait en compte que
la sémantique des unités lexicales impliquées. Il faut donc attribuer à la construction
syntaxique elle-même un sens qui permette d’intégrer les éléments présents dans une
structure globale cohérente. Goldbeig, qui appelle cette construction « caused-motion
construction », propose le schéma suivant : X causes Yto move Ζ, où X, Y et Ζ sont les trois
arguments du verbe, ce qui permet effectivement de rendre compte du sens global
obtenu, et de la forte productivité de cette construction en anglais.

La construction dynamique du sens


56 C’est sans doute Gilles Fauconnier, avec la théorie des espaces mentaux (Fauconnier 1984,
1997), qui fournit le cadre théorique le plus général pour les grammaires cognitives, au
62

sens où il permet d’intégrer la plupart des travaux que nous avons passés en revue dans
une perspective plus large, centrée sur le discours, englobant sémantique et pragmatique.
Pour Fauconnier, les formes linguistiques sont des instructions de construction de
configurations cognitives, structurées et interconnectées, qui se mettent en place au fur
et à mesure du déroulement de la parole :
« Une expression langagière n’a pas de sens en elle-même, mais plutôt un potentiel
de sens, et ce n’est que dans le cadre d’un discours complet, en contexte, que le sens
est véritablement produit. Le déploiement du discours met en œuvre des
constructions cognitives complexes. Elles comportent la mise en place de domaines
structurés liés les uns aux autres par des connecteurs ; ceci s’effectue sur la base
d’indices linguistiques, contextuels et situationnels. Les indices grammaticaux, s’ils
jouent un rôle crucial dans ce processus de construction, ne suffisent pas par eux-
mêmes à le déterminer. » (Traduit par B. Victorri)
57 Ce sont ces configurations cognitives que Fauconnier appelle des espaces mentaux. Ils
forment un réseau qui s’enrichit tout au long du discours. L’espace de départ s’appelle la
base du système. À tout moment, on peut distinguer deux autres espaces particuliers : le
point de vue, sorte de repère à partir duquel sont spécifiés de nouveaux éléments, et le
focus, l’espace qui reçoit ces nouveaux éléments. Base, point de vue et focus ne sont pas
forcément distincts (notamment au début du discours). Certaines expressions
linguistiques, les « constructeurs d’espace » (space builders), servent à construire de
nouveaux espaces à partir du point de vue, ou de la base, à laquelle il est toujours possible
de revenir. D’autres expressions servent à changer de point de vue ou de focus. D’autres
encore servent à spécifier les relations entre espaces, notamment les relations
d’accessibilité (le statut énonciatif d’un espace par rapport au point de vue dont il est
issu). D’autres enfin servent, naturellement, à introduire du contenu, en évoquant de
nouvelles entités, relations et événements qui viennent enrichir la structure du focus.
Bien entendu, une même expression linguistique peut jouer plusieurs de ces rôles à la
fois.
58 Une notion fondamentale est celle de correspondance (mapping) : les relations entre
espaces mettent en place des liens entre certains éléments de ces espaces, permettant
ainsi un transfert d’une partie de la structure d’un espace vers un autre. Prenons un
exemple très simple (Fauconnier, 1997 : 42-43) :
(25) Maybe Romeo is in love with Juliet.
59 À lui seul, cet énoncé construit deux espaces (figure 4). En effet, maybe est un
constructeur d’espace qui, en l’occurrence, spécifie une relation modale épistémique : le
nouvel espace est présenté comme une situation « possible », non pleinement validée par
le locuteur. Le réseau comporte donc une base (l’espace Β de la figure) dans laquelle sont
représentés les éléments a et b, associés aux noms Romeo etJuliet. Toutes les connaissances
partagées entre les interlocuteurs sur les deux personnes ont vocation à être
représentées dans cet espace. En revanche la relation amoureuse supposée est
représentée dans un autre espace mental M, qui est le focus actuel, accessible à partir du
premier (qui est donc aussi le point de vue) par la relation modale de possibilité (indiquée
sur la figure par la ligne en pointillés). Deux élé ments a’et b’sont arguments de la relation
amoureuse (notée LOVE) dans l’espace M. Ils sont aussi mis en correspondance avec les
éléments a et b de l’espace Β (relation d’identité notée id sur la figure), ce qui permet de
transférer dans ce nouvel espace tout ou partie des connaissances présentes dans l’espace
B, à commencer par les noms Romeo et Juliet, que l’on peut donc attribuer respectivement
à a’et b’.
63

Fig. 4 - Représentation d’espaces mentaux.

60 Il est important de noter que ce transfert s’opère par défaut, uniquement dans la mesure
où les données transférées ne contredisent pas des relations explicites dans M. Par
exemple, s’il existait dans B une relation entre a et b qui implique que Roméo ne peut pas
aimer Juliette, celle-ci n’apparaîtrait pas dans M : en construisant l’espace modalisé M, le
locuteur nierait implicitement la validité de cette relation dans ce nouveau cadre
hypothétique ainsi évoqué. Même les noms Romeo et Juliet auraient pu ne pas être
transférés dans la correspondance, si l’énoncé avait été le suivant :
(26) Maybe, Romeo and Juliet’s names are really Dick and Jane.
61 Dans ce cas, les éléments a’ et b’ auraient bien sûr pour nom Dick et Jane, mais la
correspondance permet de leur attribuer la plupart des autres propriétés des éléments a
et b de l’espace B, l’hypothèse présentée dans M consistant à considérer les mêmes
personne munies d’un nouveau nom. Ce jeu de correspondance permet notamment de
traiter tous les problèmes d’analogie contrefactuelle, casse-tête des approches logiques
du langage, qu’on peut illustrer par les exemples suivants (Fauconnier 1997 : 106-110 et
126-127) :
(27) In France, Watergate wouldn’t have done Nixon any harm
(28) Coming home, I drove into the wrong house and collided with a tree I don’t
have.
62 Au-delà de ces phénomènes subtils, Fauconnier montre que la théorie des espaces
mentaux permet de traiter de manière adéquate, outre les conditionnels et autres
modalités, les principaux systèmes grammaticaux qui opèrent au niveau du texte, depuis
l’anaphore jusqu’aux différents systèmes modaux. En particulier, les notions de base, de
point de vue et de focus sont particulièrement adaptées à la représentation des temps
verbaux, notamment des temps relatifs et des interactions entre temps et modalités.
63 Qui plus est, la théorie des espaces mentaux constitue un excellent cadre pour traiter des
métaphores. Fauconnier et Turner (1998) ont introduit une opération, appelée blending,
que l’on pourrait traduire par « mixage », qui consiste à créer une nouvelle structure
conceptuelle à partir de la fusion de deux structures existantes. Par le jeu des
correspondances, chacun des deux espaces de départ transfère une partie de sa structure
64

à la structure résultante qui, de plus, s’enrichit de relations nouvelles, émergentes, fruit


du mélange dans un même espace des relations ainsi transférées. Dans le cas de la
métaphore, où les deux espaces initiaux sont le domaine-source et le domaine-cible, on
peut rendre compte grâce à cette opération de la richesse créative du procédé. Le sens de
la métaphore ne peut en effet être représenté fidèlement ni dans le domaine-source, ni
dans le domaine-cible : en combinant les deux, c’est un sens plus riche qui est construit,
impliquant de nouvelles relations qui n’existent dans aucune des structures de départ.
64 L’opération de mixage se révèle très puissante à tous les niveaux de la cognition. Dans le
domaine conceptuel proprement dit, Fauconnier montre qu’elle peut caractériser des
développements créatifs en mathématiques et en physique, comme la découverte des
géométries non-euclidiennes (cf. Fauconnier 1997 :165-168). Et au niveau de la structure
syntaxique d’un énoncé, c’est le même processus de mixage qu’il utilise pour décrire les
constructions étudiées par Goldberg comme la caused-motion construction que nous avons
présentée plus haut (Fauconnier et Turner 1996).
65 On peut d’ailleurs noter que le procédé d’unification, tel que l’utilise Langacker (cf. p. 97
sq.), est lui aussi très proche de cette opération de mixage. D’une manière plus générale,
même si Fauconnier semble privilégier une notation logico-algébrique pour décrire la
structure interne d’un espace mental (tel le « LOVE a’b’ » de la figure 4), il est clair que
l’ensemble des outils configurationnels développés par Langacker et Tamy en sémantique
grammaticale pourraient facilement et sans doute avantageusement remplacer ces
formules : on pourrait ainsi arriver, dans le cadre général de la théorie des espaces
mentaux, à une véritable unification des différentes composantes du courant des
grammaires cognitives.

Conclusion
66 Depuis son apparition, le courant des grammaires cognitives ne s’est donc pas seulement
amplifié et diversifié, il a aussi gagné en profondeur et en cohérence. Il faut souligner que
ce renforcement ne l’a pas conduit à se refermer sur lui-même : il s’est aussi sensiblement
ouvert à des problématiques plus centrées sur l’usage du langage. Nous avons déjà signalé
les convergences avec la tradition continentale des théories de l’énonciation. On assiste
aussi depuis quelques années à un rapprochement avec les linguistiques fonctionnelles (
cf. François, dans ce volume). Des ouvrages comme ceux de Tomasello (1998) et de Barlow
et Kemmer (2000) ont permis de confronter ces deux paradigmes théoriques et de mettre
en évidence leurs points communs. De plus en plus, ces deux courants apparaissent
comme complémentaires. Si les fonctionnalistes définissent avant tout le langage comme
un outil de communication, ils comptent parmi les contraintes essentielles imposées à ce
système de communication les propriétés de l’appareil cognitif général des locuteurs, ce
qui les conduit à adopter sur de nombreux points des conceptions voisines de celles
exposées ici. Ainsi, pour ne prendre qu’un exemple, Van Valin et LaPolla (1997) intègrent
dans leur appareillage théorique des pans entiers des grammaires cognitives, à
commencer par la théorie des constructions développée par Goldberg. De leur côté, les
tenants des grammaires cognitives ont, dès l’origine, accordé une place importante à
l’utilisation du langage (usage-based models : cf. Langacker 1988) et à la pragmatique,
notamment dans les travaux de Fauconnier (1997) et de Sweetser (1990).
65

67 Pour les chercheurs en sciences cognitives non spécialisés en linguistique, les grammaires
cognitives représentent aujourd’hui une alternative séduisante aux grammaires
génératives qui ont longtemps dominé le paysage théorique en sciences du langage,
notamment en psycholinguistique. Psychologues et spécialistes des neurosciences
devraient trouver davantage matière à expérimentation dans cette approche qui relie
étroitement les phénomènes linguistiques à des mécanismes cognitifs généraux. Du point
de vue de la neurobiologie, Gerald Edelman avait déjà lancé un appel en ce sens il y a une
dizaine d’années, en soutenant que la grammaire cognitive « s’accorde davantage avec les
bases biologiques des fonctions cérébrales et corporelles, et avec les données
psychologiques sur la catégorisation » (Edelman 1992 : 386). En ce qui concerne les
modélisateurs et les spécialistes de la cognition artificielle, la place donnée dans ces
travaux au continu et à l’émergence représente un véritable défi, puisque cela nécessite
d’abandonner les formalismes logico-algébriques traditionnellement utilisés dans les
modèles linguistiques pour se tourner vers d’autres outils mathématiques, comme la
géométrie différentielle et la théorie des systèmes dynamiques, et d’inventer de nouveaux
outils informatiques capables de les implémenter. Le connexionnisme a
incontestablement permis de progresser dans cette direction (cf. notamment le plaidoyer
de Langacker (1991 : 526-536) en faveur de « l’alternative connexionniste »), mais il est
clair aujourd’hui que ces avancées ont été insuffisantes pour aboutir à des modèles qui
rendent compte de la théorie dans son ensemble. D’autres efforts sont donc nécessaires.
L’enjeu est de taille : on peut en effet penser que l’absence d’un cadre de formalisation
adéquat constitue le principal obstacle que doivent sur monter les grammaires cognitives
pour jouer pleinement leur rôle dans les recherches pluridisciplinaires en sciences
cognitives.

NOTES
1. Il faut d’ailleurs noter qu’un certain nombre de tenants du courant des grammaires cognitives,
comme Langacker et Lakoff, sont d’anciens générativistes ayant rompu avec l’orthodoxie
chomskienne. Lakoff, notamment, a été au début des années 1970 l’un des chefs de file de la
« sémantique générative », l’une des premières dissidences du courant chomskien (cf. Dubois-
Charlier et Galmiche 1972, pour une présentation des débats entre générativistes à cette période).
2. Voir aussi Kleiber (1990 : 60).
3. Voir aussi l’analyse par Brugman (1988) de la préposition anglaise over, qui entre également
dans le cadre de la théorie du prototype étendu, mais avec des traits entièrement
configurationnels.
4. On peut faire les même constats en français sur des exemples du type : Marie semble malade/Il
semble que Marie soit malade
ou, bien pire :
Marie paraît malade/Il paraît que Marie est malade.
66

AUTEUR
BERNARD VICTORRI
Directeur de recherche au CNRS. Laboratoire « Langues, Textes, Traitements informatiques,
Cognition » (UMR 8094, CNRS/ENS-Ulm/Paris VII).
67

Le fonctionnalisme linguistique et
les enjeux cognitifs
Jacques François

1 Le fonctionnalisme linguistique, fondé initialement sur la notion de marque chez


Troubetzkoy (1939), a connu dans les vingt dernières années du XXe siècle des
développements remarquables dans différentes directions. On peut citer en particulier la
lexématique fonctionnelle d’E. Coseriu (cf. Coseriu 2002) ou les théories désignées par W.
Croît (1995) comme « fonctionnalistes-formalistes », à savoir la Functional Grammar de S.
Dik (1978,1997) et la Grammaire des rôles et de la référence (cf. Van Valin et LaPolla 1997), et
avant tout la typologie fonctionnelle des langues développée en majorité par des
chercheurs américains, australiens et allemands. Je concentrerai ici mon propos sur des
travaux qui mettent en évidence des motivations externes d’ordre cognitif dans la
structuration (§ 2) et l’évolution (§ 3) des langues et, au-delà, l’ontogénèse (§ 4) et la
phylogénèse (§ 5) du langage. Certains de ces travaux se rattachent explicitement à un
programme d’explication fonctionnaliste (en particulier T. Givón, W. Croft, B. Heine ou J.
Hawkins, Κ. Hengeveld, S. Kirby), c’est pourquoi je commencerai par expliciter la
controverse entre linguistes formalistes et fonctionnalistes sur le sens qu’ils donnent à la
notion d’explication en linguistique (§ 1). D’autres se rattachent indirectement à ce
programme comme S. Lamb, R. Van Valin, ou M. Tomasello, mais entrent globalement
dans le même paradigme épistémologique.
2 Je commencerai par une citation emblématique de B. Heine. Dans l’ouvrage de 1997
intitulé The Cognitive Foundations of Grammar, qui synthétise ses travaux sur les processus
de grammaticalisation, particulièrement dans un domaine morphologique, celui de
l’apparition des auxiliaires, et dans deux domaines conceptuels, la possession et la
comparaison, Heine estime que « l’on ne peut saisir la motivation du mode effectif de
structuration du langage que si l’on prend en considération les fondements cognitifs dont
dérive la structure du langage » (19976 : 21).
3 Un an plus tard, dans son introduction au volume collectif The New Psychology of Language
consacré aux points de contact entre les orientations fonctionnelles et cognitives de la
linguistique contemporaine (rassemblées sous la désignation de « théories du langage
68

fondées sur l’usage »), le psychologue M. Tomasello déclare à son tour que si l’on veut
comprendre un jour les complexités multiples du langage, ce n’est pas d’un surplus de
formalisations mathématiques que l’on a besoin, mais plutôt de plus de coopération entre
psychologues et linguistes pour s’entraider à « déterminer comment les processus
cognitifs et sociaux fondamentaux opèrent dans le domaine particulier de la
communication linguistique humaine » (1998 : XXI).
4 Nous verrons dans la section 1 en quoi la controverse sur la notion d’explication est
directement liée à l’opposition entre une linguistique centrée sur le calcul syntaxique et
sur l’hypothèse de l’autonomie de la faculté de langage et une linguistique cherchant à
expliquer les structures linguistiques à partir d’un jeu de motivations internes et
externes, en l’occurrence cognitives et sociales, lesquelles se combinent
harmonieusement dans les thèses de W. Croft (cf. § 3) sur l’évolution des langues et de T.
Givón (cf. § 5) sur la phylogénèse du langage.

1. La notion d’explication dans la controverse entre


fonctionnalisme et formalisme en linguistique
5 Le fonctionnalisme linguistique contemporain (qu’on peut dire de troisième génération)
n’est pas la simple continuation du fonctionnalisme de première génération, représenté
par N.S. Troubetzkoy, V. Mathesius ou A. Martinet, consacré en priorité aux structures
phonologiques et à l’identification des fonctions du langage (K. Bühler, R.Jakobson), ni de
celui de seconde génération orienté vers la perspective fonctionnelle de la phrase et
l’articulation entre phrase et discours (J. Firbas, P. Sgall, M.A.K. Halliday). Son orientation
dominante est typologique, dans la lignée des travaux de J. Greenberg, et celle-ci s’est
construite en réaction contre le formalisme d’inspiration chomskienne (et ses
présupposés mentalistes). L’ouvrage programmatique de S. Dik, Functional Grammar
(1978), est caractéristique de cette nouvelle voie dont T. Givón est le représentant
emblématique. Le fond du débat, c’est la question essentielle du sens donné à l’expression
« expliquer un fait linguistique ». C’est pourquoi il serait vain de chercher à caractériser les
orientations contemporaines en linguistique fonctionnelle en dehors de cette
controverse.
6 Pour les formalistes d’inspiration chomskienne, un phénomène linguistique est déclaré «
expliqué » s’il peut être déduit de l’appariement entre un principe général (formulé dans
un vocabulaire de primitives internes à la grammaire) et un ensemble de conditions
initiales. Quant aux jugements des locuteurs natifs, ils sont expliqués par l’internalisation
de ces principes (cf. Newmeyer 1998 : 97-98). La grammaire générative est donc basée sur
un modèle d’explication interne. Le point de vue des formalistes sur le sens dans lequel on
peut parler d’explication en linguistique prend appui sur la thèse que les fonctionnalistes
confondent abusivement le plan de la compétence, donc de la grammaire interne, et celui
de la performance, donc du discours instancié. Les contributions de W. Abraham, S.
Anderson et D. Nettle au volume 1 de Formalism and Functionalism in Linguistics (Darnell et
al. 1999) sont représentatives de cette position.
69

1. 1. Aux formalistes la compétence, aux fonctionnalistes la


performance !

7 C’est dans cette optique qu’Abraham (1999) présente un tableau comparatif d’une
douzaine de caractéristiques majeures distinguant les deux entreprises, formaliste et
fonctionnaliste. J’en retiens quelques points forts :

LES FORMALISTES LES FONCTIONNALISTES

appliquent une méthode déductive appliquent une méthode inductive

pratiquent des généralisations pratiquent des généralisations graduelles ou d’ordre


absolues statistique

assignent au langage une fonction assignent au langage une fonction primaire d’interaction
primaire d’information autant que d’information

identifient des universaux de identifient des principes cognitifs plus profonds


syntaxe linguistique déterminant les universaux linguistiques

attribuent un caractère non arbitraire au lexique,


attribuent un caractère arbitraire
insistant sur l’iconicité, et identifiant de tous côtés des
au lexique
processus métaphoriques

envisagent la diachronie comme


envisagent la diachronie comme un système dynamique
constituée de stades successifs

8 Une démarche calculatoire telle que la préconise le courant forma liste doit adopter une
méthode hypothético-déductive, elle ne peut pas se satisfaire de généralisations
statistiques, elle ne peut pas tenir compte à la fois des deux fonctions d’information et
d’interaction et accorde la priorité à celle qui est le plus aisément formalisable. Elle
conçoit l’universalité de la grammaire en termes d’universaux de substance (classes de
mots) et non d’universaux implicatifs ou de tendances ordonnées en hiérarchies, elle
renvoie la discussion des motivations cognitives du lexique et de l’extension
métaphorique des concepts lexicaux comme des catégories grammaticales à une
grammaire de performance, enfin elle admet le principe des coupes de synchronie
décrivant des états de langue stabilisés comme prérequis de l’analyse diachronique. La
prise en compte des motivations pragmatiques de l’énoncé, de ses conditions d’emploi en
contexte discursif ou de son appartenance à un genre textuel constituent une tâche
secondaire. Abraham y voit « une division raisonnable du travail » (1999 :78).
9 Dans le même ouvrage, S. Anderson (1999) pousse à son terme cette ligne de
raisonnement. Il reproche aux fonctionnalistes de ne pas se contenter de formuler
l’hypothèse d’une perméabilité des structures syntaxiques vis-à-vis de facteurs de
signification et d’usage, mais de concevoir la mise en évidence de cette perméabilité
comme une stratégie de recherche (ibid. : 120). Selon Anderson, la méthode des
formalistes consiste à formuler l’hypothèse que des composantes distinctes du savoir
linguistique ont un fonctionnement autonome et que les phénomènes complexes sont
70

descriptibles par leur interaction. L’étude de la capacité générative du langage humain


(objectif déclaré des formalistes) invalide les données sur l’usage et la fréquence « et
même la question de savoir si une possibilité donnée est effectivement instanciée dans
une quelconque langue » (ibid. : 120-121). Le domaine de recherche des formalistes est ce
que le langage est (la compétence), tandis que le domaine qu’il concède aux
fonctionnalistes est celui de ce que le langage/ait (la performance), qu’Andersen
caractérise comme la « prise en compte unifiée de l’activité des utilisateurs du langage
humain ». Anderson entend fixer une hiérarchie des priorités :
• Les grammaires (internes) de la compétence (ou I-grammars, relevant de modèles formels) sont le
noyau dur fondé sur la distinction entre principes et paramètres. Elles sont seules aptes à
rendre compte de l’aptitude humaine à manier les langues comme un outil abstrait
déconnecté des besoins de communication.
• Les grammaires (externes) de la performance (ou Ε-grammars, relevant de modèles fonctionnels)
rendraient compte de l’usage effectif des langues dans la communication, ce qui selon
Anderson constitue une problématique extérieure à la grammaire au sens étroit.
10 Enfin, la contribution de D. Nettle dans le même volume (1999) prend le problème à la
racine en pointant les difficultés du fonctionnalisme en biologie, lesquelles se répercutent
sur son emploi en linguistique. Tout comme Givón (1995), dont le fonctionnalisme est
pourtant indiscutable, Nettle critique le dogme fonctionnaliste de la structuration
adaptative (emprunté à la théorie de l’évolution en biologie). Il présente comme circulaire
et empiriquement improductive l’hypothèse de l’adaptativité linguistique – c’est-à-dire
d’une relation fonctionnelle entre le degré d’utilité communicationnelle ou cognitive de
formes linguistiques et la probabilité de leur adoption1 et il illustre l’objection de Lass
(1980) selon laquelle « le problème avec l’argument fonctionnel, c’est que vous ne pouvez
pas perdre » en ces termes : « D’un côté on suppose que le système linguistique est mieux
adapté que le précédent après le développement en question et on en trouve une raison a
posteriori. D’un autre côté le développement est dit avoir été causé par cette pression
fonctionnelle » (Nettle 1999 : 450).
11 Comment les fonctionnalistes peuvent-ils répliquer à ces critiques convergentes ?

1.2. Le point de vue fonctionnaliste

12 Dans le même volume, le point de vue fonctionnaliste sur ce qui constitue proprement
une explication en grammaire est défendu particulièrement par M. Durie (1999) et D.
Payne (1999). Durie (ibid. : 418) est largement en accord avec Abraham (cf. § 2.1) sur les
bases générales du désaccord avec le structuralisme en général, mais plus spécialement
avec l’héritage saussurien. Selon les fonctionnalistes :
• La structure du langage ne peut être expliquée et internalisée qu’en termes de discours et de
parole, ce qui contredit le souci des formalistes de se cantonner au niveau de l’unité-phrase
et de ne tenir compte que de la fonction d’information au détriment de la fonction
d’interaction ;
• les contraintes du monde réel, du tempe et de l’espace qui s’appliquent à la communication
humaine (par exemple l’intentionnalité humaine, et les contraintes imposées par le medium
de la communication, verbale ou signée) doivent être prises en compte 2, ainsi que les
contraintes de l’appareil phonatoire ;
• il en est de même des aptitudes et des propensions des êtres humains au-delà du domaine
strictement linguistique, y compris les opérations du sens commun et les présuppositions
71

qui rendent la communication coopérative, ce qui va à l’encontre d’une conception


restrictive de la compétence limitée à l’usage collectif d’une même syntaxe et d’un lexique
arbitraire, abstraction faite des extensions métaphoriques affectant aussi bien la syntaxe 3
que le lexique ;
• les systèmes linguistiques sont des équilibres dynamiques et non des états idéalement
stabilisés.
13 Durie développe ce dernier point (ibid. : 426) en distinguant cinq niveaux de temporalité
dans le langage, du plus rapide, le discours comme activité individuelle et collective en
« temps réel », au plus lent, l’évolution de l’espèce (phylogénie), en passant par la
pratique, l’entraînement et la mémoire à long terme, l’acquisition (ontogénie) et
l’évolution des langues à travers le renouvellement des communautés linguistiques
(diachronie). Je reviendrai sur ces trois types de durée respectivement dans les sections 5,
4 et 3.
14 Cet article ouvre la voie à l’argumentation de D. Payne, dont la contribution intitulée
What Counts as Explanation ? touche le fond du problème. D. Payne commence par définir le
fonctionnalisme linguistique comme « une approche qui considère le langage comme un
outil de communication et dans lequel la production en cours peut être affectée par les
tâches communicationnelles à accomplir vis-à-vis de l’allocutaire aussi bien que par
l’appareil cognitif général du locuteur et de l’allocutaire et par les contraintes qui leur
sont imposées dans le traitement du langage » (1999 : 139). Les trois facteurs décisifs mis
en avant par M. Durie sont présents : l’accomplissement des tâches communicationnelles,
l’appareil cognitif des interlocuteurs et les contraintes auxquelles est soumise la
communication linguistique, que celles-ci soient d’ordre spatio-temporel ou
physiologique.
15 Le point central est que les tâches communicationnelles assumées par les locuteurs ont le
pouvoir de façonner le système linguistique. C’est l’identification de ce pouvoir qui
constitue une explication fonctionnelle selon Russell Tomlin (1994), lequel définit comme
description fonctionnelle l’analyse détaillée des relations de correspondance entre les
formes spécifiques dans un système linguistique et les fonctions qu’encodent de telles
formes. Cette description consiste en un effort de compréhension des motivations des
locuteurs dans leur choix entre des structures équivalentes en termes de logique
propositionnelle, mais formellement distinctes4. Tomlin distingue deux types majeurs de
relation entre forme et fonction :
• Le codage syntaxique ou grammaticalisé : la forme X est grammaticalisée pour coder la fonction
A si et seulement si la présence de A dans le message requiert du locuteur qu’il emploie
automatiquement et invariablement X ;
• la signalisation pragmatique : la forme X signale pragmatiquement la fonction A si la présence
de X permet à l’allocutaire d’inférer A dans un contexte donné ; toutefois, il n’y a pas
d’obligation automatique pour le locuteur à produire X dans le contexte de A.
16 À titre d’exemple de cette distinction, on peut comparer l’expression en français de la
focalisation d’un constituant actantiel ou circonstanciel selon que la force illocutoire est
déclarative ou interrogative. En phrase interrogative, la focalisation passe
obligatoirement par la sélection d’un pronom ou déterminant interrogatif (par exemple :
qui as-tu rencontré ?/qui est-ce/c’est que tu as rencontré ?/tu as rencontré qui ?/quel Ν as-tu/tu
as rencontré ?), il s’agit donc d’un codage grammaticalisé. En phrase déclarative, la
focalisation peut passer par une construction présentative, mais il ne s’agit que d’une
signalisation pragmatique : C’est Paul que j’ai rencontré.
72

17 Ce type d’explication a pour Newmeyer (1998) un caractère externe – ce qui justifie la


distinction de Croft (1995) entre le fonctionnalisme « autonomiste » de S. Kuno, qui ne
recourt qu’à des facteurs explicatifs internes au système sémiotique de la langue, et le
fonctionnalisme « externe » qui fait intervenir des facteurs pragmatiques, physiologiques
et cognitifs.

1.3. La part d’explication interne et d’explication externe dans les


théories formalistes et fonctionnalistes

18 Un intérêt majeur de la discussion des modes interne et externe d’explication en


linguistique dans le chapitre 3 de Newmeyer (1998 : 96-106) est que, après avoir reconnu
que typiquement les formalistes favorisent l’explication interne et les fonctionnalistes
l’explication externe, l’auteur montre qu’en fait les deux modes d’explication coexistent
dans les deux types de théories.
I. Explication interne en linguistique fonctionnelle. Ainsi, le principe selon lequel la
grammaticalisation est unidirectionnelle, essentiel dans la perspective fonctionnelle,
constitue une explication interne parce que c’est une hypothèse interne à la grammaire.
Newmeyer note qu’il est habituel de faire des déductions sur des changements dans des
grammaires pour lesquelles nous n’avons aucune attestation directe, comme dans l’œuvre
de B. Heine où des séquences complexes de développement historique sont proposées pour
beaucoup de langues d’Afrique (cf. Heine et Kuteva 2002).
II. Einnéité comme explication externe en grammaire generative. Quand on essaie, comme les
formalistes, d’expliquer pourquoi des grammaires sont organisées comme elles le sont, en
faisant l’hypothèse que certaines de leurs propriétés sont innées, on cherche à fournir une
explication externe de celles-ci. C’est d’ailleurs pourquoi il n’y a pas à s’étonner que M. Durie
(1999) mette en avant dans les préoccupations des fonctionnalistes les caractères innés de la
faculté de langage et que toute une littérature soit consacrée à l’acquisition phylogénétique
de ces caractères innés (cf. Elman et al. 1996). Martin Haspelmath (cité par Newmeyer)
imagine d’ailleurs qu’il est réellement plausible que des propriétés innées de l’esprit humain
obligent les langues à changer de manières particulières.
III. L’effet de l’analyse sur les structures syntaxiques. Enfin, comme on peut s’y attendre, la
performance linguistique n’est pas sans effet sur la compétence. La plupart des
grammairiens générativistes pensent que les grammaires mentales admises par les
linguistes sont réellement utilisées dans le cours de la production et de la compréhension du
discours, certaines propriétés grammaticales pouvant être attribuées à une accommodation
de la grammaire à l’analyseur.

19 En conclusion de cette discussion, entre les deux modes d’explication linguistique, le


mode interne est privilégié chez les formalistes parce que mieux adapté à un style
d’argumentation déductif et calculatoire, et le mode d’explication externe chez les
fonctionnalistes parce qu’intégrant mieux l’activité linguistique dans le comportement
global des êtres humains, de la physiologie phonatoire à la cognition. Pour autant, l’un et
l’autre mode d’explication, loin de s’exclure, constituent des procédures scientifiques
complémentaires.
73

2. Facteurs cognitifs dans la conception


fonctionnaliste des universaux du langage
20 La conception « formaliste » – plus spécifiquement générativiste – des universaux du
langage est centrée sur la question des conditions d’acquisition des structures
linguistiques par l’enfant malgré la « pauvreté du stimulus ». Chomsky (1965 : 27-30)
distingue deux types d’universaux linguistiques : les universaux substantiels sont les
pierres angulaires de la structure linguistique, il s’agit des traits distinctifs phonologiques
et de la notion de syllabe, des parties du discours (qui sont organisées ultérieurement en
fonction de deux traits [+/-N, +/-V], les noms recevant la double caractérisation [+N,-V],
les verbes [-N, + V], les adjectifs [+N, + V] et les adpositions• [-Ν,-V]), et le principe de
hiérarchisation arborescente des syntagmes. Le second type est celui des universaux
formels qui constituent le répertoire des types de règles que l’enfant doit assimiler. Dans
cette conception, l’enfant dispose d’un répertoire de règles (par exemple de formation
des syntagmes et de dérivation) qui se développeront en règles de la grammaire interne
de l’enfant une fois alimentées par la perception des régularités de la langue maternelle.
À ces deux types, Jackendoff (2002 : 77-78) adjoint un universel architectural : selon sa
théorie de l’architecture parallèle du langage, toute langue présente une architecture
composée de trois types de structures, phonologique, syntaxique et sémantique-
conceptuelle, interconnectées par des composantes d’interface phonologie-syntaxe et
syntaxe-sémantique et présentant chacune des sous-composantes modulaires (cf. § 6).
21 Le trait commun aux points de vue fonctionnalistes est la mise en avant de données de
typologie des langues plus ou moins explicitement corrélées à des observations cognitives
et à l’hypothèse que l’acquisition du langage se fonde sur des principes généraux du
développement cognitif et que la faculté de langage n’est pas soumise à des principes
spécifiques. Je n’évoquerai ici que quatre aspects parmi d’autres de la mouvance
fonctionnaliste en termes d’universaux : la notion d’universaux implicationnels•, la place
de la concurrence entre motivations dans l’émergence de hiérarchies implicationnelles
universelles, l’exploitation typologique de schèmes cognitifs universels et l’élaboration
d’un ensemble de dimensions universelles très abstraites du langage.

2.1. Les universaux implicationnels d’ordre des mots et les


contraintes de traitement

22 L’identification des universaux implicationnels du langage, qui repose sur les travaux
fondateurs de J. Greenberg (1963, 1966), s’effectue en quatre pas successifs (cf. Croît 1990 :
62-3). Le premier pas est l’énumération des paires de propriétés dont la compatibilité est
testée dans un échantillonnage aussi représentatif que possible de langues. Pour une
paire de propriétés {A +/-, Β +/-} le croisement des valeurs A +/-et Β +/-est représenté sur
une table dite « tétrachorique » (tableau 1).

Tableau 1
La forme des tables tétrachoriques

Propriété A + Propriété A -
74

Propriété B +

Propriété B -

23 Le deuxième pas est la découverte de la distribution empirique des types attestés et non
attestés, illustrée par la disposition dans la table des Ν (nombre de langues de
l’échantillon présentant la paire de propriétés) et des Ø (aucune langue attestée) ou [Ø]
(nombre insignifiant de langues attestées). Trois possibilités se présentent :
24 (I) Il s’agit d’un universel absolu, par exemple : « Toutes les langues ont des voyelles
orales » (alors qu’elles peuvent avoir ou pas des voyelles nasales)5.

Tableau 2
L’universel absolu de la présence de voyelles orales

voyelles nasales + nasales -

orales + N N

orales - Ø Ø

25 (II) Il s’agit d’un universel implicationnel, par exemple : « Si une langue dispose le nom
avant le démonstratif, alors elle dispose le nom [i.e. l’antécédent] avant la proposition
relative » :

Tableau 3
L’universel implicationnel Ν Dem → Ν Rel

Dem N N Dem

Rel N N Ø

N Rel N N

26 (III) Il s’agit d’une équivalence logique, par exemple : « Dans les langues avec prépositions,
le génitif suit presque toujours le nom régissant tandis que dans les langues avec
postpositions•, il le précède presque toujours » :

Tableau 4
Une équivalence logique

N Gen Gen N

Préposition N [Ø]

Postposition [Ø] N
75

27 Le troisième pas consiste à développer une généralisation propre à restreindre la


variation dans les types de langues sans l’éliminer (c’est-à-dire qui autorise les différents
types de langues attestés en excluant les types non attestés) et à révéler une relation
entre des paramètres grammaticaux par ailleurs logiquement indépendants.
28 Ainsi, concernant les corrélations entre (1) l’ordre relatif du verbe, du sujet et de l’objet
pour la proposition, (2) celui du nom, du démonstratif, de l’adjectif et de la relative pour
le syntagme nominal et (3) la présence de prépositions ou de postpositions pour le
syntagme prépositionnel, il résulte de l’étude typologique d’un échantillon représentatif
de 142 langues (cf. Hawkins, 1983 : 26) que sur les 26 langues à ordre dominant VSO (en
proposition principale et en mode de phrase déclaratif) de l’échantillon, 24 présentent la
configuration {VSO, prépositions, N-Génitif} dont en outre 19 avec l’ordre N-Adj contre 5
avec l’ordre Adj-N, les 2 langues restantes ayant des configurations excentriques. Pour les
52 langues à ordre dominant SVO, 32 présentent la configuration {SVO, prépositions, N-Adj},
dont 21 avec en outre N-Génitif contre 11 avec Génitif-N, et 14 la configuration {SVO,
prépositions, Adj-N} dont 8 avec au surplus N-Génitif et 6 avec Génitif-N, les 6 autres
langues se disséminant dans des configurations marginales. Enfin, pour les 64 langues à
ordre SOV, 52 partagent les trois propriétés {SOV, postpositions, Génitif-N} dont 28 avec en
outre Adj-N et 24 avec N-Adj, tandis que 11 des 12 restantes partagent les trois propriétés
{SOV, prépositions, N-génitif} avec N-Adj pour 7 d’entre elles et Adj-N pour les 4 autres.
29 On peut donc résumer ces données sous la forme suivante où « > » désigne une relation de
supériorité quantitative, l’effectif en langues attestées de chaque propriété d’ordre étant
indiqué en indice :
{VSO26, prépositions25, N-Génitif24, N-Adj19 > Adj-N7}
{SVO52, prépositions33 > postpositions19, N-Génitif31 > Génitif-N21, N-Adj33 > Adj-N19}
{SOV64, postpositions59, Génitif-N53 > Génitif-N11, N-Adj35 > Adj-N29}
30 On peut en tirer trois conclusions :
i. L’ordre VSO est en corrélation forte avec la présence de prépositions et l’ordre N-Génitif,
l’ordre SOV inversement avec la présence de postpositions et l’ordre Génitif-N. Il y a
harmonie (Croît 1990 : 55) entre la structure de la proposition et celle du SN, le même ordre
tête-modificateur (VSO) ou modificateur-tête (SOV) étant privilégié.
ii. L’ordre SVO est en revanche en corrélation préférentielle mais non décisive avec les
prépositions, l’ordre N-Génitif et l’ordre N-Adjectif (c’est-à-dire l’ordre tête-modificateur) ;
cette dispersion témoigne de la concurrence entre deux motivations, l’ordre SV étant du
type modificateur-tête dans la conception de Tesnière6 ou tête-tête dans celle de Chomsky,
et l’ordre VO du type tête-modificateur.
iii. L’ordre N-Adj l’emporte, même pour les langues SOV, c’est-à-dire que dans ce cas il y a une
dysharmonie entre l’ordre modificateur-tête de la proposition (actants•-verbe) et l’ordre tête-
modificateur du SN (nom régissant-adjectif régi).

31 Le quatrième pas consiste dans la recherche d’une explication (éventuellement externe)


pour les phénomènes de dysharmonie observés. Hawkins propose deux explications, la
mobilité (les démonstratifs, numéraux et adjectifs étant plus mobiles que le génitif et la
relative) et surtout le poids relatif (heaviness) évalué en nombre de morphèmes ou de
syllabes, avec par ordre de poids croissant le démonstratif et le numéral puis l’adjectif, le
génitif et la relative. Dans l’échantillonnage originel plus restreint de Greenberg (1963),
sur 11 langues à ordre SOV, deux présentent la relative postposée (ordre dysharmonique)
et une la relative à ordre indifférent, et quatre l’ordre N-Adj au lieu de Adj-N attendu. Il
est peu vraisemblable que l’ordre N-Adj résulte de la concurrence entre la motivation
76

d’ordre modificateur-tête et celle de poids relatif dans la mesure où l’adjectif régi a peu
de chances d’être notablement plus lourd que le nom régissant, il s’agit donc plus
vraisemblablement d’adjectifs mobiles dont l’ordre N-Adj n’est que dominant. En
revanche, pour les relatives, le facteur de poids relatif est prépondérant et celui de
mobilité peu vraisemblable compte tenu de la structure propositionnelle de la relative. Ce
facteur de poids relatif est typiquement d’ordre cognitif puisqu’il met en cause les
conditions de traitement, c’est-à-dire l’empan de la mémoire de travail 7.

2.2. Les motivations en concurrence et les hiérarchies


implicationnelles universelles : le cas de l’ergativité• partagée

32 Les langues à cas se distribuent en trois types principaux de marquage casuel. Dans le
système nominatif-accusatif les fonctions syntaxiques de sujet et d’objet déterminent
l’assignation du cas : les sujets sont exprimés au cas nominatif, les objets au cas accusatif.
Les fonctions syntaxiques suffisent à déterminer le cas. Dans le système ergatif-absolutif• la
transitivité du prédicat est le facteur déterminant : les sujets de prédicats transitifs sont
exprimés par le cas ergatif, ceux de prédicats intransitifs et les compléments d’objet de
prédicats transitifs sont exprimés au cas absolutif. Enfin dans le système actif-inactif, qui
touche un nombre de langues très limité, ce sont les rôles sémantiques qui déterminent
l’assignation de marques casuelles : les constituants agentifs• sont au cas « actif », les
constituants non-agentifs au cas « inactif ».
33 La variation de marquage du sujet dans le système ergatif en fonction de la présence ou
de l’absence d’un objet révèle la concurrence entre deux motivations : le sujet de la
proposition à un seul actant peut certes subir l’événement, mais s’il le contrôle, il reçoit
un marquage neutre (dit « absolutif », souvent non marqué) qui laissera la place à un
marquage ergatif si le patient est mentionné. C’est un facteur d’instabilité qui favorise
l’interférence avec des propriétés cognitives de deux ordres, représentationnelles et
mandatives, qui entraînent le phénomène dit d’ergativité partagée. Les premières
concernent les classes de représentation des événements (par exemple l’aspect
intrinsèque ou « aktionsart• », les propriétés d’actance) et des participants (par exemple
le caractère comptable vs. massif, animé vs. non animé, etc.), les secondes la deixis•
temporelle•, la visée aspectuelle, les modalités logiques et énonciatives, la référence et la
deixis nominales•.
34 La hiérarchie d’animation de Silverstein (1976), qui peut jouer un rôle déterminant dans le
marquage casuel hybride, combine effectivement des propriétés cognitives des deux
ordres. Le parangon de l’animé est l’allocutaire, suivi du locuteur et d’un pronom de3 e
personne. C’est donc la propriété de participation à l’acte de communication qui domine.
Le quatrième degré de l’échelle est représenté par les noms propres, lesquels assurent
une fonction référentielle (toujours une propriété énonciative), et les degrés inférieurs
distinguent les humains, les animaux et les objets inanimés (propriétés
représentationnelles). L’ergativité partagée est la combinaison des marquages casuels
ergatif et accusatif dans une langue, distribuée à travers ses sous-systèmes. Les langues
ERG/ACC présentent donc un marquage casuel hybride. Dans ces langues, la probabilité
d’un marquage ERG pour l’agent ou, inversement, d’un marquage ACC pour le patient est
inversement proportionnelle à leur « naturalité », c’est-à-dire à la conformité entre le
statut intrinsèque du participant et le rôle sémantique qu’il doit assumer dans l’énoncé.
77

35 Les agents les plus naturels sont l’allocutaire et le locuteur parce qu’ils sont des humains
engagés dans l’acte de co-énonciation. Inversement, les objets inanimés sont des patients
naturels. Si cette corrélation prototypique entre la classe conceptuelle et/ou énonciative
des participants et leur rôle sémantique est respectée, aucun marquage spécial n’est
nécessaire. En revanche, plus l’agent ou le patient est éloigné du prototype
correspondant, plus il a de chances d’être marqué respectivement comme ERG ou ACC (cf.
tableau 5).

Tableau 5
Modèle du marquage casuel hybride accusatif ou ergatif en fonction de la hiérarchie d’animation

degré de naturalité marquage degré de naturalité marquage


Hiérarchie
de l’agent de casuel de du patient de casuel du
d’animation
l’én