Jacques François

Jacques François
La genèse
du langage
et des langues
Retrouvez nos ouvrages sur
www.scienceshumaines.com
www.editions.scienceshumaines.com
Diffusion : Volumen
Distribution : Interforum
En application de la loi du 11 mars 1957, il est interdit de

reproduire intégralement ou partiellement, par photocopie ou tout autre
moyen, le présent ouvrage sans autorisation de
l’éditeur ou du Centre français du droit de copie.
© Sciences Humaines Éditions, 2017

38, rue Rantheaume
BP 256, 89004 Auxerre Cedex
Tel. : 03 86 72 07 00/Fax : 03 86 52 53 26
ISBN = 9782361064631
978-2-36106-461-7
Jacques François
La genèse
du langage
et des langues
Introduction
En ce début de xxie siècle, en dépit de la disparition irrémé-

diable de nombreuses langues due à la suprématie des langues
mondiales, l’anglais et le chinois en priorité, les linguistes en
comptent encore plus de 6 000, riches pour certaines d’entre elles
de plusieurs dialectes. Pour mettre de l’ordre dans ce trésor linguis-
tique, on est convenu de classer ces langues selon différents critères.
Un des premiers critères de classement d’une langue est son
appartenance à une famille généalogique, c’est-à-dire ses affinités
avec d’autres langues révélant une origine commune, une pro-
priété que les linguistes ont mise en évidence pour les langues
finno-ougriennes (essentiellement le finnois, le hongrois et l’esto-
nien) dès le xviiie siècle et pour les langues indo-européennes
(principalement romanes, germaniques, slaves et celtiques), et
sémitiques (hébreu, arabe, araméen, etc.) dès la première moitié
du xixe siècle.
Ensuite vient son appartenance à un type grammatical, une
propriété indépendante de la précédente, également entrevue
dès le début du xixe siècle par Wilhelm von Humboldt pour les
formes des mots (notamment dans les paradigmes de conjugai-
sons affectant les verbes et de déclinaisons affectant les noms et
les adjectifs), mais développée essentiellement dans la seconde
moitié du xxe siècle.
À cela s’ajoute occasionnellement l’appartenance de la langue
à une aire géographique, laquelle rapproche le lexique et plus
rarement les structures de langues de familles généalogiques dif-
férentes, mais en contacts persistants. Tout au long du xixe siècle,
5
La genèse du langage et des langues
les linguistes se sont ainsi demandé si l’albanais était une langue

romane compte tenu de la prolifération des emprunts lexicaux
à l’italien dans cette langue, avant de la considérer comme un
groupe à elle seule.
Il faut se rendre à l’évidence : la question de l’origine com-
mune ou indépendante des familles de langue (en termes
techniques, leur monogénèse ou polygénèse), qui a fait couler
beaucoup d’encre depuis deux siècles, reste actuellement sans
solution, malgré les progrès considérables des méthodes de
reconstruction des états passés des langues, y compris celles qui
n’ont pas de tradition écrite.
La question de l’origine des familles de langues paraît à de
nombreux chercheurs complètement distincte de celle de l’ori-
gine du langage, en tant que faculté humaine censée distinguer
le genre humain de toutes les autres espèces animales. Et de fait,
jusqu’aux alentours des années 1980, les chercheurs investis dans
ces deux types d’investigations, des linguistes et philologues d’un
côté, des spécialistes de biologie, psychologie et anthropologie
évolutionnaires de l’autre, avaient peu d’occasions de confronter
leurs vues. Cependant le tableau de la recherche sur les origines
de la faculté de langage et de sa manifestation diversifiée à travers
les langues du monde présentes et passées a beaucoup évolué à
partir de la dernière décennie du siècle passé.
Trois facteurs ont joué un rôle déterminant :
– L’imagerie fonctionnelle et clinique du cerveau a permis de
repenser la question ancienne de la localisation des « centres du
langage » dans le cerveau et plus généralement de la « biologie
du langage ».
– Le développement de la linguistique informatique et notam-
ment la modélisation de l’évolution des systèmes dynamiques
(dont le langage est un exemple flagrant) ont permis de construire
des scénarios évolutionnaires compatibles avec les découvertes de
l’archéologie préhistorique, en simulant l’interaction entre des
6
Introduction
agents* multiples (représentant un locuteur et son interlocuteur,

ou bien le transmetteur d’un savoir et le récepteur de ce savoir).
– Les progrès de l’éthologie et de la psychologie animale, ainsi
que l’émergence d’une nouvelle science, la biosémiotique*, ont
mis en doute la spécificité humaine de nombreux comporte-
ments. On s’est ainsi aperçu que la distribution des fonctions
cognitives et affectives entre les deux hémisphères du cerveau
humain est partagée par la plupart des primates, et l’étude des
vocalisations de certaines espèces d’oiseaux et de cétacés a révélé
qu’elles peuvent présenter une grammaire et que, loin d’être limi-
tées à des productions stéréotypées et innées, elles peuvent varier
selon le contexte et faire l’objet d’un apprentissage.
Depuis le tournant du xxie siècle, une communauté interdis-
ciplinaire s’est constituée autour de la question de l’origine et de
l’évolution du langage comme faculté psychologique (cognitive
et affective) et des langues comme leur manifestation tangible.
La grande question à laquelle ces chercheurs se sont attelés de
concert est celle du poids respectif du substrat biologique, et
notamment du génome avec l’effet de mutations génétiques sur
les aptitudes linguistiques, et des comportements acquis, qu’il
s’agisse du développement du langage chez les jeunes locuteurs
ou de son évolution dans l’espèce humaine (respectivement
l’ontogénèse et la phylogénèse linguistiques).
Ainsi, une nouvelle discipline a vu récemment le jour, la bio-
logie évolutionnaire développementale (abrégée en Évo-Dévo)
dont l’un des objectifs est de se représenter les modalités et les
phases de l’évolution du langage au cours de la phylogénèse à
partir des observations sur l’acquisition du langage chez l’enfant.
En marge de la biosémiotique évoquée plus haut, une autre
discipline, la biolinguistique, s’est constituée, qui défend la thèse
téméraire selon laquelle une mutation génétique aléatoire aurait
permis à un hominidé, il y a quelque 50 000 ans selon les uns,
200 000 ans selon d’autres, d’acquérir une capacité intellectuelle
7
nouvelle, celle de combiner logiquement des représentations

mentales, capacité qui, transmise à sa progéniture, aurait assuré
à un clan un avantage intellectuel tel que les premiers hommes
dotés de ce cerveau reconfiguré auraient fini par supplanter
toutes les autres sociétés d’hominidés.
Certains chercheurs voient dans cette supériorité intellectuelle
l’un des facteurs qui ont permis à l’espèce Homo sapiens de sup-
planter les néandertaliens dans l’Europe de la dernière glaciation,
alors même que le cerveau de ces derniers était globalement plus
volumineux.
Reste le grand écart entre l’étude de l’origine de chaque
famille de langue séparément et celle de l’origine de la faculté
de langage. Le constat d’un espace béant entre ces deux phases
évolutives, l’une historique, l’autre préhistorique, a laissé la place,
depuis le tournant du xxie siècle, à une vision innovante de la
genèse de ce que les encyclopédistes du xviiie siècle appelaient la
« grammaire générale ». Le propos est cependant complètement
renouvelé : il ne s’agit plus de rechercher dans le latin et le grec
classique des traits grammaticaux susceptibles d’avoir une valeur
universelle, mais de prendre pleinement en compte le caractère
incarné des lexiques, c’est-à-dire la fondation de chacun d’eux
à partir, d’une part, de représentations issues du corps humain
(notamment celle de l’espace en termes de haut, bas, avant,
arrière, gauche et droite) et de ses capacités (par exemple de
mouvement avant, arrière, ascendant ou descendant) et, d’autre
part, de la perception du temps et de la causalité.
Les linguistes spécialistes de la variété des langues ont pu
dégager les voies dominantes de la dérivation des nouveaux mots
grammaticaux à partir des mots lexicaux, ou plutôt des concepts
de base communs aux différentes sociétés et cultures. Cet inven-
taire des voies de la grammaticalisation* permet certainement de
relier l’origine des langues et celle du langage, ce que résume la
figure ci-après.
8
Introduction
TRAITS ± UNIVERSAUX TRAITS PARTICULIERS
lexiques véhiculant ces concepts

concepts universels à travers la variété des langues
voies dominantes inventaire des mots et des

de la dérivation des mots procédés grammaticaux des
grammaticaux diverses langues
constitution des langues à partir

de la combinaison de mots lexicaux
et de procédés grammaticaux
Les chapitres 1 à 5 qui suivent sont centrés sur l’émergence

de la faculté de langage. Ils abordent en premier les conditions
de l’émergence de la parole (chap.1) et le langage en tant que
fonction cognitive (chap.2) dotée d’un substrat génétique
(chap.3), avant d’évoquer en détail divers aspects de la recherche
interdisciplinaire sur la genèse du langage, à savoir les apports de
la psychologie et de l’anthropologie évolutionnaires associés à
des découvertes archéologiques (chap.4), puis ceux de la sémio-
tique*, de la philosophie évolutionnaire et de la modélisation
informatique (chap.5). Le chapitre 6 traite de l’activité de sym-
bolisation, dont le bioanthropologue Terrence Deacon estime
qu’elle permet de définir une espèce indépendamment de tout
critère anatomique actuellement identifiable, Homo symbolicus,
et qui a conduit, sans doute par le processus de sélection relâ-
chée*, à une assimilation génétique.
Les chapitres 7 et 8 portent enfin sur l’origine et l’évolution
des langues. Le chapitre 7 traite de l’origine des classes de mots et
de leurs combinaisons, lesquelles ont graduellement attribué un
statut grammatical aux mots répétés le plus fréquemment. Nous
avons là le chaînon manquant entre la genèse du langage en tant
9
que faculté universelle et la genèse des langues particulières, à

savoir le processus universel par lequel les protolangages* ont
pu donner lieu à de véritables langues structurées. Le chapitre
8 recense, pour conclure, les méthodes qui, depuis le xixe siècle,
ont permis à la linguistique de développer une composante his-
torique et finalement évolutionnaire. Au final, l’épilogue suggère
que la recherche sur les trois niveaux généalogiques, celui de la
parole et de la faculté de langage, celui des mécanismes généraux
de la grammaticalisation et celui de la diversification des langues,
réclame une vision de l’enchaînement de ces processus comme
un monumental système adaptatif complexe*. Seule une telle
perspective permettra de disposer progressivement les pièces du
puzzle qui se laisse formuler ainsi : comment la communication
d’abord orale, puis écrite, diffusée par l’imprimerie et démul-
tipliée à l’infini par la technologie informatique, a-t-elle pu se
dégager de la gangue informe des protolangages et gérer efficace-
ment le triple défi de l’intercompréhension, de la mémorisation
et de l’émergence de la pensée logique ?
Les mots suivis d’un astérisque sont explicités dans

le glossaire qui figure en fin d’ouvrage.
Chapitre 1
L’émergence de la parole
S’interroger sur les conditions et les modalités de l’émer-

gence de la parole dans l’espèce humaine revient à réperto-
rier et à ordonner une série de points d’interrogations : qui ?,
quand ?, où ?, comment ?, pourquoi et pour quoi faire ? Il va de
soi que l’accès direct à des réponses argumentées à ce catalogue
de questions nous est actuellement (et peut-être pour tou-
jours) interdit. Est-ce une raison suffisante pour en faire l’éco-
nomie et se contenter de ce que nous pouvons reconstituer
de l’histoire des langues ? Certaines données empruntées à la
génétique des populations, à l’histoire de la terre et du climat,
à l’anthropobiologie*, à l’étude de l’acquisition de la langue
maternelle (domaine de la linguistique développementale) et à
celle des cultures des dernières populations de chasseurs-cueil-
leurs (un secteur de l’anthropologie culturelle) permettent de
lever un voile du mystère, au risque bien entendu du désac-
cord entre spécialistes sur la valeur des preuves indirectes*
qui peuvent y être appliquées pour l’apparition des premières
vocalisations* assimilables à de la parole.
Qui ?
Les chercheurs s’entendent pour considérer que la parole
n’a pu émerger que dans l’une des espèces du genre Homo.
L’un des arguments pour cette limitation vient de l’observa-
tion de sociétés de chimpanzés et de bonobos : les primatolo-
11
gues1 estiment que si ces grands singes anthropomorphes ne

se communiquent des indications ou des requêtes que par la
gestuelle et limitent leurs vocalisations à l’expression des émo-
tions, c’est parce que l’échange d’informations y est peu utile.
Les individus vivent continuellement en groupe et chacun est
informé de ce que les autres font et sans doute ont à l’esprit,
l’univers social est clos et paisible à condition de respecter les
pratiques de toilettage mutuel. Inversement, les anthropo-
pithèques qui ont quitté la forêt pour pratiquer la chasse dans
la savane et sont devenus omnivores ont développé à la fois des
outils meurtriers et des vocalisations informatives en raison de
leur dispersion dans un environnement où ils ne pouvaient
plus coordonner visuellement leurs mouvements. Quant à la
question subsidiaire (« quelle espèce du genre Homo a pu pra-
tiquer quel type de parole ? »), elle est liée à la suivante.
Quand et où ?
Les bioanthropologues évoquent deux migrations à partir
de l’Afrique à deux époques très distantes l’une de l’autre. La
première est le fait de l’espèce Homo erectus, il y a environ
deux millions d’années, la seconde celle de l’espèce Homo
sapiens il y a environ cent mille ans. C’est l’hypothèse dite out
of Africa ou monocentriste, l’Afrique étant la zone de départ
des deux migrations. Une seconde hypothèse, dite pluricen-
triste, suggère que les Homo erectus dispersés à travers l’Eurasie
ont connu des évolutions analogues ayant engendré différents
groupes d’Homo sapiens. Cette seconde hypothèse est plus spé-
culative, puisqu’elle implique un parallélisme évolutif d’une
probabilité douteuse. Une troisième hypothèse, dite réticu-
lée (soit : en réseau) suggère une hybridation génétique entre
les Homo erectus et néandertaliens résidant en Eurasie depuis
deux millions d’années (et supposés avoir évolué) et les nou-
12 1. Notamment Klaus Zuberbühler de l’université de Neuchâtel.

veaux migrants du genre Homo sapiens. Il est difficile actuelle-

ment de trancher, mais du point de vue linguistique, les deux
premières hypothèses, monocentriste et pluricentriste, entrent
en résonnance avec la question de la monogénèse* ou de la
polygénèse* des langues.
Dans le premier cas de figure, celui de l’apparition de l’es-
pèce Homo sapiens en Afrique entre la première et la seconde
migration (hypothèse monocentriste), les nouveaux migrants
sont censés avoir supplanté les espèces présentes d’Homo pre-
sapiens, notamment les néandertaliens, en raison de leur faculté
d’intelligence individuelle et sociale supérieure. L’hypothèse
de la monogénèse africaine des langues passées et présentes est
alors avantagée.
Dans le second cas, celui de l’apparition dispersée de l’es-
pèce Homo sapiens en Afrique et en Eurasie, la seconde migra-
tion, celle des Homo sapiens africains, aurait eu un impact
linguistique moindre, car on peut supposer que les uns et les
autres avaient déjà dépassé à cette époque le stade du protolan-
gage* et l’hypothèse de la polygénèse des langues, encore élé-
mentaires, des premiers hommes d’Afrique et d’Eurasie gagne
en probabilité. Dans cette hypothèse, il est probable que ces
langues avaient des degrés de grammaticalisation, et donc
d’efficacité variable. Le maniement alternatif de deux langues
grammaticalisées à des degrés divers a été possible dès lors
que les usagers de la première sont parvenus à se rapprocher
intellectuellement de ceux de la seconde pour pratiquer un
jeu analogue sur les concepts, consistant par exemple à passer
du concret à l’abstrait, à comparer un concept superordonné
et un concept subordonné pour choisir entre le premier et le
second, et à construire une représentation mentale complexe
en combinant, hiérarchisant et emboîtant les concepts.
À titre d’exemple élémentaire, si un usager X de la langue L1
plus avancée sur cette voie s’adresse à un usager Y de la langue
13
L2 en employant les mots de L2 pour déclarer : L’orage menace,

Y peut comprendre les mots employés sans savoir que faire
de la combinaison « orage » + « menacer », car pour lui une
menace vient obligatoirement d’un ennemi. Mais si X associe
à cet énoncé une gestuelle et une mimique effrayante, il est
probable que Y pourra associer la représentation des éclairs, du
tonnerre et des inondations avec les signaux iconiques fournis
par son interlocuteur, et pratiquer ainsi une inférence de cet
ordre :
Quand un ennemi me fait peur il menace/il est menaçant
´ OR les orages me font peur
´ DONC un orage qui me fait peur menace
Comment ?
La communication prélinguistique des premiers représen-
tants du genre Homo était probablement constituée de syl-
labes autonomes pointant sur des choses, des personnes et des
lieux et évoquant des événements. Le protolangage avancé des
Homo erectus comportait probablement des chaînes de mots
articulés dans un ordre fixe et significatif. Il pourrait s’agir de
sortes de mots hypercomposés attestés dans les actuelles lan-
gues polysynthétiques2.
Le langage grammaticalisé qui en est dérivé s’est caracté-
risé par l’aptitude à combiner des mots lexicaux (seulement
des noms et des verbes à l’origine) et des mots grammaticaux
(conjonctions, pronoms, déterminants, prépositions et post-
positions) selon des schémas réguliers, et sans doute par l’as-
sociation de sens différents à des groupes syntaxiques consti-
2. Les langues dites polysynthétiques, notamment amérindiennes, pratiquent l’agglutination

de morphèmes* de types divers, lexicaux et grammaticaux, en formant des mots très
complexes susceptibles de correspondre en français à une phrase élémentaire. B.Lee
Whorf (Linguistique et anthropologie, 1969) en donne un exemple en nootka, une langue
amérindienne parlée sur l’île de Vancouver : tlim’sh-ya-‘is-ita-‘iyl-ma (bouill-i-mang-eurs-
aller_chercher-il_fait) qu’il reformule en « il (ou quelqu’un) va chercher (invite) des
14 mangeur de nourriture cuite ».
tués de morphèmes placés dans un ordre différent (c’est, par

exemple, l’origine de la distinction entre l’adjectif épithète et
l’adjectif attribut et entre les voix active et passive3). Le dia-
gramme ci-dessous résume cette évolution :
Communication Émergence de la
prélinguistique* parole sous la forme Langage
(gestuelle chez les d’un protolangage* grammaticalisé*
primates, vocale dénué de grammaire (prérequis pour
chez les cétacés et les (cf. Bickerton, l’automatisation)
oiseaux chanteurs) Tallerman, Wray)
Pourquoi et pour quoi faire ?

L’articulation de signes linguistiques enchaînés de manière
fixe et ordonnés hiérarchiquement de manière complexe a per-
mis de fonder des sociétés aptes à gérer les périls externes venus
des prédateurs (la parole est indispensable à la coordination de
la défense et à la préparation d’entreprises collectives, p.ex. une
migration4), les périls internes en cas de conflit (la langue est un
outil de paix sociale5) ainsi que la distribution équilibrée du pou-
voir (les hommes étant essentiellement occupés à transmettre
leurs gènes, ce sont les femmes qui organisent l’espace social).
Les gestes articulatoires à la source de la parole

La question des conditions de l’émergence de la parole
humaine a donné lieu à deux hypothèses, formulées à un quart
3. Certaines langues, comme le kimbundu, une langue bantoue de l’Angola (citée par Talmy
Givón) forment une voix passive intermédiaire entre les voix actives et passives telles que
nous les connaissons dans les langues européennes, sous la forme d’une construction active
à sujet indéfini combinée à un complément d’agent : Nzua a-mu-mono kwa meme (John
ils-l’ont-vu par moi) ´ John a été vu par moi.
4. Ch. Coupé & J.M. Hombert (2005), « Les premières traversées maritimes : une fenêtre
sur les cultures et les langues de la préhistoire ». J.M. Hombert (dir. : L’origine du langage
et des langues, chap.5), Fayard ; J.L. Dessalles (2000), Aux origines du langage : Une histoire
naturelle de la parole, Hermès Sciences.
5. R. Dunbar (1998), Grooming, Gossip and the Evolution of Language. Harvard University Press. 15
de siècle de distance, qui restent actuellement en concurrence.

La première, émise en 1968, se dit « formaliste et universa-
liste »6, la seconde date du tournant du xxie siècle et se dit
« fonctionnaliste et auto-organisatrice »7.
Selon la première hypothèse, nous disposons dans notre
patrimoine génétique d’une triple prédisposition acquise au fil
de l’évolution de l’espèce Homo sapiens. Nous sommes prêts à :
1. distinguer des traits phonologiques (découverts en 1939
par N. Troubetzkoy)8
2. articuler, dans l’opération de production, des phonèmes
composés d’un bouquet de traits concernant le passage
ou l’obturation de l’air expiré par la bouche ou le nez,
la position des organes phonatoires, l’intervention des
cordes vocales, etc.
3. identifier ces mêmes phonèmes* dans l’opération de
réception.
En fait il semble acquis que ces deux dernières opérations
sélectionnent d’abord des syllabes et dans un second temps les
phonèmes qui les constituent.
La seconde hypothèse, plus récente, fait valoir qu’il n’est
plus nécessaire de s’imaginer les phonèmes et les traits phonolo-
giques comme des axiomes innés. Car ces derniers « émergent
de contraintes antérieures sur la perception, l’articulation et
l’apprentissage, conformément à des principes biologiques
généraux d’auto-organisation » (M. Studdert-Kennedy).
Un exemple emprunté à la chimie permettra de mieux
comprendre l’hypothèse de l’auto-organisation des unités lin-
guistiques. En chimie, deux atomes (plus exactement deux
ions) comme le sodium (Na+) et le chlore (Cl-) se combinent
pour former du chlorure de sodium Na+Cl- (le sel commun).
6. N. Chomsky & M. Halle (1968), The Sound Pattern of English. MIT-Press.

7. P. MacNeilage (2008), The Origin of Speech, Oxford University Press.
16 8. N. Troubetzkoy (1949), Principes de phonologie, Paris, Klincksieck.
Par ailleurs l’ion sodium Na+ se combine aussi avec l’ion HO-
pour former de l’hydroxyde de sodium (la soude caustique),
tandis que l’ion chlore Cl- se combine avec l’ion hydrogène H+
pour former l’acide chlorhydrique H+Cl-.
De même, deux phonèmes comme la consonne occlusive
bilabiale9 sonore [b] et la voyelle centrale ouverte [a] se com-
binent en français dans la syllabe [ba], laquelle peut figurer
dans un mot (ex. BAteau, raBAT) ou constituer un mot (ex. le BAS)
ou un morphème constitutif d’un mot (ex. le contre-BAS), ce
que M. Studdert-Kennedy résume ainsi : « À un certain niveau
les unités retiennent leur intégrité tout en se combinant pour
fournir des structures superordonnées avec des éventails
de fonctions qualitativement différents par rapport à leurs
composants. »
En effet, les usagers du français sont aptes, d’une part, à
opposer d’un côté [ba] et [pa] (le bas ≠ le pas) et d’un autre
côté [ba] et [bô] (le bas ≠ le beau]. D’autre part, ils parviennent
à identifier [ba] comme la première syllabe de bateau ou la
seconde de rabat, [pa] comme la première syllabe de parent
et la seconde de compas, et [bo] comme la première syllabe de
beauté ou la seconde de rabot.
Bien que les trois syllabes [ba, bo, pa] soient immédiate-
ment perçues, dans un contexte approprié, comme des noms
monosyllabiques (bas, beau, pas), cette aptitude à distinguer
les syllabes apparentées à ces mots prouve que l’identité des
deux constituants de rang élémentaire (les phonèmes) est pré-
servée dans la reconnaissance des constituants de rang inter-
médiaire (les syllabes).
Cela prouve aussi qu’à l’échelon supérieur l’identité des syl-
labes est préservée dans la reconnaissance des mots comme le
montre le tableau ci-après.
9. Consonne interrompant le passage de l’air expiré par clôture des deux lèvres . 17
CHIMIE LINGUISTIQUE
+ -
NA CL bas /ba/, bateau /
molécule (chlorure de Q bato/, badaud / mot
sodium) bado/
atome Na (sodium) Q /ba/ syllabe
[b] consonne
occlusive
constituants bilabiale sonore phonèmes
subatomiques
11 protons1 Q
[a] voyelle centrale
ouverte
1- Le nombre des électrons varie en fonction de l’ionisation.
Cette organisation hiérarchique assure que – sauf en cas

d’ambiguïté – les productions imprécises d’un locuteur sont
rangées automatiquement par son interlocuteur dans des classes
structurées de sons linguistiques (des classes de syllabes au niveau
intermédiaire et des classes de phonèmes au niveau sous-jacent).
Selon la première hypothèse formaliste et universaliste, les
constituants primitifs des phonèmes et des syllabes sont les traits
phonologiques supposés innés, alors que selon la seconde,
fonctionnaliste et auto-organisatrice, ce sont les gestes articu-
latoires*, et chez les hominidés l’évolution a sélectionné (sous
la pression de conditions sociales et cognitives complexes) la
« machinerie vocale » la mieux adaptée à l’exécution rapide
des gestes articulatoires, malgré la nécessité de préserver le
fonctionnement primaire d’organes originellement destinés à
l’absorption d’aliments.
L’évolution des structures anatomiques du cerveau a sélec-
tionné les gestes articulatoires de la parole ainsi que d’autres
types de gestes à fonction communicative, notamment ceux
de la main et de la face. Les mammifères, et plus particulière-
ment les primates, ont commencé par développer des applica-
18
tions de la motricité orale à la succion, au léchage, à la mas-

tication et à la déglutition. Ces capacités, qui assuraient déjà
la gestion équilibrée de deux besoins primaires, la respiration
et l’alimentation, étaient le prérequis pour le développement
des gestes phonétiques (par exaptation*). Ainsi la production
des consonnes bilabiales sourde [p] et sonore [b] présuppose
la mobilité des lèvres qui intervient déjà dans l’aptitude innée
à la succion chez les nouveau-nés des espèces de mammifères.
L’évolution a sélectionné dans l’espace phonatoire plusieurs
systèmes moteurs différents sous contrôle cérébral, notam-
ment ceux de l’apex (l’extrémité de la langue), de son tronc, du
voile du palais et du larynx, et chaque geste phonétique résulte
de la combinaison particulière de valeurs de ces différents sys-
tèmes neuromoteurs. Il est probable que leur organisation, par
exemple la répartition généralement symétrique des systèmes
vocaliques entre voyelles antérieures (formées dans la bouche)
et postérieures (formées contre le voile du palais, dans le pha-
rynx et le larynx), s’est graduellement affinée sous l’effet du
mimétisme vocal, lequel a sans doute bénéficié de l’interven-
tion des neurones-miroirs10.
Les sons de la langue forment système

On sait, depuis les expérimentations de Jacques Mehler
dans les années 1980, que, dans un premier temps, les jeunes
enfants sont capables de distinguer de nombreux sons linguis-
tiques qui ne font pas partie du bain linguistique auquel ils
sont exposés. Mais, à partir du moment où ils prennent garde
à cet environnement de productions orales, ils perdent cette
capacité pour se concentrer sur le repérage de chaînes de sons
dotées d’un sens, dans les énoncés qui leur sont adressés ou
dont ils sont témoins, donc des signes linguistiques.
10. Arbib M. (2012), How the Brain got Language : The Mirror system Hypothesis. Oxford
University Press. 19
Pour le locuteur débutant, les sons constitutifs de signes

linguistiques se présentent comme un continuum sans démar-
cations évidentes et impliquant différentes dimensions. Ainsi
pour les consonnes, le passage de l’air expiré peut être inter-
rompu entre les lèvres (/p/, /b/) ou entre la lèvre inférieure
et les dents supérieures (/t/, /d/) ou entre la langue et le voile
du palais (/k/, /g/) ou bien il peut être simplement canalisé
entre les dents (/f/, /v/), entre la langue et les dents supérieures
(/s/, /z/) ou entre la langue et le palais (/६/, /ࣘ/), etc. Chacune
de ces paires de sons se distingue en fonction de l’intervention
(consonnes sonores) ou pas (consonnes sourdes) des cordes
vocales situées dans le larynx. En outre l’air peut être expiré
par le pharynx et le nez, produisant des consonnes nasales
(/m/, /n/, /।/comme dans bagne).
Au fil de leur évolution, les différentes langues tirent parti
de certaines distinctions et en négligent d’autres, ce qui peut
entraîner des difficultés dans l’acquisition d’une seconde
langue, car l’apprenant doit d’abord s’entraîner à discerner
la distinction nouvelle de manière à pouvoir la reproduire.
Un exemple permettra de comprendre comment ce conti-
nuum des productions phonétiques se structure en fonction
des distinctions opératoires, c’est-à-dire qui permettent de ne
pas confondre deux signes linguistiques de sens différent. Le
français distingue par exemple les consonnes fricatives (ou
constrictives, avec canalisation du passage de l’air) sourdes /f/
et /s/ (sans vibration des cordes vocales) fort [fࡢ࢏] ~ sort [sࡢ࢏],
tandis que l’anglais distingue une troisième consonne fricative
sourde /ƻ/ entre ces deux premières : fin (nageoire) /fࡨn/ ~ thin
(fin, adj.) /ƻࡨn/ ~ sin (péché) /sࡨn/.
La figure ci-après représente schématiquement, pour chaque
consonne du français à gauche et de l’anglais à droite, l’espace
flou de leur production (les articulations approximatives, déli-
mitées par un cercle discontinu) et leur valeur focale (l’articu-
20
lation parfaitement distinctive). En français, à moins que le

locuteur souffre d’une défaillance articulatoire (par exemple à
la suite d’une déformation du palais ou dans la période inter-
médiaire entre la chute des dents de lait et la croissance des
dents définitives), la confusion entre /f/ et /s/ est improbable,
car les espaces flous d’articulation des deux consonnes fricatives
n’ont pas de partie commune. En revanche, en anglais /f/ et
/s/ peuvent se confondre avec /ƻ/ si l’espace flou d’articulation
de chacune des trois consonnes est aussi étendu qu’en français
pour /f/ et /s/ en raison de superpositions entre ces espaces.
Ce que représentent les cercles discontinus de la partie droite
de la figure, ce sont donc les espaces flous de /f/, /ƻ/ et /s/,
non pas dans l’usage des anglophones, mais dans l’articulation
et l’audition d’un francophone débutant dans l’apprentissage
de l’anglais. Son entraînement consistera essentiellement à
réduire l’espace flou de chacune des trois consonnes jusqu’à ce
qu’ils ne se recouvrent nulle part, évitant ainsi les confusions
d’abord auditives et ensuite articulatoires.
français anglais
/f/ /s/ /f/ /T/ /s/
Les phonéticiens identifient une succession de points

d’articulation des sons linguistiques. Si le flux d’air expiré
est interrompu, la consonne est dite occlusive (ou plosive),
s’il est étroitement canalisé, la consonne est dite fricative, s’il
l’est moins étroitement, on est en présence d’une semi-voyelle
(/w/, /j/ en français comme dans oie /wa/ et ail /aj/). Enfin si le
canal est largement ouvert, c’est une voyelle qui est produite.
21
La figure11 ci-dessous, qui représente la vue du côté droit de la

partie orale de l’espace phonatoire, identifie six points d’arti-
culation supérieurs concernant la lèvre supérieure, la dentition
supérieure et l’espace alvéolaire, derrière les dents, la voûte du
palais, son voile et son extrémité postérieure, la luette, allant
des propriétés labiales à gauche aux uvulaires (formés au niveau
de la luette) à droite, et quatre points d’articulation inférieure
concernant la lèvre inférieure, la dentition inférieure et les
trois composantes de la langue, son extrémité (l’apex), son dos
et sa racine, ce qui distingue des localisations labiales, apicales,
dorsales et radiales.
Les points d’articulation

1 labiales Cavités nasales
2 dentales dents incisives limite du
supérieures os
palatal palais dur et
3 alvéolaires palatum du voile
dur
4 palatales alais ve
lèvre
éo
le p voile lum
supérieure v ûte pa ( d
5 vélaires al v o
4
l ati p alaisu palais
ne mou
3 )
6 uvulaires pointe de la 1 2 Cavité buccale (orale)
luette
langue (apex) 5
d os de la lan gue (do 6
1 rsum
lèvre 2 )
inférieure 3
4
dents incisives
Cavité pharyngale
langue (radix)
racine de la
inférieures
1 labiales
2 apicales
3 dorsales
4 radiales
Pour les consonnes postérieures, on se contente de noter

l’articulation supérieure, car la mobilité de la langue est limi-
tée : une articulation palatale implique le dos de la langue
et une articulation uvulaire implique sa racine. Pour les
22 11. Source : http://w3.uohprod.univ-tlse2.fr/UOH-PHONETIQUE6LE/

consonnes antérieures en revanche, on note les deux points

d’articulation supérieure et inférieure. Ainsi, en français /p/ et
/b/ sont des consonnes bilabiales (interrompant le flux de l’air
expiré entre les deux lèvres) et les consonnes fricatives /f/ et /v/
sont labio-dentales, c’est-à-dire que le flux de l’air est canalisé
entre la lèvre inférieure et les dents supérieures, avec vibration
des cordes vocales pour /v/ et sans vibration pour /f/.
Question : découle-t-il de cette multiplicité de points
d’articulations et de traits distinctifs complémentaires que les
systèmes de consonnes, voyelles et semi-voyelles des langues
du monde présentent une variété infinie de composants et de
combinaisons de ces composants ? Il est vrai que l’alphabet
phonétique international répertorie une foule de sons linguis-
tiques aptes à distinguer les signes linguistiques à travers la
variété des langues. Cependant des chercheurs ont pu mettre
en évidence certaines propriétés universelles de ces systèmes.
Le groupe de recherche « Communication parlée » du CNRS
basé à Grenoble a notamment dégagé les propriétés de réparti-
tion des voyelles dans les systèmes vocaliques de plusieurs cen-
taines de langues modernes. Il est à noter que bien que l’espace
de production des voyelles soit représenté sous la forme d’un
trapèze renversé, dans tous les systèmes représentés, seule la
position centrale de la base est occupée. Le /a/ y occupe donc
toujours la position centrale, c’est la voyelle la plus ouverte.
Comme la forme de base d’où dérivent tous les autres sys-
tèmes est un triangle isocèle disposé sur la pointe, on constate
que le premier système dans toutes les configurations – à l’ex-
ception de la dernière à neuf voyelles – regroupe une propor-
tion plus importante de langues. Les systèmes à cinq voyelles
représentent le meilleur équilibre avec 134 langues et parmi
celles-ci le premier système en regroupe 65,7%, soit 88 lan-
gues sur un total de 451 (environ 1/5).
23
Les chercheurs de Grenoble ont donc raison de parler de

tendances universelles : il va de soi que toutes les langues du
monde ne peuvent pas avoir convergé vers un seul système voca-
lique, mais elles l’ont clairement fait selon un même principe
génératif constitué d’un triangle vocalique de base occupant
tout l’espace : /i/ (voyelle fermée antérieure), /u/ (voyelle fermée
postérieure) et /a/ (voyelle centrale ouverte) et d’un enrichis-
sement interne affectant symétriquement la partie antérieure
(entre /i/ et /a/) et la partie postérieure (entre /u/ et /a/)12.
i y \ u
nombre de
nombre de
I U
e o Les propriétés des différents
voyelles
langues
e { o systèmes vocaliques
E. O
7
C’est le système vocalique le plus simple

avec trois voyelles /i/ - /a/- /u/ réparties aux
3 20 extrémités de l’espace disponible et donc
parfaitement symétrique entre la partie
60 antérieure et la partie postérieure.
Ce système à quatre voyelles présente une

organisation intermédiaire entre le précédent
4 32
et le suivant avec une asymétrie au profit de
la partie antérieure (le /e/ fermé).
37.5
Dans le principal système à cinq voyelles,

l’équilibre est rétabli avec le /o/ occupant
5 134
la position symétrique du /e/ dans la partie
postérieure.
65.7
12. Le tableau ci-dessous est un fragment du tableau 5 de N. Vallée, L.J. Boë et

M. Stefanuto (1999) « Typologies phonologiques et tendances universelles. Approche
substantialiste » https://linx.revues.org/863
Le chiffre en bas à droite de chaque figure indique la proportion des langues corpus répar-
24 tissant les trois à neuf voyelles de cette manière.
Le premier système à six voyelles est

6 72 analogue au système précédent avec l’ajout
du e muet, le schwa1 /ࡦ/.
30.6
Le principal système à sept voyelles est

parfaitement symétrique avec l’ajout du
7 49
e ouvert /Ƹ/ à l’avant et du o ouvert /ࡢ/ à
40.8 l’arrière.
Le premier système à huit voyelles résulte

de la combinaison des deux systèmes
8 34 précédents : il a la même organisation de base
que le système à sept voyelles en y ajoutant le
17.6 schwa /ࡦ/ du système à six voyelles.
Enfin le premier système à neuf voyelles

enrichit à nouveau les deux parties avant et
9 35 arrière par l’ajout de deux variantes moins
fermées respectivement du /i/ à l’avant et du
20 /u/ à l’arrière.
1. Schwa, en hébreu, désigne le vide. En linguistique, il désigne une voyelle neutre, qui peut,
à l’occasion, être négligée (comme dans « sam’di »).
Les mouvements cycliques de la mâchoire ont

produit des syllabes
Dans les années 1960, avec l’ouvrage de référence de Noam
Chomsky et Morris Halle sur les patrons phonologiques de
l’anglais13, la phonologie, dédiée aux différents systèmes orga-
nisant les sons linguistiques sélectionnés par chaque langue, a
pris un caractère formel, calculatoire et dénué de perspective
évolutionnaire. À partir des années 1990, une nouvelle géné-
ration de phonologues investis dans les sciences cognitives,
13. N. Chomsky & M. Halle (1968), op.cit., note 6. 25

notamment Michael Studdert-Kennedy et Peter MacNeilage,

ont plaidé au contraire en faveur d’une réorientation évolu-
tionnaire de la phonologie. Cette entreprise, qui vise à réin-
tégrer la phonologie dans le champ des sciences cognitives, se
dit conforme à « l’intuition normale que la parole a évolué du
simple au complexe au lieu d’avoir développé instantanément
la forme mentale qui est aujourd’hui à sa base » (MacNeilage,
critiquant Chomsky & Halle et l’école dite de « phonologie
générative »).
Ces chercheurs entendent démontrer que la syllabe a évolué
à partir de contraintes affectant les mouvements de la mâchoire
dans les activités primaires liées à l’absorption des aliments :
la mastication, la succion et le léchage. Les consonnes et les
voyelles sont nées de « l’alternance rythmique générée par les
mouvements d’élévation et de dépression de la mâchoire ». Le
babil du jeune enfant est constitué d’alternances entre l’ouver-
ture et la fermeture de la bouche, lesquelles produisent des
articulations qui préfigurent les syllabes. Les chercheurs ont
observé que l’acquisition de la parole passe successivement par
deux stades de développement.
Le premier est celui des « cadres » (frame stage) : l’apprenti
locuteur cadre le format syllabique des futurs sons linguis-
tiques (prioritairement CV : consonne-voyelle).
Le second est celui de l’association des cadres à des conte-
nus (frame-content stage) : l’inventaire des sons s’accroît, l’en-
fant acquiert la capacité d’enchaîner les syllabes et les premiers
mots sont créés.
Ce faisant, conformément à l’hypothèse défendue par le
biologiste allemand Ernst Haeckel en 1867, le jeune enfant
semble récapituler la genèse des syllabes au cours de l’évolu-
tion de l’espèce. Dans sa forme actuelle, cette hypothèse est
au moins partiellement innéiste : le mécanisme à la base de la
production des syllabes ferait partie de notre patrimoine géné-
26
tique, car les patterns de formation des syllabes observés dans

le babil se révèlent plus universels que les formats syllabiques
rencontrés dans les langues et ils ne peuvent donc pas être
appris à partir de l’environnement.
Quatre fonctions de l’espace oral se sont successivement
cumulées au fil de l’évolution du vivant. Les deux premières
sont la fonction d’absorption des aliments et celle de respira-
tion. Chez les mammifères, il s’y ajoute la fonction phonatoire,
concernant la production de vocalisations émotives et infor-
matives. Jusqu’aux primates supérieurs, le larynx est structuré
de manière à empêcher les aliments de prendre la direction
des bronches, mais la descente du larynx – caractéristique de
l’espèce humaine, mais qui ne touche le jeune enfant qu’à
partir de la phase du babil – a permis l’articulation des sons
linguistiques par un processus dit d’exaptation* (l’espace de la
bouche, du pharynx et du larynx est exploité pour l’exercice
de la fonction surajoutée), dont l’un des effets délétères est
1 fonction
1 fonction
communicative
2 fonctions vitales impliquant communicative
chez les seuls
le larynx chez tous les animaux chez tous les
humains liée à la
mammifères
descente du larynx
Æ Æ Ä Æ Ä Æ
ALIMENTAIRE RESPIRATOIRE PHONATOIRE ARTICULATOIRE

(par la voie de (par la voie de la (production (production de syllabes
l’œsophage) trachée-artère) de vocalisations destinées à véhiculer
exprimant des affects des contenus)
et attirant l’attention
des congénères)
Les trois systèmes de contrôles moteurs à l’origine

de la création des premières syllabes
27
le risque nouveau de s’étrangler, c’est-à-dire de laisser passer

des bribes d’aliments dans la trachée-artère. Le schéma page
précédente résume cette évolution. Les quatre fonctions repré-
sentées sont générées par des systèmes cérébraux de contrôle
moteur et les trois systèmes de contrôle respiratoire, phona-
toire et articulatoire représentent trois stades évolutifs qui ont
permis la création des premières syllabes.
Les premiers hommes faisant usage de la parole ont donc
réussi à combiner au mieux les trois fonctions respiratoire,
phonatoire et articulatoire. Le facteur constant est resté une
propriété biomécanique fondamentale, l’inertie, laquelle a
modelé les relations entre consonnes et voyelles constitutives
de la syllabe. Le système articulatoire contrôle l’aptitude de
la mâchoire à produire des cycles alternant les voyelles et les
consonnes. MacNeilage considère que ce système est aussi
ancien que le système phonatoire (de production de vocali-
sations) mais qu’il n’est devenu intéressant pour la commu-
nication que lorsque nos ancêtres primates ont développé la
communication visuofaciale, soit la production et la compré-
hension des mimiques.
La première exploitation de ce système qui se destinait
spécifiquement à la parole a consisté à regrouper le système
articulatoire et les deux autres systèmes préalables pour obte-
nir les protosyllabes. Le cycle universel consonne-voyelle est
constitué d’une phase de constriction de faible amplitude
(une consonne) et d’une phase de haute amplitude dénuée de
constriction (une voyelle). Il est présent dans toutes les lan-
gues et domine le processus d’acquisition de la parole dès son
apparition.
À l’origine (dans le développement linguistique des locu-
teurs en devenir et par hypothèse dans l’évolution humaine)
la syllabe, base du système de codage de la parole, a pu être
étendue dans le temps et donc fortifiée par son redoublement.
28
Les syllabes successives tendent à être identiques dans le babil,

et par hypothèse dans la genèse de la parole, parce que le
mécanisme de contrôle neuronal réclame plus d’un cycle de la
même alternance basique de fermeture-ouverture de la bouche
(par exemple [ba]), ce qui est réalisé par un cycle additionnel à
deux phases d’oscillation de la mâchoire ([ba-ba])14.
Ultérieurement, chez le jeune locuteur et dans la phylo-
génèse, le redoublement syllabique a largement laissé place à
l’enchaînement de syllabes différentes parce qu’il était néces-
saire de véhiculer un nombre plus important de notions et de
relations entre celles-ci. Deux voies se sont alors ouvertes.
D’une part, la création de mots enchaînant deux syllabes.
Ainsi, pour les langues sémitiques, notamment l’arabe et l’hé-
breu, certains auteurs supposent que l’ossature consonantique
de base était simplement C1_C2 (avec une variété de voyelles
disposées entre ces deux consonnes), une structure susceptible de
véhiculer un petit nombre de notions, et qu’elle s’est étendue à
l’ossature classique en C1_C2_C3 pour véhiculer un nombre plus
conséquent de notions.
D’autre part, l’invention des tons, une même syllabe CV
pouvant être prononcée selon différentes structures tonales : en
intonation haute, basse, médiane, montante, descendante, etc.,
comme dans la plupart des langues dites isolantes (celles qui ne
distinguent pas entre morphèmes lexicaux et grammaticaux et
ne les combinent pas dans des mots complexes), notamment le
chinois et de nombreuses langues d’Asie du Sud-Est.
La théorie de MacNeilage s’articule à celle du remplace-
ment du toilettage par le commérage entre les espèces Homo
primitives et les premiers Homo sapiens, défendue par Robin
Dunbar et sur la thèse, soutenue par Merlin Donald, de l’ap-
plication de l’aptitude mimétique générale des primates supé-
14. On observe un processus analogue dans la création de mélodies, qui s’appuie fréquemment
sur la répétition de thèmes aisément mémorisés. 29
rieurs à la production de chaînes de protosyllabes (voir plus

loin). Dans ces trois visions, l’émergence de la parole n’est pas
vue comme une évolution biologique. L’appariement entre les
concepts et les cadres structurant les syllabes pour créer les
premiers mots a été une invention sociale et les systèmes pho-
nologiques combinatoires se sont constitués sous une pression
socioculturelle, celle de diversifier les briques des messages
pour rendre ceux-ci plus informatifs. Au-delà des gènes, indi-
rectement à la source des systèmes de contrôle moteur et de
leur intégration graduelle, ce sont les mèmes (ces facteurs de
réplication et d’interaction culturelle suggérés par l’étholo-
giste anglais Richard Dawkins) qui ont piloté l’émergence de
la parole, dès lors que les cadres syllabiques sont devenus aptes
à véhiculer des contenus.
La parole dérive-t-elle du geste ?

La question de l’origine gestuelle (donc externe ou bimo-
dale) ou vocale (donc interne ou unimodale) de la communi-
cation orale ne peut pas être négligée, car si certaines espèces
d’animaux ont un mode de communication vocal (les unes
proches de l’espèce humaine sur le plan comportemental
comme les cétacés, d’autres très éloignées comme les oiseaux
chanteurs), ce n’est pas le cas des grands singes anthropo-
morphes (chimpanzés, bonobos, gorilles et orang-outans) chez
lesquels la communication d’informations passe essentielle-
ment par la gestuelle, leurs vocalisations étant consacrées en
priorité à l’expression des affects (colère, peur, chagrin, etc.).
La thèse la plus largement répandue, et à laquelle sous-
crivent généralement les représentants de la psychologie et de
l’anthropologie évolutionnaires, est que la communication
gestuelle est la source du mode de communication multimo-
dal des hommes, qui combine (dans des proportions variables
selon les cultures) les différents modes de l’oralité, de la ges-
30
tuelle et de l’expression faciale15.

L’argumentation de Michael Corballis en faveur de l’origine
gestuelle de la communication orale repose sur l’idée de deux
contrôles successifs de la capacité gestuelle des hominidés.
Le premier contrôle a porté sur les gestes manuels dès lors
que la bipédie l’a emporté sur la quadripédie. Dès cette époque
la communication « dyadique » entre les interlocuteurs a pu
laisser place à une communication « triadique » déclarative et
référentielle (théorie développée par M. Tomasello, voir plus
loin) impliquant, outre les interlocuteurs, le référent du dis-
cours sur lequel pointent le regard et la main.
Le second contrôle a été celui des gestes articulatoires, qui
a profité de l’évolution du tractus phonatoire (notamment
l’abaissement du larynx qui a permis la diversification des sons
vocaliques et la différenciation entre consonnes sourdes et
sonores). Comme d’autres et particulièrement A. Leroi-Gou-
rhan bien avant lui, Corballis voit dans la révolution techno-
logique et artistique néolithique (autour de -50 000 ans) la
preuve de l’affirmation de la modalité vocale, après une longue
période, évaluée à plus de 150 000 ans, de combinaison équi-
librée des deux modalités. Dans cette vision, « la transition
entre les gestes visuels et les gestes vocaux a été graduelle et
pour une grande part de notre histoire évolutionnaire le lan-
gage a été à la fois visuel et vocal » (Corballis).
Corballis n’exclut pas l’hypothèse, proposée par Derek Bic-
kerton et développée par Chomsky, d’un ajustement final de
ce contrôle à la suite d’une mutation du gène FOXP2. La cor-
rélation est très probable entre le développement du langage
vocal et celui de technologies qui ont permis la fabrication
d’outils et d’armes et la conquête du monde à partir du ber-
ceau africain, mais quelle est la cause et quel est l’effet ?
15. Notamment J.Vauclair, T. Givón, M.Corballis et R.Dunbar. 31

Corballis livre une observation sur l’acquisition des apti-

tudes cognitives de l’enfant susceptible d’éclairer l’origine
commune des deux facultés : l’habileté dans les jeux de con-
struction apparaît au même stade développemental que celle à
former les premières phrases. Il se peut que la mutation d’un
gène favorisant la fusion entre deux idées séparées et leur mise
en perspective par rapport aux trois coordonnées du locuteur
(je, ici, maintenant) ait été l’ajustement final qui a permis à la
parole d’acquérir son autonomie en libérant les mains pour le
développement de technologies nouvelles. Les opérations de
la pensée ont acquis un caractère récursif* par rattachement
entre propositions (par exemple, 1[je sais que 2[tu sais que 3[j’ai
menti]]]), ou entre désignations de personnes ou de choses,
par exemple [c’est 1[la maison 2[à gauche 3[au bout 4[du che-
min]]]]) et la récursivité des groupes syntaxiques n’en serait
que le reflet.
Effectivement, la fabrication d’artefacts, d’outils et d’armes
impliquait une hiérarchisation des gestes techniques en buts
et sous-buts, ce que Leroi-Gourhan appelait la « chaîne opéra-
toire ». Par exemple, pour chasser de gros gibiers, il fallait sélec-
tionner des armes adaptées, réunir un groupe de chasseurs, les
répartir dans l’espace pour rabattre le gibier, emporter les silex
appropriés pour la découpe du gibier, les manier de manière
experte, etc. Les mains étant de plus en plus impliquées dans
la fabrication et le maniement des outils, la mobilité faciale
devenait une nécessité impérative et Corballis suppose que les
participants à ces entreprises collaboratives ont acquis l’aptitude
à reconstituer, à partir du signal sonore, les gestes articulatoires à
fonction informative de leurs congénères et à les reproduire. En
se livrant simultanément à des tâches manuelles et à des actes de
communication orale, les premiers hommes pratiquaient donc
32
une forme élémentaire de la division du travail16.

La thèse de Corballis est confortée par Jacques Vauclair
et Hélène Cochet, deux psychologues évolutionnaires qui se
fondent sur des études d’imagerie cérébrale selon lesquelles
les deux modes de communication gestuelle et linguistique
sont pilotés l’un et l’autre par l’hémisphère cérébral gauche.
Ils voient dans la localisation adjacente des centres de pilotage
des comportements manuels et vocaux le facteur qui a permis
au contrôle de la parole de se développer17.
De leur côté, les représentants de la phonologie évolu-
tionnaire privilégient une césure entre ces modes de com-
munication18 à partir d’une triple constatation. D’abord,
Michael Studdert-Kennedy partage avec Corballis et Vauclair
la conviction que « les spécialisations vocale et manuelle de
l’hémisphère cérébral gauche sont probablement antérieures
à l’évolution des hominidés ». Mais, selon Peter MacNeilage,
les modalités d’acquisition des langues signées pratiquées par
les sourds ne constituent pas un stade préalable à la genèse
du langage oral. Enfin, pour l’un et l’autre, l’émergence de la
parole est le résultat d’une exaptation : à force de mâcher, de
déglutir et de lécher leurs aliments, les premiers hommes ont
développé un contrôle expert d’organes (les lèvres, les dents,
le corps et la pointe de la langue, le voile du palais, les cordes
vocales) qui ont trouvé un deuxième emploi dans la produc-
tion de sons vocaliques, consonantiques et semi-vocaliques
16. Cf. J. Vauclair et H. Cochet (2013), « Speech-gestures links in the ontogeny and
phylogeny of gestual communication » in R. Botha & M. Everaert (eds.), The Evolutionary
Emergence of Language - Evidence and Inference, Oxford University Press.
17. Dans un entretien avec L. Testot (J.-F. Dortier, dir. Révolution dans nos origines,
Éd. Sciences Humaines), Jean-Michel Hombert et Gérard Lenclud défendent une vision
similaire : « … chez les chimpanzés l’émission de gestes communicatifs, répondant à de
véritables intentions communicatives, est contrôlée par les régions cérébrales qui sont les
précurseurs de celles qui, chez nous, contrôlent l’usage du langage articulé… les gestes du
chimpanzé seraient donc l’homologue des mots humains ».
18. Notamment P. MacNeilage (2012), op.cit., note 7. 33
susceptibles de se distinguer suffisamment pour former des

systèmes de sons linguistiques (les phonèmes, les syllabes, les
tons et les jeux d’intonations).
5
Dans ce premier chapitre nous avons commencé par le
début, à savoir l’échange de sons assumant une fonction com-
municative primitive (attirer l’attention d’un congénère sur
une chose ou un événement, prévenir d’un danger, etc.) dans
les premières populations de l’espèce Homo sapiens, supposées
aptes à manier des symboles individuellement et collective-
ment. Ces échanges n’ont été efficaces qu’à partir du moment
où les communicants ont tous disposé d’un même inventaire
de morphèmes, eux-mêmes constitués de combinaisons de
phonèmes reconnus comme identiques. À partir de la répéti-
tion de plus en plus ressemblante de ces briques primaires, des
systèmes de phonèmes et de morphèmes ont pu entrer dans la
mémoire de ces populations et leur permettre de se construire
sur les deux plans cognitifs et social. Ce processus représente
la transition entre la parole et le langage : la parole satisfait
les besoins élémentaires de l’équilibre social du groupe, mais
elle ne permet pas à elle seule de construire l’image collective
abstraite du groupe, sa culture, avec son savoir partagé, ses
conventions, ses rites et ses mythes. Il est donc temps de passer
de la parole au langage, avec son substrat cognitif décisif : la
catégorisation.
Chapitre 2
Les conditions cognitives
de la genèse du langage
Il y a une vingtaine d’années, John Maynard-Smith et

Eos Szathmáry, deux chercheurs réputés en biologie évolu-
tionnaire, ont publié un ouvrage consacré à leur théorie de
l’évolution, qui répertorie une succession de huit « transitions
majeures »1 :
1 de la réplication des molécules aux populations de molécules com-

partimentées
2 des réplicateurs indépendants aux chromosones
3 de l’acide ribonucléique sous forme de gènes et d’enzymes à l’ADN
accompagné de protéines (le code génétique)
4 des procaryotes aux eucaryotes
5 des clônes asexués aux populations sexuées
6 des protistes à la différenciation cellulaire des animaux, des plantes
et des champignons
7 des individus solitaires aux colonies (des castes non reproductives)
8 des sociétés de primates aux sociétés humaines (par le langage)
Les trois premières transitions relèvent de la biochimie et

de la biologie moléculaire et elles touchent les origines de la
vie. La quatrième concerne l’émergence des eucaryotes à par-
tir des procaryotes. Les premiers sont des « microorganismes
composés d’une ou de plusieurs cellules dont le noyau est
1. J. Maynard-Smith & E. Szathmáry (1995), The major transitions in evolution, Oxford

University Press. Leur chap.17 est consacré à l’origine du langage. 35
dépourvu de membrane et ne contient qu’un seul chromo-

some2 », les seconds sont définis comme des « organismes
dont la ou les cellules sont composées d’un noyau vrai, déli-
mité par une membrane nucléaire, de plusieurs chromosomes,
d’un nucléole et d’organites intracytoplasmiques de structure
complexe ». Les eucaryotes se subdivisent en fonction de
leur reproduction asexuée ou sexuée (5e transition) et de leur
organisation unicellulaire ou pluricellulaire (6e transition), la
7e accorde une place particulière aux animaux vivant en colo-
nies et dont la fonction de reproduction est assumée par une
« reine » (les fourmis, termites et abeilles notamment) et la
dernière concerne la spécification des sociétés humaines parmi
les sociétés de primates sur la base du langage, c’est celle qui
nous intéresse ici.
Toutefois, en amont de cette dernière transition que
Maynard-Smith et Szathmáry présentent comme essentielle-
ment linguistique, Marco Barbieri, chercheur en biosémio-
tique*, fait valoir que certains animaux ont développé l’apti-
tude à interpréter ce qui se passe dans le monde autour d’eux,
et que ce savoir-faire est une véritable innovation évolution-
naire. Les animaux en question sont ceux qui sont aptes à se
représenter le monde environnant3, ce qui suppose un réseau
de neurones multicellulaires. On peut donc considérer que
l’émergence de tels réseaux de neurones constitue aussi une
transition évolutive majeure, car les plantes, les champignons
et ceux des animaux qui en sont dénués n’ont qu’un rapport
élémentaire avec leur environnement, alors que ceux qui en
sont dotés pratiquent de véritables échanges de signes, ces
2. Les définitions de cette section sont empruntées au dictionnaire de terminologie de l’Office

Québecois de la Langue Française (gdt.oqlf.gouv.qc.ca).
3. Éventuellement de manière extrêmement fruste comme dans le cas de la tique dont le
biologiste balte Jacob von Uexküll a montré au début du xxe siècle que la capacité de
représentation se limite au repérage olfactif de l’acide butyrique des mammifères dont elle
36 perce la peau pour se repaître de leur sang.
Les conditions cognitives de la genèse du langage
échanges constituant le domaine d’étude de la zoosémiotique.

Nous verrons dans le chapitre suivant que les biolinguistes
assimilent la transition vers le langage à l’acquisition, à la suite
d’une mutation génétique, d’une nouvelle faculté calcula-
toire, à savoir l’aptitude à associer des concepts pour former
des représentations mentales complexes. Les individus dotés
de cette nouvelle aptitude sont supposés avoir bénéficié d’un
avantage écologique et social si considérable que leur progéni-
ture a pu éliminer progressivement ceux qui en étaient dénués.
De leur côté, la plupart des anthropologues évoqués plus
loin dans le chapitre 4 (notamment Robin Dunbar) attribuent
à cette transition une cause essentiellement numérique. Ils
considèrent qu’elle a résulté de la taille accrue des premières
sociétés humaines, elle-même causée par la nécessité de se pro-
téger collectivement à la suite de l’abandon de l’habitat arbo-
ricole. Ce changement d’échelle aurait obligé les hominidés
à remplacer le toilettage mutuel, facteur décisif de cohésion
sociale qui n’était praticable que dans des groupes de taille
réduite, par le commérage, ce qui revient à considérer que la
fonction du nouveau langage était d’abord de préserver la paix
sociale en échangeant des représentations et en partageant des
affects.
Jean-Louis Dessalles quant à lui associe les deux aptitudes,
cognitive et interlocutoire. Il voit dans le langage un outil poli-
tique, un moyen de faire émerger des chefs capables de fédérer
le groupe avec leur discours à la fois informatif (par leur supé-
riorité cognitive) et persuasif (par leur don argumentatif )4.
En tout état de cause, l’accord semble général sur l’impor-
tance de l’acquisition de la double aptitude à construire des
représentations complexes et à les faire partager à des congé-
nères par un discours argumenté.
4. J.-L. Dessalles J (2000), Aux origines du langage : Une histoire naturelle de la parole, Hermès-
Sciences. 37
Cependant, il faut plutôt voir cette transition comme

une étape intermédiaire entre deux innovations. En amont,
c’est l’acquisition de l’aptitude à échanger des signes, qui est
caractéristique des animaux dotés d’un réseau de neurones
approprié, et celle de l’aptitude à calibrer des sons linguis-
tiques susceptibles de se combiner en signes linguistiques. En
aval c’est l’invention des systèmes d’écriture qui ont permis,
comme l’évoque Robert Logan, de bâtir une mémoire externe,
partagée et constamment consultable. Les divers procédés de
conservation des événements et des savoirs ont été un trem-
plin pour l’invention de l’imprimerie, de la communication
électronique et de l’internet, ce que résume le schéma ci-après.
Penser le monde avant et avec le langage

Il n’est pas très original de dire que la pensée et le langage
sont indissociables, mais il faut aller plus loin, et tâcher de
comprendre comment l’opération de catégorisation prélin-
guistique, en premier lieu celle des stimulus visuels, auditifs et
olfactifs, a changé de dimensions quand, par le langage, elle a
pu acquérir un format stable et reproductible entre l’esprit du
locuteur et celui de son interlocuteur.
Un langage structuré présuppose un jeu de catégories que
chaque langue met en œuvre de manière propre. Dans l’hypo-
thèse dite relativiste, élaborée par Wilhelm von Humboldt au
début du xixe siècle et développée au xxe par Edward Sapir,
Franz Boas et Benjamin Lee Whorf, ces catégories sont mode-
lées par la vision du monde (Weltanschauung chez Humboldt)
qui sous-tend chaque langue. Dans l’hypothèse opposée, dite
universaliste, et dont l’idée remonte à la Grammaire de Port-
Royal (1660), les catégories procèdent d’un mode de pensée
partagé par toute l’espèce humaine.
A priori, l’apprenti locuteur qui n’a pas encore pris
conscience de l’organisation de la langue pratiquée dans son
38
TRANSITIONS ANTÉRIEURES
(cf. J. Maynard & E. Szathmary)
Æ
TRANSITION SÉMIOTIQUE
(Th. Sebeok, M. Barbieri)
Acquisition de l’aptitude à se représenter le monde ambiant
et à échanger des signes
Æ
TRANSITION PHONOLOGIQUE
(Ph. Lieberman)
Aptitude à exploiter l’espace oral, le pharynx et le larynx
pour produire des sons calibrés
Æ
TRANSITION LINGUISTIQUE
(N. Chomsky, D. Bickerton)
Aptitude à associer des concepts en représentations complexes
et à les communiquer par un système linguistique
(combinaison de morphèmes et de syntagmes)
Æ
TRANSITION GRAPHIQUE
(R. Logan)
Invention des systèmes d’écriture
pictographiques > idéographiques > phonographiques
Æ
TRANSITIONS POSTERIEURES
(M. Mac Luhan, R. Logan)
Invention de l’imprimerie à caractères mobiles,
de la communication électronique et de l’internet
entourage doit disposer d’un socle élémentaire de catégories

conceptuelles prélinguistiques qui lui permettent de se repé-
rer dans son environnement. On peut citer les trois catégories
successives de l’esthétique transcendantale de Kant : l’espace,
puis le temps et enfin la causalité. Mais comment ces caté-
39
gories prélinguistiques s’articulent-elles avec celles que les

langues ont progressivement mises en avant ? J’évoquerai ici
brièvement quatre approches complémentaires de l’aptitude
spécifique du cerveau humain à catégoriser le monde ambiant
et à construire des représentations abstraites.
La catégorisation prélinguistique chez le jeune enfant5

J’évoquerai en premier lieu un jeu d’expériences de Harriet
Jisa, psycholinguiste à l’université de Lyon, destiné à discrimi-
ner la part du prélinguistique dans la capacité de catégorisa-
tion des jeunes enfants. Harriet Jisa fournit une liste – établie
à partir de multiples expériences sur l’acquisition du langage
– d’aptitudes des enfants appartenant à la classe d’âge que les
psychologues anglophones désignent comme infant (du latin
infans, « qui ne parle pas encore »). Les infants se révèlent en
fait déjà aptes « à conceptualiser la permanence des objets, à
classer les objets en catégories, à établir des relations de causa-
lité ou à relier des objets dans le cadre d’un même événement ».
La tâche que l’infant a encore à accomplir, c’est celle de faire
concorder les catégories conceptuelles prélinguistiques, par
exemple celle d’« objet sphérique qui tient dans la main », et
les signes linguistiques employés par son entourage, en fran-
çais balle ou boule, pour identifier l’objet sphérique qu’il tient
dans sa main comme une balle ou une boule en fonction de
son poids, de son aspect et de son élasticité.
Parmi les propriétés d’un objet physique, la forme et la
matière donnent lieu à des classes morphologiques diverses
selon les langues, notamment celles qui ont des classifica-
teurs*. Harriet Jisa évoque une expérience qui a porté sur l’ac-
tivité de catégorisation d’adultes parlant l’anglais ou le yucatec
(une langue maya du Mexique) et d’enfants en train d’acqué-
5. H. Jisa (2003), « L’acquisition du langage – Ce que l’enfant nous apprend sur l’homme ».
40 TERRAIN – Anthropologie et sciences humaines 40.
rir l’une ou l’autre de ces deux langues. Le yucatec réfère à un

objet à l’aide de la combinaison d’un mot lexical désignant
la matière et d’un mot grammatical (un classificateur) dési-
gnant l’appartenance à une classe de formes d’objet, évoquant
par exemple pour une bougie : [long et mince]classificateur + [en
cire]nom.
On demande d’abord aux deux premiers groupes de sujets
adultes pratiquant uniquement l’anglais ou le yucatec (groupes
A+ et Y+), de classer des objets : les premiers les classent de
préférence en fonction de la matière et les seconds en fonction
de la forme. Puis on en fait autant avec quatre groupes d’en-
fants selon le même critère que précédemment croisé avec une
différence d’âge entre des enfants âgés respectivement de sept
ans et neuf ans. On désignera ces groupes comme A7, A9, Y7
et Y9. Il ressort de l’expérience que les deux groupes les plus
jeunes, A7 et Y7, classent les objets de manière analogue. En
revanche, les groupes A9 et Y9 les classent différemment, tout
comme le font les adultes parlant la même langue. L’auteure
explique en effet que les enfants yucatecs « ne maîtrisent la
production de la morphologie des classificateurs qu’à partir
de l’âge de neuf ans et cette maîtrise, comme en témoigne
l’expérience réalisée, transparaît à cet âge dans les tâches non
verbalisées d’appariement d’objets ».
Cette expérience illustre bien l’effet du bain linguistique sur
le mode de catégorisation prélinguistique. Les infants qui, à
sept ans, n’ont pas encore une pratique experte de la langue de
leur entourage, que ce soit l’anglais ou le yucatec, tirent parti
de critères de catégorisation prélinguistique analogues (plu-
tôt la matière), tandis qu’à neuf ans, les jeunes locuteurs ont
intégré les propriétés véhiculées par les noms d’objet physique
selon qu’ils se combinent avec un classificateur (en yucatec)
ou avec un déterminant référant au nombre et à la définitude
(en anglais). La catégorisation prélinguistique constitue donc
41
bien une « rampe de lancement » pour la future catégorisation

linguistique, mais elle ne contrôle plus l’affinement ultérieur
des catégories.
Une perception globale de l’espace naturel et social

Anne Reboul6, philosophe et linguiste à l’Institut des
sciences cognitives de Lyon, montre que les concepts qui
organisent notre esprit proviennent d’une préférence pour la
perception globale (ou relationnelle) alors que la cognition des
grands singes ne tire profit que de la perception locale (ou
singulière).
Catégoriser consiste à ranger les représentations mentales
primaires d’entités perçues comme stables (des choses, des
animaux ou des personnes) et les représentations secondaires
des situations (des états, des événements, des actions) et des
propriétés. Anne Reboul considère que la césure franche entre
la cognition des humains et celle des autres animaux tient à la
préférence des premiers pour la perception globale au détri-
ment de la perception locale. Que faut-il entendre par là ? La
perception locale est riche d’une multitude de traits distinctifs
de taille, de couleur, de conformation, etc. La perception glo-
bale est un tremplin vers la conceptualisation : elle consiste à
hiérarchiser les traits au long d’une échelle entre généralité et
particularité.
Ainsi, les artistes qui ont peint des kyrielles d’animaux sur
les parois des grottes de Chauvet (autour de -30 000 ans) et
de Lascaux (autour de -18 000 ans) ont certainement rangé
les animaux qu’ils représentaient en fonction du nombre de
pattes et de la présence ou l’absence de cornes ou de bois. Ces
deux propriétés ne sont pas de même niveau, car toutes les
bêtes dotées de cornes ou de bois sont des quadrupèdes.
42 6. A. Reboul (2007), Langage et cognition humaine, Presses Universitaires de Grenoble.

La propriété [à cornes/à bois] est donc subordonnée à la

propriété [à quatre pattes]. Dans certains cas, la tendance
à regrouper les animaux selon des critères immédiatement
visibles a conduit à des erreurs, notamment à propos des céta-
cés, mais globalement la cognition humaine est ainsi parvenue
à distinguer des types (les animaux quadrupèdes), des sous-
types (les bêtes à corne D les bouquetins) et les exemplaires (le
bouquetin qu’on vient de tuer et qu’on s’apprête à découper).
Cette capacité de classer les choses, les animaux et les per-
sonnes a dû s’étendre à la capacité de classer les situations (a)
selon leur type conceptuel (action individuelle ou collective ;
événement indépendant de la volonté humaine ; état plus ou
moins transitoire) et (b) selon leur statut cognitif (réalité per-
çue ; passé enregistré en mémoire ; représentation imaginaire
en marge du réel).
La représentation de ces situations a pris la forme de scènes
comportant un agent, un lieu, un repérage dans le temps et un
effet sur un patient ou un destinataire. Et sous l’effet d’exten-
sions métaphoriques (voir page suivante G. Lakoff), les scènes
concrètes faisant l’objet d’une représentation particulièrement
prégnante pour le groupe, ont pu être transposées en scènes
mythiques organisant une cosmogonie.
Le point décisif dans l’argumentation d’Anne Reboul est
que toute catégorisation hiérarchique implique un lexique
développé. La philosophe estime que, dans l’opération de hié-
rarchisation, « le nombre des concepts atteint un certain seuil
critique qui déclenche un processus d’auto-organisation qui
correspond au sens strict au langage », ce que des spécialistes
de la modélisation du langage et de ses possibilités évolutives
ont confirmé en concevant des programmes de simulation
multi-agents, notamment Jim Hurford, Jeffrey Elman, Luc
Steels et Pierre-Yves Oudeyer (voir plus loin).
43
L’effet des extensions métaphoriques

George Lakoff et Talmy Givón ont montré l’importance
capitale que notre cognition accorde à l’activité métaphorique,
le premier pour l’organisation du lexique, le second pour celle
de la grammaire.
Les métaphores conceptuelles donnent lieu à au moins
deux classements : les métaphores poétiques, provenant de
l’imagination d’un seul individu, peuvent se répandre au point
de donner lieu à des métaphores conventionnelles, partagées
par toute une communauté, et si certaines sont le fait d’une
seule langue, la plupart sont le reflet d’une culture et certaines
ont un caractère universel. Selon George Lakoff, sémanticien
réputé de l’université de Berkeley en Californie, les preuves de
l’existence d’un système de métaphores conceptuelles conven-
tionnelles proviennent de cinq sources :
1. Des généralisations commandant la polysémie, dues à
l’observation de l’usage de mots dotés d’une pluralité de
sens associés, par exemple entre une partie d’un animal
et une partie d’une plante ou d’une chose : la tête de la
vis, la queue du cortège, le cœur de la laitue.
2. Des généralisations commandant les patterns d’infé-
rence, dues à l’observation de régularités dans le trans-
fert d’un pattern d’inférences d’un domaine conceptuel
(généralement concret) dans un autre domaine (généra-
lement abstrait), par exemple : le nœud de l’intrigue, le
noyau du parti, la structure du récit, un tissu d’âneries,
l’ombre d’un doute, le bras de la justice, etc.
3. Des généralisations commandant un langage métaphorique
nouveau, c’est-à-dire des conventions de création poétique,
par exemple fendre, percer ou déchirer le cœur de l’être aimé.
4. Des généralisations commandant des patterns de chan-
gement sémantique, issues d’images mentales partagées
par une société. Exemple : le verbe navrer, qui signifiait
44
en ancien français « blesser physiquement » et typi-

quement à l’aide d’une flèche, a donné lieu à l’image
conventionnelle de Cupidon blessant le cœur d’un être
aimé pour le rendre à son tour amoureux. Finalement,
après une période de polysémie en français classique
(xvie-xviiie siècles) ce verbe a perdu son sens physique
pour ne plus être employé que dans un sens affectif (un
événement navrant, je suis navré de cette triste nouvelle).
5. Des expériences psycholinguistiques destinées à tes-
ter la disposition des sujets à assimiler de nouvelles
métaphores.
G. Lakoff donne un exemple frappant de métaphore
conceptuelle conventionnelle avec l’énoncé notre liaison
débouche sur une impasse. L’extension métaphorique se résume
sous la forme une liaison amoureuse qui s’épuise est comme une
voie en impasse, ce que l’auteur commente ainsi :
« Les amants sont embarqués dans un voyage à deux, leurs projets de vie
communs étant vus comme des destinations à atteindre. Leur liaison est
leur véhicule, et elle leur permet de poursuivre ensemble leurs projets.
La liaison est vue comme satisfaisant ce projet aussi longtemps qu’elle
leur permet de le faire progresser en commun. Ce voyage est semé d’em-
bûches. Il y a des obstacles et il y a des endroits (des carrefours) où il faut
décider quelle direction prendre et si le périple se poursuivra à deux7. »
Dans les termes de la linguistique cognitive, la métaphore

se comprend comme un transfert d’un domaine source (ici les
déplacements) vers un domaine cible (ici une liaison amou-
reuse), ce qu’illustre le tableau ci-après :
7. Voir G. Lakoff (1993), « The contemporary theory of metaphor », in A. Ortony (ed.),

Metaphor and thought, Cambridge University Press. 45
CONSTITUANTS SENS
SENS PROPRE D
DE LA PHRASE MÉTAPHORIQUE
notre liaison attachement voyage
débouche sur mouvement mouvement abstrait,
physique, changement d’état
changement de lieu psychologique
une impasse voie sans issue voyage sans
aboutissement
Une telle métaphore est dite « généralisée », car elle est

conventionnelle, c’est-à-dire accessible à tous les usagers du
français après avoir été imaginée à l’origine par un poète (le
stade premier de la métaphore poétique) et reprise dans la
conversation courante. Et elle est aussi traduisible entre des
langues véhiculant des cultures apparentées. Mais elle n’est
pas pour autant universelle, car on réserve ce terme aux méta-
phores qui touchent des réalités transculturelles, comme les
parties du corps, par exemple dans prendre la tête d’un cortège,
faire la queue ou le ventre mou de la politique.
Dans un article publié en 2017, Matthieu Pierens8 observe
que la théorie des métaphores généralisées n’est pas aussi révo-
lutionnaire que Lakoff le laisse entendre et qu’elle « néglige
constamment la dimension historique et intersubjective
des significations ». Il est vrai que les linguistes américains
se concentrent souvent sur les controverses du moment (en
l’occurrence celle sur la place de la sémantique dans les cou-
rants de linguistique générative dont la pensée de Noam
Chomsky est à l’origine) et se préoccupent peu de la tradition
européenne. Mais la vision de Lakoff s’inscrit à la croisée des
chemins, entre l’universalisme de Chomsky et le relativisme
8. M. Pierens (2017), « George Lakoff : La métaphore structure la pensée », Les Grands

46 Dossiers de Sciences Humaines n°44, mars 2017.
d’E. Sapir et B.L.Whorf et à ce titre, elle a eu un impact consi-

dérable, notamment sur la côte ouest des États-Unis.
De son côté, Talmy Givón (en accord avec des intuitions
de Lakoff) a étudié l’impact des extensions métaphoriques sur
le plan grammatical. Il a observé notamment une tendance
universelle affectant les verbes d’action : ces derniers déve-
loppent fréquemment un type d’emploi comme verbe de
simple relation, et au-delà, deux types d’emplois grammati-
caux, soit de verbe dit ‘support’ (ou ‘opérateur’) en combi-
naison avec un groupe nominal désignant une action ou un
événement, soit de verbe auxiliaire en combinaison avec une
construction infinitive. Le schéma ci-dessous illustre, à partir
du verbe de déplacement arriver, ce parcours caractérisé par
l’enchaînement d’une première métaphore lexicale et de deux
métaphores grammaticales.
SENS SENS DE SENS

D’ACTION RELATION GRAMMATICAUX
L’eau de cuisson est

¨ SUPPORT
Les alpinistes La barrière arrivée à ébullition
sont arrivés ¨ m’arrive à
au gîte l’épaule Le prisonnier est
¨ AUXILIAIRE
arrivé à s’évader
Le langage comme réseau de réseaux

Dans les années 1960, les chercheurs en sémantique for-
melle et en intelligence artificielle se sont représenté l’orga-
nisation du lexique sous la forme d’un arbre décrivant une
hiérarchie unique comme dans le classement des espèces
biologiques. Mais les lexicographes savent qu’une définition
efficace réclame généralement une caractérisation multiple.
C’est ainsi, par exemple, que le dictionnaire Larousse définit
le diamant :
47
Pierre précieuse objet

constituée de carbone pur cristallisé, substance
¬ très dur mais cassant, généralement incolore spécification
et transparent, de la substance
¬ utilisé soit en joaillerie, soit dans l’industrie modes
d’utilisation
de la substance
Récemment, on a compris que dans les réseaux lexicaux

basés sur des associations sémantiques (connus depuis la fin du
xixe siècle), le nombre de pas pour aller d’un mot à un autre est
beaucoup plus réduit qu’on ne l’imagine, parce que la plupart
des mots du lexique général – contrairement aux termes des
vocabulaires techniques – véhiculent plus d’un sens. Certains
en véhiculent un nombre substantiel et on désigne ces mots
polysémiques comme des superconnecteurs, car ils permettent
de réduire les distances entre mots sémantiquement associés.
Ainsi, en se limitant aux relations de synonymie9, le subs-
tantif bande est synonyme de ruban, clan, zone, film, etc.
Ruban n’est pas synonyme de clan, mais il est occasionnelle-
ment synonyme de zone ou film. C’est ce que trois chercheurs
de l’université de Navarre10 appellent un « lien triangulaire »
quand ils constatent que « la polysémie confère (…) une
grande cohésion au réseau sémantique, car elle facilite aussi
bien la navigation que l’association lexicale entre concepts
(corrélée au nombre de liens triangulaires ) ». Le raccourcisse-
ment des parcours entre deux nœuds du réseau, en raison de
la présence de superconnecteurs, définit celui-ci comme un
« petit monde » (small world) et une propriété analogue a pu
être découverte concernant l’acquisition de la syntaxe.
9. Les relations de synonymie sont plus restrictives que les simples associations de sens, parce
que limitées à la possibilité de substituer deux mots dans un même contexte.
10. R. Solé, B. Corominas Murtra Bernat & J. Fortuny, « La structure en réseaux du langage ».
48 Dossier pour la Science n° 82, 2014 : L’évolution des langues - Quel avenir ?
Le Dictionnaire Électronique des Synonymes11 du Crisco

(université de Caen-Normandie) fournit une visualisation
parlante de l’espace sémantique du nom féminin bande qui
permet d’illustrer cette thèse des mots polysémiques assurant
une fonction de superconnecteur :
courroie
bandage morceau gang troupeau légion

lien
brassard
lisière colonie
ruban banc
L’espace de la vedette bande se divise grossièrement en quatre quadrants : le quadrant supé-

rieur gauche regroupe des types de bandes matérielles (courroie, bandage, lien, brassard). Dans
le quadrant inférieur gauche ruban passe du sens matériel au sens topographique (la rivière
dessine un ruban), qui conduit à lisière. Le quadrant supérieur droit rassemble des types de
bandes d’individus (légion, troupeau, gang) et dans le quadrant inférieur droit colonie permet
de passer des humains et animaux terrestres aux volatiles et aux poissons avec banc. Enfin
morceau figure au centre dans le sens topographique (un morceau / une bande de terre).
En outre, les chercheurs navarrais ont fait une observation

originale : après la phase de production de « phrases à un mot »,
c’est-à-dire de mots isolés révélant un besoin interprétable à
l’aide du contexte, l’enfant produit des phrases à deux mots
(un argument associé à un prédicat), mais on ne décèle pas
de période particulière de production de phrases à trois mots,
car les enfants deviennent subitement capables de construire
des phrases plus complexes. Ce saut qualitatif tiendrait au
repérage de superconnecteurs syntaxiques. L’algorithme qui
11. http://www.crisco.unicaen.fr/des/, université de Caen-Normandie. Les distances entre

les synonymes sont calculées automatiquement par un algorithme prenant en compte
plusieurs centaines de milliers de relations de synonymie établies par plusieurs synonymes
et mises à jour par Michel Morel, ingénieur au CRISCO et un groupe d’internautes. 49
a analysé une multitude d’énoncés d’enfants issus de la base

de données Childes* fournit un réseau dans lequel certains
mots lexicaux et grammaticaux assument ce rôle de supercon-
necteurs. Ricard Solé et ses collègues mentionnent (en traduc-
tion) aller, c’est, ceci , cela, de, là-bas, le,,mets, un, c’est-à-dire
un jeu de verbes basiques, de déterminants et de relateurs, en
somme les briques de la construction grammaticale.
Des motivations concurrentes ou coalisées

Dans un article paru en mai 2017 dans le magazine Pour
la science, Michael Tomasello, associé au psycholinguiste Paul
Ibbotson, explique pourquoi la théorie de la Grammaire uni-
verselle, prônée par Chomsky depuis plus d’un demi-siècle, ne
fait plus recette12 :
« …l’idée d’une grammaire universelle est en contradiction avec les
résultats montrant que les enfants apprennent la langue à travers les
interactions sociales, et qu’ils acquièrent de l’expérience en utilisant des
constructions de phrases créées par les communautés linguistiques au
fil du temps (…) les contributions des approches fondées sur l’usage
ont déplacé le débat dans la direction opposée [à celle de la grammaire
universelle] en se demandant ce que la pragmatique peut apporter à la
langue avant que les locuteurs aient besoin de faire appel aux règles de la
syntaxe » (2017, pp.42-43).
En réponse aux critiques mettant en doute la validité de

l’hypothèse de la Grammaire universelle, Chomsky et ses dis-
ciples ont régulièrement répondu que ces critiques se fondent
sur l’examen des performances* des locuteurs, lesquelles
« incluent des capacités mémorielles, attentionnelles et sociales
immatures » (ibid. p.41) qui masquent leur compétence*,
laquelle constituerait l’objet d’étude premier de la linguistique
théorique. Les auteurs rétorquent que « recourir à ce type
12. P. Ibbotson P. et M.Tomasello, « Au-delà de la grammaire universelle », Pour la Science

50 n°475, mai 2017, p.42-43.
d’affirmations est courant dans les paradigmes scientifiques en

déclin qui ne disposent pas d’une base empirique solide – on
peut notamment penser à la psychologie freudienne et aux
interprétations marxistes de l’histoire ».
La charge est sévère, mais juste. Ce qui est commun à ces
trois théories, c’est qu’elles mettent en avant un principe expli-
catif unique : la pauvreté des stimulus* permettant la géné-
ration d’une « infinité discrète » de phrases chez Chomky,
le refoulement d’un inconscient dominé par la gestion de la
sexualité chez Freud et la théorie du contre-pouvoir collectif
au capital que pourront exercer les masses prolétaires oppri-
mées chez Marx. Chacune de ces théories a eu un pouvoir
explicatif dans les lieux et temps où elle a vu le jour, mais
une vision lucide du jeu des forces à l’œuvre dans un système
dynamique complexe (voir l’Épilogue) permet de les dépasser
et d’écarter le simplisme idéologique.
La linguistique basée sur l’usage préconise la prise en
compte de l’effet de motivations concurrentes internes (en
rapport avec les conditions de bonne formation des structures
à chaque niveau phonologique, morphologique, lexical et syn-
taxique) et externes (en rapport avec les conditions de bonne
compréhension entre interlocuteurs) dans la sélection d’un
mode d’expression aux dépens d’un autre. Elle permet ainsi de
comprendre comment l’enfant se fraie une voie dans la jungle
des signes linguistiques.
L’effet variable de motivations concurrentes

L’un des traits fondamentaux de la communication linguis-
tique est que nous ne pouvons pas transmettre deux contenus
simultanément. Si je suis submergé par l’émotion et que je
souhaite faire savoir à mon interlocuteur à la fois que j’ai beau-
coup aimé une femme et que cette femme a trouvé la mort
dans un accident, je suis obligé de choisir un ordre de présen-
51
tation, qu’il prenne la forme d’une coordination comme :

[J’aimais passionnément Marie], [et voilà qu’elle est morte dans sa voiture]
[On a retrouvé Marie morte dans sa voiture], [je l’aimais passionnément]
ou celle d’une subordination relative ou participiale :

Marie, la femme [que j’aimais passionnément], a été retrouvée morte dans sa voiture.
La femme [retrouvée morte dans sa voiture], c’était Marie, la femme [que
j’aimais passionnément].
Le psycholinguiste J.M.W. Levelt représente la production

de tels énoncés en trois stades : la conceptualisation, la formu-
lation et l’articulation. On peut s’imaginer la conceptualisa-
tion comme non ordonnée : les deux contenus proposition-
nels, mon amour passionné pour Marie, et la nouvelle de sa
mort dans l’accident de voiture, me viennent simultanément à
l’esprit. Mais le second stade, celui de la formulation, impose
une hiérarchisation des deux contenus : j’évoquerai en premier
soit mon amour, soit la mort de la femme aimée et en second
l’information restante, plus ou moins explicitement reliée
à la première. La formation d’une proposition relative (par
exemple, que j’aimais passionnément) ou participiale (retrouvée
morte ans sa voiture) permet notamment d’intégrer l’un des
deux contenus propositionnels à l’autre par le biais de l’anté-
cédent la femme.
Ce n’est qu’une illustration parmi d’autres des multiples
choix auxquels le locuteur est continuellement confronté,
et qui entraînent souvent des ruptures de construction, des
reformulations et des lapsus13. En 1985, le linguiste améri-
cain John DuBois a forgé l’idée que la parole doit trouver son
chemin à travers une jungle de motivations concurrentes et
potentiellement coalisées.
13. La Grammaire Fonctionnelle Systémique du linguiste australien d’origine britannique

52 M.A.K. Halliday est entièrement fondée sur ce constat.
À titre d’illustration, en français moderne l’ordre des pro-

noms en fonction d’objets varie selon la personne à laquelle le
pronom-destinataire réfère, ce qui n’était pas le cas en ancien
français14. En français moderne (frm), si le pronom exprimant
l’objet-destinataire est à la première ou deuxième personne, il
figure avant le pronom exprimant l’objet direct :
Je vous le donne, tu me le donnes
Mais si ce pronom est à la troisième personne, l’ordre des

pronoms est inversé :
Je le lui donne, vous le leur donnez
Il n’en était pas de même en ancien français (afr), par

exemple :
afr. quar Diex le nos rendra bien quant lui plaira (Villehardouin)
frm. car Dieu nous le rendra bien quand il lui plaira.
afr. Se vos le me donez (Roman de Renard)
frm. Si vous me le donnez
Deux motivations concurrentes sont imaginables. La pre-

mière (M1) est syntaxique : un ordre de rattachement préfé-
rentiel des pronoms objets au verbe qui les suit, le pronom
objet direct étant plus étroitement rattaché au verbe que le
pronom objet-destinataire, d’où l’ordre (on) me/te/nous/vous/
le donne. La seconde (M2) est pragmatique : le pronom dési-
gnant le destinataire figure avant le pronom désignant la chose
transférée si ce destinataire est ou inclut le locuteur (me, nous)
ou l’interlocuteur (te, vous), mais cette motivation n’intervient
pas si le destinataire est un tiers (lui, leur). En ancien français
M1 l’a emporté sur M2, si bien que l’ordre des pronoms objets
14. J. François (1995), « Je te le donne vs. Tu le lui donnes : La prise en compte de principes
cognitifs dans les règles d’expression du modèle néerlandais de grammaire fonctionnelle »,
L’information grammaticale 67, p.28-34. 53
ne varie pas, que le pronom-destinataire désigne le locuteur,

l’interlocuteur ou un tiers. En français moderne en revanche,
M2 s’est imposé, entraînant deux ordres opposés, objet direct
+ objet-destinataire-tiers (le lui/leur V) et objet-destinataire-
(inter)locuteur + objet direct (me/te/nous/vous le V).
Des motivations concurrentes ou coalisées

Les psycholinguistes Elisabeth Bates et Brian MacWhin-
ney ont élaboré dans les années 1980 un modèle de l’acquisi-
tion de langues présentant des caractéristiques grammaticales
diverses à l’aide de la théorie de la concurrence et de la coopé-
ration entre motivations. Ce modèle a rencontré un écho très
favorable et a été appliqué en France par l’équipe de psycho-
linguistique développementale de Michèle Kail au CNRS.
Le savoir linguistique est conçu comme un réseau com-
plexe de correspondances pondérées entre les formes et leurs
fonctions. Comme toute langue fournit des indices (lexicaux,
syntaxiques, morphologiques ou prosodiques) qui signalent la
présence de telle ou telle fonction, l’analyseur dont dispose le
dispositif d’acquisition linguistique du futur locuteur intègre
des combinaisons d’indices qui peuvent impliquer la séman-
tique lexicale, la morphologie, l’ordre des mots et la prosodie.
Par exemple pour repérer le jeu de relations entre la posi-
tion préverbale, la fonction syntaxique de sujet et le rôle
sémantique d’agent, certaines corrélations peuvent émerger,
comme le montre le tableau ci-après :
54
corrélations émergentes exemple
en anglais la position préverbale

une forme Q une fonction est régulièrement associée à la
fonction sujet
la position préverbale peut être
associée selon les langues à un
une forme Q une forme
marquage casuel nominatif ou à
un trait [+défini]
le rôle sémantique de l’agent
une fonction Q une fonction est typiquement associé à la
fonction syntaxique de sujet
Les motivations ne sont pas seulement concurrentes, elles

peuvent également coopérer, ce qui débouche sur des interac-
tions complexes que le locuteur est généralement capable de
déchiffrer.
Mais en présence d’indices de corrélation concurrents, le
futur locuteur doit pouvoir pondérer ceux-ci. Pour cela, il dis-
pose de deux critères d’évaluation, la disponibilité et la fiabi-
lité. Un indice qui bénéficie des deux critères est naturellement
préféré, par exemple en anglais, la position préverbale consti-
tue un indice disponible et fiable pour le rôle d’agent, ce qui
ne vaut pas pour l’italien ou l’espagnol. Pour chaque langue,
un ordre d’importance des indices peut être identifié à partir
de ces deux critères. Ainsi dans l’échantillon de quinze langues
testé par Bates & MacWhinney (1989)15 pour l’identification
d’un agent, on observe que pour toutes les langues qui ont
des marques de cas, cet indice vient régulièrement en premier,
étant à la fois disponible et fiable. Mais le poids respectif de
deux indices peut évoluer avec l’expérience linguistique. Ainsi,
15. E. Bates & B. McWhinney (1989), « Functionalism and the competition model », in
B. MacWhinney & E. Bates (eds.), The cross-linguistic study of sentence processing,
Cambridge University Press, pp.3-76. 55
entre la période 1 (≈ 2-4 ans) et la période 2 (≈ 4-6 ans) d’acqui-

sition de l’anglais (langue dénuée de marquage casuel), l’indice
permettant en priorité de repérer l’agent et le patient, à savoir
l’ordre sujet – verbe – objet, conserve sa disponibilité, mais perd
de sa saillance, parce que d’autres indices sont entrés dans le
champ d’expérience de l’apprenti locuteur, comme le marquage
prosodique ou l’accord verbal, tandis que sa fiabilité augmente,
parce que dans ses échanges linguistiques, ce jeune locuteur n’a
rencontré presque aucun cas d’ordre objet – verbe – sujet.
Pour donner une idée concrète des inférences qui per-
mettent à l’apprenti-locuteur (un Sherlock Holmes en herbe)
de décider qui agit sur quoi ou sur qui, prenons l’exemple de
l’auditeur d’une phrase qui se termine par le segment « kila-
port » (en français). Trois interprétations sont possibles :
(1) qui l’apporte
(2) qui la porte
(3) qu’il apporte
Si les référents (sujet, objet) sont préposés, l’auditeur garde

en mémoire de travail le début de la phrase précédant le seg-
ment /kilaport/ à interpréter :
référent intro- référent segment à

interprétation
topical ducteur focal interpréter
1 Le paquet c’est Chronopost /kilaport/ qui l’apporte
La
2 c’est la direction /kilaport/ qui la porte
responsabilité
un pli
3 Le facteur c’est /kilaport/ qu’il apporte
recommandé
Calcul de référence (1) : Qu’il apporte est exclu, parce que le paquet ne
peut pas apporter Chronopost (critère sémantique). Qui la porte est exclu,
parce que le pronom objet la réfère à un groupe nominal féminin, alors
56
que le paquet est un masculin (critère morphologique). Reste qui l’apporte

compatible avec Chronopost en position d’antécédent du pronom relatif
sujet qui.
Calcul de référence (2) : qu’il apporte est exclu parce que le pronom sujet
il réfère à un groupe nominal masculin, alors que responsabilité est un
nom féminin (critère morphologique). Qui l’apporte est exclu, parce que
le groupe verbal apporter la responsabilité (de qch) est mal formé (critère
syntaxique). Reste qui la porte, compatible avec la direction en position
d’antécédent du pronom relatif sujet qui et avec la responsabilité comme
anticipation du pronom la, objet du verbe porter.
Calcul de référence (3) : qui l’apporte est exclu, parce qu’un pli recom-
mandé ne peut pas apporter le facteur (critère sémantique). Qui la porte est
exclu, parce que un pli recommandé est un groupe nominal masculin, alors
que le pronom objet la réfère à un féminin. Reste qu’il apporte, compatible
avec la direction en position d’antécédent du pronom sujet qui et avec le
facteur comme anticipation du pronom il, sujet du verbe porter, et avec un
pli recommandé, antécédent du pronom relatif objet qu’(<que).
En conclusion : trois critères ont été retenus, d’ordre

sémantique (qui peut être l’agent ? qui peut être le patient ?),
morphologique (les accords en genre et éventuellement en
nombre) et syntaxique (quelles sont les chaînes de mots bien
ou mal formées ?). Un quatrième critère mérite d’être men-
tionné, celui de la prosodie. Si la chaîne /kilapO-t/ est intro-
duite par Je sais… et suivie d’une rupture prosodique (Je sais
/kilapO-t/, la responsabilité, c’est la direction), trois critères se
coalisent, morphologique avec le genre féminin du pronom
objet anticipant la responsabilité, syntaxique avec la mauvaise
formation du groupe verbal apporter la responsabilité de qch, et
prosodique, avec la rupture prosodique qui favorise l’interpré-
tation de la responsabilité comme une apposition au pronom
relatif sujet qui.
L’auditeur en présence d’un segment offrant plusieurs
interprétations lexico-syntaxiques – situation très rare, il
faut le reconnaître – est donc forcé de procéder à un calcul
complexe faisant intervenir différents types de critères dont
57
il n’a pourtant certainement pas conscience. Il est probable

que le contexte permet l’évocation d’une représentation men-
tale prioritaire qui n’est écartée qu’en présence d’évidences
contraires, Pour (1) une telle représentation comporterait par
exemple : une camionnette Chronopost et un chauffeur qui
tient un paquet et qui sonne à la porte. Cette représentation
est associable à l’un des deux verbes porter et apporter. Si l’au-
diteur pense en premier à porter, le critère morphologique de
l’accord impossible entre le pronom objet la et le paquet inter-
vient en second pour remplacer porter par apporter.
Si l’on remplace le paquet par la lettre, ce critère mor-
phologique tombe, mais l’auditeur peut cependant se faire
deux représentations distinctes, celle de Chronopost, en tant
qu’entreprise, qui apporte la lettre, et celle du chauffeur de la
camionnette de Chronopost qui porte la lettre. Dans ce dernier
cas, c’est donc un critère d’ordre conceptuel (la représentation
distinctive de deux situations apparentées) qui intervient pour
sélectionner apporter avec le sujet Chronopost au détriment de
porter.
Cette évocation de locuteurs obligés de procéder à des
calculs de validation d’indices et de contre-indices pour s’as-
surer du sens d’une phrase ne doit pas faire penser que c’est
une situation fréquente, elle est en fait assez exceptionnelle,
car dans le cas inverse la communication serait aussi lente que
celle entre Houston et Neil Armstrong posant le pied sur la
lune en août 1969 ! Heureusement, le locuteur dispose d’une
mémoire linguistique étendue et peut tirer parti d’expressions
analogues préalablement traitées (en production comme en
réception), comme on va le voir dans la section qui suit.
Le rôle des formules figées

Tout un courant de la linguistique actuelle s’est concentré
sur l’étude de la fréquence des expressions et de leur effet sur
58
la mémorisation et la conventionalisation de segments récur-

rents. Le développement de grands corpus de textes écrits
dans la dernière décennie du xxe siècle a permis de découvrir
des régularités passées jusqu’alors inaperçues. La théorie de
la Grammaire universelle de Chomsky distingue deux types
de propriétés linguistiques, les unes universelles (les « prin-
cipes »), les autres propres à des types spécifiques de langues
et à des langues particulières (les « paramètres »). Joan Bybee,
spécialiste de la typologie et de l’évolution des langues, et
notamment de l’émergence des constructions grammaticales,
a montré que tous les patterns grammaticaux sont issus de
processus évolutifs similaires.
Les locuteurs ont l’impression de s’exprimer librement,
c’est-à-dire d’effectuer continuellement des choix en faveur
d’un ordre ou d’un autre (par exemple, Toi, tu la connaissais,
cette fille ? / Toi, cette fille, tu la connaissais ? / Tu la connais-
sais, toi, cette fille ?), d’une formulation verbale ou nominale
(par exemple, C’est le peloton qui arrive / C’est l’arrivée du pelo-
ton), d’une coordination ou d’une subordination, etc., mais
l’énonciation ne peut être fluide qu’à condition de disposer en
mémoire linguistique d’un stock de segments immédiatement
disponibles, éventuellement de structure complexe, mais saisis
en bloc, sans conscience de cette complexité.
Considérons ce court dialogue :
A : Vous venez avec moi ?
B : Ce n’est pas pour me déplaire !
Bien que B donne une réponse syntaxiquement et séman-
tiquement compliquée (double négation) il/elle n’a pas eu
besoin de construire sa phrase mot par mot, et A n’a pas besoin
de la décomposer pour comprendre que c’est « oui ».
Le langage est certes compositionnel dans son principe,
mais la parole ne peut être fluide qu’à l’aide d’une dose
notable de formules toutes prêtes, ce qui a conduit des lin-
59
guistes britanniques à parler de « langue formulaire » (formu-

laic language).
Bybee conclut son ouvrage de 201016 en constatant que
« les parcours de changement des constructions – telles que les
constructions de la voix, du temps ou de l’aspect – projettent
des universaux plus robustes que les simples comparaisons
interlangues d’états synchroniques ». Cependant ces parcours
interlangues se laissent à leur tour décomposer en mécanismes
et facteurs qui les créent au long de l’usage de la langue. Ce
qui donne lieu à ces changements, c’est l’agrégation des mor-
phèmes et la réduction phonologique, combinés à des chan-
gements de sens résultant de l’accoutumance, de la générali-
sation et de l’activité d’inférence des interlocuteurs. Entre les
expressions rigoureusement compositionnelles et celles qui
sont absolument « formulaires » et figées, les constructions se
présentent au croisement de différents continuums. Elles sont
plus ou moins analysables, compositionnelles, autonomes,
schématiques et productives.
« Toutes les constructions dans toutes les langues ont ces propriétés à
un certain degré. Donc alors que la grammaire est en soi émergente et
spécifique à chaque langue, les propriétés des unités de la grammaire
dans ces dimensions sont tout à fait comparables à travers les langues. »
(Bybee, 2010)
Ces propriétés dérivent de trois types de processus cognitifs

plus fondamentaux : la catégorisation par similarité, l’agréga-
tion de séquences répétées et les associations par contiguïté.
La catégorisation par similarité est à la source des extensions
métaphoriques (vues plus haut).
L’agrégation de séquences répétées produit notamment des
ordres conventionnels, comme nous l’avons vu plus haut à propos
de l’ordre des pronoms objets en français ancien et moderne et des
60 16. J. Bybee (2010), Language, Usage and Cognition, Cambridge University Press.
agglutinations : historiquement, dans les langues indo-européennes

les prépositions se sont agglutinées aux racines lexicales sous forme
de préfixes et les postpositions sont devenues des suffixes.
Enfin, l’association par contiguïté a généré des changements
métonymiques. Ainsi mon interlocuteur ne s’étonne pas que je
lui propose de déguster le plat du jour en buvant un verre, parce
que la mention du contenant à place du contenu fait partie de
l’usage courant, elle s’est conventionalisée.
« Ces processus généraux opèrent par la répétition à une échelle massive,
chez les individus et certainement dans les communautés ; cette répétition
dans le contexte de ce dont les gens ont envie de parler et de la manière
dont ils structurent leur discours donne forme à la grammaire et au
lexique des langues particulières. » (ibid.)
5
Ce second chapitre a évoqué les travaux de linguistes
explorant les capacités cognitives de l’espèce humaine et leur
évolution, comme Anne Reboul et George Lakoff, ainsi que
de psycholinguistes spécialistes de l’acquisition du langage et
soucieux de comprendre comment l’aptitude à échanger des
chaînes de sons dotés d’une double fonction de communi-
cation et de représentation s’est structurée sous la forme de
protolangages qui ont progressivement acquis une syntaxe
en tirant parti de motivations entrant dans un jeu subtil de
concurrence et de coopération.
La question qui s’impose dès lors est celle du caractère sou-
dain ou graduel de l’évolution cognitive qui a permis un tel
saut qualitatif. La linguistique basée sur l’usage évoquée plus
haut fait l’économie d’une mutation génétique aux effets pro-
digieux, contrairement à la biolinguistique, notamment dans
61
sa version minimaliste défendue par Noam Chomsky et ses

collaborateurs et dans le bioprogramme de Derek Bickerton,
spécialiste de l’émergence des langues créoles, qui reposent sur
l’hypothèse d’une telle mutation génétique. C’est à l’examen
de cette hypothèse qu’est consacré le chapitre suivant.
Chapitre 3
Le substrat génétique
de la faculté de langage
Le langage structuré qu’a développé l’espèce humaine a-t-il

émergé d’abord pour l’exercice de la communication ou pour
celui de la pensée ? Les linguistes fonctionnalistes, notamment
ceux qui défendent une linguistique basée sur l’usage sont de
fervents défenseurs de la première option, comme nous l’avons
vu dans le chapitre précédent, et cela paraît une évidence : les
premiers hommes modernes se sont engagés dans un mode
de vie où ils ne restaient plus groupés, mais fabriquaient des
outils et des armes, et partaient chasser au loin. Pratiquant
une division sexuelle planifiée du travail, ils avaient besoin
d’établir des conventions sociales qui présupposaient l’usage
d’expressions structurées distinguant les types de choses, les
rôles attribués à chaque individu, les lieux et les temps, les
causes et les buts, etc. Et ils ont trouvé en tâtonnant un moyen
de coder ces informations pour les échanger.
Inversement, les biolinguistes, chercheurs d’inspiration
formaliste, c’est-à-dire centrés sur les propriétés calculatoires
du langage, voient dans l’émergence de cette faculté un moyen
primaire d’organiser la pensée, la réflexion sur soi-même et sur
le monde environnant. Ils supposent que le langage a pu se
développer à l’occasion d’une mutation génétique qui aurait
affecté le cerveau d’un individu singulier. Celui-ci ou celle-ci
l’aurait transmise à sa descendance, laquelle aurait bénéficié
d’un avantage neurobiologique suffisant pour constituer une
63
nouvelle espèce apte à se répandre sur tous les continents et à

s’imposer au détriment des autres types d’hominidés. Ce cha-
pitre examine les arguments des biolinguistes et débouche sur
l’évocation de la thèse de Luigi Cavalli-Sforza, généticien des
populations, qui vise à établir un jeu de correspondances entre
les variantes du génome humain et les familles de langue.
Alors que le courant de la linguistique évolutionnaire d’ins-
piration fonctionnaliste, représentée notamment par Talmy
Givón, Joan Bybee, William Croft et leur partenaire Michael
Tomasello, psychologue développemental et primatologue, se
constituait de manière lâche, le courant opposé des linguistes
focalisés sur l’aptitude calculatoire de l’espèce humaine et son
substrat linguistique se constituait en une école de pensée
structurée et institutionnalisée avec la mise en place de la bio-
linguistique adossée au programme minimaliste de Chomsky.
La linguistique, une science de la nature ?

Dans les années 1860, à la suite de la publication de L’Ori-
gine des espèces (Darwin, 1859), le linguiste comparatiste alle-
mand August Schleicher avait conçu une théorie de linguis-
tique naturaliste qui a retenu l’attention de certains linguistes
et surtout des anthropologues de l’époque, jusqu’à ce que le
Cours de linguistique générale de Ferdinand de Saussure (1916)
oriente la recherche linguistique dans une tout autre direction
au début du xxe siècle. Schleicher partageait avec Darwin l’idée
que l’évolution des espèces et celle des langues présentent des
analogies, notamment parce que les mots et les constructions
syntaxiques sont en concurrence et que leur remplacement au
fil du temps résulte d’une sélection naturelle.
Un siècle plus tard, le biologiste Eric Lenneberg, collabora-
teur de Chomsky au MIT, concluait à nouveau que la faculté
64
Le substrat génétique de la faculté de langage
de langage a des fondements biologiques1 à partir d’obser-

vations rigoureuses sur l’acquisition et les troubles du lan-
gage. Cette étude fondatrice soulevait à nouveau la question
du classement de la linguistique (ou du moins de ses deux
composantes développementale et évolutionnaire) parmi les
sciences de la nature. En 1990, les deux psychologues Steven
Pinker et Paul Bloom se sont saisis de cette question dans un
brillant article suivi d’un débat rassemblant une trentaine de
linguistes, psychologues, anthropologues et biologistes. Les
auteurs concluaient que l’évolution du langage était bien le
résultat d’un processus néo-darwinien de sélection naturelle2
opérant graduellement sur une longue période.
Mais la même année Derek Bickerton, spécialiste de lan-
gues créoles de Guyana (l’ancienne Guyane britannique) et
de l’archipel hawaïen, jetait les bases de son « bioprogramme »
qui défendait une thèse opposée dite catastrophiste ou salta-
tionniste3. Le raisonnement de Bickerton procédait en trois
phases :
1. Après une longue période de stagnation technologique
associée à Homo habilis (ou erectus), une multitude
d’objets fabriqués voit le jour dans un espace de temps
réduit, ce qui atteste l’aptitude à se représenter des buts
et des moyens et à se projeter dans l’avenir, toutes apti-
tudes associées à Homo sapiens.
1. E. Lenneberg (1967), The biological foundations of language. MIT Press (avec une postface
de N. Chomsky). Cet ouvrage a contribué à étayer les thèses déjà biolinguistiques de
Chomsky lors du débat qui l’a opposé à Jean Piaget en 1974 à l’Abbaye de Royaumont
(voir M. Piatelli-Palmarini, dir., Traduction par Y. Noizet, Seuil, 1979).
2. S. Pinker & P. Bloom (1990), « Natural language and natural selection », Brain and
behavioral Sciences 13(4): 707-784.
3. L’adjectif « catastrophiste » dérive du sens mathématique de « catastrophe », un type de
morphogénèse caractérisé par une variation soudaine traité par un jeu particulier d’équa-
tions différentielles (la théorie des catastrophes de René Thom). L’adjectif « saltationniste »
est sémantiquement proche, désignant un saut évolutif dans la théorie des équilibres ponc-
tués du biologiste Stephen.J. Gould. 65
2. Bickerton en conclut qu’une révolution culturelle s’est

produite et qu’elle résultait d’un changement qualitatif.
3. Le candidat le plus plausible comme moteur de cette
révolution est alors la transformation, supposée bru-
tale, d’un protolangage assimilable à un pidgin dénué
de grammaire, en un langage structuré apparenté à une
langue créole. En effet, ces langues résultent souvent de
la grammaticalisation en une seule génération du pid-
gin des parents, comme Bickerton a pu l’observer sur
ses terrains d’investigation. La base de la grammaire est
le classement des mots en catégories, essentiellement
lexicales et progressivement grammaticales, et ce classe-
ment incontournable a permis à la pensée des premiers
hommes de se structurer.
Les premiers mots des hominidés

Chomsky est beaucoup plus attiré par le bioprogramme
catastrophiste de Bickerton que par l’hypothèse sélective et
gradualiste de Pinker et Bloom. Cependant il laisse à son dis-
ciple Lyle Jenkins le soin de jeter les bases de la théorie bio-
linguistique4. Celui-ci emprunte à Chomsky le questionnaire
qu’il avait rassemblé au fil de ses travaux dans le prolongement
de l’ouvrage de Lenneberg :
a. En quoi consiste le savoir linguistique ?
b. Comment ce savoir est-il acquis ?
c. Comment ce savoir est-il mis en œuvre ?
d. Quels sont les mécanismes cérébraux pertinents ?
e. Comment ce savoir évolue-t-il dans l’espèce ?
Mais, dans l’esprit de l’époque, les réponses qu’il envi-
sage ont une base strictement génétique, alors que les biolo-
gistes ont mis en évidence dans les années suivantes le rôle de
4. L. Jenkins (2000), Biolinguistics. Exploring the biology of Language, Cambridge (GB),

66 Cambridge University Press.
l’épigénèse, ce qui a rapidement invalidé ses conclusions.

De son côté, Chomsky a attendu de s’assurer la collabo-
ration de deux biologistes évolutionnaires, le primatologue
Marc Hauser et W. Tecumseh Fitch, spécialiste de la compa-
raison entre des espèces génétiquement éloignées, et particu-
lièrement des aptitudes vocales des oiseaux et des hommes,
pour publier dans la revue Science un article destiné à étayer
la distinction entre deux niveaux de la faculté de langage51.
Dans cet article, Chomsky et ses deux partenaires biologistes
opposent la faculté étendue, élémentaire et partagée avec
d’autres espèces animales, à la faculté étroite, limitée à deux
opérations, la fusion interne, c’est-à-dire l’emboîtement de
groupes syntaxiques catégorisés (groupe nominal, verbal, pré-
positionnel, etc.) dotés d’une Tête et de Membres, et la fusion
externe, c’est-à-dire le mouvement de constituants hors de
leur groupe d’origine pour exercer une fonction énonciative.
C’est le cas, par exemple, des pronoms interrogatifs :
[L’aigle a vu une proie<x> _ Qu’est-ce que [l’aigle a vu <x>] ?
où <x> note la trace du groupe nominal objet direct sur

lequel porte la question,
C’est le cas aussi des pronoms relatifs :
la proie<x> [qu+e<x> l’aigle a vue <x>]
où la trace<x> figure deux fois en indice rattaché à l’anté-

cédent la proie et à la partie variable du pronom relatif (que ≠
qui ≠ quoi).
Les trois auteurs soutiennent que le propre du langage
humain tient dans sa capacité de fusion illimitée, c’est-à-dire
la possibilité de rattacher progressivement à une proposition
principale une quantité illimitée de propositions subordonnées
5. M. Hauser, N. Chomsky, W.T. Fitch (2002), « The faculty of language : What is it, who
has it, and how did it evolve ? » Science 298 : 1569-1579. 67
les unes aux autres. Mais leur raisonnement est subtil, car ils
en reconnaissent les effets à propos d’aptitudes autres que le
langage dans d’autres espèces animales, comme la capacité
de repérage des oiseaux migrateurs6. Cet article a suscité un
débat entre d’une part M. Hauser, N. Chomsky et W. T. Fitch
et d’autre part Steven Pinker auquel s’est associé le célèbre
sémanticien Ray Jackendoff7. Tous deux faisaient valoir des
contre-arguments qui méritaient un examen attentif, mais que
les premiers ont malheureusement eu le tort d’écarter comme
simplement hors sujet.
Chomsky fonde le courant minimaliste de la

biolinguistique
En 2007 la communauté des biolinguistes en cours de
constitution fonde la revue électronique Biolinguistics. En
général les revues électroniques sont moins bien cotées que les
revues bénéficiant d’un support papier, mais ce clivage tend
à disparaître et l’accès gratuit à des textes originaux et pour
une part fondamentaux permet de faire connaître largement
de nouvelles théories dans le milieu des étudiants avancés
et doctorants. Et Chomsky a voulu se présenter comme la
caution théorique de la revue en publiant dans son premier
numéro une synthèse de sa vision d’une biolinguistique en
osmose avec le programme minimaliste*8 qu’il avait mis en
6. Certains biolinguistes assimilent le rattachement hiérarchique de subordonnées au calcul

d’orientation des oiseaux migrateurs, car on peut imaginer qu’ils s'imaginent : « Je dois passer
à l’ouest du rocher qui se trouve sur la côte qui longe la longue plage qui suit la forêt de pins. »
7. Auteur d’un ouvrage essentiel en 2002 : Foundations of Language. Brain, Meaning,
Grammar, Evolution. Oxford University Press.
8. Le programme minimaliste élaboré par N. Chomsky en 1995 vise à simplifier le mo-
dèle de la Grammaire Universelle, en se limitant à une seule transformation de « mou-
vement » : l’organisation de la phrase s’analyse désormais en une structure–noyau dont
certains constituants sont déplacés vers le haut au long d’une représentation arborescente
avec un tronc et une succession de branches hiérarchisées. En outre les catégories dites
fonctionnelles (détermination, nombre, temps, aspect, etc.) sont introduites à des niveaux
68 déterminés sur cet arbre.
place douze ans auparavant. Il y présentait huit thèses dont je

retiendrai seulement les moins techniques.
Les biolinguistes se positionnent dans le cadre de la théorie
de la Grammaire universelle (GU), dont le principe primaire
est l’infinité discrète* également appelée « fusion illimitée ».
La GU est comparable à un jeu de Legos blancs et noirs9. Un
jeu de couleurs plus diversifié serait préférable pour la com-
paraison, mais pour les besoins de la démonstration on peut
se contenter de l’assimilation d’un Lego blanc à un nom ou
un groupe nominal et d’un Lego noir à un verbe, un groupe
verbal ou une phrase élémentaire.
Prenons la phrase minimale Marie a rencontré Paul : Marie
et Paul sont des noms propres, représentés par des Legos blancs
et a_rencontré est un verbe au passé composé, représenté par
un Lego noir. Ce verbe et son objet forment un groupe verbal
[a_rencontré Paul] représenté par un Lego noir, puisqu’il a une
tête verbale. Le groupe verbal se combine finalement avec le
sujet pour former la phrase [Marie a_rencontré Paul] dont on
admettra par simplification qu’elle constitue un groupe verbal
d’un rang supérieur, lequel sera donc représenté à nouveau par
un Lego noir. Ce que signifie l’expression « infinité discrète »
ou « fusion illimitée », c’est le fait que chacun des trois consti-
tuants est (en principe indéfiniment) extensible, par exemple :
Marie Ù la fleuriste de la place de la mairie
lego le conducteur du bus qui fait

blanc régulièrement le tour de cette place
Paul Ù
avant de rejoindre son terminus dans
les faubourgs de la ville
9. Voir schéma page suivante. 69

a fait la rencontre, attendue, mais

a_rencontré Ù
intrigante, de
La fleuriste de la place de la mairie
lego a fait la rencontre, attendue, mais
rouge Marie a_ intrigante, du conducteur du bus qui
Ù
rencontré Paul fait régulièrement le tour de cette place
avant de rejoindre son terminus dans
les faubourgs de la ville.
Supposons maintenant que les Legos blancs représentent

les noms et les groupes nominaux (GN) et les Legos noirs les
prépositions. Marie est représentée par un unique Lego blanc,
les GN la fleuriste, la place et la mairie sont également repré-
sentés par un lego blanc et les GP de la mairie, de la place et
de la place de la mairie par un Lego noir. Un Lego blanc peut
se superposer à un autre Lego blanc (pour indiquer qu’il s’agit
d’un groupe dont la tête est un nom ou un groupe nominal)
accolé à un Lego noir. La construction s’élève et au sommet
on trouve naturellement un Lego blanc, puisque la fleuriste de
la place de la mairie est un GN plus complexe mais de même
nature que Marie :
la fleuriste
de la place de la
mairie Marie
(la fleuriste) de la place

de la mairie
(la fleuriste) (de) de la place

de la mairie
(la fleuriste) (de) (la place) de la mairie
la fleuriste de de de la mairie
70
Le GN la fleuriste de la place de la mairie est récursif puisque,

par l’intermédiaire de la préposition de, le GN la mairie four-
nit une extension au GN la place et le GN complexe la place
de la mairie une extension au GN la fleuriste. Cette série d’ex-
tensions est a priori infinie ou illimitée, toutefois dans la réa-
lité de la communication linguistique, le nombre des exten-
sions est limité par la mémoire dite « immédiate » ou « de
travail, en dehors des comptines où il s’agit précisément d’aller
jusqu’aux limites des capacités de la mémoire. Mais la réponse
de Chomsky est que c’est une question de performance et non
de compétence. Une telle réponse implique que les opéra-
tions linguistiques soient gérées par un processeur autonome
que d’autres processeurs cognitifs autonomes d’attention, de
calcul et de mémorisation ont le pouvoir de brider. De leur
côté, les représentants de la « linguistique basée sur l’usage »
évoqués dans le chapitre précédent mettent en doute la perti-
nence de cette distinction entre compétence et performance,
parce qu’ils dénient toute autonomie au traitement neuronal
des briques linguistiques et considèrent qu’il s’agit d’une fonc-
tion cognitive intégrée.
Chomsky considère que « le langage est une solution par-
faite pour les conditions d’interface », c’est-à-dire que l’espèce
humaine a réussi à développer une forme de pensée calcu-
latoire ordonnée et hiérarchisée (notamment récursive) que
permet la combinatoire régulée de mots catégorisés en noms,
verbes, adjectifs, etc., en prise d’un côté avec la représentation
conceptuelle des choses, des événements, des propriétés, des
modalités, et de l’autre avec la production par le locuteur d’un
signal sonore interprétable par l’interlocuteur. C’est ce qu’il
appelle la « thèse minimaliste forte ». Cette thèse a fait cou-
ler beaucoup d’encre, car Chomsky l’associe à l’image de la
perfection structurale d’un flocon de neige, alors que la majo-
rité des spécialistes de l’histoire des langues font valoir que
71
leur évolution tient plus du bricolage que de l’architecture.

Des fragments encore exploitables de grammaire et de lexique
d’une langue source sont recyclés de manière à constituer un
système de bric et de broc. On peut en trouver de multiples
exemples, dont celui du paradigme de conjugaison des verbes
du latin classique, passé par les simplifications du latin vul-
gaire et les recompositions de ces paradigmes dans les lan-
gues romanes. Le processus est loin d’être chaotique, car par
exemple le futur, le conditionnel et les temps composés sont
formés de la même manière en français, italien et espagnol.
Le résultat de cette évolution est que les verbes du français
moderne entrent dans une multitude de classes de conjugai-
son dont les enfants parviennent à acquérir l’essentiel durant
la « fenêtre d’acquisition » (entre 1,5 an et 6 ans), mais qui
effraient les adultes apprenants.
En outre, Chomsky ne met pas les deux interfaces séman-
tique et phonétique sur un plan d’égalité, puisqu’il considère
que le langage est parfaitement adapté à l’organisation de la
pensée par les emboîtements conceptuels qu’il permet, mais
qu’il ne l’est qu’imparfaitement à la communication de cette
pensée, car le langage ne serait pas prioritairement destiné à
cette fonction (« La corrélation à l’interface sensori-motrice se
révèle un processus secondaire »). Là aussi, le désaccord avec
les linguistes fonctionnalistes est flagrant. Quant à l’origine de
la fusion illimitée, Chomsky, comme Bickerton, l’attribue à
un « recablage du cerveau » qui aurait affecté un seul individu
à la suite d’une mutation génétique, individu dont la postérité
aurait joui d’un tel avantage sélectif que nous serions tous ses
descendants.
Chomsky distingue cependant deux phases dans le déve-
loppement langagier. La première serait celle d’une parole
interne permettant, par une mise en relation plus intelligente
des concepts, une meilleure évaluation des actions possibles et
72
souhaitables. La seconde est celle de la communication par la

parole externe, permettant par exemple à un groupe (famille,
clan, tribu) de coordonner des actions et de partager des affects.
Par ailleurs, Chomsky s’en tient à une corrélation entre le
développement volumique du cerveau et celui du langage.
Cela l’incite à situer à environ -50 000 ans10 le « grand bond en
avant » symbolique. Cette vision est aujourd’hui obsolète, car
les archéologues ont rencontré des preuves d’un comportement
symbolique bien plus tôt (il y a ±270 000 ans). D’autre part,
selon les spécialistes de l’anthropologie physique et notam-
ment Robin Dunbar, le facteur déterminant de l’hominisation
a été l’interruption du développement volumique du cerveau,
et donc du crâne du nouveau-né parce que le bassin des par-
turientes n’était plus extensible, et son remplacement par un
accroissement vertigineux des liaisons entre les neurones11.
En revanche, il est en accord avec la plupart des linguistes12
quand il conclut que le lexique a été le seul facteur de variété
et de complexité. Dans sa vision de la grammaire construite
10. C’est la thèse de l’archéologue Richard Klein, évoquée plus loin.

11. Dans Human evolution (2016, p.245), Robin Dunbar décrit ainsi le problème anato-
mique auquel l’espèce humaine a été confronté : la gestation d’un fœtus doté d’un cerveau
volumineux est nécessairement plus longue que celle d’un fœtus moins « cérébral » ; et
c’est le cas par exemple pour les éléphants. Conformément au pattern courant des mam-
mifères, les petits humains devraient naître au bout de 21 mois de gestation. Mais la
conformation du bassin des parturientes (les deux moitiés du pelvis reconfigurées sous
l’effet de la station debout pour supporter le tronc et les viscères) n’est pas extensible et ne
permet pas le passage du crâne d’un bébé aussi développé. La solution de fortune, et effec-
tivement fortunée, que l’évolution humaine a bricolée, est passée par deux rectifications :
le néocortex a adopté une disposition plissée augmentant considérablement sa surface, et
le développement du petit humain s’est subdivisé en neuf mois de gestation prénatale et
douze mois de développement postnatal du nouveau-né sous le contrôle attentif de ses
géniteurs (une sorte de « solution kangourou », dit Dunbar). De ce fait le nouveau-né a
été exposé aux stimulus du monde extérieur durant le développement de son néocortex,
d’où une place décisive accordée à une épigénèse en milieu social et donc au développe-
ment de l’intelligence sociale.
12. Notamment Maurice Gross avec la théorie du « lexique-grammaire », Igor Mel’čuk avec
la théorie Sens-Texte ou M.A.K. Halliday avec la Grammaire Fonctionnelle Systémique
dont le noyau est la composante « lexico-grammaticale ». 73
sur des principes très restreints et de nombreux paramètres

adaptant les principes au système de chaque langue particu-
lière, le lexique figure désormais comme « le lieu où s’exerce la
variation paramétrique »13.
Syntaxes animales
En distinguant entre deux niveaux de la faculté de lan-
gage, étendue et étroite, les biolinguistes entendent tracer une
ligne de démarcation rigoureuse entre les capacités linguis-
tiques des espèces pratiquant des vocalisations chargées d’un
sens cognitif et non seulement émotif (les cétacés et certaines
espèces d’oiseaux chanteurs) dont les productions ne peuvent
être que stéréotypées (relevant de la faculté de langage éten-
due) et celles de la seule espèce humaine, dont les capacités
présentent une syntaxe créative relevant de la faculté étroite.
Cette syntaxe se manifeste dans l’organisation du langage par
le biais de groupes syntaxiques constitués d’une tête, laquelle
dote le groupe d’une classe particulière (N, V, Adj, etc.), et de
membres de classes compatibles avec celle de la tête qui sont
hiérarchisés, avec des classes éventuellement auto-emboîtées
(fonction de récursivité*). On se souvient tout de même que,
dans leur article de 2002, Hauser, Chomsky et Fitch2 admet-
taient que d’autres capacités peuvent avoir un caractère récur-
sif, notamment la faculté d’orientation des oiseaux migrateurs.
En réalité, les choses ne sont pas si simples. Le primatologue
Klaus Zuberbühler, de l’université de Neuchâtel, a enquêté
avec ses collaborateurs sur différentes espèces de primates et
de grands singes anthropomorphes. Leur but était d’identifier
13. Cependant la préférence de chaque langue pour un ordre Tête-Membres (centrifuge dans
les termes de Lucien Tesnière, exemple en français : la famille de Pierre) ou Membres-
Tête (ordre centripète, exemple en anglais : Peter’s family) n’est pas imputable au lexique.
Et l’une ou l’autre option n’est pas complètement indifférente, contrairement à ce que
Chomsky suggère, car l’ordre centripète impose un effort supérieur à la mémoire de tra-
vail ou un entraînement à la prédiction de la Tête postposée à partir de l’enregistrement
74 des Membres préposés.
les racines biologiques et les pressions évolutionnaires sous-

jacentes à l’aptitude humaine à contrôler volontairement la
production de vocalisations et à s’inspirer pour cela de celles
de leurs congénères et d’autres espèces. Zuberbühler a compilé
les résultats de différentes études qui concluent que les vocali-
sations des primates présentent un certain degré de flexibilité
et qu’elles présentent des convergences entre espèces.
Deux interprétations sont en concurrence, (a) celle des bio-
linguistes qui considèrent qu’« une telle flexibilité vocale ne
peut pas résulter d’un apprentissage social14 », et relève donc
du patrimoine génétique de l’espèce, et (b) celle de Zuber-
bühler qui observe que les vocalisations en cause se produisent
typiquement durant des interactions sociales, et qui suppose
qu’elles proviennent d’un apprentissage social.
Pour trancher entre ces deux visions, l’équipe du prima-
tologue a comparé le degré de similitude acoustique entre les
cris de contact de singes de Campbell en fonction d’une part
de leurs liens sociaux et d’autre part de leur parenté géné-
tique. Les cris associés à un lien social se révèlent finalement
similaires sur le plan acoustique, mais pas ceux associés à une
relation de parenté génétique. Cela signifie que les facteurs
sociaux ont le pouvoir d’influencer la structure fine de cer-
tains des types de cris dont les caractères généraux ont une
base génétique, ce qui conforte la thèse de l’évolution gra-
duelle de la parole humaine à partir d’un protolangage vocal
en amont. Une observation complémentaire vient à l’appui de
cette thèse : la complexité des vocalisations (décrite comme en
linguistique en termes d’affixation, de répétition et de combi-
naison) croît en fonction de celle de la structure sociale. Et,
comme on pouvait s’y attendre compte tenu des multiples
similitudes comportementales entre cette espèce et l’espèce
humaine, les bonobos produisent des vocalisations différentes
14. M. Hauser, N. Chomsky & W.T. Fitch (2002), op. cit. 75

et interprètent différemment celles de leurs congénères en

fonction de l’environnement et de leur intelligence sociale.
L’observation de vocalisations syntaxiquement variées ne
se limite d’ailleurs pas au monde des primates. L’ornitho-
logue Irene Pepperberg a exploré de son côté les performances
vocales de perroquets gris du Gabon (Psittacus erithacus) et
a soutenu en 2005 que « les substrats neuronaux nécessaires
pour les précurseurs comportementaux du langage peuvent
se développer dans tout cerveau de vertébré raisonnablement
complexe si les pressions sélectives socio-écologiques sont
convenables ». Les biologistes distinguent rigoureusement les
processus présentant une homologie, attestant une origine
commune, de ceux présentant une analogie, c’est-à-dire résul-
tant d’une convergence comportementale à partir de substrats
différents. À défaut d’homologie, la syntaxe des vocalisations
d’oiseaux chanteurs présente plusieurs analogies remarquables
avec la parole humaine :
• une période de sensibilité pendant laquelle l’exposition au
système adulte permet au développement de s’accélérer ;
• un stade de pratique du babil où les jeunes s’entraînent
avec les sons qui deviendront finalement une partie de
leur répertoire ;
• un besoin d’apprendre non seulement les sons à produire
mais aussi le contexte approprié dans lequel produire des
vocalisations spécialisées ;
• l’aptitude à traiter hiérarchiquement des séquences
vocales structurées, lesquelles ont sans doute été des pré-
curseurs de la syntaxe chez les humains ;
• et des structures cérébrales latéralisées dédiées à l’acqui-
sition, au stockage et à la production de vocalisations15.
15. A. Lemasson, K. Ouattar, E.J. Petit, Kl. Zuberbühler (2011), « Social learning of vocal
76 structure in a nonhuman primate ? ». BMC Evolutionary Biology, Vol. 11, 362, 16.12.2011.
Irene Pepperberg s’est rendue célèbre par le véritable partena-

riat linguistique qu’elle a entretenu pendant plus de trente ans
avec l’un de ses perroquets qu’elle avait appelé Alex pour son
expérience sur le langage d’un oiseau (« ALEX : Avian Lan-
guage EXperiment »). J’emprunte à la notice de l’encyclopédie
Wikipedia.org qui est consacrée à Alex la description d’une de
ses étonnantes aptitudes :
« Alex avait un vocabulaire d’une centaine de mots, mais il faisait excep-
tion car il comprenait manifestement le sens de ce qu’il disait. Par exemple
quand on montrait un objet à Alex et qu’on l’interrogeait sur sa forme,
sa couleur ou sa matière, il pouvait la désigner correctement. Il pouvait
décrire une clé quelle que soit sa taille ou sa couleur et pouvait déterminer
si la clé était différente d’autres clés. En se regardant dans un miroir, il dit
« quelle couleur » et apprit « gris » après avoir entendu le mot six fois ».
Concernant les facultés vocales des cétacés, un article paru

en juin 2014 dans le journal de l’Association américaine des
acousticiens révèle que les orques peuvent s’engager dans un
apprentissage vocal avec d’autres espèces. En l’occurrence, les
chercheurs ont constaté que des orques socialisées avec des
dauphins souffleurs au large de l’Australie avaient adapté leurs
vocalisations à celles de leurs partenaires sociaux. L’expérience
a consisté à comparer des enregistrements d’orques vivant dans
des groupes de même espèce et d’orques vivant en compagnie
de dauphins souffleurs et elle a démontré le haut niveau de
plasticité neuronale des orques.
Dans le même esprit, le zoologiste Vincent Janik, de l’uni-
versité écossaise de Saint Andrews, a pu constater que le chant
d’une espèce de baleines à bosse (les Megaptera novaeangliae)
a « une structure hiérarchique consistant en séquences consti-
tuées d’éléments multiples », chaque séquence durant environ
quinze secondes et étant habituellement répétée plusieurs fois,
ce qui est analysé comme un thème. Le chant est constitué
77
de plusieurs thèmes et peut atteindre trente-cinq minutes.

Au total, les baleines chanteuses peuvent répéter ces chants
pendant plus de vingt heures de suite. En outre la prolon-
gation de cette étude sur plusieurs années a montré que les
baleines varient leurs chants d’une saison à l’autre au point de
les renouveler complètement au bout de douze ans.
L’interprétation la plus plausible des variations dans les
chants est liée à la séduction des partenaires sexuels : d’un côté
les mâles doivent synchroniser leurs chants pour produire les
changements hormonaux nécessaires chez les femelles, d’un
autre côté ils introduisent des variantes pour sortir du lot.
Selon Janik, ces variantes seraient ensuite copiées par leurs
concurrents, ce qui entraînerait une variation collective des
chants.
Le « style galiléen » de Chomsky

La double hypothèse spéculative, défendue par Chomsky
et Bickerton, d’un saut qualitatif16 favorisé par une mutation
génétique aléatoire et de la primauté de la fonction calculatoire
du langage au détriment de la fonction communicative, est
téméraire et elle réunit peu de suffrages17. Chomsky la justifie
par une approche de « style galiléen ». Il veut dire par là que,
malgré l’intuition partagée et seule acceptable théologique-
ment, du géocentrisme, Galilée a été intellectuellement séduit
par la « révolution copernicienne » de l’héliocentrisme. Il est
entré en contact avec Johannes Kepler et, par la fabrication de
16. Je fais référence à l’expression « un saut qualitatif dans la série quantitative » qu’employait
Friedrich Engels pour décrire la transformation du singe en homme, elle-même issue de
l’image du bourgeon se transformant en fleur dans la Phénoménologie de l’esprit de Hegel.
C’est la source de l’adjectif « saltationniste » (Bickerton défend une théorie saltationniste,
Pinker une théorie gradualiste de l’hominisation).
17. Ch. Behme, « A “Galilean” science of language ». Journal of Linguistics, mai 2014 : « Dans
une perspective biologique, la thèse saltationniste est tellement exotique qu’elle a été
rejetée à la quasi-unanimité par des chercheurs qui sont par ailleurs en désaccord entre
78 eux sur de nombreux autres aspects de l’évolution du langage ».
sa lunette, il s’est donné le moyen de découvrir les satellites de

Jupiter et de proposer une généralisation logique à l’ensemble
des mouvements planétaires dans le système solaire et au-delà.
Mais la controverse ne s’est pas fait attendre : dans un
article retentissant paru dans le Journal of Linguistics en mai
2014, l’historienne des sciences Christina Behme se déclare
consternée par la démarche de Chomsky :
« Chomsky donne l’impression de citer des fragments d’une quantité
substantielle de travaux scientifiques qu’il a conduits ou avec lesquels il est
familier. Pourtant ses spéculations révèlent un manque de compréhension
des bases mêmes de la biologie, et un refus de se confronter sérieusement à
la littérature pertinente. En même temps, il ridiculise l’œuvre de presque
tous les autres théoriciens, sans énumérer les conceptions avec lesquelles
il est en désaccord. Une analyse critique de la « méthode galiléenne »
démontre que Chomsky fait appel à l’autorité pour préserver ses propres
thèses de toute réfutation par la preuve empirique du contraire. Cette
forme de discours n’est pas sérieusement en phase avec la manière dont
progresse la science18 ».
L’auteure fait référence à l’échelonnement des capacités cog-

nitives dans le processus d’accession à un langage perfectionné
dans la phylogénèse de l’espèce humaine élaboré par le neuro-
psychologue Michael Arbib. L’échelle proposée comporte sept
stades (S1 à S7), le septième, celui du « véritable langage » se
subdivisant lui-même en quatre phases d’acquisition :
• LA1 : phase de la symbolisation et de la compositionnalité,
• LA2 : phase de la syntaxe, de la sémantique et de la récursivité,
• LA3 : phase des temps verbaux
• LA4 : phase de l’aptitude à l’apprentissage.
À elle seule, la progression du stade S1 (la saisie par l’es-
prit) au stade S3 (l’imitation d’un comportement complexe)
réclame déjà des changements cognitifs et neurologiques
notables, ce qui rend très aléatoire l’idée qu’une seule mutation
18. Ch. Behme, op.cit. 79

ait permis de franchir le fossé neurolinguistique entre nos

ancêtres proches des grands singes anthropomorphes actuels
et nous-mêmes.
Selon cette échelle, la récursivité apparaît tardivement
(stade 7, niveau LA2), ce qui autorise Ch. Behme à conclure
que le cerveau des hominidés avait subi des changements
significatifs à partir du cerveau des grands singes avant d’être
prêt pour quelque chose comme la fusion illimitée. Ce qui
revient à dire que l’hypothèse saltationniste de la biolinguis-
tique minimaliste (Chomsky en 2007) et du bioprogramme
(Bickerton en 2009)19 n’est pas tenable, et que seule la sélec-
tion naturelle graduelle reste plausible, comme le pensent Pin-
ker et Jackendoff, évoqués plus haut.
La mutation de certains gènes a affecté l’aptitude

au langage des premiers hommes
Il y a un quart de siècle, deux neurolinguistes, M. Gopnik
et M.B. Crago, faisaient paraître dans la prestigieuse revue
Cognition un article consacré à un trouble développemental
du langage qui affectait la moitié d’une vaste famille sur trois
générations20. La dysphasie (un trouble de l’élocution) dont
souffre cette famille connue sous le nom de code KE est une
défaillance de la production de syllabes à valeur flexionnelle
et la proportion de membres de cette famille concernés impli-
quait une origine génétique.
Les auteurs introduisaient ainsi leur étude :
« Cet article explore l’étiologie de la dysphasie développementale et ses
propriétés linguistiques. Les données présentées suggèrent que certains cas
au moins de dysphasie sont associés à un gène dominant anormal. Nous
rapportons les résultats d’une batterie de tests appliqués à une grande
19. D. Bickerton (2010), La langue d’Adam, Dunod.

20. M. Gopnik & M. Crago (1991), « Familial aggregation of a developmental language
80 disorder », Cognition 39 (1):1-50.
famille embrassant trois générations dont la moitié des membres souffrent

de dysphasie. Ces résultats montrent que la morphologie abstraite est
perturbée chez ces sujets. Nous faisons valoir en outre que ces données
concordent avec l’hypothèse que les dysphasiques apprennent les lexies
marquées par des traits [morphologiques] comme des lexies inanalysées.
Ils n’ont pas la capacité sous-jacente d’acquérir le langage en construisant
des paradigmes. »
En 1991, l’année de l’étude de Gopnik et Crago, la géno-

mique n’était pas encore avancée et c’est seulement en 1998
que FOXP2 (Forhead-Box-Protein P2) a été identifié comme
un « gène de transcription » régulant un millier d’autres gènes.
La controverse sur l’effet de la mutation d’un gène (encore
inconnu) susceptible d’avoir entraîné le trouble du langage
ou de la parole affectant la famille KE n’a pu se clarifier qu’à
partir de cette date. En résumé : les gènes sont des fragments
d’ADN (acide désoxyribonucléique) véhiculant les infor-
mations nécessaires à la synthèse d’un ARN (acide ribonu-
cléique). La transcription est la conversion de l’information de
l’ADN à l’ARN et de celui-ci à une protéine21. Si un gène de
transcription subit une mutation, celle-ci peut avoir des effets
multiples et engager l’évolution sur une nouvelle voie.
En quoi la mutation du gène FOXP2 identifiée dans la
famille KE éclaire-t-elle la phylogenèse de la faculté de lan-
gage ? L’hypothèse communément partagée est actuellement
que l’espèce Homo sapiens a été phylogénétiquement avan-
tagée par une mutation [mut.1] du gène de transcription
FOXP2 (et sans doute d’autres gènes du même ordre, voir
plus loin) qui lui a permis de contrôler les muscles de la
bouche, de la face et du larynx, de produire différents types de
voyelles et de consonnes et de moduler la production de sons
qui ont fini par constituer des systèmes articulatoires permet-
tant à leur tour de bâtir des signes linguistiques. La famille
21. Voir J. Koolman & K.H. Röhm (2011, 4e éd., 230), Biochimie humaine, Lavoisier. 81
KE examinée par Gopnik & Crago est affectée par une autre
mutation [mut.2] qui remet en cause certains des avantages
de la mutation [mut.1], touchant notamment le contrôle oro-
facial, comme l’illustre le tableau ci-dessous :
Stade 1 Hominidés FOXP2
Stade 2 Homo sapiens FOXP2 [mut.1]
FOXP2 [mut.2] réduisant

Pathologie Famille KE
les avantages de [mut.1]
De ce fait les membres de cette famille présentent des défi-

ciences dans l’articulation des syllabes, notamment finales,
qui donne l’impression qu’ils pratiquent un langage dénué
de marques morphologiques. Il se trouve que ces marques
morphologiques (de pluriel pour les substantifs et de temps
et personne pour les verbes) sont véhiculées par des syllabes
inaccentuées plus sujettes à disparaître que les syllabes radi-
cales toniques, mais la dysphasie en cause présente une ana-
logie avec la réduction syllabique qui s’est produite massive-
ment entre le latin et les futures langues romanes. Par exemple
le latin insula a donné le français classique isle et le français
moderne île. Le latin securus a donné le français sûr, et com-
putare a donné compter. Les syllabes réduites n’avaient pas de
valeur morphologique, elles étaient seulement inaccentuées,
et il en est apparemment de même dans les productions orales
de la famille KE.
Une fois identifié, l’examen de l’éventail de l’impact d’une
mutation de FOXP2 sur la physiologie humaine a permis
d’écarter définitivement la thèse d’un « gène de la grammaire »
qui avait fleuri dans les médias à la fin des années 1990,
pour une part à cause de l’enthousiasme prématuré de Ste-
ven Pinker dans L’Instinct de langage. En outre on a constaté
82
ultérieurement que les capacités vocales des oiseaux chanteurs

et des perroquets gris, dont Alex, étudié pendant une trentaine
d’années par l’ornithologue Irene Pepperberg, sont associées
au même gène FoxP2 qui leur permet un contrôle moteur
vocal exceptionnellement complexe.
Genèse du langage et culture symbolique

Cela étant, peut-on dater la mutation génétique qui a
ouvert la voie de la parole ? Au début du xxie siècle Richard
Klein, un archéologue de l’université américaine de Stanford,
a cherché à associer l’émergence du langage avec l’explosion de
la culture symbolique, illustrée par de nombreuses peintures
rupestres datant d’il y a quelque 50 000 ans. Mais en 2009
Rebecca Cann, spécialiste de biologie moléculaire et cofonda-
trice de l’hypothèse de l’Eve mitochondriale, a objecté, dans
un article rédigé avec le linguiste et biologiste Karl Diller, que
« le contrôle de l’appareil vocal est extrêmement complexe,
implique la langue, les lèvres, les cordes vocales, la respiration,
etc.22 ». Il s’avérait donc peu vraisemblable qu’une mutation
isolée ait suffi pour que les premiers hommes acquièrent la
capacité neuronale à exercer un contrôle conscient de tous ces
processus23. Terrence Deacon va dans le même sens quand il
souligne que la coévolution entre le cerveau et le langage a
impliqué une longue maturation, en l’absence de laquelle la
faculté de langage serait une capacité fragile, alors que c’est
22. K. Diller & R. Cann (2009), « Evidence against a genetic-based revolution in language
50,000 years ago », in R. Botha & Ch. Knight (eds. 2009), The Cradle of Language,
Oxford University Press.
23. K. Diller & R. Cann (op.cit., p.149) « D’un point de vue neurolinguistique, si FOXP2 a
réellement une importance cruciale pour l’évolution du langage en favorisant un contrôle
neuromusculaire des organes de la parole, on s’attendrait à ce que les mutations humaines
de FOXP2 se soient produites au début ou près du début du processus de croissance
considérable du cerveau, de telle sorte que le langage parlé et l’aptitude biologique au
langage puissent co-évoluer en se renforçant mutuellement. Nous présumons que le
million et demi d’années qu’a duré la croissance du cerveau dans le genre Homo a coïncidé
avec cette co-évolution du langage et des structures biologiques pour le langage. » 83
manifestement une capacité robuste, puisque la quasi-totalité

des enfants, même de ceux qui souffrent d’une microcépha-
lie24, parviennent à la maîtrise, au moins superficielle, d’une
langue.
K. Diller et R. Cann font valoir que l’explosion symbo-
lique d’il y a 50 000 ans a été précédée par des manifestations
d’un symbolisme naissant. À titre d’illustration, ils notent que
l’utilisation de pigments dans un contexte culturel humain
remonte à quelque 270 000 ans. Il en résulte que selon eux la
capacité de langage était déjà pleinement développée chez les
premiers humains anatomiquement modernes il y a au moins
200 000 ans, et que les données de l’archéologie et de l’anthro-
pologie physique excluent l’hypothèse d’une révolution sou-
daine dans la culture symbolique il y a environ 50 000 ans.
Ils évoquent pour les mutations du gène humain FOXP2 une
datation de l’ordre de 1,8 à 1,9 million d’années, correspon-
dant à l’époque où la taille du cerveau humain a commencé
à tripler (depuis les 450 cm3 du cerveau des chimpanzés et
des australopithèques jusqu’aux 1 350 cm3 du cerveau humain
moderne).
Cette datation peut aussi être mise en relation avec la thèse
du physiologiste Philip Lieberman25 selon laquelle l’un des
facteurs décisifs de la genèse de la parole a été l’allongement
du larynx des hominidés (y compris les australopithèques)
lui-même causé par le repositionnement du crâne au-dessus
des vertèbres cervicales à la suite du passage à la bipédie. La
thèse aujourd’hui dominante est que « la bipédie existe depuis
plus de 6 millions d’années, elle est utilisée aussi bien par nos
ancêtres que par de grands singes actuels… Chez les homini-
dés, cette aptitude s’est amplifiée au fur et à mesure du temps
24. « Malformation néonatale définie par une taille de la tête beaucoup plus petite que celle
des autres nouveau nés du même âge et du même sexe » (OMS).
25. Ph. Lieberman (1984). The Biology and Evolution of Language. Cambridge, Harvard
84 University Press.
pour devenir chez les hommes modernes l’unique moyen de

locomotion, ce n’est donc pas un trait de différenciation26 ».
Si l’on s’en tient à cette thèse, l’enchaînement des aptitudes
serait donc :
passage à la bipédie (il y a 6 millions d’années)
¾
mutations du gène FOXP2

(il y a 1,8/1,9 millions d’années)
et genèse d’un protolangage
¾
premières manifestations du symbolisme

(il y a ±270 000 ans)
et langage articulé
¾
révolution symbolique (-50 000 ans)

¾
invention de l’écriture cunéiforme

(IVe millénaire avant notre ère)
Puisque Diller & Cann estiment très improbable qu’une

seule mutation ait été à l’origine du langage ou même de la
parole, quelles autres mutations génétiques ont-elles pu y
contribuer ? Les auteurs mentionnent un gène impliqué dans
le développement du cortex cérébral et de la fonction des
axones (CNTNAP2), dont de hautes concentrations ont été
découvertes dans des circuits neuronaux liés au langage27. Ils
évoquent aussi la mutation humaine du gène CMAH il y a
26 . http://www.hominides.com/html/dossiers/bipedie.php, site qui évoque également la

thèse inverse d’une bipédie originelle chez les grands singes.
27. Selon un article paru dans le European Journal of Human Genetics (2014) 22, 171–178,
le gène CNTNAP2 « a été récemment impliqué dans un large éventail de phénotypes
incluant des désordres dans le spectre de l’autisme, la schizophrénie, le retard intellectuel,
la dyslexie et les troubles du langage ». 85
environ 2,7 millions d’années, laquelle a stoppé la production

d’un enzyme inhibant la croissance des cellules du cerveau et
peut avoir ouvert la voie à la genèse de la parole : « Il se peut
que le relâchement de ce frein à la croissance ait été un prére-
quis pour la réorganisation du cerveau au profit de la parole et
du langage, mais cela n’explique pas la réorganisation. »
Édification de la syntaxe :
entre architecture et bricolage
Nous avons rencontré précédemment des manifestations
convaincantes de l’auto-organisation dans le domaine de la
phonologie28, mais, selon la thèse émergentiste de William
O’Grady, l’auto-organisation touche aussi la syntaxe et elle
remet en cause l’idée d’une grammaire universelle innée. Dans
son ouvrage de 2005 sur « la charpenterie syntaxique »29, ce
linguiste propose une approche originale de l’étude de la for-
mation des phrases. Partant de la thèse émergentiste que la
structure et l’usage du langage sont modelés par des forces plus
fondamentales et non linguistiques plutôt que par une gram-
maire universelle, O’Grady montre comment les propriétés
définitoires de différents phénomènes syntaxiques résultent de
l’intervention d’un processeur linéaire, guidé par la recherche
d’efficience. Il débouche sur une vue originale et fascinante de
la formation des phrases basée sur les conditions psycholin-
guistiques de leur traitement en production et en réception.
O’Grady résume ainsi sa thèse :
« quand il s’agit de phrases, il n’y a pas d’architecte ; il y a seulement des
charpentiers. Ils imaginent (design) en construisant, et ils tiennent compte
uniquement du matériau à leur disposition et de la nécessité d’achever
28. Notamment B. De Boer (2001), The Origins of Vowel Systems, Oxford University Press ;
P.Y. Oudeyer (2013), Aux sources de la parole : Auto-organisation et évolution, Odile Jacob ;
P. MacNeilage P. (2008), The Origin of Speech, Oxford University Press.
29. W. O’Grady (2005), Syntactic Carpentry: An Emergentist Approach to Syntax, Londres,
86 Routledge.
leur ouvrage aussi vite et efficacement que possible. De fait, comme je

vais le montrer, l’efficience est la force qui pilote le design et l’opération
du système computationnel pour le langage humain. »
Diller & Cann font référence en 2013 à la thèse de leur

collègue et s’associent à sa conviction qu’en adoptant la méta-
phore du charpentier construisant sans plan, O’Grady montre
que les propriétés d’un éventail de phénomènes associés à la
grammaire universelle (l’accord, le contrôle, le liage, c’est-
à-dire la référence des groupes nominaux, et les effets des
traces des mouvements syntaxiques) tiennent simplement à
la manière dont les phrases sont construites par un processeur
dont le souci premier est simplement de minimiser l’encom-
brement de la mémoire de travail. Moins la mémoire de travail
est encombrée, plus l’énonciation est efficiente.
Par exemple, compte tenu de la nécessité de savoir ce sur
quoi Paul s’interroge, l’encombrement de la mémoire de tra-
vail est important dans la phrase [1] Paul se demandait, depuis
qu’il avait découvert des contrefaçons dans la comptabilité de son
service, s’il devait en aviser ses supérieurs. Il est plus faible dans la
phrase [2] : Depuis qu’il avait découvert des contrefaçons dans la
comptabilité de son service, Paul se demandait s’il devait en infor-
mer ses supérieurs. Dans la seconde, on a rapproché le verbe
de la proposition principale et de la proposition interrogative
indirecte.
C’est également la ligne d’argumentation de John Hawkins
qui constate que les grammaires ont été profondément pétries
par la performance, et que même des propriétés de base et
apparemment non fonctionnelles de la grammaire universelle,
par exemple la disposition des adjectifs épithètes avant ou après
le substantif auxquels ils se rapportent, reçoivent une explica-
tion plus adéquate en termes de performance. Cette hypo-
thèse de la correspondance entre performance et grammaire
est exposée dans un de ses ouvrages intitulé L’Efficience et la
87
complexité dans les grammaires30. Les spécialistes de la simula-

tion informatique de la genèse des structures syntaxiques Mor-
ten Christiansen et Michelle Ellefson31 vont également dans le
même sens en s’attaquant à l’un des bastions de la théorie de la
grammaire universelle : la contrainte de sous-jacence. Il s’agit
du constat qu’un pronom (interrogatif ou relatif ) ne peut pas
être déplacé loin en dehors de la proposition à laquelle il se
rattache naturellement.
Considérons ces exemples :
[1] Sarah connaît X _ Qui est-ce que Sarah connaît ?
_ Qui est-ce que Sarah croit que
[2] Sarah croit que tout le monde tout le monde connaît ?
connaît X _ ? Qui est-ce que Sarah croit
connu de tout le monde ?
[3] Sarah comprend que tout le _ Qui est-ce que Sarah comprend
monde connaît X connu de tout le monde ?
Dans la phrase [1], X est l’objet du verbe connaît. Il peut

être extrait de la proposition sous la forme du pronom inter-
rogatif qui.
Dans la phrase [2], X est toujours l’objet du verbe connaît
mais celui-ci figure dans une subordonnée complétive. Il
devient alors impossible de le transformer en un pronom inter-
rogatif, à moins éventuellement de transformer la proposition
complétive en un groupe participial passif (appelé « proposi-
tion réduite ») connu de tout le monde, car cette transformation
réduit la complexité de la relation syntaxique entre le sujet de
30. J. Hawkins (2004), Efficiency and complexity in grammars, Oxford University Press.
31. M. Christiansen & Ellefson M. (2002), « Linguistic adaptation without linguistic
constraints : the role of sequential learning in language evolution », in A. Wray (ed.), The
88 transition to language, Oxford University Press.
la principale Sarah et le pronom interrogatif 32.

Dans la phrase [3], la transformation possible avec des
verbes de pensée tels que savoir, croire, penser, juger ou estimer,
n’est plus possible avec le verbe comprendre.
La grammaire universelle de Chomsky établit précisément
les conditions dans lesquelles un pronom interrogatif ou rela-
tif peut être extrait de la proposition à laquelle il se rattache,
et constate que cette contrainte opère de manière analogue à
travers les langues, moyennant des ajustements (la contrainte
est appelée un principe, les ajustements sont appelés des para-
mètres). C’est son pouvoir descriptif, mais elle ne cherche pas
à expliquer pour quelle raison il en est ainsi. La modélisation
de Hawkins, O’Grady et Christiansen vise en revanche à expli-
quer la contrainte par la limitation de la charge mémorielle.
En termes simples, le locuteur et l’interlocuteur doivent
inconsciemment se représenter des groupes syntaxiques
emboîtés les uns dans les autres, et la contrainte stipule qu’il
est possible d’extraire le pronom interrogatif ou relatif d’une
boîte unique, mais pas d’une boîte contenue dans une autre
boîte. La première opération est relativement simple et ne
demande donc pas un grand investissement de la mémoire
de travail, tandis que la seconde est complexe. Or, au bout
de quelques secondes le résultat du traitement en mémoire
de travail doit être transféré dans la mémoire à long terme,
sinon il est perdu. Comme ce transfert s’avère impossible, la
phrase ne peut être ni énoncée par le locuteur ni comprise par
l’interlocuteur.
On peut en conclure que les opérations linguistiques ne
sont pas dissociables d’opérations cognitives plus générales
d’attention, de computation et de mémorisation, ce qui est
32. Il ne s’agit pas de leur éloignement dans la phrase Qui est-ce que Sarah croit connu de tout le
monde ? qui est modéré, mais de la relation entre ces deux mots à travers la hiérarchie des
groupes dont ils font partie, dont il n’est pas possible de donner une représentation ici. 89
contraire à l’hypothèse de Chomsky selon laquelle les proces-

sus linguistiques répondent à une logique propre définie par sa
Grammaire universelle. Ce qui constitue le substrat inné per-
mettant la pratique du langage, ce sont très probablement ces
principes de régulation de l’activité cognitive qui conditionnent
l’activité linguistique, mais ne lui sont pas propres, que ceux-
ci affectent la sélection et la combinatoire des phonèmes ou la
sélection et la combinatoire des signes linguistiques.
Quand les populations migrent,

les langues se diversifient
Dans le chapitre 5 de Genes, People and Languages33 (2000),
le généticien Luigi Cavalli-Sforza, fort de sa collaboration
avec ses collègues linguistes de l’université de Stanford, Joseph
Greenberg et Merrit Ruhlen, a entrepris de coordonner les
données généalogiques disponibles sur les superfamilles de
langues et celles de la génétique des populations. Cette dis-
cipline, dont Cavalli-Sforza est l’un des spécialistes les plus
réputés, poursuit une démarche apparentée sur la base de dif-
férents types de données génétiques, initialement les types de
groupes sanguins, plus récemment le séquençage de l’ADN
des différentes populations.
La comparaison entre les données de la comparaison mul-
tilatérale (voir dernier chapitre) et celles de la génétique des
populations vise à identifier les zones d’homologie entre les
deux classements. Dans un même espace les populations se
mêlent plus ou moins selon leurs rapports de force, de sorte
qu’on est en présence d’un côté de parentés linguistiques plus
ou moins marquées34 et d’un autre côté de parentés génétiques
elles aussi graduelles. Cependant, dans certains cas, les deux
33. Traduction française : Gènes, peuples et langues (1996, Odile Jacob).

34. Selon la théorie de la diffusion ondulatoire des traits linguistiques proposée par le linguiste
90 comparatiste Johannes Schmidt en 1872.
classements se recoupent de manière flagrante, par exemple

dans le cas de la diffusion des peuples bantous. Cavalli-Sforza
propose un diagramme à double entrée (voir plus bas), les
regroupements génétiques à gauche et les familles de langues à
droite : « Il précise qu’une famille de langues figure parfois sur
une seule branche de l’arbre génétique-linguistique conjoint
parce que les populations parlant ces langues figurent dans un
seul groupe génétique, présentant une grande similitude, de
nature soit génétique, soit ethnographique, et vivant dans des
espaces voisins35. »
Le généticien cite comme exemples de concordance entre
les deux classements, linguistique et génétique, les peuples
bantous pour l’Afrique et la famille na-déné du Nord-Ouest
du Canada pour les Amériques. Cependant il faudrait exami-
ner de près les cas inverses de discordances, lesquelles peuvent
avoir des origines diverses : un contact déstabilisant avec une
culture plus prestigieuse, une colonisation, une migration,
une guerre de conquête, etc., et qui requièrent des études
approfondies. Trois zones de son diagramme (numérotées et
entourées d’une ellipse en pointillés) appellent notamment
des remarques :
1. Les Éthiopiens sont génétiquement proches des « bush-
men » (San) mais les uns et les autres parlent des langues
de familles très différentes. Les Éthiopiens pratiquent
une langue de la famille « afro-asiatique » (ou « hami-
tique »), les San se rattachent à la famille khoïsan célèbre
pour ses « clics » qui la rangent parmi les langues les plus
anciennes du globe.
2. Inversement dans le nord de l’Eurasie, les Lapons et les
Samoyèdes sont linguistiquement apparentés (appar-
tenant à la même famille ouralienne-youkaghir), mais
sont génétiquement distants. Les premiers sont rattachés
35. Cf. L. Cavalli-Forza (1996) dans la bibliographie. 91

génétiquement aux Indo-européens et les seconds aux

Mongols, et les Turcs du nord parlent une langue altaïque
alors qu’ils sont rattachés génétiquement aux Eskimos,
lesquels parlent une langue eskimo-aléoute. Quant aux
Indiens du sud-est parlant des langues dravidiennes, ils
sont rattachés génétiquement aux autres Indiens parlant
des langues indo-européennes, ce qui atteste la migra-
tion indo-européenne et la dominance linguistique du
groupe linguistique indo-aryen (incluant la majorité des
langues de l’Inde et de l’Iran) qui en découle dans la
majeure partie de l’Inde.
3. De même les populations mélanésiennes de Nouvelle-
Guinée et des îles Salomon sont génétiquement étroite-
ment apparentées aux populations micronésiennes des
îles Gilbert, Marshall et Marianne, mais les Néo-Gui-
néens se rattachent linguistiquement à la famille indo-
pacifique et les Salomonais à la famille austronésienne,
lesquelles ne sont pas directement apparentées.
92
93
Évolution génétique et évolution culturelle

de l’espèce humaine
Traduit en 2005, le livre Évolution biologique, évolution
culturelle, de Luigi Cavalli Sforza affirmait pour l’espèce
humaine le caractère indissociable des deux modes d’évolu-
tion, biologique et culturel. On y lisait notamment ceci :
« l’on ne peut pas exclure totalement l’existence de différences génétiques
susceptibles d’influer fortement sur la culture (…) l’homme est surtout
un animal culturel, bien que la culture existe aussi chez les animaux
(…) la génétique a développé la théorie de l’évolution biologique, mais
cette théorie est totalement générale et inclut aussi celle de l’évolution
culturelle, parce qu’elle est applicable à tout « organisme » capable de
s’autoreproduire (…)36 »
Cavalli-Sforza énumère quatre facteurs qui modèlent

l’évolution biologique : les mutations, la sélection naturelle,
la dérive génétique, (qui équivaut à un « hasard généralisé »)
et les migrations d’individus particuliers et de populations
entières qui débouchent sur un métissage génétique. Il définit
la culture comme « l’ensemble des connaissances et des com-
pétences qu’un individu acquiert à partir de sa naissance et
ce à l’aide de son cerveau », et les hommes comme des ani-
maux culturels, car « notre bagage héréditaire consiste dans
des idées, qui transitent d’un cerveau à un autre grâce au lan-
gage articulé ». Il établit un lien analogique entre les muta-
tions en biologie de l’évolution et le jeu des innovations et des
déperditions dans le domaine des idées et des connaissances :
lorsqu’un savoir ou un mode de représentation collectif se
désagrège, il donne lieu à un renouvellement plus ou moins
94 36. L. Cavalli-Sforza (2005), Évolution biologique, évolution culturelle (p. 21), Odile Jacob.
aléatoire37.
Dès 1981, Luigi Cavalli-Sforza et son partenaire, le bioma-
thématicien Marcus Feldman, se donnaient comme objectif,
dans leur livre sur « la transmission culturelle et l’évolution »38,
de classer et de systématiser les différents modes de transmis-
sion de la culture et d’explorer leurs contributions respectives
à l’évolution culturelle. Ils développaient pour cela une théo-
rie mathématique de la transmission de traits culturels indé-
pendants de la génétique, dont Cavalli-Sforza, dans une inter-
view donnée en 2005, regrettait cependant qu’il ait effrayé les
anthropologues par son haut niveau de formalisation39.
Bien entendu, l’échelle chronologique et les modalités des
deux types d’évolution diffèrent profondément : la transmis-
sion biologique est lente et « verticale » (de génération en
génération), tandis que la transmission culturelle est rapide
et « horizontale » (entre interlocuteurs). Certains choix cul-
turels peuvent influer sur le succès reproductif, voire sur la
survie des individus, il suffit d’avoir à l’esprit l’effet de l’usage
ordinaire de drogues dangereuses ou la propagation du sida.
En pointant sur la croyance en la virginité de la mère de Jésus,
autoritairement décrétée par le second concile de Constanti-
nople en 553, le généticien de Stanford illustre l’analogie entre
des innovations génétiques aléatoires, qui constituent la dérive
génétique, et des innovations culturelles dont la diffusion est
purement idéologique.
37. Le processus cyclique est largement illustré en linguistique, par exemple dans l’expression
du futur qui est passée d’un format flexionnel en latin classique à un format analytique
(avec un auxiliaire du futur du type avoir à) en latin vulgaire, puis à la reconstitution d’un
format flexionnel en français et dans les autres langues romanes suivie de la réapparition
d’un format analytique avec cette fois un auxiliaire du type aller qui s’oppose au type venir
de. Exemple : elle va arriver ≠ elle vient d’arriver.
38. L. Cavalli-Sforza & M. Feldman (1981), Cultural transmission and evolution, Princeton
University Press.
39. « Des gènes aux idées-Rencontre avec Luca Cavalli-Sforza », in Révolution dans nos
origines, J-F. Dortier (dir.), éditions Sciences Humaines, 2016, p.350. 95
Toutefois les innovations culturelles aptes à réorienter les

processus de sélection naturelle ne peuvent favoriser des muta-
tions qu’à la condition de se perpétuer au fil de nombreuses
générations. Cavalli-Sforza donne l’exemple de la création de
clairières humides dans des forêts tropicales qui a entraîné une
extension catastrophique du paludisme. Mais ce facteur de
mortalité élevée a inversement favorisé la diffusion, dans les
populations infectées, du gène FYo apte à accroître la résistance
au paludisme et donc à limiter la pandémie. En conclusion,
la survie des espèces dépend de l’éventail de leurs variantes
génétiques, seul capable d’offrir « un maximum de réponses
possibles aux changements de notre environnement ». Et chez
les humains, c’est la variabilité des cultures qui a permis de
contourner des obstacles majeurs, notamment la réduction des
espaces habitables durant la dernière période glaciaire dont le
maximum a été atteint environ vingt millénaires avant notre
ère, soit à l’époque où les hommes modernes ont éliminé les
Néandertaliens. La perpétuation de notre espèce est donc due
à une prédisposition à des comportements flexibles.
« Chez l’homme, la culture a pris une importance exceptionnelle par
rapport à tous les autres animaux. Son principal atout est de nous donner
beaucoup de flexibilité dans nos comportements, et c’est à elle que nous
devons notre succès comme espèce. Pas à un simple mélange d’agressivité
et d’altruisme aveugle40. »
L’esquisse d’une cartographie des aires d’origine

et d’implantation des grandes migrations du
néolithique
Patrick Manning, historien réputé des populations et des
migrations, considère comme Cavalli-Sforza que les ana-
lyses de la génétique des populations et la reconstruction de
superfamilles linguistiques dans l’esprit de Joseph Greenberg
96 40. « Des gènes aux idées », op. cit.

et de Merrit Ruhlen sont effectivement complémentaires, à

condition cependant d’y adjoindre celles de l’archéologie pré-
historique. Ces dernières donnent lieu à ce que le linguiste
sud-africain Rudolf Botha appelle des inférences dégageant
des « preuves indirectes », lesquelles permettent entre autres
d’estimer les dates de divergence entre communautés linguis-
tiques mieux que ne peut le faire la glottochronologie*.
Manning développe une thèse bien argumentée qui pro-
longe celle de Cavalli-Sforza. La césure principale dans l’his-
toire des migrations s’est produite à la fin du xve siècle avec
la colonisation par les Espagnols de l’Amérique centrale et
progressivement de l’ensemble du double continent par les
Portugais, les Français et les Anglais. Ces découvertes et colo-
nisations ont bouleversé la corrélation entre les langues et les
peuples, mais la distribution actuellement observée des lan-
gues du monde révèle une quantité d’informations précieuses
sur les populations et les migrations d’avant cette époque.
Manning applique une technique simple consistant à imagi-
ner les déplacements les plus courts (principle of least moves),
selon le principe de parcimonie généralement adopté dans la
démarche scientifique41. Seules deux sortes d’informations
sont requises, que les linguistes peuvent fournir dans de nom-
breux cas :
1. Un classement généalogique de langues apparentées, dis-
tinguant les vastes familles de langues des temps anciens
et les regroupements de langues plus étroitement appa-
rentées à des époques plus récentes
2. Une carte montrant les localisations de populations par-
lant ces mêmes langues et groupes de langues.
41. C’est une méthode désormais classique en dialectologie, élaborée à la fin du xixe siècle par
le linguiste allemand Hugo Schuchardt. 97
En application de ce principe, Manning rappelle notam-

ment que les romains latinophones, en particulier ceux de la
moitié nord de l’Italie, ont colonisé il y a plus de deux mille
ans toutes les aires qui sont devenues administrativement des
provinces romaines, et ont engagé ainsi le processus qui a
débouché sur les langues romanes d’aujourd’hui42. Manning
formule l’hypothèse complémentaire que les zones où l’on
observe aujourd’hui une faible diversité linguistique repré-
sentent le lieu d’implantation de peuples migrants, tandis que
celles où s’observe une forte diversité linguistique représentent
leur lieu d’origine (homeland). Et il inventorie quatre home-
land d’importance cruciale :
1. Le Caucase, avec les langues du Nord-Causase (dont le
tchétchène), les langues kartvéliennes (dont le géorgien)
et des langues indo-européennes (l’arménien) et oura-
liennes (les langues turques).
2. La côte de l’Asie du Nord-Est, où quatre des sept sous-
groupes de l’eurasiatique* semblent avoir pris leur ori-
gine (notamment les langues altaïques). En appliquant
le principe des déplacements les plus courts, Manning
conclut que l’aire d’origine de l’ensemble de la superfa-
mille eurasiatique se situe près de la côte nord-ouest du
Pacifique et il suggère que les steppes de l’Eurasie ont été
atteintes à partir de l’est et non de l’ouest. Dans cette
hypothèse, les langues indo-européennes ont émergé
aux frontières occidentales de l’espace linguistique
eurasiatique.
3. Il situe le lieu d’origine du sino-tibétain et des langues
austriques (dont notamment les austrasiatiques et les
austronésiennes) dans le Sud-Ouest de la Chine. Il est
42. Les langues des peuples voisins des Romains du Latium durant le dernier millénaire avant
notre ère sont dites « italiques » et les langues qui sont issues du latin vulgaire pratiqué
98 dans les provinces romaines sont dites « romanes ».
vraisemblable que des migrants précoces se sont répan-

dus de là dans toutes les directions, puisque les langues
provenant de cette aire d’origine sont parlées mainte-
nant dans toutes les régions d’Asie et au-delà.
4. La vallée moyenne du Nil a constitué le homeland des
langues afro-asiatiques et nilo-sahariennes. Le Nil a été
la source de tout le processus d’expansion vers l’est il y
a 80 000 ans et probablement aussi de l’expansion vers
le nord.
La carte des langues eurasiatiques, telle que l’a proposée
Greenberg, couvre une aire tellement immense que l’on est
immédiatement tenté de la considérer comme reflétant « un
mouvement rapide pour occuper toute l’Asie septentrionale
en partant d’une seule région dans les tropiques ». Manning
voit un progrès substantiel dans l’identification de cette vaste
famille de langues, car elle corrige selon lui l’erreur du xixe
et de la première moitié du xxe siècle qui consistait à se foca-
liser sur les langues indo-européennes, lesquelles se révèlent
maintenant n’être que l’un des sept groupes constitutifs de
la famille eurasiatique. Cependant, dans son enthousiasme,
Manning suppose un peu hâtivement que les thèses de Green-
berg et Ruhlen recueillent l’assentiment de la communauté
des linguistes, ce qui est loin d’être le cas, en dehors du clas-
sement des langues d’Afrique, qui fait désormais consensus.
Manning évoque trois voies de migration principales cen-
sées expliquer l’accès de différents peuples aux zones tempé-
rées de l’Eurasie, climatiquement intéressantes pour l’élevage
comme pour l’agriculture.
La première aurait conduit des populations eurasiatiques
provenant de la côte nord-est du Pacifique (autour de la Corée
et du Japon actuels) jusqu’aux steppes de l’Asie centrale par la
vallée du fleuve Amour et l’actuelle Mongolie. Les archéolo-
gues établissent une corrélation entre la distribution des restes
99
d’embarcations en peaux à travers l’Eurasie septentrionale et

les zones arctiques du continent américain, et les zones où se
sont parlées des langues eurasiatiques.
La seconde va du homeland sino-tibétain aux steppes de
l’Eurasie. Elle suppose que les migrants, ayant franchi des val-
lées himalayennes, se sont accoutumés à des zones de plus en
plus sèches. Cet itinéraire aurait été à l’origine de la célèbre
Route de la soie.
La troisième est la plus traditionnelle, imaginée dès le
xixe siècle, partant du Nil vers le Caucase en parcourant le
croissant fertile du Moyen-Orient. Manning invoque toute-
fois trois arguments qui ébranlent cette hypothèse. Le premier
est d’ordre écologique : il doute que des peuples en migration
il y a 60 000 ans aient été capables de surmonter les obstacles
climatiques que cette route accumule. Le second est linguis-
tique, et c’est pour Manning l’occasion d’évoquer les raisons
idéologiques qui ont conduit les linguistes du xixe siècle à éta-
blir un lien étroit entre les langues indo-européennes et sémi-
tiques. Elles tenaient à la couleur de la peau (le « type causa-
sien ») et au triple épanouissement des cultures de l’écrit en
Crète, en Mésopotamie et en Égypte. Il semble désormais que
les groupes linguistiques du sémitique, de l’ancien égyptien et
du berbère ont divergé à une époque relativement récente (il
y a ±15 000 ans), donc bien plus tard que les autres voies évo-
quées plus haut. Le troisième argument est d’ordre génétique
et Manning met en doute la préférence de Cavalli-Sforza pour
cette voie d’accès au Caucase.
Au final Manning brosse un tableau synthétique des migra-
tions qu’il suppose les plus probables :
« Un mouvement par des plaines ou en partie le long de fleuves dans les
vallées orientales de l’Himalaya de la Chine méridionale vers l’est des
steppes eurasiennes peut avoir donné naissance à une population “tem-
pérée”. Ce groupe, parlant des langues déné-caucasiennes, a commencé
100
à s’adapter à la vie dans des zones tempérées. La seconde migration

substantielle s’est déplacée vers le nord le long de la côte du Pacifique.
Ce mouvement a donné lieu à la formation du groupe des langues eura-
siatiques, lequel s’est diffusé pour refouler ou assimiler des groupes anté-
rieurs à l’exception de quelques reliquats de déné-caucasiens. La diversité
linguistique de la côte septentrionale du Pacifique suggère pour le moins
qu’il s’agissait d’un lieu d’implantation précoce et d’un homeland pour des
groupes de migrants. En troisième lieu, un mouvement vers le nord de
locuteurs de langues afro-asiatiques d’origine africaine peut avoir contri-
bué à leur implantation dans l’Eurasie tempérée. Si un tel mouvement
a pris place à une époque relativement précoce, les migrants pourraient
s’être déplacés le long des côtes de la Méditerranée et de la mer Noire, bien
que les données linguistiques suggèrent que la migration afro-asiatique a
été relativement tardive43. »
Un point mérite d’être souligné dans cette vision, c’est

que le Caucase, avec sa fantastique diversité linguistique, ne
se présente que comme un homeland intermédiaire, un lieu
d’implantation de populations venant du Pacifique plutôt
que d’Afrique, dont certaines ont probablement développé le
fonds linguistique et culturel indo-européen et l’ont diffusé
vers le sud (les cultures persane et indienne non dravidienne),
vers l’est (le tokharien, une culture indo-européenne implan-
tée dans le Xinjiang plus d’un millénaire avant notre ère et
éliminée par des peuples turcophones au ixe siècle de notre
ère) et surtout vers l’ouest avec les familles slave, germanique,
celtique et italique et dont une migration antérieure a proba-
blement conduit les Vascons jusque dans l’actuelle Gascogne
et le pays basque44.
43. P. Manning (2013, 2e éd.), Migration in world history, Routledge (p. 51).
44. E. Hamel & Th. Vennemann (2014), « Le vascon, première langue d’Europe ? », Dossier
Pour la science n° 82 : L’évolution des langues - Quel avenir ?. 101
Les migrations d’Homo sapiens

L’archéologue Pascal Depaepe évoque trois scénarios
imaginables45 :
Selon le premier, dit « Out of Africa », Homo sapiens aurait
été, au cours de sa migration, un terrible prédateur capable
d’anéantir les autres populations, mais la découverte de croise-
ments génétiques ébranle fortement cette hypothèse.
Selon le second scénario, Homo erectus aurait évolué de
manière convergente vers des formes d’Homo sapiens dans
différentes régions de l’Ancien monde, bien que les données
génétiques favorisent une origine exclusivement africaine
d’Homo sapiens.
Le troisième scénario invoque une succession de migra-
tions par vagues à partir d’environ deux millions d’années
avant notre ère : « Ces nouvelles populations rencontrent des
populations locales plus anciennes et évoluant elles-mêmes sur
place, avec lesquelles elles s’hybrident ».
Contrairement à ce qui a été supposé au xxe siècle, il n’est
pas possible d’associer sans ambiguïté une culture matérielle
à un type humain : des Néandertaliens se sont révélés aptes à
utiliser des outils fabriqués par Homo sapiens à l’époque mous-
térienne (paléolithique moyen), ce qui permet à l’archéologue
de conclure que « l’étude des cultures matérielles peut appor-
ter son lot d’informations dans des domaines que la génétique
et l’anthropologie biologique ne peuvent aborder, comme la
vie quotidienne ou la pensée symbolique », confirmant en cela
les thèses du linguiste Rudolf Botha et de l’archéologue Fran-
cesco D’Errico (voir plus loin). Et la découverte du site néan-
dertalien de Byzovaya en Sibérie laisse supposer que des popu-
lations néandertaliennes ont subsisté pendant quelque temps
45. P. Depaepe (2016), « Et les hommes peuplèrent la terre ». dans J.F. Dortier (dir.),
102 Révolution dans nos origines, op. cit., p.346-7.
dans un état de relégation dans des zones inhospitalières que

l’espèce Homo sapiens leur concédait volontiers.
Une illustration de la corrélation incertaine entre

familles de langues et populations
L’anthropolinguiste Brigitte Pakendorf de l’université de
Lyon, qui a poursuivi ses premières recherches dans le cadre
de l’Institut Max Planck d’anthropologie évolutionnaire à
Leipzig, nous montre à quel point les hypothèses sur la corré-
lation entre les constats linguistiques et les données génétiques
peuvent être ouvertes46. On sait depuis un siècle que les lan-
gues khoïsanes de l’Afrique australe sont les seules à pratiquer
un type exceptionnel de consonnes appelées « clics » (sons pro-
duits avec la langue ou les lèvres sans l’aide des poumons). Ces
langues sont considérées comme plus anciennes que les lan-
gues bantoues qui ont fini par les environner à la suite d’une
puissante migration bien documentée. Cependant, certaines
langues bantoues de Zambie présentent des clics, apparem-
ment empruntés aux langues khoïsanes avoisinantes. Or, tous
les mots comportant des clics ne sont pas d’origine khoïsane :
certains dérivent d’étymons bantous. Sur cette base contradic-
toire, deux hypothèses sont en concurrence :
Hypothèse 1 : Les locuteurs de ces langues ont extrait les
clics de mots empruntés aux langues khoïsanes et en ont par-
semé leurs mots bantous.
Hypothèse 2 : Il s’est produit un changement complet de
langue : du fait de l’attraction d’une culture plus dévelop-
pée, des groupes entiers de locuteurs d’une langue khoïsane
auraient adopté une langue bantoue, mais ils auraient importé
46. B. Pakendorf, « La génétique appliquée aux langues », Dossier Pour la Science n° 82,
L’évolution des langues : quel avenir ? (p. 46-51). 103
quelques consonnes à clics dans leur nouvelle langue47.

Cette seconde hypothèse en implique une autre d’ordre
ethnologique : les mariages entre une femme d’un peuple de
cultivateurs-éleveurs et un homme chasseur-cueilleur étant
proscrits (parce que cela représente une déchéance culturelle
pour la femme et donc sa famille), il est hautement probable
que les unions se sont limitées à celles de femmes khoïsanes
avec des hommes bantous. L’ADN mitochondrial se transmet
uniquement par les femmes et on constate qu’un quart des
lignées maternelles dans un peuple bantou de Zambie, les
Fwes, provient de femmes khoïsanes, ce qui conforte l’hypo-
thèse 2. La conclusion de Brigitte Pakendorf, à partir de l’appa-
riement des deux analyses linguistique et génétique, est donc
que « les mots à clics en fwe ont été transférés dans la langue
bantoue par les femmes parlant des langues khoïsanes ».
5
Dans ce troisième chapitre, j’ai souligné l’intérêt de la thèse
biolinguistique du point de vue de l’organisation de la pen-
sée permise par l’émergence d’un lexique doté de catégories
hiérarchisées du particulier au général, et de structures syn-
taxiques également hiérarchisées en groupes emboîtés les uns
dans les autres. Mais j’ai en même temps mis en doute l’hypo-
thèse « catastrophiste » ou « saltationniste » imputant ce saut
qualitatif (que Chomsky, reprenant la métaphore de Mao Tsé
Toung, appelle « le grand bond en avant ») à une mutation
génétique aléatoire ayant affecté à l’origine un individu sin-
gulier. Rares sont les généticiens qui accordent du crédit à
cette hypothèse, celle d’une famille d’hominidés enfantant un
47. Selon un processus apparenté à ce qui s’est produit quand les Francs se sont mis à parler
le gallo-roman, ce qui a généré le dialecte francien du Nord de la France (ou langue d’oïl)
se distinguant notamment de la langue d’oc (l’occitan) par la mutation consonantique
104 /k/ B /ю/ (cat ≠ chat).
Sherlock Holmes dont la progéniture aurait supplanté tous ses

congénères moins futés. Plus généralement, cette controverse
pose la question du rapport entre le patrimoine génétique et le
patrimoine culturel, dont la diversité des langues constitue un
facteur déterminant, puisque c’est par le langage que se fixent
les conventions sociales et culturelles. C’est dans cette perspec-
tive que j’ai finalement évoqué les travaux de Cavalli-Sforza
mettant en vis-à-vis les familles de langues et les variations du
génome des populations qui se répartissent actuellement sur la
terre, lesquels montrent des disparités que les anthropologues
et archéologues spécialistes des grandes migrations de l’his-
toire humaine, comme Pascal Depaepe, Patrick Manning ou
Brigitte Pakendorf cherchent à expliquer.
Ce faisant, la voie est ouverte vers le chapitre 4 qui va laisser
la parole à ces chercheurs de disciplines diverses, psychologues
et anthropologues évolutionnaires associés à des archéologues,
qui contribuent à la vaste entreprise interdisciplinaire actuelle
centrée sur la genèse du langage. Car, comme nous le verrons
dans les chapitres 7 et 8, les linguistes ont d’excellents outils
pour reconstituer l’histoire des langues, même sans tradition
écrite, mais ils sont relativement désarmés face à la genèse du
langage, et les linguistes évolutionnaires comme Jim Hur-
ford, Frederick Newmeyer ou Rudolf Botha ont la sagesse de
contribuer eux aussi à cette entreprise.
105
Chapitre 4
Le point de vue des psychologues
et des anthropologues évolutionnistes
La psychologie et l’anthropologie évolutionnaires ont un

important noyau commun, à savoir tout ce qui touche à l’évo-
lution des comportements humains depuis l’émergence de
l’espèce Homo sapiens. Ce recouvrement partiel a pour effet
que les psychologues évoqués dans ce chapitre sont aussi des
anthropologues, voire des épistémologues comme Robert
Logan, qui a élaboré une vision séduisante de l’extension de
l’esprit humain au fil de découvertes technologiques, du lan-
gage à la sémiosphère de l’Internet. Le propos de ce quatrième
chapitre est essentiellement de mettre en vis-à-vis trois visions
de la genèse du langage provenant de ces disciplines :
Celle de Robin Dunbar est centrée sur la manière dont les
premiers hommes ont dû réorganiser leur emploi du temps
afin de pouvoir rester en symbiose sociale avec un nombre
beaucoup plus important de congénères en raison du change-
ment de leur mode de vie.
Celle de Peter Gärdenfors est axée sur l’extension des capa-
cités de l’esprit par l’acquisition de l’aptitude à se projeter
mentalement hors du temps présent et donc à se distancier de
son corps.
Enfin, celle de Michael Tomasello et Talmy Givón part
d’observations circonstanciées sur l’acquisition de la langue
maternelle par l’apprenti locuteur et spécialement de sa syn-
taxe pour essayer de reconstituer les stades par lesquels l’es-
107
pèce humaine est parvenue à notre langage aussi expert dans

le maniement des symboles (la fonction cognitive) que dans
celui des interactions verbales (la fonction pragmatique). Elle
s’appuie sur la linguistique basée sur l’usage évoquée à la fin
du chapitre 2.
La plupart des arguments élaborés par les uns et les autres
resteraient toutefois pure spéculation si l’archéologie n’offrait
pas des preuves indirectes de la présence d’un langage structuré
à la base de nombreuses activités bien datées, comme l’embel-
lissement des corps par le maquillage à l’ocre et les colliers
de coquillage, ou la préparation et la réalisation d’entreprises
maritimes périlleuses.
Un certain nombre de disciplines appelées « évolution-
naires1 » ou « évolutionnistes » dérivent de la biologie évolu-
tionnaire, laquelle est concernée par l’évolution de toutes les
espèces vivantes, des protozoaires aux humains. Elle a été mise
en place essentiellement par Jean-Baptiste de Lamarck dans
la première moitié du xixe siècle et Charles Darwin dans la
seconde. Dans les années 1930, les découvertes génétiques
(déjà anciennes mais passées inaperçues) de Gregor Mendel
et la théorie de la sélection naturelle ont été combinées dans
la Théorie synthétique néodarwinienne de R.A. Fisher et ses
pairs.
Cependant dès le tournant du xixe siècle James Baldwin
et ultérieurement Conrad Waddington y ajoutaient l’effet
Baldwin-Waddington qui rend compte de la place des niches
écologiques dans l’orientation de l’évolution biologique.
1. À proprement parler, l’adjectif « évolutionnaire » désigne un domaine scientifique en rap-

port avec le constat que les espèces vivantes ont évolué au cours des millénaires et des ères
géologiques, alors qu’« évolutionniste » désigne un positionnement en faveur de la théorie
darwinienne de l’évolution des espèces biologiques par la sélection naturelle, combinée
108 avec les apports génétiques de Gregor Mendel.
Le point de vue des psychologues et des anthropologues évolutionnistes
Actuellement la théorie la plus prometteuse est l’Evo-Devo

(Evolutionary Developmental Biology) qui intègre l’évolution
(phylogénétique) des espèces et le développement (ontogé-
nétique) des individus. L’anthropologie évolutionnaire est la
partie de la biologie évolutionnaire qui traite de l’homme du
point de vue physique et psychique. La psychologie ou plu-
tôt la neuropsychologie évolutionnaire s’intéresse à la consti-
tution des systèmes neuronaux et aux comportements qui en
résultent, elle concerne toutes les espèces possédant un système
nerveux central. Quand elle se concentre sur les hommes, cette
discipline croise l’anthropologie évolutionnaire, couvrant
pour les facultés cognitives l’épistémologie évolutionnaire et
pour les émotions l’anthropologie évolutionnaire des affects
(brillamment illustrée par les travaux d’Antonio Damasio)2.
L’anthropologie évolutionnaire a, outre ces deux compo-
santes, une troisième composante centrée sur l’anatomie et la
physiologie, la bioanthropologie évolutionnaire.
La question de l’évolution du volume du cerveau concerne
cette dernière composante, car elle est révélée par le déve-
loppement des parties frontales, temporales, pariétales et
occipitales du crâne et le plissement croissant du néocortex.
L’accroissement des liens synaptiques entre les neurones
concerne la neuropsychologie évolutionnaire.
Le diagramme page suivante illustre les relations entre les
disciplines issues de la biologie évolutionnaire concernées par
l’émergence et l’évolution de l’homme.
2. A. Damasio (2003), Spinoza avait raison : Joie et tristesse, le cerveau des émotions, Odile Jacob. 109
évolution des espèces
BIOLOGIE
ÉVOLUTIONNAIRE
centrée sur l’évolution neuronale

centrée sur l’homme et psychique
ANTHROPOLOGIE évol. (NEURO-)PSYCHOLOGIE évol.
centrée sur l’anatomie/physiologique centrée sur l’esprit humain
BIOANTHROPO-
LOGIE évol. spéc. sur les facultés cognitives
ANTHROPOLOGIE
évol. des affects
ÉPISTÉMOLOGIE
évol.
Les grands jalons de l’évolution de l’esprit humain

En 1962, il y a plus d’un demi-siècle, le canadien Mar-
shall MacLuhan publiait The Gutenberg Galaxy3, ouvrage dans
lequel il exposait une thèse évolutionnaire en quatre stades
dont la durée respective se réduit progressivement :
1. Les premiers hommes se sont constitués en une espèce
d’interlocuteurs animés d’une intelligence sociale. Ce pre-
mier stade s’est étendu au long d’un nombre incalculable
de siècles, quelque 2 000 selon les dernières hypothèses.
2. Le second stade débute avec l’invention de l’écriture
en Mésopotamie au début du troisième millénaire av.
J.-C. L’effet de l’écriture alphabétique, selon R. Logan
(2004)4 a été de délivrer une première mémoire externe,
laquelle a permis d’abord la comptabilité et l’enregistre-
ment des contrats, puis les échanges épistolaires, l’inven-
tion de l’histoire et de la géographie, l’unification des
empires, l’élaboration des lois avec le code d’Hammou-
3. Traduit en français en 1967 : La Galaxie Gutenberg, La genèse de l’homme typographique

(Biblis, 2017).
110 4. R. Logan (2004), The alphabet effect, St Martins Pr.
rabi, etc5. Ce stade s’étend sur une trentaine de siècles.

3. Le troisième stade est celui de l’invention de l’impri-
merie à caractères mobiles6 par l’allemand Johannes
Gutenberg à Mayence en 1450, laquelle a fait basculer
l’humanité de l’ère de l’écriture à celle de la typogra-
phie, c’est-à-dire de l’écriture stéréotypée et démulti-
pliée. Dès lors la culture, notamment religieuse avec la
Bible traduite en allemand par Luther (en 1522 à partir
du grec pour le Nouveau Testament et en 1534 à par-
tir de l’hébreu pour l’Ancien Testament), est accessible
à un plus grand nombre, l’illettrisme recule et les lan-
gues se normalisent7. L’humanité entre dans la « galaxie
Gutenberg ». L’étendue temporelle de ce stade se réduit
à quatre siècles.
4. Avec l’invention de la télégraphie sans fil par l’italien
Gugliemo Marconi en 1896, suivie de celle de la télé-
vision dans l’entre-deux-guerres, l’humanité connaît un
nouveau basculement, de la « galaxie Gutenberg » vers
la « galaxie Marconi », assimilable à un village global. Ce
quatrième stade ne s’étend plus que sur un siècle, car
(ce que Mac Luhan ne pouvait pas deviner, mais que
Logan met en avant) le développement de l’Internet a
ouvert un cinquième stade à la quasi-totalité des socié-
tés humaines, celui de l’échange généralisé et immé-
diat d’informations, avec des répercussions sociales,
cognitives et politiques dont nous faisons l’expérience
quotidiennement.
5. Mac Luhan observe en particulier que « la culture des Grecs illustre la raison pour laquelle
la manifestation visuelle ne peut pas intéresser un peuple avant qu’il ait intégré la technique
alphabétique dans son mode de vie (…) Les Grecs imaginèrent leurs innovations artistiques
et scientifiques une fois qu’ils eurent intégré l’alphabet dans leur structure psychique. »
6. L’imprimerie à caractères fixes était connue des chinois depuis le viie siècle de notre ère.
7. Mc Luhan note encore qu’ « en transformant les langues provinciales en média de masse ou
en systèmes clos, l’imprimerie a créé les forces uniformes et centralisatrices du nationalisme
moderne ». 111
E E M
En 1991 le psychologue Niveau II mimétique
Niveau I épisodique
(Homo erectus)
Merlin Donald propose trois (primates)
stades dans l’évolution des E M

représentations entre les pri-
mates, Homo erectus et les
L
premiers Homo sapiens. Il Niveau III linguistique
(hommes archaïques)
résume ainsi l’évolution en
trois niveaux de compétences illustrés ci-dessus8.
Les primates (représentés en haut à gauche) ont un niveau
de représentation primaire limité à la mémoire épisodique, sans
transformation des percepts en concepts. Ils se souviennent des
événements vécus, des actes effectués et de leurs localisations.
Homo erectus y ajoute des représentations « mimétiques » (ils
s’imaginent vus par leurs congénères). Et les premiers hommes
modernes y ont ajouté le troisième niveau, celui du langage et
du maniement des symboles.
Au tournant du xxie siècle, Robert Logan, ancien colla-
borateur de Mac Luhan à Toronto, entreprend d’intégrer la
pensée de son mentor et celle de M. Donald en raffinant et
complétant les trois stades proposés par Donald. Il subdivise
le second stade mimétique en trois phases impliquant la copie
du comportement d’un congénère, celle de la fabrication
d’outils, celle de l’intelligence sociale et celle de la communi-
cation mimétique par des signaux manuels, une gestuelle, un
langage du corps et les premières vocalisations (constituant
globalement un « prélangage »). Il en fait autant pour le troi-
sème stade linguistique en distinguant, à la suite du créoliste
Derek Bickerton, un protolangage constitué d’un lexique
vocal réduit et dénué de syntaxe et un langage proprement dit
constitué d’un lexique vocal développé, catégorisé et hiérar-
chisé dans des structures syntaxiques.
8. M. Donald (1991), Origins of the Modern Mind: Three stages in the evolution of culture and
112 cognition, Harvard University Press (p. 270).
À la suite de Mac Luhan, R. Logan voit dans l’invention

de l’écriture le développement de diverses formes de ce qu’il
appelle « l’esprit étendu », soit les bases du droit, de la concep-
tion d’un dieu unique et omniscient, de l’arithmétique et
du raisonnement logique. Celle de l’imprimerie à la fin du
xve siècle a permis l’extension sociale de la culture écrite et a
conforté les langues de communication et de pouvoir. Celle
des outils de conservation électronique du savoir a permis
une extension extraordinaire de la mémoire externe de tous
ses usagers9 et enfin le développement du réseau de l’Internet
a entraîné un échange d’informations et d’émotions à la fois
riche et immédiat, ce qui a renforcé le sentiment d’apparte-
nance au « village global » prophétisé par M. MacLuhan10.
Langage et cohésion sociale

Entre 1998, date de la parution de son ouvrage sur « le
toilettage, le commérage et l’évolution du langage11 » qui l’a
propulsé au premier plan des recherches anthropologiques
sur la genèse du langage, et 2016, date de la publication d’un
nouveau livre sur « l’évolution humaine, nos cerveaux et
notre comportement12 », les modélisations de l’anthropologue
Robin Dunbar se sont affinées. Ce qui reste le cadre intangible
de sa pensée est une double idée :
D’abord, c’est celle que toutes les espèces vivantes ont un
budget-temps (time budget) pour vaquer à leurs obligations,
lesquelles consistent d’une part à trouver de la nourriture, et
9. R. Logan, The Fifth Language: Learning a Living in the Computer Age (1997). ISTE
Editions.
10. R. Logan (2004), The Sixth Language : Learning a living in the internet age, Caldwell, NJ,
Blackburn Press et en guise de synthèse (2007) The Extended Mind: The Emergence of
Language, the Human Mind and Culture, Toronto University Press.
11. R. Dunbar (1998), Grooming, gossip, and the evolution of language. Oxford University
Press.
12. R. Dunbar (2016), Human evolution : our brains and our behaviour. Oxford University
Press. 113
d’autre part à contribuer à la bonne entente dans le groupe

afin d’éviter son éclatement. Ensuite, celle que l’étendue de ce
groupe dépend du nombre de partenaires auxquel un individu
peut offrir ses services à cette même fin de cohésion.
Chez les singes, la pratique adéquate est celle du toilettage
mutuel (grooming). Comme il est impossible de combiner quo-
tidiennement l’épouillage de plus d’une quinzaine de congé-
nères et la quête de nourriture, le groupe ne peut pas dépas-
ser une quinzaine de membres. Chez les premiers hommes
modernes, Dunbar suppose que la pratique de l’épouillage
mutuel a pu être remplacée par une pratique plus efficace,
le commérage (gossip). Selon lui, le commérage n’est pas un
effet secondaire de l’émergence d’un langage destiné à partager
des informations (ce qu’il appelle le langage instrumental), il
résulte de la nécessité d’élargir le groupe pour mieux se pro-
téger des prédateurs et pour établir un réseau de relations de
famille destiné à structurer ce groupe (c’est le langage social)
et à établir des liens avec des groupes avoisinants. Ce faisant,
le groupe peut se décupler, atteignant jusqu’à 150 membres.
L’avantage du commérage sur le toilettage, c’est qu’il permet
de s’adresser à plusieurs interlocuteurs à la fois et d’employer
simultanément ses mains à d’autres activités, par exemple à
la fabrication d’outils ou de vêtures constituées de peaux de
prises de chasse cousues ensemble.
Telle est, rapidement résumée, la thèse de 1998. Depuis
lors, Dunbar et ses collègues ont mené des expériences qui les
ont incités à faire intervenir quatre facteurs intermédiaires : le
rire, la musique, la narration et la religion.
1. Le rire : dans la pratique du toilettage mutuel, le patient
bénéficie d’un flux d’endomorphine, mais pas l’agent,
alors que dans le rire, le flux d’endomorphine s’étend à
l’ensemble des rieurs (que Dunbar limite à trois, ce qui
paraît excessivement réducteur). Même dans ces limites
114
« le rire est trois fois plus efficace que le toilettage comme

processus créateur de liens » (bonding process).
2. La musique : selon l’anthropologue britannique Steven
Mithen, les néandertals auraient développé des capacités
vocales et orales essentielles à leur survie face aux défis
de l’Âge glaciaire. Le chant présente une continuité évi-
dente avec le rire, car il met en jeu les mêmes processus
anatomiques et physiologiques, à savoir le contrôle de
la respiration, celui des muscles de la cage thoracique
et du diaphragme. En conséquence le chant et ses déri-
vés, la musique instrumentale et la danse, ont le pouvoir
de produire un flux d’endomorphines dans un groupe
beaucoup plus vaste, ce qui permet à la communauté
de s’étendre et d’être plus cohésive. Ainsi, le toilettage
mutuel est la pratique typique des primates, le rire celle
des hommes archaïques bientôt suivie du fredonnement,
de la danse et de la musique rythmée, et la parole, des-
tinée au commérage, constitue l’aboutissement de l’évo-
lution des pratiques destinées à préserver la cohésion du
groupe. Et Dunbar souligne un point important, à savoir
que le fredonnement met en jeu des traits qui vont deve-
nir décisifs pour la genèse de la parole : la segmentation,
l’articulation, la prosodie et une rythmique synchrone13.
3. La narration : la parole acquiert un pouvoir de fasci-
nation quand elle permet de raconter des événements
vécus, favorisant la mémoire partagée, et de proposer
des événements fictifs à l’imagination collective, ce qui
13. Une version d’inspiration marxiste de la genèse du langage par l’intermédiaire des
psalmodies est proposée par Mike Beaken (2010, 2e éd., The making of language,
Dunedin) qui voit dans le chant et la danse « une première forme de mémoire collective,
où les techniques du travail étaient consolidées dans une danse mimétique qui a conservé
un grand pouvoir pour les premiers humains ». En s’associant à une danse mimétique, la
psalmodie renforce la mémorisation des techniques de travail. En outre Beaken suggère,
tout comme Dunbar, que la pratique de la psalmodie rythmée a favorisé l’aptitude
humaine à produire des syllabes structurées en consonnes et voyelles. 115
implique de la part du narrateur et de ses auditeurs l’ap-

titude cognitive à se projeter en dehors du monde vécu
immédiat.
4. La religion : l’aptitude narrative déclenche inévita-
blement une interrogation sur l’avenir, la condition
humaine, la mort et l’au-delà. La narration collective
débouche sur l’élaboration de mythes susceptibles de
calmer les angoisses existentielles, et de se représenter les
places respectives des hommes et des esprits14.
Le chant, la musique et la danse ont un effet de cohésion
négligeable sur une grande communauté, aussi longtemps que
le langage est sous-développé. Or la cohésion du groupe est un
facteur décisif de survie collective, car un investissement dis-
proportionné au profit des alliés proches peut occasionner des
frictions, voire des confrontations avec les alliés plus éloignés,
dont le soutien et l’assistance peuvent être occasionnellement
indispensables. Face à ce dilemme, le langage permet d’intera-
gir avec plusieurs individus simultanément, de se livrer simul-
tanément à d’autres activités, d’acquérir des informations sur
l’état du réseau social et de promouvoir ses propres intérêts en
se faisant valoir et en dénigrant les compétiteurs.
Mais le nouveau scénario de Dunbar va plus loin : il com-
bine les avantages du langage et du feu. La domination du feu
a permis de passer du cru au cuit, fournissant ainsi de nou-
veaux nutriments qui ont permis au cerveau d’accroître son
14. B. Victorri (2002), « Homo narrans : le rôle de la narration dans l’émergence du langage »,
Langages 146 ; (2005), « Les mystères de l’émergence du langage », J.M. Hombert, dir.
116 (2005), Aux origines des langues et du langage, chap.8., Fayard).
volume15 et donc aux fonctions cognitives de se perfection-

ner. En même temps, Dunbar reste fidèle à son fil d’Ariane :
le budget-temps, et il note que le feu permet d’allonger la
journée et de diminuer la crainte des prédateurs. Certaines
activités, comme la couture des vêtures en peau de bêtes,
deviennent possibles le soir, ce qui laisse plus de temps pour
la quête de nourriture, et au milieu des flammes qui dessinent
des créatures imaginaires, le moment est favorable pour créer
un monde d’esprits intervenant dans le destin des hommes.
Dunbar propose également une échelle de taille des com-
munautés des premiers hommes modernes.
1. Le groupe de base, celui dont les membres entretenaient
des contacts quotidiens aurait une taille d’environ 150
membres correspondant au nombre de congénères
accessibles chaque jour par le rire, le chant et le langage.
2. L’exogamie, elle-même mise en place par le besoin de
constituer des communautés plus étendues, impliquait
la recherche d’alliances dans une communauté plus
vaste, de l’ordre de 500 individus en contacts occasion-
nels (notamment en cas de désastre écologique) et prati-
quant un même dialecte.
3. Enfin, les échanges de produits et d’outils entre groupes
pratiquant des dialectes apparentés englobait une popu-
lation encore plus étendue, de l’ordre de 1 500 individus,
soit la taille moyenne des aires ethnolinguistiques selon
la littérature ethnographique. Au-delà de cette limite, le
15. Toutefois, en raison du caractère inextensible du bassin des parturientes, le développement

du cerveau est passé dans l’espèce humaine (a) par l’accroissement de la surface du
néocortex permise par ses nombreux plissements et (b) par l’accroissement des relations
synaptiques qui ont permis la constitution d’un réseau de neurones de plus en plus
développé. Dans l’entretien que J.M. Hombert et G. Lenclud ont accordé à L. Testot
(J.-F. Dortier, dir., 2015, op.cit.) le linguiste et l’anthropologue suggèrent un enchaînement
évolutif en cinq phases : adaptation bipède B réduction du bassin B croissance post-
natale du volume cérébral Btemps d’apprentissage exceptionnellement long B lequel a
été mis à profit pour l’acquisition linguistique et culturelle. 117
langage n’étant plus efficace, il fallait avoir recours à des

individus nés dans les marges et susceptibles de com-
prendre « les nôtres » et « les autres », ceux que les Grecs
appelleront « barbares ».
Au final, l’argumentation de Robin Dunbar est captivante,
mais elle reste incomplète, car Dunbar est celui des auteurs
mentionnés dans ce chapitre qui tient le moins compte des
traits caractéristiques des langues à chaque niveau (phono-
logique, morphologique, syntaxique, sémantique et prag-
matique). Or ces composantes attestent de manière diverse
le développement des aptitudes cognitives des hommes
archaïques et des hommes modernes. L’aptitude à respecter un
système phonologique concerne le développement primaire
de la parole. L’aptitude à dégager des concepts stables à par-
tir de percepts fugaces (la capacité sémantique) représente un
degré d’évolution supérieur à l’aptitude à trouver simplement
l’expression adaptée à une situation d’échange particulière (la
capacité pragmatique). Enfin, l’aptitude à combiner des signes
linguistiques dans des groupes de mots catégorisés (la capacité
syntaxique) ou dans des mots complexes (la capacité morpho-
logique) va de pair avec la capacité sémantique.
Homo est devenu sapiens en se projetant dans l’avenir

L’un des prérequis décisifs pour le développement de la dis-
position typiquement humaine à la coopération et notamment
à la communication coopérative16 est la capacité de planifica-
tion pour des besoins futurs. Elle recouvre l’aptitude à se pro-
jeter individuellement dans l’avenir et à partager des intentions
et donc des représentations sur cet avenir, voire à construire une
représentation collective de l’avenir du groupe. On en trouvera
un exemple plus loin, avec l’exploration de l’Australie à partir de
la Nouvelle-Guinée il y a environ 60 000 ans.
118 16. Voir la synthèse de M. Tomasello dans la section suivante.

Tel est l’objet des travaux du psychologue évolutionniste

suédois Peter Gärdenfors. Dans un article récent17, Gärdenfors
et son partenaire Mathias Osvath développent le concept de
niche culturelle. Parmi l’ensemble des niches écologiques, les
niches culturelles ont la particularité d’occasionner une boucle
de rétroaction : la niche (notamment celle de la communica-
tion linguistique) générée par la coopération du groupe a un
effet en retour : « même si les traits générés par la construction
de niche sont des produits de la sélection naturelle, ils ne sont
pas que cela, puisque, une fois créés, ils sont susceptibles eux-
mêmes d’altérer la dynamique évolutive ».
Les auteurs en fournissent un exemple instructif : les
hominidés qui ont quitté l’Afrique il y a environ 200 000 ans
semblent avoir été conduits par une aspiration irrépressible à
explorer les continents, même les plus inhospitaliers18. Pour
se répandre dans des zones boréales, ils ont concentré leur
attention sur le moyen de résister à un climat hostile et ils
sont parvenus à coudre ensemble les peaux des animaux qu’ils
chassaient. Les archéologues ont retrouvé des aiguilles en os
avec un chas datant du paléolithique supérieur. Ils ont domes-
tiqué le feu pour le chauffage, la cuisson et le fumage des ali-
ments, ce qui permet aux auteurs de conclure que « ce sont les
17. M. Osvath & P. Gärdenfors, « Quand les hommes inventèrent l’avenir », in J.-F. Dortier
(dir.), op.cit., 2015. Dans un autre article paru en 2012, P. Gärdenfors, I. Brinck et
M. Osvath expliquent que les bénéfices de la coopération visant le futur ont contribué
à l’évolution de la communication symbolique, laquelle impliquait une syntaxe
minimale à partir d’un certain degré de complexité de la pensée : « la coopération avec
une visée sur le futur a coévolué avec la communication symbolique, la communication
gestuelle intervenant probablement à un stade intermédiaire. Toutefois, sans la présence
d’une ample capacité d’anticipation cognitive et de l’intersubjectivité, le potentiel de
coopération et les pressions sélectives consécutives qui ont débouché sur les symboles
n’auraient pas émergé (…) La capacité de coopération avec une visée sur le futur requiert
une planification basée sur une capacité d’anticipation cognitive et des formes complexes
d’intersubjectivité. Ces deux capacités cognitives sont bien plus développées chez les
humains que dans toute autre espèce. »
18. Il se peut aussi qu’ils aient fui des adversaires invincibles, comme cela s’est produit au
ve siècle de notre ère avec des peuples germains pénétrant en Gaule transalpine parce
qu’ils étaient refoulés par les Huns. 119
hominidés eux-mêmes, en créant des niches culturelles parti-

culières, qui ont engendré une pression sélective ayant fait de
nous des humains ».
La capacité cognitive nouvelle qui a permis ces développe-
ment technologiques et les explorations qui en ont découlé,
c’est celle de former et de partager des représentations déta-
chées du contexte immédiat, laquelle suppose à son tour la
capacité de mettre en sommeil les sensations que l’on reçoit
dans l’instant :
« Un organisme est capable de planifier ses actions s’il possède la repré-
sentation d’un but, une situation de départ, et s’il est capable de générer
une représentation d’un ensemble ordonné d’actions qui va lui permettre
d’aller du point de départ au but recherché (…) la capacité de planifica-
tion nécessite donc d’avoir un monde intérieur19. »
Les psychologues de la cognition ont étudié depuis plu-

sieurs décennies – notamment à propos de l’enseignement des
technologies – les processus qui associent en amont l’intention
d’accomplir une action et en aval la représentation du but à
atteindre en passant par différents niveaux de sous-buts, ce
qu’illustre le schéma ci-dessous à propos du stockage des vivres.
intention sous-but 2 sous-but 1 but

d’action pour atteindre pour atteindre
le sous-but 1 le but
disposer construire et transporter mettre à
de vivres transporter des les carcasses l’abri les
stockés outils, des armes d’animaux vivres
et des artefacts abattus ou de
charognes
120 19. M. Osvath & P. Gärdenfors (2015), op.cit. (p.108).

Le groupe a besoin de disposer de vivres stockés, le but des

chasseurs est donc de pouvoir mettre des vivres à l’abri. Pour
atteindre ce but ultime, il faut pouvoir ramasser des charognes
ou abattre des animaux vivants et en transporter des morceaux
et des carcasses (sous-but 1) et pour atteindre ce but intermé-
diaire, il faut être préalablement capable de construire et de
transporter des armes (des flèches, des javelots ou des sagaies)
et des artefacts comme des brancards bricolés pour transporter
les carcasses (sous-but 2). L’ensemble du raisonnement peut se
schématiser ainsi :
Je veux disposer de vivres stockés
Ä pour cela il faut que je puisse en mettre à l’abri
Ä pour cela il faut que je puisse transporter des vivres dans l’abri
Ä pour cela il faut que je dispose d’armes efficaces pour tuer les proies
et d’artefacts pour les transporter.
La célèbre primatologue Sue Savage-Rumbaugh expliquait

en 2010 que de jeunes chimpanzés élevés en captivité peuvent
découvrir le monde de manière accélérée, parce qu’en l’ab-
sence de danger, ils ne sont plus obligés de rester accrochés à
leur mère et peuvent employer leurs mains à l’exploration de
leur environnement. Terrence Deacon appelle ce processus la
« sélection relâchée ». Ce constat est transposable aux origines
de notre espèce : en passant à la bipédie, les australopithèques
et les Homo erectus (ou ergaster) ont libéré leurs mains, ce qui a
libéré leur esprit et a développé leur aptitude à l’anticipation,
indispensable dans un nouvel espace dont ils devaient décou-
vrir les prédateurs. Et cette aptitude a entraîné le dévelop-
pement d’autres traits culturels : la collaboration, les rituels,
l’émergence de la communication symbolique et des mythes.
L’une des conséquences majeures a été la division sexuelle
du travail, car contrairement aux groupes de grands singes
continuellement rassemblés et où nul n’ignore ce que font les
121
autres, désormais « chaque individu doit être capable, dans

l’instant, d’imaginer ses congénères, éloignés de son champ
sensoriel immédiat, en train d’effectuer leur partie du travail ».
Et au bout du compte il est de l’intérêt des hommes comme
des femmes d’entretenir une relation stable, comme l’a égale-
ment fait valoir Terrence Deacon de son côté :
« Pour ne pas perdre son enfant, c’est-à-dire pour être bien approvisionnée
en viande, une mère devait donc s’assurer de l’appui d’au moins un mâle.
De l’autre côté, un mâle qui ne pouvait pas être raisonnablement sûr qu’il
était le père des enfants qu’il avait à charge courait un sérieux risque de
propager les gènes d’un concurrent. Donc les deux sexes eurent chacun
des raisons valables d’un point de vue évolutif d’établir des liens à long
terme entre eux. »
Le neuropsychologue néo-zélandais Michael Corbal-

lis défend une thèse apparentée20 en insistant sur l’aptitude
strictement humaine à voyager mentalement dans le temps,
et donc par extension à se représenter des univers alternatifs.
Corballis et ses collaborateurs ont constaté que « la mémoire
épisodique partage un réseau neuronal central avec la simula-
tion d’événements futurs, permettant un déplacement mental
dans le temps vers le passé aussi bien que vers le futur ». Ils
considèrent l’évolution de l’aptitude à simuler des événements
possibles à l’avenir, basée sur la mémoire épisodique, comme
un processus adaptatif, car la représentation de différents scé-
narios possibles a développé la capacité de sélectionner une
action individuelle ou surtout collective qui a augmenté le
pronostic de survie et de reproduction21. Et comme Gärden-
20. Th. Suddendorf, D.R. Addis & M. C. Corballis, « Mental time travel and the shaping of
the human mind », Phil. Trans. R. Soc. B (2009) 364, 1317-1324.
21. Dans leur entretien avec L. Testot en 2015 (op. cit.), J.-M. Hombert et G. Lenclud vont
dans le même sens en déclarant qu’ « il s’est produit une rupture entre les systèmes de
communication dont disposent les animaux et le langage, à partir du moment où des êtres
ont disposé des moyens d’évoquer des choses absentes de leur champ de vision, et d’en faire
le contenu de messages émis intentionnellement », la gestion mentale de l’absence étant le
122 premier pas vers le déplacement hors du présent et hors de l’univers tangible.
fors, ces neuropsychologues évolutionnaires suggèrent que « le

langage humain a évolué en premier lieu pour le partage d’évé-
nements passés et prévus dans le futur, voire d’événements
fictionnels, assurant une meilleure adéquation à l’environne-
ment social ».
Dans la même veine, Thomas Suddendorf, collaborateur
de Corballis, cherche, dans un ouvrage intitulé « La brèche : la
science de ce qui nous sépare d’autres animaux22 », à élucider
en quoi notre esprit diffère de celui des autres animaux et il
met en avant deux traits distinctifs décisifs : notre aptitude illi-
mitée à imaginer des scénarios et à les soumettre à la réflexion
et notre tendance insatiable à connecter nos esprits les uns aux
autres. C’est ainsi que l’espèce humaine est parvenue à ampli-
fier des qualités partagées par héritage avec d’autres espèces,
comme le montre le tableau ci-dessous :
aptitudes mentales aptitudes proprement

d’espèces proches humaines qui en sont issues
communication animale Ä langage
mémoire Ä voyage mental dans le temps
sociabilité Ä intercompréhension/théorie de
l’esprit (mind reading)
résolution de problème Ä raisonnement abstrait
traditions Ä culture
empathie Ä moralité
Arrivés à ce stade de notre exploration des hypothèses de

la psychologie et anthropologie évolutionnaires sur la genèse
du langage, force est de constater que chaque hypothèse est
plausible et peut délivrer légitimement une pièce du puzzle à
reconstituer. Cependant il manque à toutes une composante
22. Th. Suddendorf (2013), The Gap : The Science of What Separates Us from Other Animals,
Perseus Books Group. 123
cruciale – ce dont Chomsky a abusivement tiré parti pour

rejeter ces travaux dans leur ensemble – à savoir la prise en
compte du savoir technique des linguistes23. C’est ce qui fait à
mon sens la supériorité de l’hypothèse de Michael Tomasello
qui met en vis-à-vis l’évolution supposée du langage depuis au
moins 200 000 ans et le développement attesté de la langue
maternelle chez l’infant (en anglais ; étymologiquement « celui
qui ne parle pas encore »), car Tomasello, directeur de la sec-
tion de psychologie de l’Institut Max Planck en anthropologie
évolutionnaire à Leipzig, combine une double formation de
psycholinguiste développemental et de primatologue.
La découverte du langage éclairée par son

apprentissage
Michael Tomasello défend depuis un quart de siècle la
thèse selon laquelle l’étude comparative des capacités cogni-
tives et sociales des grands singes anthropomorphes et des
jeunes apprentis locuteurs permet d’identifier en quoi l’intelli-
gence sociale des jeunes enfants se distingue de celles des grands
singes et de formuler une hypothèse plausible sur les conditions
dans lesquelles cette distinction a émergé dans la phylogénèse
de l’espèce Homo. Cette étude le conduit à s’écarter absolument
aussi bien de la biolinguistique minimaliste de Chomsky que
du bioprogramme de Derek Bickerton. Tomasello modélise
l’acquisition du langage par les infants en trois stades :
1. Les apprenants ne sont confrontés qu’à des énoncés
isolés et ils doivent repérer par eux-mêmes des patterns
ou effectuer des abstractions à travers ces énoncés. Ils
entendent et cherchent à reproduire des énoncés, c’est-à-
dire des chaînes phonologiques susceptibles d’exprimer
des intentions communicatives. Ainsi, ils apprennent à
23. Il faut cependant accorder une place à part à Peter Gärdenfors dont les travaux en
124 sémantique cognitive font autorité.
attribuer une fonction communicative à la fois à l’énoncé

comme un tout et à certains de ses constituants.
2. Sur cette base ils se constituent un inventaire de construc-
tions grammaticales de diverses formes, de diverses tailles
et de divers degrés d’abstraction. Pour cela, ils stockent
des énoncés et des constituants qu’ils ont compris et
qu’ils savent reproduire, accompagnés de leurs interpré-
tations. Ils sont sensibles à la fréquence des fragments
de langage stockés, ce qui leur permet de retenir des
schémas d’énoncés comme Fous le camp ! Fais gaffe ! et
des schémas de constituants d’énoncés comme J’en ai X
exprimant l’exaspération (exemples : J’en ai assez/marre/
ras-le-bol/ma claque, etc.)
3. Comme le montrent les exemples ci-dessus, les enfants
produisent des énoncés par « couper et coller » à partir
de leur inventaire de schémas d’énoncés et de consti-
tuants stockés. Exemples :
tu me + groupe verbal : tu me casses les pieds Ä tu me prends la tête
j’en ai + adverbe ou groupe nominal : j’en ai assez Ä j’en ai marre / ras le
bol / ma claque
je me + verbe : je m’en vais Ä je me basse / casse / titre / débine
C’est ainsi que l’enfant apprend à jouer avec ce que Toma-
sello appelle des îlots constructionnels, sans place libre (des
énoncés répétitifs indécomposés, que les linguistes appellent
des « holophrases ») ou avec une place libre (des constituants
d’énoncés répétitifs et combinables plus ou moins librement),
dont il donne les exemples ci-dessous :
Sans place libre Avec place libre

Hi ! Where’s the X ? (Où est le X)
Bye-bye ! I wanna X (je veux X)
Hello ! More X (plus de X)
Thank-you ! Put X here (mets X là)
125
Une vision empirique de l’acquisition du langage

opposée à celle de la biolinguistique
Selon la grammaire générative, depuis son origine à la fin
des années 1950 jusqu’à sa version la plus récente au tournant
du xxie siècle, la génération des mots et celle des phrases sont
deux processus parfaitement distincts.
Du point de vue de la genèse du langage dans l’espèce
humaine explorée par la biolinguistique, cela signifie que les
premiers membres du genre Homo (erectus/ergaster) ont fait
émerger une parole limitée à l’origine à des holophrases. Ce
sont des mots isolés assimilables à une phrase entière parce
qu’ils assument une fonction pragmatique explicite de décla-
ration, d’interrogation ou de commande par l’adjonction d’un
geste ou d’une mimique. Le bébé qui s’exclame « encore ! » en
secouant sa cuiller produit une holophrase du genre « Je veux
encore de la purée de carottes ! ».
Ensuite, les premiers Homo sapiens ont découvert – à la
suite, selon cette théorie, d’une mutation génétique ayant
affecté un individu particulier, puis sa descendance – des
combinaisons efficaces de mots catégorisés pouvant assumer la
fonction d’argument (la chose ou l’être vivant dont on parle)
et de prédicat (ce qu’on en dit), créant ainsi la syntaxe.
Moyennant quoi, dans les langues agglutinantes et celles
qui sont passées au-delà au stade de langues flexionnelles
(dans l’ancienne terminologie de Wilhelm von Humboldt)
ou fusionnantes (dans la terminologie plus récente d’Edward
Sapir) cette syntaxe a donné lieu à la morphologie linguistique
par figement de la combinaison entre des racines lexicales et
des préfixes et suffixes grammaticaux de nombre, de genre, de
temps, de personne, de voix, etc.
Sur le plan de l’acquisition du langage par l’apprenti locu-
teur, la théorie de la grammaire générative et de la biolinguis-
tique considère – à partir de l’argument dit de la pauvreté
126
des stimulus – que l’enfant ne peut être confronté qu’à un

nombre insuffisant d’énoncés pour pouvoir en déduire toutes
les combinaisons de morphèmes bien formées et surtout pour
comprendre pourquoi les autres combinaisons sont mal for-
mées. À l’idée d’une phylogénèse de la parole en mots-phrases
suivie d’une genèse de la syntaxe en mots régulièrement com-
binés correspond celle d’une ontogénèse (c’est-à-dire de l’ac-
quisition de régularités par l’apprenti locuteur confronté à un
bain linguistique) suivant un processus double : dès lors que
l’enfant cherche à assembler deux mots dans un énoncé du
type argument + prédicat, il est supposé tirer parti de deux
ressources :
1. Des principes innés (rassemblés dans une Grammaire
Universelle partie prenante de notre patrimoine géné-
tique) qui vont lui permettre de repérer des mots natu-
rellement destinés à jouer, les uns le rôle d’arguments, les
autres celui de prédicat, puis progressivement de modi-
fieur d’un nom (un adjectif ) ou d’un verbe (un adverbe),
de substitut d’un nom (un pronom), de connecteur
entre deux groupes syntaxiques (une conjonction ou un
pronom relatif ), etc.
2. Des paramètres d’ajustement qu’il va repérer dans les
énoncés de son entourage, entre autres l’ordre des fonc-
tions syntaxiques, la présence d’affixes grammaticaux, la
fonction de la prosodie, etc.
La thèse inverse est celle du processus d’apprentissage
simple. Les défenseurs de la linguistique basée sur l’usage
considèrent l’argument de la pauvreté des stimulus comme
invalide. Tomasello précise cette doctrine dans son ouvrage
de référence de 2003 sur la construction du langage par les
apprentis locuteurs24 :
24. M. Tomasello (2003) Constructing a language: A Usage-Based Theory of Language

Acquisition. Harvard University Press (p. 9). 127
« La conception basée sur l’usage est l’opposé de la conception de la

Grammaire Générative. Dans la première, l’usage de symboles par les
humains est primaire, le scénario évolutionnaire le plus vraisemblable étant
que l’espèce humaine a développé des savoir-faire permettant l’usage de
symboles linguistiques au cours de la phylogénèse. Mais l’émergence de la
grammaire est une affaire culturelle et historique – apparue probablement
très récemment dans l’évolution humaine – n’impliquant pas d’événements
génétiques additionnels concernant le langage en tant que tel (à l’exception
peut-être de certaines aptitudes au traitement d’informations vocales et
auditives contribuant directement au processus de grammaticalisation). »
Il est inutile, selon Tomasello et de nombreux autres (psy-

cho-)linguistes, de faire l’hypothèse d’une mutation génétique
spécifique à la grammaire, parce que, d’abord, les processus de
grammaticalisation et de syntactisation peuvent effectivement
générer des structures grammaticales à partir d’énoncés concrets,
et qu’ensuite, la grammaticalisation et la syntactisation sont des
processus culturels, historiques et non biologiques.
À ce stade du raisonnement, il est nécessaire de clarifier
pourquoi Tomasello introduit ces deux termes a priori syno-
nymes : « grammaticalisation » et « syntactisation ». On peut
distinguer au total quatre processus successifs :
1. Le premier concerne le traitement, par l’ensemble d’une
communauté de locuteurs, d’une chaîne particulière et
répétitive de sons linguistiques comme un morphème,
par exemple en français coucou ! C’est un processus de
grammaticalisation au sens étroit.
2. La combinaison régulière de deux morphèmes dans un
ordre fixe est la base du second processus de syntactisa-
tion, exemple : fais coucou !
Ces deux premiers processus valent pour toutes les langues
du monde. Les deux suivants constituent des développements
qui sont plus ou moins présents selon les types de langues.
3. La morphologisation opère dès que certains mots assu-
ment une fonction lexicale, d’autres une fonction gram-
128
maticale, et que les premiers et les seconds tendent à for-

mer des mots complexes. Cela ne se produit pas dans les
langues dites isolantes comme le vietnamien, mais cela
atteint inversement des proportions impressionnantes
dans les langues dites incorporantes ou polysynthétiques
comme la plupart des langues amérindiennes.
4. Une variante du processus de morphologisation est
celui de la lexicalisation, qui se manifeste en français
par la dérivation lexicale, par exemple riche > enrichir
> enrichissement et la composition populaire, à partir de
racines du français (exemple : porte-fenêtre), ou néoclas-
sique, à partir de racines empruntées au latin ou au grec
(omni + vore, géo + thermie). À cela s’ajoute pour toutes
les langues la distribution de l’espace conceptuel entre
les mots. Ainsi, le français distingue entre les poils et les
cheveux, là où l’anglais emploie le même mot, hair.
Le tableau ci-dessous résume ce classement :
GRAMMATICALISATION
Traitement collectif d’une chaîne de sons linguistiques comme un morphème
(un signe linguistique minimal doté d’une forme sonore et d’un sens)
Æ
SYNTACTISATION
Accord de la communauté linguistique sur un groupement régulier de
morphèmes constitué d’une tête et de membres et doté d’un sens constant
Æ Æ
MORPHOLOGISATION LEXICALISATION
Figement d’un groupe syntaxique Figement d’un groupe syntaxique
en un mot constitué d’une tête en un mot constitué d’une tête
lexicale et d’affixes (préfixes et/ou lexicale et d’affixes (préfixes et/ou
suffixes) grammaticaux suffixes) lexicaux
(ex. fini + r + -ai Ä finirai) (ex. fini(r) + -tion Ä finition)
et distribution des mots lexicaux dans
l’espace conceptuel
(ex. ang. hair ≠ fr. cheveu / poil)
129
La thèse du processus d’acquisition simple remet en cause

la distinction entre prélangage (la production parlée de mots
isolés ou combinés avec des gestes et des mimiques) et lan-
gage structuré. Tomasello a conduit notamment une expé-
rience développementale dans laquelle il a enregistré durant
six semaines 10 % de tous les énoncés de sa fille, alors âgée de
deux ans, en interaction avec sa mère. Chaque énoncé-cible
a été ensuite comparé avec les énoncés similaires produits
précédemment par l’enfant dans l’enregistrement. Tomasello
qualifie de « basées sur l’usage » les opérations syntaxiques réa-
lisées par l’enfant dans les derniers jours de la période, car
l’enfant assemblait ses énoncés à partir d’un assortiment hété-
roclite de différents types de fragments préalablement testés et
mémorisés.
Le psycholinguiste en conclut que le matériau stocké,
rappelé et réemployé par l’enfant, est hautement diversifié,
« incluant de tout depuis les mots isolés jusqu’à des catégories
abstraites, des énoncés partiellement abstraits ou des schèmes
syntaxiques » et que les enfants ne coordonnent pas seulement
les formes linguistiques impliquées, mais également les fonc-
tions de communication conventionnelles de ces formes.
La différence décisive entre le mode d’acquisition de la
langue maternelle par les enfants modernes et la genèse du
langage structuré chez les premiers hommes tient à ce que ces
derniers ont dû créer, au-delà des mots isolés, des combinai-
sons régulières de mots dont le sens devait être partagé par
l’ensemble de la communauté des locuteurs, les expressions
linguistiques devenant conventionnelles, c’est-à-dire des outils
partagés mais inutiles s’ils sont mal construits. Les apprentis
locuteurs sont confrontés à une tâche moins exorbitante, celle
de combiner les pièces d’un puzzle. La comparaison est éclai-
rante : deux pièces de puzzle vont bien ensemble à deux condi-
tions : que leurs formes s’imbriquent (c’est en termes linguis-
130
tiques leur face signifiante) et qu’elles se complètent dans la

mise à jour progressive d’une image (c’est leur face signifiée).
De ce point de vue, le remplissage progressif du puzzle
est assimilable à la découverte d’un langage, chaque pièce du
puzzle correspondant à un morphème. Cependant la com-
paraison pèche sur un point essentiel : l’enfant combine de
mieux en mieux les morphèmes à force d’en rencontrer de
plus en plus qui se ressemblent, c’est-à-dire qui peuvent rem-
plir les mêmes fonctions. Ce sont par exemple, des mots qu’on
rencontre précédés de un/une/le/la/des/les et qui sont peu à peu
perçus comme représentant des choses ou des personnes, et
des mots qu’on rencontre précédés de je/tu/il/elle/on/nous/vous/
ils/elles et qui sont peu à peu perçus comme représentant ce
qui arrive à ces choses ou ces personnes.
Pour que la comparaison reste valide, il faut supposer que
dans l’esprit de l’enfant toute pièce bleue claire du puzzle ait à
voir avec un fragment de ciel, toute pièce bleue foncée avec un
fragment de mer, toute pièce verte avec un fragment de feuil-
lage, etc. Bien entendu cette hypothèse ne sera pas toujours
confirmée et l’enfant devra corriger le tir, mais cette compa-
raison donne une idée de ce qu’on a appelé la linguistique du
prototype.
À titre d’exemple, une fois que l’apprenti locuteur a repéré
un mot comme un nom, la représentation prototypique acti-
vée est celle d’une chose ou d’une personne, et une fois qu’il
en a repéré un autre comme un verbe, sa représentation pro-
totypique est celle d’une action ou d’un événement. Mais si
l’enfant entend un énoncé tel que L’orage a coupé le courant, il
repère bien qu’un événement important est en cause, car tout à
l’heure il y avait de la lumière dans la maison, puis il y a eu un
terrible éclair, et maintenant il n’y a plus de lumière. Cepen-
dant l’orage n’est ni une chose ni une personne, c’est déjà un
événement et le courant est quelque chose d’insaisissable, sans
131
doute en rapport avec le courant d’une rivière (image préala-

blement stockée) et qu’on peut couper comme on peut couper
le courant de l’eau avec un barrage (autre image préalablement
stockée). La compréhension de cet énoncé implique donc
un degré d’abstraction élevé, puisqu’un premier événement
(l’orage) entraîne un second événement (la perte de l’éclai-
rage) en rapport avec l’image d’un cours d’eau dont on coupe
le passage.
C’est pourquoi Tomasello estime que la performance cru-
ciale des apprentis locuteurs est de pratiquer des abstractions
(ce qui, dans la phylogénèse, n’a pu survenir qu’après la caté-
gorisation préalable du monde ambiant en choses, personnes,
événements, qualités, etc., laquelle a demandé des millé-
naires). Les énoncés que les enfants entendent et cherchent
à comprendre ne comportent que des choses, des personnes,
des événements particuliers. Leur tâche consiste à ranger tout
ce matériau dans des classes combinatoires, par exemple : une
personne va avec une action (maman + revient), une qualité de
poids ou d’encombrement va avec une chose (sac + lourd), une
qualité de comportement va avec une personne ou un animal
(chien + méchant), etc.
Il est à noter enfin que la conception de Tomasello met
sérieusement en cause la plausibilité du bioprogramme de
Bickerton, consistant à assimiler l’acquisition du langage par
les premiers hommes à l’élaboration collective d’une gram-
maire créole par les enfants de pratiquants d’un pidgin.
En effet, ces enfants sont certainement d’abord en contact
avec la langue maternelle structurée de leurs parents, car il
est très improbable qu’ils n’entendent que le pidgin que leurs
parents doivent pratiquer dans leur nouvel environnement
social ou professionnel. Ils donc donc sensibilisés d’une part,
à un langage structuré dans le cercle familial et d’autre part,
dans d’autres contextes de rapports sociaux, avec leur pidgin
132
dénué de structure. Pour transformer collectivement ce pid-

gin en une langue créole structurée, ils disposent donc d’un
modèle de structuration linguistique, ce qui n’était évidem-
ment pas le cas pour les premiers hommes modernes qui
ne pouvaient partir que d’une combinatoire élémentaire de
gestes, de mimiques et de cris.
Une adaptation biologique à la parole suivie d’une

adaptation culturelle à la grammaire
Le comportement des tout jeunes enfants (avant dix-huit
mois environ) diffère catégoriquement de celui des chimpan-
zés et des bonobos, qui sont les grands singes dont on a le
plus étudié les capacités cognitives et sociales. Les enfants se
distinguent par leur intelligence culturelle. Tomasello entend
par là la différence entre une gestion dyadique et une gestion
triadique de l’espace social25.
Pour mieux comprendre ce qui est en cause, il est utile de se
référer au modèle dit « organique » de la communication lin-
guistique26 élaboré par le psychologue allemand Karl Bühler
objets et procès
Représentation
Expression Appel
Émetteur Récepteur
Le modèle organique de la communication de Karl Bühler.
25. Voir Tomasello, op. cit., section 2.1.

26. K. Bühler (2009), Théorie du langage. La fonction représentationelle, Agone, (original 1936). 133
en 1934. Ce modèle est triadique, c’est-à-dire qu’il prévoit

trois composantes : un émetteur, un récepteur et des « objets et
procès », ce qu’on appelle désormais des référents. L’émetteur
est connecté au récepteur par la fonction d’appel : il se choisit
un partenaire d’échange linguistique. Il est connecté à la fois
au récepteur et aux référents par la fonction de représentation.
Et il est connecté à lui-même par la fonction d’expression.
Selon Tomasello, les grands singes et à plus forte raison
les autres primates ne peuvent pratiquer qu’un mode de com-
munication dyadique, limité à un émetteur de signes gestuels
et vocaux à l’intention d’un récepteur, sans pointer simulta-
nément sur un référent27. Chez le jeune enfant, Tomasello
identifie trois formes d’engagement successives qu’il désigne
comme le regard à partir de trois ans, la vue participative à
partir de neuf mois et l’attention à partir de quatorze mois :
Dans la première phase (dyadique) le jeune enfant
regarde les personnes qui l’entourent, il comprend leur
comportement et partage leurs émotions.
Dans la seconde (triadique), il partage avec elles des per-
ceptions et des buts, c’est-à-dire pointe sur des objets et fait
comprendre ce qu’il veut en faire.
Dans la troisième (celle de l’attention partagée) il par-
tage avec une personne de son entourage l’attention parti-
culière portée à un objet et il s’engage avec elle dans une
action collaborative, par exemple pour rapprocher un jouet
de lui ou d’elle. À partir de ce moment, la communication
linguistique se met en place, en commençant par des mots
isolés combinés à des gestes et au partage du regard.
27. Cf. M. Tomasello (2003, Constructing a language) : « Le plus frappant est que les primates
non humains ne pointent pas du doigt ou ne gesticulent pas pour autrui en direction
d’objets extérieurs [aux partenaires de l’échange] ou d’événements, ils ne se saisissent pas
134 d’objets pour les montrer à autrui et ils ne tendent pas des objets pour les offrir à autrui. »
Alors que Chomsky fait l’hypothèse d’une mutation géné-

tique ayant permis l’émergence de la syntaxe il y a environ
50 000 ans, Tomasello évoque une adaptation biologique à la
source de l’émergence du langage humain il y a plus ou moins
200 000 ans. Mais l’aptitude en cause n’est pas celle, pure-
ment linguistique, de combiner des morphèmes en groupes
syntaxiques, mais celle, plus largement cognitive, d’attirer
l’attention d’un congénère sur une réalité extérieure afin de
partager une information, une opinion, une croyance ou une
émotion à propos de cette réalité. Cette vision est proche de
celle de Terrence Deacon évoquée dans le chapitre 6, mais elle
en diffère quant au niveau d’investissement cognitif supposé :
pour Deacon, le saut qualitatif en cause, désigné par le terme
Homo symbolicus, est l’émergence de la représentation symbo-
lique (indispensable à l’échange des signes linguistiques), alors
que pour Tomasello il s’agit seulement d’un nouveau type de
cognition sociale : les congénères se reconnaissent mutuelle-
ment comme des agents intentionnels dotés d’une théorie de
l’esprit, ce qui les incite à essayer de s’influencer mutuellement
à des fins coopératives et compétitives.
Au terme actuel de la très longue évolution culturelle de
notre espèce, « l’enfant d’aujourd’hui est confronté à toute
une panoplie de symboles et de constructions linguistiques
qui incarnent différentes façons de porter son attention sur
toutes sortes de situations », ce dont Tomasello fournit trois
illustrations en distinguant :
1. L’échelle de granularité : un même objet de perception
peut être désigné de plus en plus précisément comme
une chose, un meuble, un siège ou un fauteuil.
2. La mise en perspective : la même action peut être envisa-
gée comme une chasse du point de vue du prédateur ou
une fuite du point de vue de la proie, comme une vente
ou un prêt du point de vue de celui qui cède un objet,
135
ou comme un achat ou un emprunt du point de vue de

celui qui en bénéficie, etc.
3. La sélection d’une fonction : je peux présenter le même
individu comme un homme, un Français, un professeur
ou mon père.
Sur cette base, l’opération essentielle à l’efficacité de
l’échange linguistique est le compactage, c’est-à-dire le choix
du mode d’expression propre à transmettre un maximum
d’information ou d’émotion à partager, avec un minimum de
signes linguistiques28. En accord avec Talmy Givón, Tomasello
répertorie trois processus de communication sociale décisifs :
l’automatisation, la réanalyse fonctionnelle et l’analogie.
Le premier permet l’accélération du rythme de l’énon-
ciation et le troisième est la base de l’abstraction : ce qui res-
semble s’assemble, et peut entrer dans une même catégorie,
ce qui conduit occasionnellement à des erreurs, comme le
classement des chauves-souris parmi les oiseaux et celui des
dauphins parmi les poissons.
La réanalyse fonctionnelle est un processus beaucoup plus
complexe qui explique certaines facettes de l’évolution des
langues. Tomasello en donne un exemple insolite qui montre
l’intrication complexe entre l’ordre des fonctions syntaxiques
et le cadre sémantique d’un verbe, en l’occurrence l’anglais to
like, au fil de son histoire entre le vieil anglais (au début du
moyen-âge), le moyen anglais (après la conquête de l’Angle-
terre par les Normands) et l’anglais moderne. À l’origine le
verbe signifie plaire et non aimer, mais en vieil anglais l’ordre
habituel pour les verbes de sentiment est Objet (au datif ) –
28. Ce faisant, Tomasello considère implicitement que la fonction primaire est celle de
représentation (jumelée avec celle d’appel). La fonction d’expression est secondaire, elle
vise à se présenter en tant qu’émetteur sous un certain angle (l’expert ou le candide, le
senior ou le junior, le raisonneur ou le séducteur, l’imperturbable ou l’émotif, etc.) et à ce
second niveau l’exigence du compactage disparaît : le discours de séduction ne se satisfait
136 pas d’une énonciation compacte.
Verbe – Sujet (OVS). Dans le tableau ci-dessous on voit qu’en

vieil anglais le sujet se reconnaît, bien que disposé après le
verbe, d’une part à l’accord du verbe au pluriel et d’autre part
à la marque du datif sur le déterminant du premier groupe
nominal (pam).
Expérient1 Verbe de Stimulus2 Traduction Ordre des

sentiment mot-à-mot fonctions
v.ang. pam kynge licoden peran au roi – O–V–S
sujet plaisaient –
les poires
m.ang. the king licenden peares le roi – O–V–S
sujet plaisaient –
les poires
ang. the king liked pears le roi – S–V–O
mod. sujet aimait – les
poires
1. Une personne qui éprouve un sentiment ou une émotion ou exerce son activité cognitive.
2. Une chose qui produit un sentiment ou une émotion.
En moyen anglais, cette marque ayant disparu, seul l’ac-

cord du verbe désigne le second groupe nominal comme le
sujet et si l’objet et le sujet sont tous deux au singulier ou au
pluriel, il ne reste plus que le sens du verbe pour repérer le
sujet. C’est alors justement que le sens relationnel du verbe
s’inverse : à X plaît Y est réanalysé par les locuteurs comme X
aime Y. Le sens ne change pas, seule la sélection du sujet et de
l’objet change, et désormais, en anglais moderne, c’est donc le
premier groupe nominal qui va s’accorder avec le verbe.
Cet exemple montre clairement que les langues évoluent en
fonction de ce que les locuteurs comprennent collectivement
et quand certains indices disparaissent et que deux structures
sont imaginables (comme ici en moyen anglais), la commu-
nauté des locuteurs se scinde fréquemment entre les seniors
137
qui continuent à se représenter la structure ancienne (celle ou

le verbe signifie plaire) et les juniors qui acceptent plus volon-
tiers de réanalyser cette structure sous un nouvel angle et qui
vont finalement l’imposer29.
De la collaboration au mensonge30
Tomasello voit comme origine de la communication lin-
guistique des actions collaboratives menées par un groupe de
congénères. Ce faisant il distingue collaboration et coopéra-
tion de la manière suivante : comme les animaux qui restent en
troupeaux pour faire front contre les prédateurs, les premiers
hommes avaient une tendance naturelle à collaborer, mais
par l’intermédiaire de l’attention partagée, ils ont découvert
la possibilité de concentrer collectivement leur attention sur
un même objet ou un même événement et de partager leurs
émotions, leurs observations et leurs intentions à ce propos.
L’individu qui comprend qu’il possède une information
qu’ignore son interlocuteur, et qui s’imagine un meilleur ave-
nir si l’un et l’autre partagent cette information, tend à offrir
son aide. Inversement s’il ignore une information cruciale que
connaît manifestement son interlocuteur, il en attend autant
de sa part. La base de ce comportement d’offre et d’attente
d’informations est ce que Tomasello appelle « l’intuition
empathique récursive » (recursive mindreading). La récursivité
en cause ici est plutôt une réversibilité, celle de la théorie de
l’esprit. Exemple : Je sais que tu ignores P /Tu sais que je sais P /
Tu sais que je sais que tu ignores P, etc. Le verbe composé mind
+ read (lire dans l’esprit d’autrui) traduit bien ce processus.
29. Un autre exemple classique est celui du latin folium (neutre : la feuille) dont le pluriel
était folia. En latin vulgaire, le genre neutre disparaît et comme le féminin singulier
est généralement marqué par la désinence –a, l’ancienne marque de neutre pluriel est
réanalysée comme un féminin singulier, d’où en français la feuille. Le genre neutre du
latin classique apparaît encore dans l’emprunt à l’ablatif latin comme dans un in folio.
138 30. Voir M. Tomasello (2008), The Origins of Human Communication, MIT-Press.
Les différents stades conduisant de la collaboration, répan-

due dans de nombreuses espèces, à la communication coopé-
rative spécifique à l’espèce humaine, en passant par l’inten-
tionnalité partagée, les activités mutualistes, la mise en place
de l’altruisme et le souci de défendre une bonne réputation,
sont clairement répertoriés dans ce passage :
« La communication coopérative a émergé comme un moyen de coor-
donner plus efficacement des activités collaboratives, d’abord en héritant
d’une infrastructure psychologique commune d’intentionnalité partagée
puis en contribuant à son développement. Tout cela a commencé presque
certainement par des activités mutualistes dans lesquelles un individu qui
aidait son partenaire se rendait simultanément service à lui-même. Mais
ensuite il y a eu une généralisation vers des situations plus altruistes dans
lesquelles des individus informaient simplement ou partageaient des
choses librement avec autrui, peut-être comme un moyen de cultiver la
réciprocité et une réputation de coopération dans le groupe culturel. Ce
n’est que plus tard que des humains ont commencé à communiquer selon
ce nouveau mode coopératif en dehors de contextes de coopération à des
fins supérieures, non-coopératives – débouchant sur la possibilité de la
tromperie par le mensonge31. »
Le risque de l’écroulement de l’édifice coopératif par le

mensonge a beaucoup occupé les psychologues évolution-
nistes. Mais Jean-Louis Dessalles32 a fait valoir qu’en débou-
chant sur la tentation du mensonge, la communication coo-
pérative a également fait avancer l’intelligence sociale, car
pour démasquer le menteur, il a fallu développer des trésors
de réflexion sur la probabilité de l’exactitude de l’information
fournie et sur l’intérêt que le supposé menteur peut avoir à
désinformer son interlocuteur. Mais, comme on le voit tous
les jours au journal télévisé, la compétition entre l’information
et la désinformation n’est pas près de s’éteindre, et c’est ce qui
fait vivre les professionnels du poker !
31. Tomasello (2008), op. cit., p. 8.

32. Voir J.-L. Dessalles (2000), op.cit., note 21. 139
Finalement, en dépit de ce risque, la communication lin-

guistique humaine a été une success story en transformant
des constructions linguistiques en conventions transmises
culturellement, ce qui a débouché, non pas comme le pense
Chomsky sur une grammaire unique et universelle, mais sur
trois grammaires exploitées en alternance selon les contextes
de communication : une grammaire des requêtes, une gram-
maire de l’information et une grammaire des échanges et de la
narration. Elles correspondent à ce que les linguistes appellent
habituellement des modalités énonciatives33.
L’émergence de la syntaxe selon Talmy Givón

Talmy Givón est un spécialiste de la typologie des langues
et de l’évolution des systèmes linguistiques, notamment de
leur grammaticalisation graduelle. Sa vision est particulière-
ment séduisante en raison de son aptitude à intégrer trois
perspectives, les deux premières étant partagées avec Michel
Tomasello : celle de l’évolution du langage dans l’espèce
humaine (la phylogénèse linguistique), celle de son dévelop-
pement chez l’apprenti locuteur (l’ontogénèse linguistique) et
celle de la reconfiguration historique des langues (la diachro-
nie linguistique).
Dans son ouvrage de 2009 sur la genèse de la complexité
syntaxique34 il met notamment en parallèle les deux premiers
processus. Il fait valoir que, durant le stade développemental
du « un-mot », le reste du message propositionnel est inféré du
contexte, en collaboration étroite avec l’interlocuteur adulte et
en échange avec les adultes par des tours de parole. En com-
binant, puis en condensant des constructions syntaxiques,
l’apprenti locuteur passe successivement à la complexité syn-
33. Sur ces modalités énonciatives, voir P. Charaudeau (1992), Grammaire du sens et de
l’expression, Hachette.
140 34. T. Givón (2009), The genesis of syntactic complexity, Amsterdam, Benjamins.
taxique, puis à la complexité morphologique, par exemple :
pas vrai Ä c’est pas Ä ça ne me semble Ä c’est invraisemblable

vrai pas vrai
Le traitement d’informations séquentielles dans la percep-
tion, la mémoire et le comportement moteur implique l’agré-
gation de constituants, si bien que les informations présentées
en chaînes composées de plus de trois ou quatre constituants
sont recodées en agrégats (chunks) d’unités organisées hiérar-
chiquement. Certains professionnels – notamment les typo-
graphes, musiciens, danseurs, lecteurs experts, joueurs d’échec,
etc. – ont un mode d’organisation de leur savoir plus hiérar-
chique que les novices (leur cerveau a « modularisé » leurs
connaissances). Les structures hiérarchiques agrégées et hié-
rarchisées permettent d’automatiser le traitement d’agrégats
complexes (par exemple, la compréhension et la reproduction
de l’adjectif invraisemblable), ce qui réduit l’effort mental et les
exigences d’attention.
Le tableau ci-dessous répertorie huit aspects du développe-
ment des aptitudes linguistiques de l’apprenti-locuteur entre
un mode de communication pragmatique (dénué de codage)
et un mode de communication codé, c’est-à-dire structuré.
La parole de l’enfant ne comporte initialement (vers dix-huit
mois) que des mots à valeur lexicale, les mots grammaticaux
(par exemple : pas, après, là) apparaissant ensuite, les proposi-
tions se réduisent à un seul mot (des « holophrases ») et leur
discours (ou leur « tour de parole ») à une seule proposition.
Progressivement les propositions à deux ou trois mots, puis
l’enchaînement de propositions se mettent en place.
141
communication dénuée
¼ communication codée
de codage
1 lexique ¼ grammaire
2 propositions à un mot ¼ propositions à deux ou
trois mots
3 discours à une proposition ¼ discours
multipropositionnel
4 pidgin prégrammatical ¼ langage grammaticalisé
5 propositions enchaînées ¼ propositions emboîtées
6 référence fixe ¼ référence déplacée
7 actes de langages ¼ actes de langages
manipulatifs déclaratifs et interrogatifs
8 modalité déontique ¼ modalité épistémique
(obligations) (probabilités)
Avec l’apparition des mots grammaticaux, la transition

majeure (celle que Chomsky impute à la fusion entre des
représentations élémentaires par l’opération de récursivité)
s’effectue avec la substitution d’un langage grammaticalisé
(c’est-à-dire contenant des mots grammaticaux, notamment
des conjonctions et des pronoms) à un pidgin prégrammati-
cal, notamment l’apparition de propositions emboîtées (rela-
tives et conjonctives) et avec l’apparition de ce que Givón
appelle la « référence déplacée » qui touche les personnes (lui/
elle ≠ je et tu), les lieux (là-bas ≠ là) et les temps (avant/après ≠
maintenant). Si bien que l’enfant doit comprendre, et il le fait
très vite, que son interlocuteur a aussi le droit de dire je/moi,
tu/toi, et qu’il intervertit la relation en devenant locuteur.
Un autre aspect de cette transition majeure concerne les
actes de langage. Ils passent des requêtes, qui sont des actes de
langage « manipulatifs » (exemple : gâteau ! encore !) aux actes
déclaratifs, (exemple : joujou cassé) et interrogatifs (exemple :
142
papa parti ?). Enfin, à un stade plus avancé la modalité

déontique, relative aux obligations morales (exemple : Faut
faire dodo ?) qui atteste la compréhension de relations entre
des contractants, en priorité entre l’enfant et son entourage
immédiat, est complétée par sa variante épistémique, relative
aux connaissances et aux croyances, (exemple : Le joujou doit
être sous le lit), qui atteste la représentation d’un monde pos-
sible dans le présent.
Tous ces traits sont évocateurs de l’évolution linguistique
qu’a connue l’espèce humaine avec l’acquisition de deux
aptitudes essentielles : l’aptitude à agréger et hiérarchiser des
représentations élémentaires pour élaborer des représentations
complexes, et celle à s’imaginer une autre perspective que
« moi-ici-maintenant », intégrant des contrats et des mondes
possibles.
À la recherche d’indices archéologiques

En 2013, deux linguistes évolutionnaires, le sud-africain
Rudolf Botha et le néerlandais Martin Everaert, ont publié les
actes d’un colloque tenu à Utrecht en 2010 sur « l’émergence
évolutionnaire du langage », dont le sous-titre Evidence and
Inference (« preuves et inférences »)35 indique bien l’ambition
des participants, résumée dans leur introduction :
« Il n’y a qu’une seule manière de venir à bout du problème du manque
de preuves directes. Elle consiste à tirer des inférences sur l’évolution du
langage à partir de phénomènes qui donnent lieu à des preuves directes. »
Je fournis ici deux illustrations de la méthode qui consiste

à tirer des inférences sur le niveau de structuration du lan-
gage approximativement à la même époque, celle de ce qu’on
appelle le Middle Stone Age pour l’archéologie des sites afri-
35. R. Botha & M. Everaert (eds, 2013), The Evolutionary Emergence of Language. Evidence
and Inference. Oxford University Press. 143
cains et le paléolithique moyen pour celle des sites européens.

La première a été proposée par Rudolf Botha à partir des
travaux des archéologues qui ont exploré la caverne Blombo
Cave, au bord de l’Océan indien au sud du Cap, dont les traces
de présence humaine remontent à environ 70 000 ans, et elle
se base sur des indices de maquillages et de parures.
La seconde est développée en 2005 dans une étude appro-
fondie de Christophe Coupé, membre du laboratoire Dyna-
mique des langues du CNRS à Lyon et Jean-Marie Hombert,
son directeur, et elle porte sur la planification collective qu’im-
posait l’exploration de l’Australie à partir de la côte sud de la
Nouvelle-Guinée, il y a plus ou moins 50 000 ans36.
Des indices matériels de l’usage d’un langage élaboré

En 2009, à l’occasion d’un grand colloque interdiscipli-
naire organisé en Afrique du sud37 par le même Rudolf Botha
et le psychologue Chris Knight, les archéologues Francesco
D’Errico, Marian Vanhaeren, Christopher Henschilwood
et Benoît Dubreuil ont publié deux articles dans lesquels
ils cherchaient à inférer le degré d’évolution du langage des
hommes qui ont occupé Blombo Cave il y a 70 000 ans à par-
tir de traces archéologiques a priori sans aucun rapport avec le
langage.
À partir de l’analyse de coquillages (Nassarius kraussianus)
percés pour constituer des colliers découverts dans cette caverne
et datés de cette époque, D’Errico et Vanhaeren concluent
que « les données actuelles indiquent que le choix, le trans-
port, le traitement, la teinture, et l’usage de ces objets pen-
dant une longue période faisaient tous partie d’une forme de
36. Ch. Coupé & J.M. Hombert (2005), op.cit., note 4.

37. Le colloque Cradle of Language organisé en 2006 par Rudolf Botha et Chris Knight
à l’université de Stellenbosh en Afrique du sud a donné lieu à deux volumes d’actes,
The Prehistory of Language (2009a) et The Cradle of Language (2009b) dans lesquels ces
144 découvertes et leur interprétation jouent un rôle décisif.
comportement symbolique délibérée, partagée et transmise ».

Les coquillages en question ont été transportés sur de longues
distances, ce qui implique la mise en place d’une culture lar-
gement partagée, laquelle présuppose à son tour l’usage du
langage ou de systèmes de représentations analogues. De leur
côté leurs collègues C. Henshilwood et B. Dubreuil ont étudié
des blocs d’ocre gravés provenant du même site et datés de la
même époque et ils parviennent à une conclusion similaire.
Selon leur argumentation la fabrication de parures implique
ce qu’ils appellent une « mise en perspective de niveau 2 ».
Un sujet A développe une perspective de niveau 1 à partir
du moment où il observe un congénère B. S’il est capable
de se mettre à la place du sujet B, on dira qu’il acquiert
une perspective de niveau 2. S’il est en outre capable de se
représenter la perspective de niveau 2 du sujet B par rapport à
lui-même ou à un tiers (Comment B me voit-il/elle ? ou comment
B voit-il/elle C ?) il acquiert une aptitude supérieure dans la
« théorie de l’esprit », une perspective dite de niveau 3. Les
archéologues décrivent cette hiérarchie de trois perspectives
en termes de récursivité (A voit que B le voit/voit C), d’une
représentation de A à une méta-représentation de A relative
à la représentation de B. Et à leurs yeux, le passage de la
perspective 1 (immédiate) à la perspective 2 (décalée) permet
de « lire » à travers certains des artefacts de Blombo la présence
d’un langage syntaxique.
Le linguiste évolutionnaire sud-africain Rudolf Botha a
élaboré à partir de ces observations un raisonnement en quatre
stades sur le niveau de langage employé par les habitants de la
caverne de Blombo, que résume le schéma ci-après.
145
Observations sur des propriétés des coquilles de

1
Nassarius kraussianus du mésolithique
Æ
Hypothèse intermédiaire 1 sur les colliers portés par les

2
habitants de la grotte de Blombo
Æ
Hypothèse intermédiaire 2 sur le comportement

3
symbolique des habitants de la grotte de Blombo
Æ
Thèse finale : les habitants de la grotte de Blombo

4
avaient un language ‘pleinement syntaxique’
1. Le premier stade établit une corrélation entre deux

observations des archéologues : (a) les coquilles de
Nassarius kraussianus retrouvées dans la caverne sont
datées du mésolithique et (b) elles sont toutes percées
d’une manière régulière qui ne peut pas être l’effet d’un
processus naturel.
2. Le second stade constitue une première hypothèse
intermédiaire : les coquilles étaient toutes percées pour
être passées dans une cordelette et constituer des colliers.
3. De cette première hypothèse Botha déduit une seconde
hypothèse, à savoir que les habitants de la grotte de
Blombo avaient la capacité, en voyant un congénère
portant un collier, de s’imaginer eux-mêmes à travers
le regard du congénère et de vouloir avoir la même
allure. C’est un processus symbolique, car il suppose
un préalable de la théorie de l’esprit, la réversibilité
cognitive (« Je suis/vais devenir aux yeux de X comme X est
à mes yeux »).
4. Le quatrième stade est le plus audacieux, puisqu’il
consiste à déduire de cette réversibilité cognitive que ces
146
humains parés de colliers de coquillages possédaient aussi

un langage structuré et « pleinement syntaxique ». Selon
la thèse de Botha, la transmission et le partage d’un sens
symbolique impliquent une forme de langage évoluée,
incluant une combinatoire de signes linguistiques.
Le peuplement de l’Australie
Dans un entretien de 2014 avec Laurent Testot, le
linguiste africaniste Jean-Marie Hombert et son partenaire
anthropologue Gérard Lenclud (op. cit.) examinaient
l’hypothèse d’une polygénèse du langage survenue entre
80 000 et 50 000 ans dans trois aires de peuplement en Afrique,
en Australie ou au Moyen Orient. Concernant l’exploration et
la colonisation de l’Australie, leur raisonnement repose sur une
preuve indirecte provenant de la reconstruction archéologique
des premières migrations maritimes, car celles-ci suggèrent un
tableau des capacités linguistiques des explorateurs.
La démonstration en a été faite en 2005 dans un article38 de
Christophe Coupé et Jean-Marie Hombert, évoqués plus haut.
Ces deux chercheurs ont examiné de manière approfondie les
conditions dans lesquelles des hommes archaïques, antérieurs
à l’espèce Homo sapiens, ont atteint et colonisé des îles en
général visibles depuis la côte, mais parfois seulement devinées
à partir des déplacements d’oiseaux marins ou de fumées
suggérant un feu de forêt sur une île invisible. Ils partagent
implicitement le point de vue de l’archéologue Clive Gamble
qui considère que l’Australie et ses environnements n’auraient
pas pu être colonisés aussi rapidement sans des réseaux sociaux
étendus qui permettaient aux colonisateurs de compter les uns
sur les autres en cas de nécessité. Il voit dans la colonisation
du Pacifique « une entreprise délibérée, témoignant d’une
38. Coupé, Hombert (2005), op. cit. 147

planification et d’un suivi »39. Pour Coupé et Hombert,

l’organisation d’une exploration maritime permet d’inférer
la disponibilité d’un langage structuré au même titre que la
production d’outils, la fabrication de peinture pariétales ou la
disposition symbolique de sépultures.
La paléoclimatologie de l’Océan pacifique parvient à
reconstituer les changements du niveau de la mer sur des
millénaires, et il en ressort qu’il y a environ 50 000 ans,
époque où les archéologues rencontrent les premières traces
d’une présence humaine en Australie, la glaciation était à son
maximum. De ce fait la largeur du détroit entre le sud-est de
la Nouvelle-Guinée et le cap York en Australie ne dépassait
pas 100 km, ce qui représente quand même trois fois celle
du détroit du Pas de Calais. Les explorateurs venant de
Nouvelle-Guinée ne pouvaient sans doute avoir l’intuition de
la présence d’une terre au-delà de l’horizon qu’en observant
les déplacements des oiseaux. Ils devaient donc se représenter
individuellement un espace inconnu à conquérir et parvenir
collectivement à une représentation suffisamment unifiée pour
permettre de concevoir l’entreprise, d’en planifier les phases et
d’en coordonner la réalisation.
On peut difficilement s’imaginer l’enchaînement de ces
diverses opérations cognitives et d’intelligence sociale en
l’absence d’un langage possédant un lexique développé et
des structures syntaxiques pour exploiter ce lexique dans un
discours argumentatif.
5
Bien entendu l’inventaire des disciplines impliquées dans
l’étude interdisciplinaire de la genèse du langage ne s’arrête
39. R. Lavenda & E. Schultz (2008), Anthropology : What does it mean to be human ? Oxford
148 University Press.
pas aux seuls psychologues, anthropologues et archéologues

qui portent leur attention sur l’environnement d’hommes
ayant vécu en Afrique et dans l’Asie du sud-est il y a plus de
50 000 ans, dont la capacité à manier efficacement des signes
linguistiques était contestée jusqu’à présent. J’ai évoqué à la
fin du chapitre 1 la question de l’origine gestuelle de la parole.
Cette question concerne particulièrement les sémioticiens qui
ont entrepris de modéliser la genèse de la semiosis, c’est-à-dire
de l’aptitude à donner du sens à l’environnement humain et à se
reconnaître mutuellement comme des porteurs de sens. Cette
activité intéresse l’épistémologie évolutionnaire, concernée
par l’évolution des savoirs, des croyances et de la conscience
d’être des détenteurs de savoir : la question est ici celle de la
réversibilité des représentations sociales que permet un langage
où je et tu ont des référents attachés alternativement au locuteur
et à l’interlocuteur. De même que l’archéologie a le pouvoir
de conforter ou d’ébranler les hypothèses des psychologues et
anthropologues évolutionnaires, de même le rôle de ce qu’on
pourrait appeler l’informatique linguistique évolutionnaire
consiste à élaborer des simulations informatiques issues de la
théorie des jeux et faisant figurer des agents multiples, pour
fournir des arguments aux sémioticiens et aux épistémologues
en faveur de l’un ou l’autre modèle d’évolution du langage. Je
vais donner la parole à ces diverses disciplines dans le chapitre 5.
149
Chapitre 5
La genèse du langage humain
selon la sémiotique, la philosophie
et l’informatique évolutionnaires
La spécificité des premiers hommes modernes a été de

chercher du sens dans le monde qui les environnait, et de
construire et partager des représentations qui leur ont per-
mis d’embrasser ce monde environnant en le catégorisant et
en imaginant des mondes absents, donc issus d’un processus
mental d’abstraction, que celui-ci porte sur le passé, sur l’ave-
nir ou sur des mondes de fiction. Cela a ouvert la porte à
l’élaboration de mythes de plus en plus élaborés et reflétant
des questionnements existentiels, avec le développement des
cultures dotées de l’écriture, offrant une première mémoire
externe, à laquelle ont succédé l’imprimerie à caractères
mobiles et les découvertes successives de la communication
à distance, individuelle puis collective. Le point de départ est
le processus de la semiosis, qui devient l’objet d’étude prin-
cipal de l’épistémologie évolutionnaire (et aussi de la biosé-
miotique) et dont l’informatique linguistique exploitée à des
fins évolutionnaires élabore des modèles qui n’ont sans doute
pas le pouvoir de prouver quel a été exactement le chemine-
ment de l’espèce humaine comme bâtisseuse de sens, mais qui
suggèrent des voies plausibles, lesquelles méritent donc à leur
tour de retenir l’attention des linguistes évolutionnaires et des
pratiquants des disciplines connexes.
151
Comment le sens vient à l’esprit

Dans son livre sur l’origine du sens1 James Hurford, lin-
guiste polyvalent et éminemment novateur à l’université
d’Edimbourg, a mis en avant un processus psychique qu’il a
appelé la semiosis, du grec classique semeiosis (désignation, indi-
cation) et que je traduirai simplement par « charge de sens ».
Il n’y a évidemment pas seulement les expressions linguistiques
qui sont « chargées de sens », la plupart des comportements
et des attitudes le sont aussi et sens peut s’entendre au pluriel,
elles peuvent véhiculer plus d’un sens, ce qui impose fréquem-
ment un travail d’interprétation. Les deux familles lexicales
de « sens » et de « signe » s’entrecroisent, puisque ce qui « fait
sens » constitue un signe.
Hurford propose trois types de préadaptations ayant pu
favoriser la genèse du langage :
1. La première est d’ordre cognitif, car on a pu observer
que parmi les espèces de primates, les grands singes
anthropomorphes présentent l’aptitude la plus dévelop-
pée à se projeter dans l’esprit de leurs congénères. Par ail-
leurs différentes hypothèses sur les aptitudes cognitives
des premiers hommes sont mutuellement compatibles,
notamment celle de Derek Bickerton sur la capacité des
premiers hommes à se représenter des scènes et un par-
tage des rôles, celle de Merlin Donald sur l’extension de
la capacité d’imitation que la découverte des neurones-
miroirs a confortée (Michael Arbib), ou celle de Terrence
Deacon sur l’émergence de la référence symbolique par
coévolution entre le cerveau et le langage.
2. La seconde est d’ordre social : on a constaté que les pri-
mates sont capables d’altruisme et de collaboration, et
Robin Dunbar a élaboré un scénario selon lequel c’est
la taille croissante du groupe qui a obligé à remplacer
152 1. J. Hurford (2007), The Origin of meaning, Oxford University Press.

La genèse du langage humain selon la sémiotique,
la philosophie et l’informatique évolutionnaires
le toilettage mutuel par le langage vocal comme facteur

décisif de cohésion pacifique du groupe.
3. La troisième est d’ordre physiologique. Elle concerne
la taille croissante du cerveau au fil de l’évolution des
hominidés et deux évolutions mises en évidence par Phi-
lip Lieberman : le contrôle de la motricité des muscles
de la face et la reconfiguration de l’espace vocal des pre-
miers humains.
Selon Hurford, une fois ces facteurs biologiques en place,
les structures linguistiques se sont développées par auto-orga-
nisation puis par transmission culturelle. Cette vision établit
une passerelle appréciable entre l’étude des deux genèses suc-
cessives, celle de la faculté de langage et de la parole, et celle
du langage grammaticalisé. La méthode de Hurford consiste à
énumérer précisément les précurseurs probables chez l’animal
de diverses composantes de la faculté de langage. Il évoque
deux conditions de l’émergence du langage articulé. L’une est
« protopragmatique », c’est-à-dire suppose un développement
de l’action collective susceptible d’entraîner l’émergence d’une
communication centrée sur l’accomplissement de tâches qui
vont assurer la perpétuation du groupe. La seconde est « proto-
sémantique », c’est-à-dire exige l’esquisse d’un jeu de relations
entre catégories conceptuelles avec comme facteur détermi-
nant l’émergence des propositions constituées d’un prédicat
et d’arguments. À l’origine, la place de l’argument est occupée
non pas par un terme investi d’un contenu permanent, mais
par une variable qui peut référer à tout objet retenant particu-
lièrement l’attention de l’animal de manière transitoire.
Pour illustrer cette thèse, Hurford imagine un babouin
qui distingue dans son espace d’attention visuelle un lion tapi
et un rocher. Il propose une représentation intégrant deux
niveaux d’attention par emboitement. Deux référents font
partie du champ perceptif-cognitif de ce babouin : X entre
153
dans la catégorie perceptivement dynamique mais cogniti-

vement stabilisée des lions et en outre dans celle temporaire
des animaux tapis (la propriété stable figure au-dessus de la
propriété temporaire), tandis que Y entre dans la catégorie sta-
tique des rochers :
champ perceptif-cognitif du babouin
ÁÂ
X Y
L L
LION ROCHER
L
TAPI
Les trois boites internes relèvent de deux domaines d’atten-

tion locale, portant respectivement sur X et sur Y. La boite
externe représente le domaine d’attention globale qui assure la
relation spatiale entre le lion et le rocher. Hurford précise que
la perception et l’action sont indissociablement liées dans les
images mentales du monde que peuvent élaborer les primates :
ils sélectionnent des objets particuliers et des propriétés par-
ticulières de ceux-ci, de préférence à d’autres objets et d’autres
propriétés dont ils ne tiennent pas compte, en fonction de la
charge de sens (semiosis) de la scène. En l’occurrence, l’atten-
tion du babouin porte sur l’orientation du regard du lion, le
risque de faire partie de son domaine d’attention et le com-
portement qui s’impose en fonction de la conclusion.
Hurford insiste sur une différence essentielle entre l’univers
des primates et celui des premiers hommes : la communication
entre animaux « prélinguistiques » est extrêmement limitée
dans la nature, parce qu’ils partagent la plupart de leurs expé-
riences, si bien, par exemple, que les primates ne pointent du
doigt qu’une fois instruits de l’utilité de ce geste dans un cadre
de communication avec des humains. Ce qui définit leur uni-
154
vers, c’est « une structure sociale égalitaire et complexe avec

des alliances temporaires, un certain degré de monogamie et
d’égalité entre les sexes, et une attention étendue des parents à
l’égard de leurs petits fournissant l’environnement le plus hos-
pitalier dans lequel des codes de communication à l’échelle du
groupe peuvent être adoptés ». En outre l’équilibre du groupe
implique un certain degré de compréhension des autres esprits
(leurs besoins, désirs, craintes, etc.).
À l’autre extrême, l’univers des humains modernes se
caractérise par « la capacité d’apprendre plusieurs milliers de
connexions arbitraires entre des formes et des sens (c’est-à-dire
des mots et des constructions), d’exprimer un éventail virtuel-
lement illimité de propositions2 sur le monde réel, d’évoquer
des mondes abstraits, imaginaires et fictionnels par le langage,
et de véhiculer de nombreux niveaux de nuances subtiles et
des degrés d’ironie à propos de ce que nous disons3 ».
L’univers cognitif et social des premiers hommes s’est
reconfiguré de manière graduelle et continue entre ces deux
extrêmes, dès lors qu’ils ont commencé à échanger des pro-
positions en employant des symboles appris et arbitraires, et
en les insérant dans des séquences structurées, c’est-à-dire à
s’entendre sur les fondements d’une grammaire.
La vision de Hurford diffère de celle de la biolinguistique
sur deux points essentiels. Pour Chomsky et Bickerton, le
grand « bond en avant » a consisté dans l’opération d’emboî-
tement d’une représentation dans une autre, par exemple :
1. ma flèche [X] a tué le lion [Y]

[1[2]] : J’ai fabriqué la flèche [X
qui [X] a tué le lion [Y]
2. J’ai fabriqué la flèche [X]
2. « Proposition » s’entend ici au sens logique : une proposition se compose d’un prédicat et
d’un ou plusieurs arguments.
3. J. Hurford (2011), The origins of grammar, Oxford University Press. 155
Hurford considère quant à lui que « l’aptitude à enregistrer

une centaine d’items et à regrouper simplement trois d’entre
eux d’une manière systématique fournissait un avantage inex-
ploré jusque là4 ».
La suite se réduit selon lui à un effet cumulatif : le cer-
veau des premiers hommes a acquis une capacité de stockage
supérieure et une aptitude supérieure à combiner des chaînes
de morphèmes de plus en plus longues exprimant des signifi-
cations complexes interprétées de manière compositionnelle.
Hurford conforte cette thèse avec une simulation informa-
tique multi-agents de l’origine du langage qui met en com-
pétition des agents d’âge différent ayant des champs d’action
différents :
« Les individus qui acquièrent le plus de langage ont proportionnellement
plus de descendance. Mais évidemment les individus qui n’ont pas encore
atteint la puberté (…) ne sont pas en compétition. Une fois qu’ils ont passé
la puberté, il vaut mieux qu’ils soient prêts s’ils veulent avoir des enfants.
De fait, ce qui se développe dans la simulation c’est un profil développe-
mental dans lequel la capacité d’apprentissage linguistique est enclenchée
dans le premier cinquième de la durée de vie et n’est plus significativement
enclenchée après cette période (…) Les inventions sporadiques de fragments
de langage dans ce modèle sont des innovations culturelles auxquelles le
génome s’adapte progressivement5. »
Hurford considère donc que les premiers humains n’ont

pas franchi un Rubicon en combinant des mots dotés chacun
d’un sens, car le Rubicon avait été franchi au stade antérieur,
celui d’un protolangage déjà apte à associer un sens et une
forme dans un mot, si bien que « l’évolution de la grammaire
n’a pas été un big bang : une fois les conditions nécessaires
en place, la floraison du langage et des langues s’est effectuée
4. J. Hurford (2011), op.cit.

5. Ce raisonnement s’apparente étroitement à celui d’Eva Jablonka (voir chap. 6) sur
156 l’« assimilation génétique étendue ».
à un rythme sans précédent avec des degrés de subtilité et de

complexité inouïs ».
À l’origine de l’épistémologie évolutionnaire

Nous avons exploré dans le chapitre 4 les ambitions et
les méthodes de la psychologie évolutionnaire à propos de la
thèse de Robin Dunbar, et évoqué à ce propos l’épistémologie
évolutionnaire comme un dérivé de la neuropsychologie évo-
lutionnaire centrée spécifiquement sur les facultés cognitives.
Il est temps désormais d’aborder la combinaison fructueuse de
l’épistémologie et de la théorie de l’évolution des esprits.
L’organisme et son monde propre

À l’origine de cette épistémologie, on trouve l’œuvre du bio-
logiste balte Jakob von Uexküll au début du xxe siècle, centrée
sur la relation complexe entre les organismes et leur environ-
nement. Uexküll et ses successeurs emploient le mot allemand
Umwelt6 qu’on traduit généralement en français par « monde
propre ». L’essentiel de sa conception tient dans le cycle fonc-
tionnel (Funktionskreis) que résume la figure ci-dessous :
RÉCEPTEUR
organe récepteur
central structure inverse
Récepteur de sens VÉHICULE de sens

(SUJET) (OBJET)
organe effecteur
central
EFFECTEUR
6. L’ouvrage de référence de Jacob von Uexküll est Umwelt und Innenwelt der Tiere (1909,
« Monde environnant et monde interne des animaux »). 157
Le biosémioticien Dario Martinelli commente ainsi les

composantes de ce cycle fonctionnel :
« La semiosis est le résultat de l’interaction entre un sujet et un objet, entre
une structure et une contre-structure, entre un récepteur et un véhicule
de sens. Ces deux parties échangent des informations constamment et
mutuellement. En fait, l’échange lui-même est le véritable générateur
de tout phénomène sémiotique, puisque le second [le véhicule de sens]
n’existerait tout simplement pas si le sujet n’était pas affecté par lui et ne
l’affectait pas en retour. Toute recherche zoosémiotique, des phéromones
aux chants des baleines, devrait prendre en compte une telle conception,
sinon elle risque de pervertir l’essence même du phénomène de semiosis7. »
L’illustration la plus exemplaire de ce cycle fonctionnel est

la relation minimale, mais cependant « protocognitive », entre
la tique et ce qu’elle attend, repère et exploite dans son envi-
ronnement. Ce dont la tique dispose pour explorer le monde
extérieur (son « récepteur de sens ») relève uniquement de
l’odorat : elle est simplement apte à reconnaître l’odeur de
l’acide butyrique dégagée par tous les mammifères.
« La tique se tient sans mouvement à l’extrémité d’une branche jusqu’à
ce qu’un mammifère passe en-dessous. L’odeur de l’acide butyrique la
réveille et elle se laisse tomber. Elle atterrit sur le pelage de sa proie, dans
lequel elle creuse et elle perce la peau chaude avec son dard. Elle absorbe
ensuite le sang liquide ; elle n’a pas d’organe du toucher. La poursuite
de cette simple règle sémantique constitue presque l’intégralité de la vie
d’une tique8. »
Ce que la tique attend du monde extérieur relève donc

aussi du seul odorat. Son véhicule de sens doit exhaler de
l’acide butyrique par sa sueur, sans plus :
7. D. Martinelli (2010), A Critical Companion to Zoosemiotics, Dordrecht : Springer.

8. D. Favareau (2010), « Introduction : an evolutionary history of biosemiotics », Essential
158 readings in biosemiotics, Springer (p.100).
« …ce porteur de sens peut être décrit comme un mammifère extrê-

mement simple sans les propriétés visibles et auditives qui différencient
habituellement les différentes espèces de mammifères. Pour la tique, le
porteur de sens n’est qu’une odeur qui provient de la sueur partagée par
tous les mammifères. Ce porteur de sens est aussi tangible et chaud, et il se
laisse percer et transfuser son sang. De cette façon il est possible de réduire
tous les mammifères – quelles que soient leurs différences de forme, de
couleur, de sonorité et d’odeur dans notre umwelt – à un dénominateur
commun. À l’approche, les propriétés de tout mammifère – que ce soit
un homme, un chien, un cerf ou une souris – activent par contrepoint la
règle de vie de la tique. » (ibid.)
Les orientations successives de l’épistémologie

évolutionnaire
L’épistémologie évolutionnaire va au-delà des autres
approches naturalistes – qui prennent toutes leur origine dans
un écrit du philosophe américain William O. Quine en 1969
intitulé Epistemology naturalized – car elle considère que même
la communication entre cellules révèle un niveau embryon-
naire de connaissance, ce qui la rapproche intimement de la
biosémiotique. Cette orientation, la seule qui nous intéresse
ici, a donné lieu à trois approches distinctes.
Dans l’approche adaptationniste, celle de la Nouvelle
synthèse néo-darwinienne des années 1930, l’organisme est
sélectionné par l’environnement et n’a aucun impact sur ses
chances de survie ni de réussite reproductive. L’éthologiste
Konrad Lorenz a été le plus célèbre propagateur de cette
vision, que l’épistémologue Nathalie Gontier résume ainsi :
« Par l’adaptation, il y a une correspondance entre nos images du monde et
le monde en lui-même, ou entre l’organisme et l’environnement, ou entre
les théories et le monde9. Il n’y a évidemment pas une correspondance 1-à-1 ;
notre image d’un arbre ne ressemble pas à un arbre réel, mais, comme notre
appareil cognitif est adapté au monde, il y a une isomorphie partielle entre
9. Voir chap.6 l’équivalence posée par Peter Munz entre une théorie et un organisme
désincarné et inversement un organisme et une théorie incarnée. 159
les deux. Les adaptations deviennent donc une description du monde dans
un langage biologique10. »
Donald Campbell, le premier théoricien de l’épistémologie
évolutionnaire adaptationniste (variante de première généra-
tion), estimait que l’aptitude au langage au sens large, incluant
le langage des abeilles et les phéromones, résulte de deux apti-
tudes préalables, celle de la mémorisation et celle de l’appren-
tissage par observation et imitation. Et l’expérience cognitive
est mutualisée par le langage, car différents explorateurs font
des essais dont ils enregistrent les succès et les échecs avant de
mettre leurs acquis dans un pot commun.
Une deuxième approche est attachée à la notion de « gène
égoïste » développée par le biologiste Richard Dawkins en
1976. Selon lui les gènes sont égoïstes parce qu’ils sont poten-
tiellement immortels et véhiculent temporairement des répli-
cateurs, vecteurs d’information.
« L’évolution résulte de la survie différentielle de réplicateurs. Les gènes
sont des réplicateurs ; les organismes et les groupes d’organismes ne sont
pas des réplicateurs, ils sont des véhicules grâce auxquels des réplica-
teurs se déplacent. La sélection du véhicule est le processus par lequel
certains véhicules sont plus aptes que d’autres à assurer la survie de leurs
réplicateurs11. »
Je ferai abstraction de cette approche purement génétique,
car elle n’a rien de particulier à dire sur les processus mentaux
qui conditionnent l’émergence du langage humain.
Une troisième approche est qualifiée par N. Gontier de
constructiviste : elle intègre les boucles de rétroaction de la
systémique et s’inspire donc directement du cycle fonctionnel
de J. von Uexküll. Peter Munz dit du poisson qu’il « est une
théorie de l’eau » et N. Gontier lui emboite le pas en disant de
10. N. Gontier (2006), « Evolutionary Epistemology », Stanford Encyclopedia of Philosophy

[plato.stanford.edu].
160 11. R. Dawkins (1982), The Extended Phenotype, Oxford University Press.
la forme du sabot du cheval qu’elle « donne une théorie cor-

recte et vraie de ce qu’est un pays de steppe ». Franz Wuketits,
le promoteur de cette approche formule trois hypothèses sur
le statut de la cognition à tous les niveaux du monde des orga-
nismes vivants.
« La cognition est la fonction de systèmes biologiques actifs et non de
machines aveugles qui se contentent de réagir au monde extérieur.
La cognition n’est pas une réaction au monde extérieur, mais elle résulte
d’interactions complexes entre l’organisme et son environnement.
La cognition n’est pas un processus linéaire ou une accumulation d’infor-
mations pas-à-pas, mais un processus complexe d’élimination continue
d’erreurs12. »
On peut représenter cela comme un processus d’élagage

progressif d’un arbre constitué d’essais successifs, sur lequel
les essais fructueux sont représentés par & et les infructueux
par & :
essai 1 ¼ &
Â ' essai 2 ¼ ' essai 3 ¼ &
Â & Â ' essai 4 (…)
Pour Wuketits, un organisme assure sa survie s’il est cohé-

rent avec son environnement, et pas seulement en correspon-
dance comme l’imaginait Donald Campbell. Il doit composer
activement avec ce dernier en l’explorant méthodiquement.
C’est le succès de cette exploration qui compte finalement et
la notion de vérité n’en est que le reflet.
12. Fr. Wuketits (2006), « Evolutionary epistemology : The non-adaptationist approach »,

N. Gontier, J.P. Van Bedegem & D. Aerts (eds.), Evolutionary Epistemology, Language and
Culture : A non-adaptationist, systems theoretical approach, Dordrecht : Springer. 161
« La vérité est en relation étroite avec la fitness évolutionnaire. C’est une

construction typiquement humaine et elle a pour fonction de nous offrir une
certaine sécurité dans un univers généralement incertain et imprédictible ».
(ibid.)
Il s’ensuit que les valeurs absolues deviennent une coquille

vide.
« Les humains agissent dans – et en accord avec – des environnements
précaires, les valeurs sont leur propre construction et nullement quelque
chose de donné a priori. Les valeurs changent avec le changement de nos
conditions de vie. Les valeurs sont utiles dans tout contexte de la vie pour
une société humaine, mais pas en dehors de ces contextes » (ibid.)
Les hommes modernes ont su se construire un monde

interne partagé par le biais du langage, c’est leur spécificité.
Concrètement, cela signifie qu’ils sont parvenus à appliquer
collectivement des opérations référentielles, puis prédicatives
et enfin énonciatives au monde perçu individuellement par
les uns et les autres. Et cela leur a permis de s’entendre sur ce
qui pouvait être considéré comme vrai et comme faux dans
leurUmwelt partagé.
L’apport des simulations « multi-agents »

Bien que chaque usager d’une langue soit tour à tour émet-
teur (ou locuteur) et récepteur (ou interlocuteur), l’émetteur
et le récepteur sont engagés dans un jeu complexe de compé-
tition et de coopération. Une situation analogue se présente
quand un usager du réseau de circulation urbaine est à certains
moments un automobiliste et à d’autres moments un piéton :
en tant qu’automobiliste, il veille à ses prérogatives d’automo-
biliste et en tant que piéton, à ses prérogatives de piéton. La
prérogative que défend l’émetteur, c’est de limiter son effort
articulatoire (dans l’opération de codage), celle que défend le
récepteur, c’est inversement de limiter son effort interprétatif
162
(dans l’opération de décodage).

La production d’une expression compositionnelle, c’est-à-
dire dont les composants sont aisément repérables (exemple :
aim(e) + r + ont /Emrõ/), est avantageuse pour le récepteur,
car elle est transparente et facilite son décodage, mais elle est
désavantageuse pour l’émetteur, car elle est lente et implique
un effort articulatoire substantiel.
Inversement la production d’une expression non compo-
sitionnelle (exemple : (ils) virent / vir/) est avantageuse pour
l’émetteur, car elle est brève et réduit ainsi l’effort de codage,
mais elle est désavantageuse pour le récepteur car elle est
opaque et entraîne donc un décodage ardu, ce que résume le
tableau ci-dessous où [+] symbolise le caractère avantageux et
[-] le caractère désavantageux.
propriétés d’une COMPOSI- NON COMPOSI-

expression TIONNELLE TIONNELLE
point de vue de
lente [-] brève [+]
l’ÉMETTEUR
point de vue du
transparente [+] opaque [-]
RÉCEPTEUR
Ces intérêts opposés de l’émetteur et du récepteur motivent

leur compétition, mais l’un et l’autre sont forcés de négocier
pour que l’acte de communication progresse de manière fluide
et ne soit pas continuellement interrompu par des demandes
de clarification du récepteur. L’un et l’autre sont donc astreints
à une coopération, et le fait qu’ils échangent constamment
leur rôle les incite à tenir compte des deux points de vue en
concurrence.
Cette situation est comparable à celle qui est l’une des
sources de la théorie des systèmes dynamiques et de son appli-
cation à des questions écologiques et économiques, le jeu du
163
chat et de la souris. Soit plus généralement l’interaction entre

une population « p » de proies et une population « P » de pré-
dateurs : si les prédateurs consomment une proportion impor-
tante des proies, leur santé est florissante et leur population
augmente. Progressivement le rapport P/p s’accroît tellement
que les proies viennent à manquer, si bien que les prédateurs
les plus faibles disparaissent et que leur population diminue.
De la sorte le rapport P/p diminue et son évolution à long
terme adopte un rythme périodique entre deux solutions
maximales d’une paire d’équations différentielles, la solution
où P/p est au plus haut avant de décroître et celle ou P/p est au
plus bas avant de croître à nouveau. On ne peut pas parler de
coopération entre les proies et les prédateurs à titre individuel :
les proies s’échappent jusqu’au jour où, affaiblies, elles sont
dévorées et les prédateurs consomment à tout-va jusqu’au jour
où, face à un vivier de proies en extinction, ils s’affaiblissent
eux-mêmes et meurent avant d’avoir pu se reproduire. Mais
les deux populations coopèrent par obligation aussi longtemps
qu’aucun facteur externe ne modifie les règles du jeu.
Si je fais cette comparaison apparemment hasardeuse, c’est
parce que les simulations multi-agents s’appliquent désormais
aussi bien aux jeux de langage qu’à ceux de l’équilibre écolo-
gique et du marché entre offre et demande. Dans un dossier
consacré en 2011 aux systèmes complexes, un article dédié à
la complexité (au sens mathématique)13 du système éducatif
donne une définition des systèmes multi-agents qui montre
que le langage, l’éducation, l’écologie et l’économie présentent
des caractères communs :
13. N. Friant et al., « Le système éducatif : un système complexe que l’on peut modéliser ».
Éléments 05, Le magazine de l’université de Mons, mars 2011, Dossier Les systèmes com-
164 plexes, p.43-45.
« Les systèmes multi-agents proposent de représenter directement un

système complexe par un ensemble d’agents évoluant dans un environne-
ment commun. Un agent est, dans ce cas, une entité autonome qui a la
capacité de percevoir les caractéristiques de son environnement, d’y agir,
d’interagir avec les autres agents présents, de réagir à temps aux change-
ments qui se produisent dans son environnement, mais également de
prendre l’initiative pour atteindre ses objectifs propres. »
L’émetteur et le récepteur (éventuellement deux facettes du

même usager de la langue) sont donc concevables comme des
agents dont l’environnement est l’ensemble des signes linguis-
tiques. Chacun a ses « objectifs propres », mais ils doivent res-
pecter un objectif commun : arriver à communiquer efficace-
ment, et selon Luc Steels l’efficacité des stratégies14 employées
se laisse mesurer et comparer à partir de simulations informa-
tiques ajustées :
« Des agents sont dotés d’un ensemble déterminé de stratégies, lequel
constitue alors leur dispositif d’acquisition du langage [Language
Acquisition Device] et on démontre ensuite par des simulations informa-
tiques ou des expériences robotiques (i) le degré d’efficacité de ces straté-
gies pour acquérir un système linguistique existant dans une population,
(ii) leur degré d’efficacité pour étendre un système linguistique de manière
à ce qu’il conserve son adaptation aux besoins et aux environnements de
son usager, et (iii) l’aptitude d’une population à inventer et à coordonner
un nouveau système linguistique à partir de zéro en employant cette
stratégie. »
L’origine des systèmes de voyelles et de syllabes

Dans ce cadre méthodologique, le phonéticien Bart De
Boer, de l’université d’Amsterdam, s’est donné comme objectif
d’expliquer les universaux des systèmes vocaliques humains15
(ceux qui ont été décrits par le groupe de recherche Commu-
14. L. Steels (2015), The talkingheads experiment: origins of words and meanings, Language
Science Press, chap. 12 : « Manguage evolution ».
15. B. de Boer (20001), The origins of vowel systems. Oxford University Press. 165
nication parlée du CNRS à Grenoble, évoqués dans le chapitre

1) par le jeu des échanges entre un instructeur et un apprenant
qui est essentiellement un imitateur. L’instructeur produit un
son linguistique que l’apprenant a pour tâche de reproduire au
mieux, et le premier évalue l’exactitude de cette reproduction.
L’instructeur est donc tour à tour émetteur puis récepteur tan-
dis que l’apprenant est d’abord récepteur, puis émetteur. Et le
jeu de parole se poursuit jusqu’à ce que l’instructeur constate
que la reproduction de l’apprenant est parfaite.
Le jeu de trois simulations successives élaboré par De
Boer vise à étudier l’effet d’un « bruit » plus au moins per-
turbant (c’est-à-dire d’un degré variable d’altération du son
linguistique produit par l’instructeur) dans l’évolution de
systèmes vocaliques vers la complexification ou la simpli-
fication. Les systèmes vocaliques sont adaptatifs, complexes
et en outre ouverts. Cette dernière propriété signifie qu’au
cours du temps les agents changent, une nouvelle génération
d’émetteurs-récepteurs remplace l’ancienne génération et dans
l’entre-temps, la population jeune tend à imiter rapidement
les voyelles nouvellement perçues à l’inverse de la population
âgée, plus conservatrice. Les premiers font progresser le sys-
tème, les seconds le freinent cette progression et l’algorithme
tient compte de ces deux types de comportements.
Dans une première simulation, le niveau de bruit est fixé
à 20 % et au bout de mille interactions entre l’instructeur et
l’apprenant, le système chaotique (au sens mathématique)
se stabilise sous l’effet d’un attracteur avec seulement trois
voyelles :/i/-/a/-/u/. Ce sont celles qui figurent en premier dans
le tableau des systèmes vocaliques répertoriés par le groupe
Communication parlée. Dans une seconde simulation, la per-
turbation s’élève seulement à 10 % et le système se stabilise
avec environ sept voyelles qui se disposent fréquemment de
manière symétrique entre l’avant et l’arrière de l’espace vocal.
166
Et dans une troisième simulation, le niveau de bruit étant fixé

entre ces deux valeurs, le nombre de voyelles se stabilise autour
de cinq. On retrouve donc, par le biais de cette modélisation
informatique, les grandes lignes du classement typologique
présenté dans le chapitre 1 (cf. tableau ci-dessous) :
Niveau de bruit B 20 % ± 15 % 10 %
Stabilisation du + /e/à l’avant + /E/ à l’avant

/i/-/a/-/u/
système dynamique + /o/à l’arrière + /O/ à l’arrière
Classement
typologique de
N. Vallée et ses
collègues 40.8
On peut apparemment conclure de ces simulations que la

sélection d’un système vocalique à trois, cinq ou sept voyelles
dépendrait de la capacité de discrimination (c’est-à-dire d’arti-
culation et de reconnaissance acoustique distinctives) de l’ins-
tructeur et de l’apprenant. Le système tendrait à se complexifier
si la capacité de discrimination de l’apprenant est supérieure
à celle de l’instructeur, et il tendrait à se simplifier dans le cas
inverse. Cette évolution pourrait être liée au renouvellement
de la population par assimilation de migrants. En tout état
de cause, elle a des effets décisifs sur la structure du lexique.
En effet dans une langue dont le système vocalique se limite
à trois voyelles l’espace de variation des syllabes, et donc des
racines monosyllabiques, est très limité (exemple :/b/+Voyelle
B/bi/-/ba/-/bu/). Pour disposer d’un jeu de racines apte à
véhiculer un nombre substantiel de notions, deux solutions
s’offrent alors : soit la langue adopte des racines bisyllabiques
(c’est ce que soupçonnent les spécialistes de l’histoire des lan-
gues sémitiques), soit le système vocalique est enrichi par une
167
distinction de longueur (voyelles brèves vs. voyelles longues,

comme en latin) ou par l’adoption de tons (dans les langues
tonales associant à chaque syllabe un ton haut, moyen, bas,
ascendant ou descendant).
Sur le modèle fourni par Bart de Boer, Pierre-Yves Oudeyer,
chercheur à l’INRIA et ancien collaborateur de Luc Steels, a
conçu des simulations multi-agents comparables pour l’évolu-
tion des systèmes de syllabes. Oudeyer s’inspire de la théorie
de la morphogénèse élaborée par le biologiste évolutionnaire
D’Arcy Thompson dans la première moitié du xxe siècle.
Par exemple, pour expliquer la forme hexagonale des
cellules dans les ruches d’abeilles, deux hypothèses sont en
concurrence. Dans la théorie synthétique néo-darwinienne,
les abeilles ont dû tester une multitude de formes avant de
trouver avec l’hexagone la forme la mieux adaptée. D’Arcy
Thompson préfère mettre en évidence des contraintes phy-
siques : puisque des gouttes d’eau entourées d’un fluide vis-
queux adoptent une forme hexagonale, celle des cellules de
ruche résulte manifestement d’une répartition optimale des
forces physiques dans l’espace restreint de la ruche.
Les simulations d’Oudeyer, du même ordre que celles de
Bart de Boer, intègrent deux tendances universelles bien attes-
tées empiriquement. D’une part, une préférence décroissante
pour différents types de syllabes, qu’on peut représenter ainsi :
CV Â
[du] CVC Â
[dur] CCV/CVV Â
[dru, lui] V/VC Â
[eu, eurent] CCVC/CCVV Â
[croule, plié] etc.
168
D’autre part, une hiérarchie des sonorités entre consonnes,

semi-voyelles et voyelles favorise une attaque consonantale
et accessoirement une coda (finale) également consonan-
tale, donc le format CVC. Par ailleurs l’apprenant-imitateur
cherche à reproduire le geste articulatoire de l’instructeur,
c’est-à-dire le mouvement des articulateurs qui a produit la
syllabe, mais il n’a pas directement accès à celui-ci, il n’en per-
çoit que le résultat, et la reproduction ne peut être parfaite
que si l’apprenant exerce son oreille pour distinguer des gestes
articulatoires très proches16.
La modélisation montre que la convergence entre les syl-
labes produites respectivement par l’instructeur et par l’appre-
nant présuppose un réglage fin de la boucle de rétroaction
entre les deux activités de réception et d’émission imitative,
non seulement comme chez de Boer en externe entre l’émis-
sion de l’instructeur et la production de l’apprenant, mais
aussi en interne chez l’apprenant, entre l’analyse du signal de
parole de l’instructeur et l’émission d’un signal de parole sup-
posé identique. Ces boucles internes ont été mises en évidence
par le psycholinguistique néerlandais Piet Levelt et elles per-
mettent de comprendre par exemple comment certains lapsus
sont corrigés « au vol » au milieu même de l’énonciation17.
16. À titre d’illustration, ma petite fille âgée de trois ans, cherchant à prononcer le nom de
Saïda, articule /haïda/. Le point d’articulation du /s/ est palatal, celui du /h/ est glottal,
mais ces deux consonnes sont des fricatives sourdes. Cela signifie que sa « boucle de
rétroaction » entre l’audition du /s/ et la production du /h/ ne lui permet pas encore de
distinguer auditivement les deux sons et donc de reproduire distinctivement les deux
gestes articulatoires.
17. Dans une conférence récente diffusée sur France Culture, un scientifique parlant
d’entomologie a produit [on rencontre] des sectes d’../ des sortes d’insectes qui….. Dans la
littérature sur les lapsus, ce type de dérapage oral est classé comme une anticipation. Dans le
plan d’organisation de la phrase à énoncer, le nom sorte est confondu avec la seconde syllabe
du nom insecte qui doit être énoncé immédiatement après, car le nom secte, qui a la même
consonne initiale, existe aussi. La syllabe /sekt/ est donc articulée prématurément, et cela
d’autant plus facilement qu’elle a une existence lexicale autonome. 169
L’évolution des systèmes morphologiques

Luc Steels, spécialiste de la modélisation du langage au
laboratoire de la société Sony, rend compte d’une simulation
multi-agents de son collaborateur Remi van Trijp, destinée
à expliquer pourquoi le système des marques de cas sur l’ar-
ticle défini de l’allemand s’est graduellement simplifié entre
le vieux-haut-allemand (entre 900 et 1100), le moyen-haut-
allemand (entre 1100 et 1500) et le nouveau-haut-allemand
(depuis le xvie siècle)18.
Dans le système actuel, de nombreuses formes sont syn-
crétiques c’est-à-dire qu’elles assument plusieurs fonctions de
cas, de genre et de nombre et ne sont donc plus distinctives,
donnant l’impression que le système est mal adapté (répon-
dant au besoin de simplification de l’émetteur/locuteur mais
non à celui de clarification du récepteur/interlocuteur) alors
que celui du vieux-haut-allemand était parfaitement distinctif,
chaque forme de l’article défini véhiculant une fonction diffé-
rente selon le cas, le nombre et le genre.
Le tableau ci-après illustre le degré de syncrétisme de cha-
cune des six formes de l’allemand contemporain. Il appelle
deux observations.
D’abord, ce syncrétisme va de deux fonctions pour das, dem
et des, qui sont donc relativement distinctifs, à huit fonctions
pour die, qui a donc une capacité de distinction très réduite.
Ensuite il se concentre au pluriel sur die (au nominatif et à
l’accusatif ), der (au génitif ) et den (au datif ), mais il couvre
aussi des fonctions très différentes. Ainsi der véhicule à la fois
le nominatif masculin singulier et le génitif féminin singulier.
L’impression générale est donc qu’un système historiquement
bien structuré a dérivé vers un système chaotique.
170 18. L. Steels (2015), op.cit.

CAS NB GENRE das dem den der des die

M •
Sg F •
Nom
N •
M •
Pl F •
N •
M •
Sg F •
Acc
N •
M •
Pl F •
N •
M •
Sg F •
Dat
N •
M •
Pl F •
N •
M •
Sg F •
Gén
N •
M •
Pl F •
N •
syncrétisme ¼ 2 2 4 6 2 8
Cependant Luc Steels fait valoir que la performance d’un

système englobe quatre facteurs qui concernent diversement
l’émetteur et le récepteur.
L’émetteur et le récepteur sont concernés l’un et l’autre par
l’effort de sélection, pour le premier, et de reconnaissance,
pour le second, de chaque forme. Cet effort serait minimal
si le système ne comportait qu’une seule forme et maximal
s’il en comportait 24, une pour chaque configuration {cas4 *
nombre2 * genre3}.
171
L’émetteur est concerné en outre par l’effort articulatoire

mesuré en « nombre de mouvements que les articulateurs tels
que les lèvres et la langue ont à effectuer en prononçant cha-
cun des phonèmes qui compose [la forme de] chaque article ».
De son côté le récepteur est concerné par
1. le « pouvoir de désambigüisation » du système basé sur
le nombre d’interprétations qui persistent après l’applica-
tion de la grammaire (par exemple : un groupe nominal
au génitif ou au datif se présente dans un contexte dif-
férent d’un groupe au nominatif et des désinences diffé-
rentes s’appliquent au nom et aux adjectifs épithètes dans
les différentes configurations {cas – genre – nombre}),
2. et par la précision acoustique basée sur la distance pho-
nologique entre les formes (par exemple : dem et den sont
difficilement distinguables avec leurs consonnes nasales
finales étroitement apparentées).
La modélisation de Remi van Trijp intègre ces quatre
dimensions de ce qu’il appelle le « paysage adaptatif » (fit-
ness landscape) pour calculer la performance globale du sys-
tème. Le graphique ci-dessous représente en abscisses le
nombre de formes distinctes jusqu’à 18 et en ordonnées le
pouvoir de désambiguïsation de chaque forme (en blanc) et le
calcul de la performance (en noir).
1
0.95
0.9
0.85
0.8
0.75
0.7
0.65
0.6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
172
La performance du système (compte tenu des quatre cri-

tères répertoriés plus haut) se révèle optimale avec quatre
formes distinctes. Celui du vieux-haut-allemand en compte
neuf, celui du moyen-haut-allemand en compte six, contre
cinq en allemand moderne (si l’on fait abstraction de la forme
des en voie d’extinction).
On peut donc conclure que l’usager de l’allemand diminue
en tant qu’émetteur son effort de sélection avec un système de
l’article défini réduit à cinq formes, sans qu’il soit confronté
en tant que récepteur à un effort notable de désambiguïsa-
tion, car d’autres facteurs (notamment l’ordre des mots et les
marques morphologiques sur ces mots) contribuent générale-
ment à sélectionner une seule interprétation. C’est cet équi-
libre entre l’effort sélectif et articulatoire de l’émetteur et l’ef-
fort de reconnaissance acoustique et fonctionnelle qui définit
un système optimal.
L’acquisition de la syntaxe
Dans un article paru en 1999, Jeffrey Elman, brillant cher-
cheur en intelligence artificielle, a présenté un jeu de trois
simulations multi-agents dont l’objectif est de reconstituer la
manière dont un enfant arrive à repérer les régularités syn-
taxiques dans les énoncés auxquels il ou elle est confronté(e)
et comment il ou elle les réplique.
Elman sélectionne un corps de catégories syntaxiques incluant
trois types de verbes : intransitifs, transitifs avec objet obligatoire
et transitifs avec objet facultatif, et quatre types de relatives avec
pronom sujet ou objet et un antécédent qui exerce la fonction de
sujet ou d’objet dans la proposition principale. Il se donne ainsi
les moyens de tester la capacité de l’algorithme simulant l’inter-
prète à identifier dans ces constructions relatives les relations
correctes entre groupes nominaux et verbes par leur position et
leur accord. Trois simulations sont menées successivement.
173
Dans la première, on attend de l’interprète qu’il consti-

tue sa grammaire interne en traitant 10 000 paires d’énoncés
dotés d’un jugement « grammatical » vs. « non grammatical ».
Comme ces énoncés mélangent des phrases simples et com-
plexes, il est incapable de constituer la moindre grammaire.
Dans la seconde, l’interprète est exposé progressivement
à des phrases qui comportent une proportion régulièrement
croissante de phrases complexes. Dans ce cas, l’interprète
parvient bien à constituer une grammaire, mais Elman sou-
ligne que c’est une simulation irrréaliste du bain linguistique,
lequel, en dépit des simplifications syntaxiques qu’entretient
le discours de la mère (qui pratique le motherese ou « mama-
nais »), comprend des phrases complexes dès le début.
Le matériel de la troisième simulation adjoint l’introduc-
tion d’un filtre attentionnel plausible et confirmé par des
observations expérimentales. La capacité attentionnelle de
l’interprète est réglée au début à un niveau bas et est ajustée de
manière à augmenter régulièrement au fur et à mesure que de
nouveaux énoncés sont traités. Cela signifie que dans un pre-
mier temps les phrases complexes sont perçues uniquement
comme du bruit et ne sont pas traitées du tout. Par exemple,
les phrases traitées peuvent être au début seulement celles qui
n’ont aucune proposition relative, puis dans un second temps
celles qui ont un pronom relatif sujet, puis enfin celles qui ont
un pronom objet. Le résultat est analogue à celui de la seconde
simulation, mais dans des conditions « écologiques » réalistes.
Contrairement à la précédente simulation dénuée de
réalisme, la troisième présente un intérêt majeur car elle est
compatible avec l’observation que les enfants sont aptes à
apprendre leur langue maternelle et des langues étrangères
avec une aisance analogue durant un intervalle de temps
strictement limité, la « fenêtre d’acquisition », dans lequel le
développement de la capacité attentionnelle n’a pas atteint son
174
maximum. Après cette période, c’est la pleine maturation de

la capacité attentionnelle qui entrave l’acquisition aisée d’une
nouvelle langue.
Le poids de la grammaire dans le succès de la

communication
Si les langues ont acquis une organisation grammaticale,
c’est parce que sans cette organisation l’intercompréhension
est restreinte à un niveau élémentaire, comme dans les pre-
mières constructions des jeunes locuteurs, celles des travail-
leurs immigrés pratiquant un pidgin ou le discours haché et
essentiellement lexical des victimes d’aphasie agrammatique
(une pathologie qui touche spécifiquement les mots gramma-
ticaux et les marques morphologiques). Luc Steels présente un
jeu de simulations de son collaborateur Michael Spranger qui
permet de se représenter le rôle de la grammaire dans l’optimi-
sation d’un énoncé spatial. Ce type de discours peut recourir à
quatre types de stratégies : il peut faire usage de relations dites
projectives (par exemple : à l’avant/à l’arrière, au-dessus/au-des-
sous, à gauche/à droite), auxquelles peuvent s’ajouter la relation
de distance/proximité (près de/loin de) et les relations absolues
(relativement aux points cardinaux) et enfin des relations dites
allocentriques, c’est-à-dire déplaçant le point de vue à partir
de l’observateur vers un des repères de l’espace observé.
Cette dernière relation est cruciale, car elle implique la
syntaxe, plus exactement une opération récursive. Comme le
précise Luc Steels « dans le groupe le bloc en face de la boîte19,
la boîte joue un rôle de repère et les relations spatiales projec-
tives sont calculées comme émanant de cet objet ». Mais dans
le bloc à ta gauche, le repère est l’interlocuteur.
19. Cet exemple suppose que la boîte a une face particulière. 175
Dans cette simulation, les scènes donnant lieu à un jeu de

langage artificiel entre l’émetteur et le récepteur pour le repé-
rage de leurs constituants étaient de trois types :
1. des scènes comportant de nombreux objets répartis
autour d’un repère unique,
2. des scènes comportant plusieurs objets mais en l’absence
d’un repère susceptible de fournir un point de vue,
3. des scènes avec et sans repère allocentrique, plus com-
plexes dans la distribution de leurs constituants que le
premier type.
Le calcul tenait compte du degré de succès de la commu-
nication, de l’ambiguïté sémantique persistante après l’analyse
syntaxique et du degré de concordance entre les interpréta-
tions de l’émetteur et du récepteur. Michael Spranger constate
que l’entreprise de communication dénuée de grammaire
conduit généralement à un échec car, en l’absence d’analyse
syntaxique, l’ambiguïté sémantique persistante est très éle-
vée et le décentrage du point de vue à partir de l’émetteur
vers un repère allocentrique est impraticable, d’où sa conclu-
sion : « C’est seulement avec la grammaire que les agents sont
capables de partager la même structure sémantique, permet-
tant à la communication d’atteindre un haut degré de succès ».
5
En 1953, les deux biochimistes Stanley Miller et Harold C.
Urey ont conçu une expérience destinée à tester l’hypothèse
de l’origine des composés organiques, les briques de la vie,
en recréant les conditions qu’on pensait avoir régné sur terre
après la formation de la croûte terrestre. « Ils ont enfermé dans
un ballon des gaz (méthane CH4, ammoniac NH3, hydrogène
H2 et eau H2O) et soumis le mélange à des décharges élec-
176
triques pendant sept jours20 ». Le résultat a été une reconstruc-

tion de la « soupe primitive de la vie » contenant de l’urée, du
formaldéhyde, de l’acide cyanhydrique, des bases et des acides
aminés. Les simulations informatiques ou robotiques de Bart
de Boer, Pierre-Yves Oudeyer sur l’origine de la parole, et de
Jeffey Elman et Luc Steels sur celle de la grammaire, ainsi que
d’autres qui n’ont pas pu être évoquées ici de Simon Kirby
sur l’origine des universaux du langage21, poursuivent un but
analogue : il s’agit là aussi de reconstruire des interactions, non
pas entre des composés chimiques, mais entre des intentions
de communication dans un jeu où les agents sont tour à tour
locuteur et interlocuteur et où les intérêts de chacun des deux
rôles doivent être pris en compte.
Dans un esprit similaire de reconstruction globale, nous
verrons dans le chapitre 6 comment la caractérisation des
premiers hommes modernes comme des représentants d’une
espèce dénuée de substrat anatomique (ni neurologique) par-
ticulier, Homo symbolicus, a donné lieu à des modélisations
d’ordre épistémologique (Peter Munz), biosémiotique (Ter-
rence Deacon) et génétique (Eva Jablonka) qui cherchent
à rendre compte du tout de l’évolution cognitive, sociale et
linguistique humaine de manière plus satisfaisante que la
biolinguistique.
20. URL https://fr.wikipedia.org/wiki/Experience_de_Miller-Urey

21. Voir J. François (2018), De la généalogie des langues à la génétique du langage, Lambert-
Lucas, chap.6. 177
Chapitre 6
Homo symbolicus,
le manipulateur de symboles
Existe-t-il finalement une propriété du langage structuré

propre à l’espèce humaine qui lui soit absolument spécifique ?
Comme nous l’avons vu dans le chapitre précédent, l’approche
de l’épistémologie évolutionnaire (apparentée à celle de la bio-
sémiotique) diffère radicalement de celle de la biolinguistique.
L’hypothèse des biolinguistes, selon laquelle il faudrait comp-
ter la combinatoire syntaxique des morphèmes parmi les traits
constitutifs de la faculté de langage humaine, est notamment
remise en cause par l’observation de vocalisations dotées d’une
syntaxe dans des espèces aussi diverses que les grands singes
anthropomorphes, les oiseaux chanteurs et les cétacés.
Trois thèses évolutionnaires originales éclairent diverse-
ment la question de la caractérisation des hommes modernes
par l’aptitude à élaborer des symboles et à les manipuler de
manière experte.
La première est déjà ancienne, c’est la vision du langage
humain comme doté de trois dimensions, défendue par l’épis-
témologue Peter Munz, une propriété qui le distingue radi-
calement du protolangage des tout premiers hommes et qui
a permis aux générations suivantes de mettre en concurrence
leurs « théories » individuelles sur le monde ambiant auquel
leur groupe était confronté.
De son côté, après avoir forgé l’espèce « virtuelle » Homo
symbolicus dans son ouvrage de 1997, L’Espèce symbolique : la
179
co-évolution du langage et du cerveau1, le bioanthropologue

Terrence Deacon a approfondi plus récemment sa théorie sur
la genèse du langage en explorant la contribution de la « sélec-
tion relâchée » à ce processus, tandis qu’Eva Jablonka, géné-
ticienne et épistémologue à l’université de Tel-Aviv, explorait
pour sa part le rôle du processus d’assimilation génétique éten-
due à cette genèse.
Les trois dimensions du langage humain

Peter Munz, épistémologue néo-zélandais d’origine alle-
mande disciple de Ludwig Wittgenstein et de Karl Popper et
auteur en 1993 de Philosophical Darwinism, offre une vision
évolutionnaire de la conscience et de la cognition humaines
qui fait écho au tableau qu’en dressent les linguistes, notam-
ment le britannique John Lyons, théoricien de la sémantique
linguistique2, et les Hollandais Simon Dik et Kees Hengeveld,
fondateurs de l’école néerlandaise de grammaire fonctionnelle3.
Au même titre que ces linguistes, P. Munz se fait du lan-
gage humain une représentation à trois dimensions ou une
construction à trois étages qui s’est bâtie par une évolution gra-
duelle de la conscience4. Ces trois dimensions correspondent
approximativement aux phases du prélangage, protolangage
et langage structuré dans la vision de Talmy Givón. Le tableau
ci-après met en relation la hiérarchie des entités linguistiques
selon Lyons, Dik et Hengeveld, les trois phases de Givón et les
trois dimensions de Munz.
1. T. Deacon (1997), The Symbolic species : the coevolution between language and the brain,
Norton.
2. Voir J. Lyons (1978), Éléments de sémantique, Larousse.
3. Voir S. C. Dik (1997), The theory of functional grammar (2 vol.), De Gruyter [édition
posthume par K. Hengeveld].
4. C’est l’une des bases de l’épistémologie évolutionnaire et un thème que l’on retrouve aussi
180 chez le physiologiste Gerald Edelman (cf. Biologie de la conscience, 2008, Odile Jacob).
Homo symbolicus, le manipulateur de symboles
vision hiérarchique vision génétique

¾ Á Â
J. Lyons, S. Dik,
T. Givón1 P. Munz
K. Hengeveld
1 entités du 1er ordre : choses, prélangage langage
personnes unidimensionnel
2 entités du 2e ordre : protolangage langage
prédications localisables dans bidimensionnel
l’espace (et le temps)
3 entités du 3e ordre : langage langage
propositions, dotées d’une structuré tridimensionnel
valeur de vérité (dans un
monde dont conviennent les
interlocuteurs)
1. Comme Givón soutient que l’acquisition du langage par l’apprenti locuteur

(ontogénèse) passe par les mêmes phases que son évolution dans l’espèce humaine
(phylogénèse), ces trois stades s’appliquent à l’une comme à l’autre.
Au premier stade, la capacité linguistique des premiers

humains ou des apprentis locuteurs d’aujourd’hui consiste à
désigner des choses et des personnes. L’opération complémen-
taire de prédication, exprimant l’implication de ces choses
ou personnes dans une scène, est véhiculée par un geste ou
une onomatopée, par exemple joujou boum. Au second stade
les deux opérations de référence et de prédication entrent en
combinaison et constituent des propositions, par exemple :
papa parti noté en logique des prédicats PARTI (x : papa) ou
gâteau – là, noté LÀ (x : gâteau). Au troisième stade, les pro-
positions ainsi construites sont associées à un acte de langage,
typiquement de déclaration, d’interrogation ou de requête, et,
dans le cas des déclarations, elles reçoivent une valeur de vérité
dans le monde réel ou dans un monde possible.
181
La seule différence notable entre la vision hiérarchique

de Lyons, Dik et Hengeveld et celle génétique de Givón et
Munz tient à la représentation des situations dans le passé ou
le futur qui pour ces derniers constitue un déplacement cogni-
tif caractéristique d’une conscience du troisième niveau. En
effet, l’homme en émergence ou l’apprenti locuteur devient
capable de transposer l’opération de prédication en dehors du
moment d’expérience, ce que Munz formule ainsi :
« J’entends par langage tridimensionnel un langage qui a des modes opta-
tif, subjonctif, des temps du futur et du passé et qui dispose d’une syntaxe
suffisamment flexible pour exprimer des représentations, des images, des
souhaits, des espoirs, des regrets, etc. à propos d’événements qui n’ont
pas eu lieu. Dans un tel langage tridimensionnel on peut formuler des
inventions et des contenus imaginaires suggérés par l’observation de ce
qui existe. »
La transition vers le langage tridimensionnel est passée par

une double évolution physiologique et neurocognitive qui
vaut aussi bien pour les jeunes enfants que pour les premiers
hommes :
« Quand les deux produits de l’évolution – un tractus vocal adapté et un
système nerveux central suffisamment complexe – se sont mis à coïncider,
c’est là qu’a débuté la transformation du langage bidimensionnel en un
langage tridimensionnel. »
Pour Munz, dès lors que l’espèce humaine s’est dotée d’un
langage tridimensionnel, elle a acquis une double faculté.
D’une part, celle de construire des théories c’est-à-dire des
modélisations réfutables du monde ambiant (l’Umwelt de
J. von Uexküll). D’autre part, celle de composer avec ce mon-
de, c’est-à-dire d’en reconnaître les contraintes et d’en tester
le contournement, ce qui passe par ce qu’on appelle commu-
nément la négociation du sens, c’est-à-dire la construction
collective d’une représentation commune par le dialogue.
182
Munz résume sa thèse sous une forme assez énigmatique :

« chaque organisme est une théorie sur son monde ambiant ».
Un organisme est une théorie incarnée aussi longtemps qu’il
n’a pas été réfuté, c’est-à-dire éliminé en raison de son incom-
patibilité avec le monde ambiant : « Une théorie stipule qu’on
a certaines attentes (…) Si et quand ces attentes ne sont pas
satisfaites, l’organisme succombe et la théorie qu’il représente
est réfutée ».
Je propose d’illustrer cette vision par un exemple concret.
Notre système respiratoire est en quelque sorte une théorie sur
la composition du gaz à inhaler. Si la composition de ce gaz
est modifiée drastiquement, comme pour des mineurs dans
une galerie où se répand du gaz carbonique, l’organisme res-
piratoire est en danger. Dans les termes de Munz, « sa théorie
est réfutée ». En d’autre termes, les attentes qui assurent sa
fonctionnalité ne sont plus satisfaites, et si le mineur n’est pas
averti du risque, il succombe à l’asphyxie. Munz dit des pois-
sons qu’ils ont une théorie, celle de vivre dans l’eau :
« La forme d’un poisson et ses réflexes neuronaux représentent l’eau (…)
le comportement du poisson et le fonctionnement d’une théorie sur l’eau
sont exactement identiques. Le poisson représente l’eau par sa structure
et son fonctionnement ».
Cela permet d’établir une relation d’équivalence ou de

paraphrase :
X a un monde ambiant Y Ù X a une théorie sur Y
Mais Homo sapiens occupe une niche qualifiée, selon les
approches, de cognitive, de culturelle ou de sémiotique :
l’homme donne sens collectivement au monde ambiant du
groupe. Il n’a donc pas seulement une théorie sur ce monde
ambiant au même niveau élémentaire que tous les êtres
vivants (y compris la tique de Uexküll), il est « l’organisme
qui produit des théories exprimées linguistiquement » et
183
comme chaque X est doté de la même faculté, on en conclut

que {X1,…, Xn} confrontent par le langage leurs théories
respectives sur Y.
À ce stade du raisonnement, puisque les organismes ne
peuvent survivre et se reproduire que si leur théorie sur le
monde ambiant est adéquate, après avoir présenté les orga-
nismes comme des théories incarnées Munz présente désor-
mais les théories comme des organismes désincarnés, ce qui
est encore plus difficile à saisir. Il entend par là que les théories
sur leur monde ambiant que les humains confrontent « sont
sujettes aux mêmes processus d’évolution par mutation aléa-
toire et rétention sélective – même si la sélection ne sera pas
entièrement naturelle – en tant qu’organismes ou théories
incarnées ».
Dans l’espèce humaine, l’impact de la sélection naturelle
s’est considérablement réduit par rapport aux autres espèces.
Certes, le choléra, le paludisme et autres maladies tropicales,
la consommation d’une eau polluée, la tuberculose, le cancer
et les maladies vasculaires continuent à décimer des popula-
tions. Mais d’autres causes ont un impact important, et leur
développement est lié, pour certaines, à des comportements
à risques dans les pays industrialisés, et pour d’autres à des
conflits meurtriers prenant en otages des populations misé-
reuses de pays sous-développés et insuffisamment médicalisés.
De même que la sélection naturelle a permis l’évolution
des espèces sous la forme de multiples variétés dont les moins
adaptées ont été écartées, de même la sélection culturelle a
besoin d’un vivier de théories vraies et fausses entre lesquelles
choisir :
« À moins qu’il n’y ait une abondance de théories entre lesquelles sélec-
tionner, l’évolution ne peut pas avoir lieu. “Abondance” signifie ici la
présence de théories qui sont fausses et de théories qui sont vraies, de telle
sorte que la sélection peut s’effectuer. Mais sans un langage tridimension-
184
nel, il est impossible de formuler des déclarations qui aillent au-delà de

l’information fournie et qui puissent donc être fausses. »
Le tableau ci-dessous compare les deux processus d’évolu-

tion naturelle et d’évolution culturelle selon Munz en quatre
composantes.
évolution naturelle évolution culturelle
N1. Vivier d’organismes (théories C1. Vivier de théories (organismes désincar-

incarnées) génétiquement variés, nés) variées sur l’environnement naturel
viables (compatibles avec l’envi- et social, « vraies » ou « fausses » (repré-
Ù
ronnement, Umwelt) ou non sentant correctement/incorrectement
viables (incompatibles avec l’en- l’environnement selon le jugement du
vironnement) groupe)
¾ ¾
N2. Parmi l’éventail des organismes, C2. Parmi l’éventail des théories, sélection
sélection naturelle de ceux qui culturelle par le groupe de celles qui sont
Ù
sont viables. « vraies » (représentant correctement
l’environnement naturel et social).
¾ ¾
N3. Perfectionnement de l’ajustement C3. Perfectionnement de l’ajustement des

des organismes à l’environnement théories à l’environnement naturel et
Ù
aussi longtemps que celui-ci de- social aussi longtemps que celui-ci de-
meure inchangé. meure inchangé.
¾ ¾
N4. Si l’environnement change, des C4. Si l’environnement change, des varian-

variantes génétiques (allèles) tes idéologiques compatibles avec ses
compatibles avec ses nouvelles nouvelles caractéristiques sont sélec-
caractéristiques sont sélection- Ù tionnées au détriment des variantes
nées au détriment des variantes devenues moins compatibles ou incom-
devenues moins compatibles ou patibles.
incompatibles.
185
La composante 1 (N1 pour l’évolution naturelle, C1 pour

l’évolution culturelle) énonce les prérequis : un vivier d’orga-
nismes d’un côté, de théories sur le monde ambiant de l’autre.
La composante 2 concerne l’exercice de la sélection naturelle
vs. culturelle. La 3 concerne l’effet de la sélection quand le
monde ambiant perdure de manière stable et la 4 son effet
quand le monde ambiant change et réfute donc la théorie
de chaque organisme, dans le sens d’une meilleure ou d’une
moindre adéquation (fitness).
Chacune de ces composantes demande une illustration.
J’introduis ci-dessous successivement les deux types de sélec-
tion pour chaque composante.
[N1] Une population de poissons vit dans une eau à faible salinité, avec des indi-
vidus dont l’organisme présente des allèles (des versions variables d’un même
gène ou d’un même locus génétique) A1 compatibles uniquement avec une
faible salinité, d’autres dont les allèles A2 sont compatibles avec une eau de
salinité moyenne et d’autres dont les allèles A3 sont compatibles uniquement
avec une eau à forte salinité.
[C1] Une population d’hominidés P1 vit dans un espace montagnard où la chasse
est propice et la cueillette suffisante pour que la population se perpétue. Une
population P2 vit à quelque distance dans un espace de plaine où la chasse est
plus maigre mais la cueillette abondante, cette population a suffisamment de
nutriments pour prospérer.
[N2] Les organismes du type A1 survivent et se reproduisent, ceux du type A2
survivent plus difficilement et se reproduisent médiocrement, ceux du type
A3 ne se reproduisent pas et sont éradiqués.
[C2] La population P1 décide collectivement de miser en priorité sur la chasse, la
population P2 décide de tirer profit de la cueillette.
[N3] La place dans P1 des organismes du type A1 se renforce, celle des organismes
du type A2 stagne.
[C3] Les membres de la population P1 s’apprennent mutuellement à traiter les
peaux des animaux chassés et à les coudre pour se protéger du froid ; ceux de
la population P2 s’apprennent mutuellement des techniques de chasse (par
exemple, au collet) pour augmenter leur ration de protéines.
[N4] La salinité de l’eau augmente progressivement et affecte la survie des poissons.
Les organismes du type A1 deviennent graduellement incapables de se repro-
186
duire, ceux du type A2 progressent et ceux du type A3 qui continuent à être

produits par la sélection aléatoire sont favorisés et finissent par l’emporter.
[C4] Le climat entre dans une phase glaciaire qui touche particulièrement l’espace
montagnard. Un débat s’engage dans la population P1 pour savoir s’il faut
rester ou descendre dans la plaine. Deux tribuns s’opposent : le premier fait
valoir que l’essentiel est la chasse qu’ils pratiquent habilement et que la popu-
lation P1 sait se protéger efficacement du froid par ses techniques de chasse et
de couture. Il persuade une partie de la population (P1a) d’affronter le froid
et la réduction du produit de la cueillette en misant sur la chasse. Le second
persuade l’autre partie de la population (P1b) de miser sur le maintien de la
cueillette en descendant dans la plaine. Au bout de quelques années, la popu-
lation P1a se perpétue malgré des conditions de survie plus difficiles, tandis
que la population P1b, une fois descendue dans la plaine, entre en conflit
avec la population P2 mieux adaptée au milieu et finit pas être éradiquée. Le
mentor de la population P1a a donc fait un bon choix (celui qui a préservé
la survie de sa population) tandis que celui de la population P1b a fait un
mauvais choix qui a conduit à l’extinction de sa population.
La sélection culturelle, en d’autres termes la constitution

d’une niche sémiotique, bénéficie d’un avantage décisif qui a
permis à l’espèce humaine de se répandre sur les cinq conti-
nents et d’affronter efficacement des conditions de vie « inhu-
maines » : pourvu qu’un consensus se dégage, un groupe peut
trancher rapidement entre deux théories en concurrence, alors
que la sélection naturelle ne peut opérer qu’à un rythme beau-
coup plus lent, ce que Munz résume ainsi :
« Pour que la sélection naturelle opère sur des théories fausses [c’est-à-dire
des organismes inaptes] il faut attendre l’extinction d’une génération
complète. Tandis que la sélection d’organismes désincarnés [c’est-à-dire
des théories] peut prendre place beaucoup plus rapidement, parce que
les théories exprimées linguistiquement peuvent être écartées bien avant
l’extinction des organismes qui les incarnent. »
En conclusion, ce n’est pas pour se représenter le monde

ambiant que la conscience « supérieure », selon la distinction
de G. Edelman, a émergé, mais « pour faire des erreurs par
l’intermédiaire du langage qu’elle promeut » :
187
« La conscience est nécessaire, non pas, comme les philosophes l’ont

toujours supposé depuis Platon, parce qu’elle opère comme un guide
méthodique pour les vérités et les comportement bons, mais parce qu’elle
est capable de générer des suppositions sauvages (wild guesses). »
Ces suppositions « téméraires » sont l’équivalent cultu-

rel des allèles en génétique humaine : chaque individu se fait
une représentation du monde qui entoure le groupe et des
décisions à prendre, ce qui suppose qu’il puisse comparer la
situation présente à des situations vécues jadis qui demeurent
dans la mémoire collective (transfigurées par les mythes), à
des situations que d’autres populations vivent ailleurs, et à des
situations imaginées à l’avenir. Seul un langage tridimension-
nel selon Munz, un langage structuré selon Givón ou un lan-
gage opérant sur des entités du troisième ordre selon Lyons,
Dik et Hengeveld, permet la représentation de telles situations
et la confrontation des théories auxquelles ces représentations
donnent lieu. Une telle vision présente des affinités avec celle
de Jean-Louis Dessalles, qui considère qu’au fil de la discus-
sion collective (la palabre dans la tradition africaine), un tri-
bun développe une argumentation plus adaptée à la réalité
vécue par le groupe, ce qui lui confère le statut de guide du
groupe.
Sans sélection relâchée, pas de langage humain

Dans son ouvrage mentionné précédemment, le bio-
anthropologue américain Terrence Deacon a proposé de défi-
nir l’homme en émergence comme Homo symbolicus5. En quoi
cette désignation se distingue-t-elle d’Homo sapiens sapiens qui
mettait déjà en évidence l’aptitude à un savoir réflexif et donc
implicitement la possession d’une théorie de l’esprit ? Selon
5. J.M. Hombert et G. Lenclud (2013, Comment le langage est venu à l’homme, Fayard)
lui préfèrent le qualificatif d’Homo culturalis, mais les deux désignations se recouvrent
188 largement dans la mesure où le maniement de symboles est à la base de toute culture.
Deacon, il s’agit d’une « sorte d’espèce virtuelle et non d’une

espèce génétique, car elle se fonde sur quelque chose de dif-
férent des traits strictement génétiques ou morphologiques ».
Et il précise :
« Tous les hominidés manipulant des symboles sont liés par un vivier
commun d’informations symboliques, lequel est aussi inaccessible à
d’autres espèces que le sont les gènes humains (…) À plus d’un titre, le fait
d’être partie prenante de ce lignage basé sur les informations symboliques
est un trait plus spécifique d’humanité qu’un quelconque trait physique
(…) Ce n’en est pas moins une classification biologique. »
Pour Deacon l’homme moderne est certes un hominidé qui
a acquis un savoir réflexif, la conscience d’être savant (Homo
sapiens sapiens), mais surtout un virtuose de la manipulation
de symboles, c’est-à-dire de concepts se rapportant au réel sans
relation iconique avec ce réel, selon la distinction de Charles
S. Peirce entre les icônes, les indices et les symboles6.
Bien que l’espèce virtuelle Homo symbolicus n’ait pas pu lais-
ser de fossile spécifique, l’étude comparative de crânes d’Homo
habilis et d’australopithèques révèle un développement carac-
téristique de l’aire préfrontale, notamment dans l’hémisphère
gauche, dédiée chez l’homme moderne à la planification des
actions, et Deacon en conclut que « ces changements saillants
dans la structure du cerveau sont corrélés avec le développe-
ment d’une faculté de symbolisation proprement humaine ».
Les premiers hommes n’ont pas seulement employé des
outils comme peuvent le faire les chimpanzés qui prennent
une brindille pour récupérer des termites au fond d’une termi-
tière, il est devenu un Homo faber, un fabricant d’outils (une
désignation due au philosophe Henri Bergson dans L’Évolu-
tion créatrice en 1907). Car « une fois qu’un comportement
avantageux se répand à travers une population et acquiert de
l’importance pour sa subsistance, il va générer des pressions
6. http://www.signosemio.com/peirce/semiotique.asp 189
sélectives sur les traits génétiques qui sont à la base de sa pro-

pagation ». Les outils fabriqués par les premiers hommes sont
ainsi devenus la principale source de sélection affectant leur
corps et leur cerveau. Et en désignant ce processus évolutif
comme le « trait distinctif d’Homo symbolicus », Deacon met
en avant la manipulation de symboles débouchant sur la pla-
nification d’actions effectuées à l’aide d’outils fabriqués à cette
fin plus que la conscience de soi évoquée par la désignation
Homo sapiens sapiens. Les deux désignations ont cependant en
commun l’implication du langage dans deux de ses usages,
pédagogiques (Homo symbolicus montre et commente la fabri-
cation des outils et leur destination) et interlocutoire (Homo
sapiens sapiens a conscience d’avoir des interlocuteurs et de
négocier le sens du monde ambiant avec ceux-ci pour pro-
duire une action collective).
Deacon défend un modèle d’évolution « baldwinien ».
La théorie de James Baldwin, développée ultérieurement par
Conrad H. Waddington, explique comment les comporte-
ments des individus peuvent affecter l’évolution de l’espèce,
mais sans impliquer (contrairement à Lamarck) que les
réponses aux exigences environnementales acquises au cours
de la vie d’un individu puissent se transmettre directement à
sa descendance. Deacon illustre cette thèse à partir de l’évolu-
tion de la tolérance au lactose :
« Les populations humaines présentant le taux le plus haut d’adultes
tolérant le lactose sont celles où des animaux ont été élevés depuis le plus
long temps, et celles avec le taux le plus bas sont celles où l’élevage a été
introduit le plus récemment ou pas du tout (...) l’emploi de lait animal
comme source de nourriture, malgré des difficultés à le digérer pour cer-
tains, a favorisé la reproduction de ceux qui le toléraient. »
Par conséquent, le changement évolutionnaire résulte

de l’héritage de comportements appris, lequel permet à un
190
organisme d’accéder à un répertoire d’adaptations poten-

tielles. Selon Deacon, la représentation de la faculté de lan-
gage comme un « instinct », selon la formulation célèbre de
Steven Pinker, ne peut pas s’appliquer au savoir grammatical,
car « les attributs les plus universels des structures linguis-
tiques sont par nature les plus variables dans la représentation
superficielle, corrélés variablement à des tâches de traitement
et difficilement localisables dans le cerveau entre individus ou
même chez un même individu ». Il en résulte que ces traits
ne peuvent pas avoir développé des supports neuronaux spé-
cifiques. Il manque en effet à la logique profonde des règles
grammaticales les caractéristiques invariantes qui permet-
traient à la sélection naturelle de les piloter.
Sa réflexion a progressé récemment en écho au dévelop-
pement de la biosémiotique et de la biologie évolutionnaire
développementale (Evo-Devo). En 2010, Deacon a publié en
ligne un article intitulé « À propos de l’humain : Retour sur
la sélection naturelle du langage humain7 » qui a donné lieu à
un débat impliquant les meilleurs spécialistes. L’auteur com-
mence par récuser la thèse de Darwin dans La Filiation de
l’homme et la sélection sexuelle (1891)8 attribuant le développe-
ment du langage humain à la sélection sexuelle. Le principal
argument à l’encontre de cette hypothèse est que tous les cas
connus de sélection sexuelle débouchent sur un dimorphisme
entre les deux sexes. Or les capacités linguistiques – et plus
généralement cognitives – des hommes et des femmes sont
analogues. En revanche, il est hautement vraisemblable que
l’usage balbutiant de formes protolinguistiques a réorganisé le
réseau social et qu’une compétition s’est mise en place entre
locuteurs débutants pour tirer le meilleur profit de cet avan-
7. T. Deacon, « On the Human: Rethinking the natural selection of human language »,
https://nationalhumanitiescenter.org/on-the-human/ 2010/02/on-the-human-rethinking-
the-natural-selection-of-human-language/.
8. Ch. Darwin (1871), Descent of Man, and Selection in Relation to Sex, Muray. 191
tage dans la lutte pour la survie et la reproduction, et cette

compétition a dû favoriser les individus dotés d’un esprit
innovant et communicatif.
Pour Deacon, « nous sommes des créatures dont les apti-
tudes sociales et mentales ont été littéralement formatées par
les exigences particulières de la communication à l’aide de
symboles ». Mais le bioanthropologue récuse aussi la vision
saltationniste de Noam Chomsky et Derek Bickerton qui fait
remonter l’émergence du langage grammaticalisé à moins de
100 000 ans, car une datation aussi récente implique deux
corollaires : un effet négligeable sur l’organisation du cerveau
humain et une faible intégration à d’autres fonctions cogni-
tives, ce qui en ferait un outil fragile, notamment en cas de
déficience mentale congénitale.
Or, la faculté de langage a substantiellement affecté l’évolu-
tion de notre cerveau. Contrairement à la thèse de Chomsky,
elle est bien intégrée dans presque tous les aspects de nos vies
cognitives et sociales et elle s’avère robuste même dans des cir-
constances sociales difficiles ou en cas de handicap neurologique.
Inversement Deacon partage avec Jim Hurford et ses anciens
collaborateurs de l’université d’Edimbourg, Morten Chris-
tiansen et Simon Kirby, la conviction que les langues doivent
également s’adapter aux cerveaux. Car plus les structures de
la langue sont aisées à apprendre et adaptées aux limitations
humaines, plus leur reproduction de génération en génération
est effective. En revanche il n’est pas convaincu par la thèse de
Robin Dunbar pour qui la faculté de langage n’est qu’un aspect
de l’intelligence générale concerné par la gestion des relations
sociales. D’un côté « les vocalisations variées dont nous avons
hérité, comme le rire, les sanglots d’effroi et les cris d’angoisse,
sont contrôlés dans un espace neurologique (en général sous-
cortical) comme le sont d’autres modes de communication
animale », tandis que d’un autre côté « le langage dépend
192
d’une constellation largement dispersée de systèmes corticaux,

identifiables chacun dans le cerveau d’autres primates, mais
développés pour assumer des fonctions différentes ».
C’est ici qu’intervient sa nouvelle hypothèse accordant une
place décisive à la sélection relâchée (relaxed selection) dans la
genèse du langage. Deacon donne l’exemple des vocalisations
différentes de deux espèces d’oiseaux étroitement apparentées,
l’une sauvage, le munia à croupe blanche, l’autre domestiquée,
le pinson du Bengale. On a observé que l’espèce domestiquée
a développé l’aptitude à apprendre des vocalisations beaucoup
plus complexes et diversifiées, ce qui implique un contrôle
neuronal plus étendu que dans l’espèce sauvage. Étant admis
que les oiseaux chanteurs sauvages ont développé des vocali-
sations complexes, mais stéréotypées9, pour faire bonne figure
dans les joutes sexuelles, l’hypothèse de Deacon est que les
oiseaux domestiqués ne sont plus soumis à une compétition
sexuelle, leur sexualité étant étroitement encadrée. Par consé-
quent les biais innés contrôlant la production des chants se
sont réduits et le chant domestique est devenu à la fois moins
contraint et plus variable, parce que sujet à des perturbations
plus variées provenant du contexte social. Deacon observe
d’ailleurs que le babil du jeune enfant se caractérise par un état
de relaxation et une grande variété de vocalisations, contrai-
rement aux rires, aux pleurs et aux hurlements produits dans
des états d’excitation particulière et associés à des contextes
spécifiques. Dans son commentaire à l’article de Deacon, la
primatologue Sue Savage-Rumbaugh souligne une différence
comportementale passée jusque là inaperçue : l’éducation des
grands singes, contrairement à celle des hommes, requiert que
les petits se cramponnent à leur mère, avec pour effet des profils
épigénétiques divergents concernant la bipédie, les vocalisations
9. En contradiction avec cette généralisation, nous avons vu plus haut que les vocalisations de
certaines espèces d’oiseaux chanteurs et de cétacés sont dotées d’une syntaxe. 193
libres et l’usage et la fabrication d’outils. Les petits bonobos éle-

vés en l’absence de prédateurs dans un environnement qui leur
épargne ce comportement engagent leurs mains et leurs yeux
dans des manipulations d’objets variées et leur cerveau peut
construire des systèmes manipulatoires impliquant œil, main,
bouche et objet de la même manière que les jeunes humains.
C’est un nouvel exemple de sélection relâchée : le petit bonobo
condamné à rester cramponné à sa mère pour assurer sa survie
connaît un développement exempt de relaxation, et la prima-
tologue, qui avait réussi à engager un véritable dialogue avec le
bonobo Kanzi à l’aide de lexigrammes, considère que la bifur-
cation génétique cruciale ne passe pas entre les hommes et les
grands singes anthropomorphes (apes) mais entre ceux-ci et les
autres singes (monkeys), car Kanzi et d’autres chimpanzés et
bonobos ont pu s’ouvrir à un nouveau mode de communica-
tion en compagnie des hommes, alors qu’une telle « relaxation »
n’a jamais été observée avec d’autres espèces de singes.
Selon Deacon nous sommes des « savants symboliques », et
c’est un aspect essentiel de notre relation à autrui et au monde
environnant. Il entend par là que l’espèce humaine a déve-
loppé une prédisposition à voir dans les objets des symboles10.
Nous sommes au centre d’un « écosystème de relations sym-
boliques ». L’une des manifestations les plus frappantes de cet
écosystème est révélée par la complexité et la variété extraor-
dinaire des régimes d’alliances matrimoniales, étudiées par les
anthropologues depuis la fin du xixe siècle. Si l’appétit sexuel
est un mode d’interaction « bestial », sa canalisation répon-
dant à des règles extraordinairement complexes dans certaines
sociétés, notamment amérindiennes, prouve à quel point l’in-
telligence sociale pilotée par le langage a modelé pendant des
10. L’attractivité du conspirationnisme s’est largement développée depuis le développement

des réseaux sociaux : la plupart des événements sociaux et politiques seraient lourds d’un
194 sens auquel des forces suspectes nous empêcheraient d’accéder.
millénaires des sociétés qui affirmaient la supériorité de l’ordre

humain en privilégiant l’unité organique du corps social.
Comment l’évolution culturelle a pu déboucher sur

une assimilation génétique
En 2005, un ouvrage a fait sensation parmi les chercheurs
en philosophie de l’évolution et en anthropobiologie, celui de
deux chercheuses en biologie évolutionnaire, Eva Jablonka et
Marion Lamb, intitulé L’évolution en quatre dimensions – la
variation génétique, épigénétique, comportementale et symbo-
lique dans l’histoire de la vie11. De l’avis des spécialistes, il a
représenté un jalon décisif dans la réflexion théorique sur les
stades de l’évolution (comparable à la synthèse de Maynard-
Smith & Szathmáry une décennie auparavant), adoptant une
approche de biologie évolutionnaire développementale. Et il
a notamment permis d’évaluer la place, dans l’évolution, de
l’émergence de la cognition symbolique et donc du langage.
Les auteures résument ainsi leur vision :
« Nous sommes convaincues que pour tous les changements majeurs dans
l’évolution il faut s’imaginer au moins deux dimensions de l’hérédité,
génétique et épigénétique. Avec de nombreux animaux, une troisième
dimension, celle qui implique de l’information transmise par le compor-
tement est également pertinente et pour les humains le système symbo-
lique ajoute une quatrième dimension. Ces quatre voies de tranmission de
l’information introduisent, à différents degrés et de différentes manières,
des mécanismes d’instruction dans l’évolution. »
Les deux biologistes se proposent d’« étendre l’idée de l’assi-

milation génétique au comportement et de montrer comment
la sélection naturelle peut convertir ce qui était à l’origine une
réponse apprise de l’environnement en un comportement qui
est inné ». La notion d’assimilation génétique est due au bio-
11. E. Jablonka & M. Lamb (2005), Evolution in Four Dimensions : Genetic, Epigenetic,
Behavioral, and Symbolic Variation in the History of Life, MIT-Press. 195
logiste et généticien Conrad Hal Waddington au milieu du

xxe siècle12. Ce processus est assimilable à l’effet Baldwin et à
la construction de niche. Talmy Givón précise à ce propos que
« par l’interaction entre la construction de niche et l’assimila-
tion génétique, un entraînement comportemental flexible finit
par s’assimiler au génome » et Maynard-Smith & Szathmary
notent en 1995 qu’ « un trait qui apparaît d’abord en réponse
à un stimulus environnemental peut, s’il présente un avan-
tage sélectif, être assimilé génétiquement, c’est-à-dire se pré-
senter en l’absence de stimulus (…) le processus opère parce
que la sélection favorise ceux des génotypes dont la réponse
au stimulus est la plus adaptée ». De ce fait les chercheurs en
épistémologie évolutionnaire associent volontiers les deux bio-
logistes en évoquant un « effet Baldwin-Waddington ».
Jablonka et Lamb mettent cette notion en relation avec
celle de plasticité développementale élaborée par la généti-
cienne Mary West-Eberhard13, qui la définit comme « l’apti-
tude d’un génotype unique à générer, en réponse à des circons-
tances environnementales différentes, des formes variables de
morphologie, de physiologie, et/ou de comportement ». La
plasticité est étroitement corrélée à son inverse, la canalisa-
tion. En présence d’un défi, comme celui de créer collective-
ment un mode de communication linguistique qui puisse être
appris sans difficulté majeure, la plasticité a ouvert un éventail
de solutions entre lesquelles la canalisation a effectué un tri
afin de sélectionner la solution la plus conforme aux aptitudes
mémorielles et sémantiques limitées qui permettaient aux pre-
miers hommes d’acquérir un nouveau savoir.
12. C. H. Waddington C.H. (1953), « Genetic assimilation of an acquired character »,

Evolution 7.
13. M. West-Eberhard (2003), Developmental Plasticity and Evolution, Oxford University
196 Press.
Les auteures développent une version étendue du principe

de l’assimilation génétique, illustrée par exemple par le com-
portement de petits goélands à peine éclos qui réagissent à un
objet long avec un point rouge (ressemblant vaguement au
bec d’un de leurs parents) en le becquetant. Elles l’interprètent
selon le principe de l’assimilation génétique étendue : « Une
partie de la séquence comportementale qui dépendait jusque
là principalement de l’apprentissage est maintenant assimilée
génétiquement ; et cela permet à un nouvel élément appris d’y
être ajouté. »
Les gènes hérités et la niche héritée entretiennent une
boucle de rétroaction quand, par exemple, une population de
singes, qui a déjà dans son patrimoine génétique une réac-
tion d’évitement à l’encontre d’un ensemble de prédateurs
aériens connus, est exposée à une nouvelle espèce prédatrice.
L’extension de ce comportement en présence des nouveaux
prédateurs suppose une capacité de comparaison et de géné-
ralisation : le nouvel arrivant a des traits d’aspect physique et
de comportement semblables à celui de prédateurs connus, il
entre donc dans la classe des rapaces à redouter. Et si ce rapace
se manifeste suffisamment souvent, la liste des prédateurs à
éviter inscrite dans le patrimoine génétique va s’allonger.
Dans le cas des macaques du Japon qui, en un demi-siècle
(depuis 1953), ont répandu sur presque tout l’archipel la
pratique du lavage des patates douces avant de les consom-
mer, l’éthologiste Bernard Thierry considère qu’il ne peut pas
s’agir d’un cas d’assimilation génétique étendue car « la fixa-
tion des caractères acquis est peu développée chez les singes,
le processus cumulatif reste limité et l’on n’observe pas chez
eux les dérives culturelles que l’on rencontre dans les cultures
humaines »14. Pour ce chercheur, les cultures animales ont un
14. « L’évolution culturelle a introduit une rupture entre l’homme et l’animal », entretien de
Nicolas Journet avec Bernard Thiery, J.-F. Dortier (dir.) 2015, op.cit., p.118-125. 197
caractère contingent, c’est-à-dire que « les animaux peuvent

survivre sans traditions et ils ne modifient pas leurs organi-
sations sociales d’une génération à l’autre (…) ils reviennent
périodiquement à leur état initial ». Inversement, comme le
résume l’effet-cliquet (ratchet effect) de Michael Tomasello, la
dérive culturelle humaine est irréversible. Notre niche cogni-
tive15 s’adapte continuellement à un environnement évolutif,
avec la « modification lente, continue et irréversible des tech-
niques, des acquis symboliques et des règles sociales ».
L’essentiel pour l’espèce humaine, c’est que le langage a
changé les gènes, car « par l’usage, les inventions originales
sont perfectionnées et canalisées, et d’autres nouvelles inven-
tions qui les prolongent sont adoptées. Graduellement, tan-
dis que les mots et les structures s’accumulent, la quantité de
ce qui est à apprendre s’accroît16 ». La philosophe et linguiste
Anne Reboul présume elle aussi que l’émergence du langage
est à mettre sur le compte de la nécessité impérative de gérer
l’augmentation exponentielle des concepts et de leurs rela-
tions. L’expansion du langage a changé la niche sociale des
premiers hommes, car ceux qui peinaient à s’y adapter et à
le pratiquer efficacement ont fini par faire figure d’attardés
mentaux.
Jablonka & Lamb imaginent la naissance d’une compé-
tition entre bons et mauvais locuteurs : « Certains individus
auront une constitution génétique qui leur permettra de
mieux acquérir le système linguistique culturellement étendu
et par l’avantage sélectif que confère l’aptitude à apprendre
15. Le biosémioticien Kalevi Kull et ses partenaires préfèrent parler d’une niche sémiotique
puisqu’elle réside dans l’opération individuelle de symbolisation et le maniement collectif
des symboles, et en premier lieu des signes linguistiques : « Une niche sémiotique se définit
comme la totalité des signes et des indices dans l’environnement d’un organisme – des
signes qu’il doit être capable d’interpréter de manière sensée pour assurer son équilibre
et son bien-être » (« Theses on Biosemiotics: Prolegomena to a Theoretical Biology »,
Biological Theory, 4(2) 2009, 167–173).
198 16. E. Jablonka & M. Lamb (2005), op.cit.
à comprendre et à employer le langage, la proportion de ces

individus dans la population va croître. » Jean-Louis Dessalles,
chercheur en technologies de la communication et en linguis-
tique évolutionnaire, raffine cette vision en voyant comme
chef naturel du groupe celui qui s’impose par la pertinence
de sa vision des rapports de force entre les hommes et avec
la nature environnante17 quand Bernard Victorri, linguiste et
mathématicien, insiste de son côté sur la place éminente de
celui qui sait raconter et exalter le vécu collectif et lui donner
sens à travers la création de mythes18.
La conception de Jablonka et Lamb est proche de celle
des biosémioticiens (notamment Thomas Sebeok et Terrence
Deacon), car elles conçoivent l’évolution des espèces sous la
forme d’une échelle d’élaboration de plus en plus efficace de
l’information :
« Certaines des transitions évolutionnaires majeures – des organismes uni-
cellulaires aux multicellulaires, des individus aux groupes sociaux homo-
gènes, des groupes sociaux aux communautés culturelles – ont été bâties
sur de nouveaux types de transmission de l’information. Avec l’addition
de nouvelles voies de transmission de l’information et l’émergence de
nouveaux types d’organismes dotés de capacités évolutives différentes, le
rôle et l’importance des systèmes d’héritage existants a changé. »
Leur échelle évolutive comporte trois degrés :

Pour les organismes du premier degré, toute l’information
passe par les moyens de la génétique et de l’épigénétique.
Pour ceux du deuxième degré, l’information comporte-
mentale finit pas prévaloir sur l’information épigénétique.
Enfin, pour les organismes du troisième degré, l’infor-
mation symbolique entraîne des « changements culturels
explosifs ».
17. J.-L. Dessalles (2000), op.cit.

18. B. Victorri, op.cit. p. 116 du présent ouvrage. 199
Une fois un certain degré de complexité anatomique et

physiologique atteint, c’est en priorité par leurs comporte-
ments que les organismes multicellulaires et particulièrement
les animaux ont évolué. Une fois les relations neuronales par-
venues à un certain degré de complexité dans le cerveau de
ces animaux, la transmission de l’information symbolique s’est
mise en place, avant de progresser de manière exponentielle.
À terme cette dernière a fini par équilibrer, et même écraser,
les modes précédents de transmission de l’information. Le
schéma ci-dessous résume cette vision échelonnée de l’évolu-
tion du traitement de l’information :
Animaux pratiquant la COMMUNICATION

3e
SYMBOLIQUE (ébauche dans la lignée des primates
degré
et développement dans la seule espèce humaine)
Å
2e animaux complexes dotés d’un SYSTEME NERVEUX

degré CENTRAL
Å
1er organismes unicellulaires dotés uniquement de systèmes

degré d’héritage GENETIQUE et EPIGENETIQUE
5
Dans ce chapitre nos interrogations ont pris un tour
épistémologique.
L’épistémologue évolutionniste Peter Munz nous a déli-
vré avec sa vision – déjà ancienne, mais toujours précieuse
– des organismes comme des théories incarnées et des théo-
ries comme des organismes désincarnés, une épistémologie
en forme de ruban de Moebius : sur une face les théories, sur
200
l’autre les organismes, mais au final il s’avère que le ruban n’a

qu’une seule face.
À son tour, Deacon nous fournit l’une des clés de cette
créativité avec son observation, confirmée pour les jeunes
primates par la primatologue Savage-Rumbaugh, de la sélec-
tion relâchée qui s’applique à des oiseaux chanteurs élevés en
captivité. L’absence habituelle de créativité chez ces oiseaux
en milieu sauvage serait un effet des exigences de la sélection
sexuelle.
Enfin la théorie de l’assimilation génétique des avantages
compétitifs fournis par le maniement expert du langage per-
met à Eva Jablonka d’imaginer un mode d’évolution inté-
grant l’effet Baldwin-Waddington, c’est-à-dire l’impact de la
construction de niches culturelles, sans mettre pour autant
Lamarck à la place de Darwin.
Après cette échappée dans des zones « stratosphériques »,
nous allons revenir aux apports de la linguistique historique
dans les deux derniers chapitres. Nous verrons notamment
que depuis le début du xixe siècle, les linguistes ont accu-
mulé des quantités de données sur l’évolution historique des
langues, qui ont permis de comprendre en quoi la diversité,
notamment syntaxique et morphologique, des langues du
monde, actuelles et anciennes, est compatible avec l’existence
d’un nombre limité d’universaux du langage.
201
Chapitre 7
L’origine des classes de mots
et de leurs combinaisons
Quelles sont les propriétés fondamentales d’une langue ?

Les linguistes distinguent traditionnellement les propriétés de
l’expression et celles du contenu (les deux faces signifiante et
signifiée des signes linguistiques selon le Cours de linguistique
générale de Ferdinand de Saussure). Nous avons vu dans le
premier chapitre qu’à partir d’une « soupe primitive » de
vocalisations plus ou moins distinctes dans leur expression
et dans le contenu qu’elles étaient destinées à véhiculer, le
processus de discrétisation (c’est-à-dire de discrimination)
progressive a produit pour chaque idiome un inventaire de
phonèmes et de leurs combinaisons primaires, les morphèmes.
Les phonèmes vocaliques et consonantiques sont
grossièrement comparables aux particules constitutives des
atomes en physique : les morphèmes sont comparables à des
atomes qui nécessitent une certaine proportion de voyelles
et de consonnes. La différence notable est qu’un morphème
peut consister en une seule voyelle (exemple en français a, à,
eu, ont, etc.), alors que dans un atome le nombre des protons
doit être égal à celui des électrons, sinon on est en présence
d’un ion à charge électrique positive ou négative. C’est au
niveau intermédiaire que la comparaison est instructive : les
molécules correspondent aux mots composés de plusieurs
morphèmes, tous lexicaux comme dans tire-bouchon /ti-
bu‘O/ ou lexicaux et grammaticaux comme dans la forme de
203
conjugaison comparerons /kOpar({)rO/, et les macromolécules

aux groupes syntaxiques. Et au niveau supérieur, les protéines,
constituées de longues chaînes de composants organiques, sont
comparables aux discours. Les protéines sont les briques de la
vie et ce sont les discours qui donnent vie aux langues avec la
sélection de modalités dites « discursives » ou « énonciatives »,
comme la description, l’interpellation ou l’argumentation.
Le propos de ce chapitre est d’examiner comment les
morphèmes se sont combinés de manière variable selon les
types de langue et comment des universaux du langage se
sont mis en place en dépit de l’extrême variété de ces types
phonologiques (évoqués dans le chapitre 1), morphologiques,
lexicologiques et syntaxiques.
L’émergence des classes de mots

Si je veux interagir avec un interlocuteur sur le monde
ambiant par la parole, cela suppose à un premier stade que
je lui communique la représentation mentale de personnes,
de choses ou de substances concrètes stables sous la forme de
noms (N) et celle d’une situation évolutive (un événement),
impliquant éventuellement un agent (une action) ou plus ou
moins continue (une activité ou un état) sous la forme d’un
verbe (V). Selon James Hurford, spécialiste de linguistique
informatique à l’université d’Edimbourg, l’articulation
fondamentale du langage réside dans l’acte de prédication,
c’est-à-dire d’assemblage d’un mot d’action (un prédicat
verbal) et d’un ou plusieurs noms référant à un agent et
éventuellement à un patient. La prédication peut être soit
intransitive (Marie chante), soit transitive (Paul abat un arbre).
204
L’origine des classes de mots et de leurs combinaisons
Les deux classes N et V sont donc primaires et sont

universellement distinguées1. Il n’en est pas de même pour les
classes secondaires : les adjectifs, les adverbes lexicaux (ceux
en -ment pour le français) et les mots grammaticaux (articles,
adjectifs et pronoms indéfinis, démonstratifs, interrogatifs,
exclamatifs, conjonctions, verbes auxiliaires de temps ou de
voix, etc.). On peut supposer que les classes les plus largement
répandues sont les plus anciennes et on sait depuis les premiers
développements de la grammaire historique et comparative
au xixe siècle que les mots grammaticaux et les morphèmes
à valeur grammaticale se combinant avec des racines ont tous
une origine lexicale plus ou moins directe. On a pu classer
plusieurs stades de catégorisation lexicale et grammaticale2 :
Stade 1 : les noms et les verbes

Stade 2 : les adjectifs et les adverbes
Stade 3 : les démonstratifs, les prépositions et postpositions, les affixes
de l’aspect (l’accompli par exemple), les marques de la négation
(ne…pas, le préfixe in-)
Stade 4 : les pronoms personnels et relatifs, les marques du défini/
indéfini (en français, l’article), de la comparaison (plus, moins,
aussi), des cas (nominatif, accusatif, etc.) et des temps verbaux
Stade 5 : les marques sur le verbe de l’accord avec le sujet, de la voix
passive, les conjonctions de subordinations
Les classes de mots (lexicaux et grammaticaux) se

définissent en raison d’une part de leur fonction et d’autre
part des combinaisons qu’elles entretiennent entre elles (leur
distribution, en termes techniques). Le stade 1 des typologues
Bernd Heine et Tania Kuteva tient compte uniquement de
1. Certaines langues dites omniprédicatives (par exemple, l’ancien aztèque ou nahuatl)
peuvent combiner une racine non catégorisée avec une marque de morphologie nominale,
ce qui spécifie celle-ci comme un nom, ou une marque de morphologie verbale, ce qui
la spécifie comme un verbe, mais c’est déjà le cas en français avec le processus dit de
« conversion morphologique » (exemple : avec la racine cri- : le bébé cri+e / les cri+s du bébé.
2. B. Heine & T. Kuteva (2002), World Lexicon of Grammaticalization. Cambridge University
Press. 205
la combinaison de deux classes : un ou plusieurs noms se

combinent à un verbe pour former une proposition par un
acte de prédication (exemple, bucheron–frappe, arbre–tombe,
bucheron–abat–arbre).
Mais progressivement les schémas prédicatifs ont
été recyclés pour exprimer des relations métaphoriques :
le bucheron frappe l’arbre
¼ l’éclair frappe l’arbre
¼ la maladie frappe les enfants
¼ la nouvelle frappe les téléspectateurs
C’est notamment l’origine de la dérivation sémantique qui

fait passer le verbe aller d’un premier emploi de mouvement
avec une destination vers un second emploi de mouvement
avec un but exprimé par une construction infinitive et au-delà
vers un troisième emploi d’auxiliaire d’aspect :
Je suis allé à Paris
¼ je suis allé voir mes amis
¼ j’allais partir à Paris quand je suis tombé malade
La constitution de groupes syntaxiques a pris son origine

dans la nécessité de référer de plus en plus précisément à des
choses, des personnes, des situations, puis des représentations
abstraites. Il est possible d’attirer l’attention de l’interlocuteur
sur une zone de l’espace visuel partagé (une chose, une personne
ou un événement en cours) par la gestuelle et la mimique,
mais il est impossible de référer par ces moyens primaires à
des choses ou à des personnes absentes du champ visuel ou à
des événements passés ou futurs. C’est essentiellement cette
fonction qu’assument les mots grammaticaux comme les
démonstratifs, les pronoms, les auxiliaires de temps et de voix,
etc., et les affixes qui se combinent à des mots lexicaux, comme
par exemple les marques de pluriel pour les noms ou de temps
206
pour les verbes3. On peut s’en assurer en considérant ce que

la constitution de groupes nominaux et verbaux a permis en
français à partir du schéma prédicatif primitif bucheron–abat–
arbre et en suivant les stades évoqués plus haut :
Stade 1 : bucheron – abat – arbre noms, verbe
Stade 2 : jeune + bucheron – abat + + adjectifs, adverbes
facilement – vieux + arbre
Stade 3 : [ces jeunes bûcherons] – négation + démonstratif,
+ abat + facilement – [nos vieux numéral, possessif,
arbres] négation
Stade 4 : [ils]sujet [[ne…pas]nég. [les]objet [avoir + pronoms, auxiliaire

abattu facilement]]groupe verb. de temps
Stade 5 : (Ces jeunes bucherons), ils ne les ont mise en forme de la
pas abattus facilement (nos vieux phrase avec accord et réfé-
arbres) rence des pronoms
Au stade 1 plusieurs notions sont organisées en un schéma

prédicatif minimal. Au stade 2 l’adjonction d’adjectifs et
d’adverbes permet de commencer à « référencer » ces notions,
c’est-à-dire à les repérer dans l’espace physique et social
partagé. Ce référencement progresse au stade 3 par l’ajout
de déterminants de différents types, et la phrase se simplifie
au stade 4 par l’introduction de pronoms personnels, tandis
que l’ajout d’un auxiliaire de temps renvoie l’événement dans
le passé. Enfin, au stade 5 l’accord entre le verbe et le sujet
est réalisé et la référence des deux pronoms personnels est
assurée par deux groupes syntaxiques disposés avant et après la
proposition centrale.
3. Il est à noter que la fonction de certains affixes est seulement de renforcer (de manière
redondante) la cohésion grammaticale entre les noms, adjectifs et verbes par un accord
entre classes en nombre, genre ou personne. Mais certains de ces affixes ne se manifestent
qu’à l’écrit et la communication orale s’en dispense très bien. Si je dis une grande personne/
des grandes personnes, seul l’article une/des véhicule le nombre singulier ou pluriel à l’oral. 207
On peut supposer avec Bernd Heine et Tania Kuteva que

l’évolution du protolangage vers les langues proprement dites a
suivi un tel cheminement. Il y a eu certainement de nombreux
protolangages dont certains ont donné lieu (dans l’hypothèse
de la polygénèse des langues) à des langues grammaticalisées
en procédant à des choix différents qui ont conduit à la variété
grammaticale des langues d’aujourd’hui, qu’il s’agisse de
l’ordre des groupes syntaxiques (les langues à ordre de base
Sujet-Verbe-Objet, Sujet-Objet-Verbe ou Verbe-Sujet-Objet
par exemple) ou de la présence réduite ou développée de
marques morphologiques de types divers.
Ainsi l’équivalent de l’article défini dans la maison
correspond en danois à un suffixe : hus+et et le passif dit
« analytique » du français (elle est aimée) correspond au passif
dit « synthétique » du latin classique (amatur) formé par la
combinaison entre une racine verbale (ama-) et un suffixe
amalgamé de {voix passive & présent & 3e pers.sing.} (-tur).
L’émergence des mots grammaticaux

Au début du xxe siècle, le grand linguiste Antoine Meillet a
regroupé sous le nom de grammaticalisation des observations
éparses depuis le xixe siècle sur un processus au terme
duquel des mots ont perdu leur statut lexical, ou plutôt ont
développé un nouvel emploi grammatical en marge de leur
emploi lexical, au point que les locuteurs croient reconnaître
deux mots distincts. Cette notion a été remise à jour bien
plus tard, autour de 1980 par Talmy Givón, déjà mentionné,
et le typologue allemand Christian Lehmann entre autres.
La distinction entre un mot lexical et un mot grammatical
nous paraît intuitivement claire, mais il n’en est rien. Un mot
du français actuel peut parfaitement présenter des emplois
grammaticaux en marge de ses emplois lexicaux de base. Si
l’on y réfléchit bien, c’est déjà le cas avec le verbe avoir. Si
208
avoir est vu comme un synonyme de posséder, cette synonymie

s’applique bien pour j’ai/je possède une voiture neuve. Mais
avoir n’a plus de synonyme dans j’ai une sœur aînée/un frère
cadet/une femme aimante, etc. Dans j’ai la grippe/froid on peut
considérer qu’il s’agit du résultat de j’ai attrapé la grippe/froid,
mais ce n’est pas possible pour j’ai faim/sommeil/chaud.
Peut-on pour autant dire que le verbe avoir se présente ici
dans un emploi grammatical ? Pas encore, mais c’est pleinement
le cas quand il est employé comme auxiliaire du passé (avoir
+ participé passé, exemple j’ai fini) ou comme auxiliaire de
modalité (avoir à + infinitif, exemple j’ai à vous dire quelque
chose). Quant aux constructions verbales avoir froid et avoir
sommeil, elles sont figées : on ne peut pas y toucher. Avoir un
sommeil léger/lourd/agité a un sens très différent. Avoir sommeil
exprime une disposition, le fait d’être prêt à s’endormir, alors
qu’avoir un/le sommeil léger exprime une espèce de sommeil. Le
figement d’une construction constitue un premier pas sur la
voie de la grammaticalisation, c’est-à-dire de la transition vers
le statut de mot grammatical. Et une construction figée peut
souvent se paraphraser par un mot lexical dérivé, exemples :
faire peur Ù apeurer, prendre patience Ù patienter, perdre
patience Ù s’impatienter.
Mais l’exemple de l’évolution de l’adjectif sauf va nous
fournir une illustration claire de la création d’un emploi
purement grammatical (la préposition sauf) en marge de
l’emploi lexical (elles sont sorties saines et sauves du naufrage).
En ce début de xxie siècle, les emplois lexicaux de l’adjectif
sauf sont devenus assez nébuleux. Qui comprend encore le
mot sauf-conduit ? C’est le document qui conduit de l’autre
côté d’une frontière ou autorise à entrer ou sortir d’un espace
interdit en restant sauf, c’est-à-dire sans se mettre en péril.
On imagine mal qu’à la fin du Moyen Âge (en « moyen
français »), il n’existait que l’adjectif et que la préposition
209
s’en est graduellement distinguée. Cela a été possible parce

que l’adjectif était fréquemment employé en tête du groupe
nominal comme dans ce fragment4 daté de 1410 : sanz
prejudice et sauves les raisons et le droit d’une chascune desdictes
parties, c’est-à-dire « sans préjudice et en gardant saufs (en
sauvegardant) les raisons et le droit de chacune des dites
parties ».
Comme dans le cas du participe présent durant devenu une
préposition mais encore susceptible de se placer après un groupe
nominal désignant un espace de temps (par exemple durant
deux années/deux années durant), cette disposition a eu pour
effet que l’adjectif préposé a été progressivement réinterprété
(ou « réanalysé ») comme une préposition au prix de grandes
incertitudes : on trouve à cette époque d’un côté le masculin
sauf ou saulf (provenant du latin salvus) suivi d’un groupe au
féminin (exemples sauf vostre reference ; sauf vostre grace ; saulf
la couronne de mon royaume), et d’un autre côté sau(l)ve suivi
d’un groupe au masculin (exemples sauve toutesfoiz vostre bon
plaisir) ou d’un groupe au masculin ou féminin pluriel (saulve
tous droiz, sauve les loix). Les rédacteurs de ces fragments ne
savaient manifestement plus s’il s’agissait d’un adjectif variable
en genre et en nombre ou d’une préposition (invariable donc)
et il faudra attendre le xviie siècle pour que l’adjectif ne
soit plus employé qu’après le nom qu’il modifie et que soit
reconnue l’existence autonome de la préposition.
Il en a été de même pour la préposition hormis issue de
l’adverbe hors suivi du participe passé mis du verbe mettre,
exemple hors mise la clameur de propriété (daté de 1260) c’est-
à-dire « la réclamation de propriété étant mise en dehors/
écartée ». Même chose pour l’adverbe cependant résultant de la
composition figée du pronom sujet ce et du participe présent
pendant, dont on retrouve la trace dans l’expression juridique
210 4. Exemple emprunté au Trésor de la Langue Française, article « Sauf ».

toutes affaires pendantes signifiant « sans traiter les affaires en

attente de jugement ».
Au terme d’une grammaticalisation complète, un mot
lexical peut se réduire à un affixe. C’est ce qui s’est produit
en français, mais aussi dans d’autres langues romanes avec le
futur. En latin classique, le futur était véhiculé par deux types
d’affixes différents selon le type de conjugaison. Les verbes des
deux premiers types se combinaient avec le suffixe –b– suivi
des désinences de personne (ex. ama+b+imus : nous aimerons).
Ceux des trois autres types se combinaient avec une marque
vocalique –a/e– apparentée à la conjugaison du subjonctif
présent (ex. audi+e+mus : nous entendrons). La plupart des
formes de cette conjugaison dite synthétique (constituée d’un
suffixe de temps, aspect, mode et voix et de désinences de
personnes) ont disparu en latin dit « vulgaire » notamment à
la suite de la fondation des provinces transalpines de l’Empire
romain d’occident. La conjugaison analytique (c’est-à-dire à
l’aide d’un auxiliaire), qui existait déjà en latin classique pour
les temps accomplis de la voix passive (amatus sum : j’ai été
aimé), s’est répandue car elle était plus aisée à manier pour
les celtes et les germains, et une combinaison infinitif +
auxiliaire habere s’est mise en place (approximativement amare
habeo, littéralement « j’ai à aimer »). Cette combinaison s’est
graduellement figée et a donné finalement j’aim+er+ai Ö
j’aimerai. Le verbe habere, qui a donné avoir en français, a ainsi
connu la réduction la plus drastique en devenant un simple
suffixe de futur.
De la syntaxe à la morphologie et vice-versa
Le déclin de la pragmatique au profit de la grammaire

Le typologue américain Talmy Givón a été le premier à
donner corps en 1979 à la notion de « grammaticalisation »
211
suggérée au début du xxe siècle par Antoine Meillet, célèbre

spécialiste de l’histoire comparée des langues indo-européennes
au Collège de France5. Il a pu montrer que les sociétés sont
passées historiquement d’un mode de représentation mentale
et d’organisation linguistique d’ordre pragmatique, (avant la
mise en place d’une véritable grammaire), à un mode d’ordre
grammatical.
Les cinq processus évoqués ci-dessous ont joué un rôle
crucial dans cette évolution d’abord cognitive et sociale
(concernant en priorité ce que les anthropologues appellent
l’intelligence sociale), puis linguistique.
1. La structure topique (information connue) – commen-
taire (information nouvelle) de l’énoncé s’est transformée
en une structure sujet-prédicat de la phrase. Exemple :
Le mode pragmatique subsiste encore en français quand
un noyau prédicatif est composé d’un verbe et de pro-
noms sujet et objet, lesquels sont associés à des groupes
nominaux détachés :
format neutre avec format expressif avec
groupes nominaux intégrés groupes nominaux détachés
Paul connaît la voisine d’en face ¼ Paul, il la connaît, la voisine d’en face
2. Un mode de conjonction lâche entre deux propositions

s’est transformé en une subordination étroite. Par
exemple, originellement la conjonction that introduisant
une subordonnée complétive en anglais ne se distinguait
pas du pronom objet neutre. [I knew that you were ill]
(« je savais que tu étais malade ») dérive donc de [I knew
that] : [you were ill] (« je savais cela : tu étais malade »).
212 5. T. Givón (1979), Understanding grammar, Chicago University Press.

3. Le rythme lent de l’élocution (avec plusieurs contours

prosodiques successifs) a laissé place à un rythme
d’élocution rapide (avec un seul contour prosodique).
Le développement de l’énonciation de phrases de
complexité croissante chez le jeune locuteur à partir
d’environ trois ans nous donne une image de ce qui a dû
se produire dans l’histoire de l’humanité.
4. Dans le premier mode, l’ordre des mots est déterminé
essentiellement par un principe pragmatique : les
informations anciennes viennent en premier, les nouvelles
suivent. Dans le second, l’ordre des mots sert à signaliser
des rôles sémantiques (même s’il peut aussi servir à
indiquer des relations pragmatiques de topicalité).
Pour donner un exemple, ce processus est lié à la
formation de la voix passive. Soit la représentation
abstraite : Topique : le meurtrier [X] + Commentaire :
la police a interpellé [X]
Dans le mode pragmatique, le topique précède le noyau de
la phrase : Le meurtrier / la police l’a interpellé. Dans le mode
grammatical, la voix passive permet de superposer la fonction
grammaticale de sujet et la fonction pragmatique de topique :
Le meurtrier a été interpellé par la police. Ce qui n’interdit pas
de combiner les deux modes : Le meurtrier / il a été interpellé
par la police, voire : Il a été interpellé par la police / le meurtrier.
Dans le mode pragmatique, on observait une répartition
approximativement égale du nombre de noms et de verbes
dans le discours, car les verbes étaient sémantiquement simples,
c’est-à-dire qu’ils n’avaient pas de complément. Dans le mode
grammatical, la proportion des noms a augmenté par rapport
aux verbes, car ceux-ci ont acquis la capacité de véhiculer des
relations entre deux ou trois groupes nominaux.
Ainsi, on suppose que le protolangage devait segmenter la
réalité en situations simples, comme Hulk a frappé et l’arbre
213
est tombé, avant de concevoir une représentation complexe

véhiculée par le verbe abattre : Hulk a abattu l’arbre. Les
constructions résultatives de l’anglais constituent un stade
intermédiaire : the woodcutter cut the tree down (littéralement :
« le bucheron – a coupé – l’arbre – en bas ») segmente encore
l’activité du bûcheron (cut the tree) et la chute de l’arbre (the
tree down) qui s’ensuit, tandis que sa paraphrase the woodcutter
felled the tree véhicule la relation entre la cause (l’acte de trancher
ou de scier) et l’effet (la chute de l’arbre) par un procédé plus
récent, la substitution du verbe causatif to fell (faire tomber)
au verbe simple de même racine to fall (tomber).
Des constructions syntaxiques se sont figées en

composés morphologiques
L’apparition des adverbes de manière fournit un bel exemple
de l’effet de l’usage très fréquent de constructions syntaxiques.
Les adverbes du français constituent une classe hétéroclite où
l’on distingue habituellement d’un côté des « particules » (bien,
mal, encore, déjà, ainsi, etc.) et d’un autre côté les adverbes
de manière formés à l’aide du suffixe -ment, productifs et
relativement bien structurés en adverbes modifiant le verbe
et adverbes modifiant la phrase. La négation délimite les deux
classes: les adverbes de phrase se disposent avant et les adverbes
de manière après la composante pas de la négation.
Exemple :
Votre fils ne travaille généralement pas (l’adverbe modifie la phrase)
à opposer à :
Votre fils ne travaille pas suffisamment (l’adverbe modifie le verbe)
Certains adverbes polyvalents peuvent assumer l’une ou
l’autre fonction, par exemple Votre fils ne travaille vraiment pas
et Votre fils ne travaille pas vraiment utilisent le même adverbe,
mais avec un sens différent, de renforcement dans vraiment
pas, ou de degré dans pas vraiment.
214
Les adverbes de manière sont une catégorie relativement

récente dans l’histoire des langues et dans certaines langues
cette catégorie fait défaut. Historiquement, les deux seules
catégories indispensables à la construction d’une proposition
ont été le nom (véhiculant la représentation d’une chose ou
d’une personne) et le verbe (véhiculant celle d’une situation :
action, événement ou état). La catégorie des adjectifs s’est
démarquée dans les langues qui emploient une copule (être
en français) pour véhiculer la représentation d’une propriété
transitoire ou durable d’une chose ou d’une personne. Elle
n’est pas universelle, et celle des adverbes de manière s’est
constituée tardivement pour véhiculer la représentation d’une
propriété d’une situation. Au même stade historique certains
noms ont acquis l’aptitude à véhiculer la représentation d’une
situation et on a ainsi développé deux façons de représenter
une situation enrichie d’une propriété :
situation Ä V / propriété ÄAdv situation Ä N / propriété Ä Adj
Paul court rapidement La course rapide de Paul

Suzanne rit gaiement Le rire gai de Suzanne
L’élève lit attentivement l’exercice La lecture attentive de l’exercice
par l’élève
Il est probable que l’émergence des adverbes de manière est

due à l’augmentation de la fréquence des groupes nominaux
exprimant une situation, laquelle atteste de son côté une
diversification de l’organisaton cognitive de notre lexique
avec le développement de l’abstraction. À l’origine de nos
adverbes en -ment, on trouve une combinaison syntaxique en
latin (ex. secura mente, litt. « dans un esprit sûr »), puis une
composition morphologique en italien (ex. sicuramente) et
enfin une dérivation suffixale en français (ex. sûrement et sa
variante préfixée assurément).
215
Le destin instable de la morphologie des langues

Pour que certaines constructions syntaxiques d’une langue
se transforment en des composés morphologiques impliquant
des suffixes, des préfixes et éventuellement différentes variantes
de la racine lexicale, il faut que toute ou du moins la plus
grande partie de la population pratiquant cette langue en
ait acquis l’usage au plus jeune âge. Dès lors qu’une partie
notable de la population a acquis cette langue à l’âge adulte, ce
processus est entravé, car la population est linguistiquement
hétérogène.
Ainsi, le latin est passé historiquement par plusieurs formes :
le latin archaïque, puis classique, avec sa variante orale et
familière de latin vulgaire, puis le latin médiéval et finalement
académique. Le latin archaïque a été pratiqué quand Rome
luttait, à l’époque de la royauté, contre les autres peuples
peuplant l’Italie (les Sabins, les Étrusques, etc.), alors que sa
grammaire commençait à se mettre en place. Le latin classique
correspond à l’époque de la république romaine et du début de
l’empire, avec une importante littérature poétique, historique,
théâtrale et juridique. Le latin vulgaire est la langue orale de
l’Empire romain d’occident (le grec byzantin étant celle de
l’empire de Constantinople), dont il ne nous reste des traces
que par le théâtre et par des graffiti, notamment à Pompéi, il
s’est développé à côté du latin classique aussi longtemps que
l’administration et l’école ont exercé leur fonction linguistique
préservatrice.
Dès le déclin de l’Empire romain d’Occident, l’usage
du latin par des populations exophones, l’effondrement de
l’administration et de l’école, et le développement rapide de
l’illettrisme, ont entraîné la fragmentation du latin vulgaire,
chacun de ces fragments étant à l’origine des différentes langues
romanes. Dans les abbayes, surtout bénédictines, une variante
orale du latin s’est maintenue, qui a permis le maintien de
216
la communication entre les clercs à travers l’espace roman,

mais faute de locuteurs natifs, ce latin d’église s’est abâtardi,
jusqu’à ce que les humanistes reconstruisent au xvie siècle un
latin académique complètement figé qui a permis les échanges
entre savants jusqu’au xviiie siècle et dont on trouve un dernier
reliquat dans les conciles de l’Église catholique romaine.
Ce qui nous intéresse ici, c’est la transition entre le latin
vulgaire pratiqué en Gaule transalpine, qui devient le gallo-
roman et se subdivise en différents dialectes, dont le francien6
à la suite de l’installation de tribus de Francs dans la partie
septentrionale de cet espace. C’est l’origine de l’ancien français
et finalement du français moderne. Après la période de
plusieurs siècles durant laquelle le latin avait été acquis durant
la prime enfance par la plupart de ses locuteurs, ce qui avait
permis un développement remarquable de sa morphologie (les
paradigmes de déclinaisons et de conjugaisons et les régularités
des dérivations lexicales), l’augmentation de la proportion
de locuteurs ayant acquis le latin vulgaire comme langue
de communication à l’âge adulte a entraîné l’effondrement
relativement rapide de tout cet édifice morphologique et de
nouvelles structures linguistiques ont lentement émergé dans
les différentes aires de l’espace roman.
Je n’évoquerai ici que l’évolution du paradigme des
conjugaisons entre le latin classique, le latin vulgaire et le
français moderne afin de donner une idée de l’itinéraire
erratique des modes d’expressions des temps, des modes et des
voix entre les deux pôles appelés respectivement synthétique
(des formes complexes et régulières avec variation de la racine,
suffixes et désinences, sans auxiliaire) et analytique (des formes
simples combinées à un, voire deux auxiliaires).
6. À ne pas confondre avec le francique, dialecte germanique qui s’est maintenu dans le nord
de la Lorraine jusqu’à la première moitié du xxe siècle. 217
L’exemple le plus frappant d’évolution cyclique est celui du

futur flexionnel du latin classique, qui est remplacé par une
construction syntaxique : amabo (j’aimerai) est remplacé par
amare + habeo (j’ai à aimer), laquelle, à force d’être employée
très fréquemment, se fige en une nouvelle forme flexionnelle
qui donne en français j’aimerai (= j’aim+er+ai).
LATIN
LATIN VULGAIRE FRANÇAIS
CLASSIQUE
CONDITIONS acquisition de la acquisition de la langue acquisition de la

D’ACQUISITION langue dans la par une population de langue dans la
prime enfance « barbares » adultes prime enfance
EFFET avantage à la avantage à la syntaxe avantage à la

GRAMMATICAL morphologie morphologie
EXEMPLES futur flexionnel : futur périphrastique : futur flexionnel :

amabo *amare + habeo j’aimerai
Un autre exemple intéressant est celui de l’apparition de

formes doublement analytiques à la voix passive. Le latin
classique connaissait déjà des formes analytiques au passif
(amatus sum : j’ai été aimé). En latin vulgaire, amatus sum est
réinterprété comme un présent de la voix passive à la place
de amor, qui a disparu. En même temps les temps du passé
qui étaient préalablement formés à l’aide du parfait (exemple :
ama+v+i = « aimer » + aspect parfait + 1e personne du
singulier, soit j’aimai/j’ai aimé) sont remplacés par des formes
analytiques (j’ai/j’avais/j’eus/j’aurai aimé). De ce fait le nouveau
système analytique s’est dédoublé avec avoir comme auxiliaire
du passé et être comme auxiliaire du passif (j’ai été aimé).
218
¾ voix / aspect ¼ présent parfait

latin actif amo amavi
classique passif amor AMATUS SUM » analytique, aux. ESSE

ò
¾ voix / temps ¼ présent passé composé
actif j’aime J’AI AIME » analytique, aux. AVOIR
français
JE SUIS » doublement analytique,
moderne passif AIME
J’AI ETE AIME
aux. ÊTRE + AVOIR
½ analytique, aux. ÊTRE
Le classement des langues

Après une débauche de classements proposés tout au long
du xixe siècle dans le sillage des types isolant, agglutinant,
flexionnel et incorporant proposés par Wilhelm von
Humboldt7, le classement le plus complet, encore valide
aujourd’hui, est celui qu’a proposé Edward Sapir en 1921.
Ce linguiste et anthropologue américain d’origine germano-
lituanienne, spécialiste des langues et cultures des peuples
natifs de l’Amérique du nord, a révisé la terminologie de
Humboldt en distinguant entre des techniques et des caractères
morphologiques.
Dans la terminologie de Sapir, la technique est isolante si un
mot lexical ne peut pas se combiner avec un mot grammatical.
Elle est agglutinante si une racine lexicale peut se combiner
avec un ou plusieurs affixes juxtaposés sans amalgame. Elle
est fusionnante si la combinaison entre la racine lexicale et les
affixes donne lieu à un amalgame. Enfin elle est symbolique si
un mot lexical est constitué d’une racine qui présente plusieurs
degrés dotés d’une valeur sémantique (exemple : en anglais
7. Voir J. François (2018), op.cit. 219

sing = « chanter » au présent ; sang = « chanter » au passé, sung

= « chanter » au participe passé).
Toujours selon Sapir, le caractère d’une langue est analy-
tique si les mots lexicaux et grammaticaux se combinent syn-
taxiquement en restant des mots simples et indépendants, il est
synthétique si un mot lexical se combine morphologiquement
avec un ou plusieurs affixes grammaticaux en formant un mot
complexe. Et il est polysynthétique si plusieurs mots lexicaux
se combinent morphologiquement avec un ou plusieurs af-
fixes grammaticaux en formant un mot hypercomplexe8.
Ces deux facteurs la technique et le caractère, peuvent se
recouper partiellement, ce qui révèle une analyse extrêmement
fine. C’est ainsi que la technique caractéristique du tibétain mo-
derne est classée comme « agglutinante-isolante » et celle de la
langue sioux comme « agglutinante-fusionnante ». En outre le
caractère de cette dernière langue n’est que partiellement poly-
synthétique, ce qui la distingue d’autres langues amérindiennes
comme le nootka et l’algonquin, absolument polysynthétiques.
TECHNIQUE CARACTÈRE EXEMPLE

isolante analytique chinois, annamite
agglutinante-isolante analytique tibétain moderne
synthétique turc, bantou
agglutinante
polysynthétique nootka (île de Vancouver)
agglutinante-fusionnante (poly)synthétique sioux
analytique français, anglais
fusionnante synthétique latin, grec, sanskrit
polysynthétique algonquin
symbolique-fusionnante synthétique sémitique (arabe, hébreu)
220 8. Ici, le terme incorporant, créé par Humboldt, a disparu, remplacé par polysynthétique.
Ce catalogue de classements morphologiques est certaine-

ment fastidieux et abstrait, faute d’illustrations concrètes, mais
il nous montre que la découverte de nouvelles familles de lan-
gues au cours des siècles avec une accélération notable depuis
le xviiie siècle a imposé en linguistique, comme en biologie,
un mode de classement de plus en plus raffiné et technique.
Si le classement morphologique des langues s’est mis en
place dès le début du xixe siècle, le classement syntaxique est
plus récent. Les grammairiens se sont longtemps contentés
d’observer que les langues disposant de marques de cas ont
généralement un ordre des mots, ou plus exactement des
groupes syntaxiques, plus souple que les langues qui en sont
dénuées. Ainsi, à l’exception de la disposition de certains
adverbes et des compléments circonstanciels, l’ordre des
groupes syntaxiques est relativement fixe en anglais et en
français modernes, alors qu’il était plus libre dans les états
antérieurs de ces deux langues, en vieux saxon et en ancien
français, quand des désinences sur les noms permettaient de
distinguer aisément le sujet et l’objet.
Un classement syntaxique plus élaboré a émergé à
partir des années 1930 avec la distinction entre langues
centrifuges et langues centripètes. Tout groupe syntaxique a
obligatoirement une « tête » (ou un « centre sémantique ») qui
lui donne sa catégorie, et aussi, en général, des « membres »
(ou « périphérie »). Le verbe étant considéré comme le centre
sémantique de la phrase simple, si celui-ci figure régulièrement
en tête de phrase (comme en arabe classique), la phrase est dite
centrifuge. Si le verbe figure régulièrement en fin de phrase
(comme en turc ou en japonais), elle sera dite centripète. Il
en est de même dans le groupe nominal qui est centrifuge
si le nom figure régulièrement en tête et centripète s’il figure
régulièrement à la fin du syntagme. Cependant, les membres
d’un groupe syntaxique peuvent se répartir avant et après la tête
221
de ce groupe. C’est le cas en français dans le groupe nominal

le petit chat noir, où l’article et l’adjectif de taille précèdent le
nom, tandis que l’adjectif de couleur le suit.
Et le français comme l’anglais ont un ordre de base {sujet-
verbe-objet}, ces deux langues ne sont donc pas absolument
centripètes ni centrifuges, elles se caractérisent plutôt par des
tendances. C’est pourquoi le linguiste français Lucien Tesnière
a proposé un classement plus subtil en langues à tendance
syntaxique centrifuge ou centripète marquée ou mitigée en
se fondant sur l’ouvrage de synthèse Les Langues du monde,
coordonné en 1924 par deux maîtres de la typologie des
langues à cette époque, Antoine Meillet et Marcel Cohen.
Comme l’anglais – au même titre que les autres langues
germaniques – dispose les adjectifs épithètes essentiellement
avant le nom dans les groupes nominaux, tandis que le
français les dispose majoritairement après le nom, le français
est, du point de vue syntaxique, une langue centrifuge mitigée
et l’anglais une langue centripète tout aussi mitigée. Le tableau
ci-dessous résume ce classement, qui était novateur dans les
années 1950 et qui a été régulièrement affiné depuis lors.
ORDRE ¼ centrifuge centripète

¾ (tête – membres) (membres – tête)
marqué langues bantoues japonais, basque, turc

langues romanes tibétain, allemand
mitigé
(dont le français) (anglais)
Des structures néanmoins universelles

Dans l’introduction à un recueil d’articles illustrant le
développement de la linguistique descriptive aux États-Unis
dans les trois décennies précédentes, le linguiste structuraliste
américain d’origine allemande Martin Joos a déclaré en 1957
222
que « les langues peuvent différer entre elles sans limite et

d’une manière imprédictible ». La même année paraissait le
petit ouvrage qui a lancé la carrière académique de Noam
Chomsky, Syntactic structures, dans lequel il soutenait la
thèse inverse et en 1963 le typologue et généalogiste Joseph
Greenberg éditait une somme en trois volumes consacrée aux
universaux de la grammaire, dans laquelle il faisait paraître une
contribution révolutionnaire intitulée « Quelques universaux
de la grammaire concernant notamment l’ordre des éléments
dotés de sens »9.
Les deux entreprises de Chomsky et de Greenberg sont
très différentes. La première est calculatoire et « mentaliste » :
Chomsky part de l’hypothèse que l’esprit humain dispose de
manière innée de catégories syntaxiques propres à véhiculer
des types de concepts (par exemple, les noms véhiculent pri-
mairement des représentations de choses concrètes et de per-
sonnes, les verbes véhiculent des représentations de situations :
actions, événements et états). Il suppose aussi l’aptitude innée
à combiner ces structures de manière conventionnelle pour
construire des phrases que la communauté des usagers de la
langue juge grammaticales. Chomsky introduit comme une
propriété universelle et constitutive des langues du monde
leur aptitude à former des groupes syntaxiques complexes
par emboitement (c’est la propriété dite de récursivité), par
exemple10 :
[le chienN1 [Δ]] + [le voisinN2] ¼ [le chienN1 [du voisinN2]]
La seconde entreprise est empirique : Greenberg a rassemblé

une multitude d’observations sur la grammaire de plus d’une
9. K. Greenberg (1963), « Some universals of grammar with particular reference to the order
of meaningful elements ». J. Greenberg (ed.) Universals of Grammar. MIT Press, pp.73-113.
10. Le symbole Δ symbolise la place libre pour un groupe nominal dépendant. 223
centaine de langues, notamment amérindiennes et africaines,

il a constaté que certaines propriétés (ou leur combinaison)
en impliquent d’autres, et sur cette base il a élaboré la théo-
rie des universaux linguistiques implicatifs. Cette théorie a été
largement reprise et appliquée dans différents domaines de la
grammaire. Cependant rares sont les implications réellement
universelles entre deux propriétés, et le courant qui a déve-
loppé cette vision, la « typologie fonctionnelle des langues »,
s’est concentré sur l’élaboration de tendances implicatives,
sans prétention à l’universalité. Ces tendances prennent fré-
quemment l’aspect de correspondances échelonnées du type
Plus la propriété A est marquée, plus la propriété B l’est aussi.
Pour expliciter cette démarche, voici deux illustrations de
complexité croissante.
Les trois sortes de pluriels

Certaines langues, notamment polynésiennes, marquent
le pluriel nominal par le redoublement total ou partiel de
la racine. Le même procédé est souvent appliqué aux verbes
comme marque de l’intensité, ce que nous pratiquons aussi
en français sans que ces enchainements soient perçus comme
des mots à part entière (exemple : Il est petit-petit et pourtant il
mange-mange !).
Le pluriel peut ne pas être marqué du tout comme en
pirahã, une langue d’Amazonie, mais il est le plus souvent mar-
qué par un affixe. Certaines langues comme le grec classique,
l’arabe classique et l’hébreu connaissent un duel marqué sur
le verbe, indiquant généralement que l’action est accomplie
par deux personnes. Quelques rares langues d’Asie présentent
également un triel (trois personnes). Concernant ces marques
numérales de sophistication croissante allant de un (singulier)
à plus de deux (pluriel), exactement deux (duel) et exactement
trois (triel), on constate qu’on ne rencontre pas de langue qui
224
dispose d’un duel en l’absence d’un pluriel ou d’un triel en

l’absence d’un duel et indirectement en l’absence d’un pluriel.
Ce qu’on peut exprimer par un universel implicatif :
Si une langue possède un mar- elle doit posséder un mar-

quage MA d’une spécification quage MB ≠ MA du pluriel
du pluriel alors non spécifié
[propriété A] [propriété B]
La corrélation entre l’ordre des mots dans la proposition

et dans le groupe nominal
L’entreprise de Greenberg en 1963 évoquée ci-dessus a été
poursuivie vingt ans après par le syntacticien américain John
Hawkins11. Celui-ci s’est concentré sur l’ordre des fonctions
syntaxiques dans la proposition (dont le verbe est la tête et
le sujet et l’objet les membres), traditionnellement noté SVO
pour sujet-verbe-objet, VSO pour verbe-sujet-objet et SOV
pour sujet-objet-verbe.
Il s’est penché également sur la place de l’adjectif épithète
(avant ou après le nom) et du génitif (exemple : Peter’s sister,
« la sœur de Peter ») dans le groupe nominal, dont le nom est
la tête et l’adjectif ou le génitif le membre. L’ordre est noté
AN/GN si l’adjectif ou le génitif est régulièrement disposé
avant le nom et NA/NG dans le cas inverse.
Il a pris en compte aussi la place des adpositions introduisant
(en fonction de tête) un groupe nominal (en fonction de
membre), appelées prépositions quand elles le précèdent et
postpositions quand elles le suivent.
Hawkins a constaté trois cas de figure :
1. L’ordre VSO est en corrélation forte avec la présence
de prépositions et l’ordre N-Génitif, alors que l’ordre
SOV est corrélé avec la présence de postpositions et
11. J. Hawkins J(1983), Word Order Universals. Academic Press. 225

l’ordre Génitif-N. Il y a harmonie entre la structure de la

proposition et celle du SN, le même ordre tête-membres
(V+SO) ou membres-tête (SO+V) étant privilégié.
2. L’ordre SVO est en revanche en corrélation préférentielle
mais non décisive avec les prépositions, l’ordre N-Génitif
et l’ordre N-Adjectif (c’est-à-dire l’ordre tête-membre),
certaines langues présentant une disposition inverse.
3. L’ordre N-Adj l’emporte, même pour les langues SOV,
c’est-à-dire que dans ce cas il y a une dysharmonie entre
l’ordre membre-tête de la proposition (actants – verbe)
et l’ordre tête-membre du groupe nominal (nom-tête –
adjectif-membre).
La première configuration constitue une implication
syntaxique universelle, la seconde une tendance implicative,
en présence de quelques langues adoptant un ordre inverse, et
la troisième contredit l’hypothèse implicative. Hawkins a donc
cherché à expliquer les phénomènes de dysharmonie observés.
Il envisage finalement deux explications : 1. la mobilité, car les
démonstratifs, les numéraux et les adjectifs sont plus mobiles
que le génitif et la proposition relative ; 2. et surtout le poids
relatif évalué en nombre de morphèmes ou de syllabes, car les
démonstratifs et les numéraux sont généralement plus courts
que le génitif et que la proposition relative, il va de soi.
Dans l’échantillonnage originel plus restreint de Greenberg
en 1963, sur onze langues à ordre SOV, deux ont des
propositions relatives postposées (ordre dysharmonique,
puisque dans la proposition les membres précèdent la tête
verbale) et une des relatives à placement indifférent, et quatre
présentent l’ordre N-Adj au lieu de Adj-N attendu. Il s’agit
vraisemblablement d’adjectifs mobiles qui se présentent plus
souvent dans l’ordre N-Adj. En revanche, c’est le facteur du
poids relatif qui explique la disposition des relatives après le
nom-tête.
226
Si une proposition relative développée était disposée avant

le N-tête, cela représenterait un coût cognitif excessif pour la
mémoire de travail. Le facteur du poids relatif est donc d’ordre
cognitif, puisqu’il met en cause les conditions dans laquelle
la phrase peut être aisément énoncée (du point de vue du
locuteur) et comprise (du point de vue de l’interlocuteur).
Les trois options explicatives

Le constat de l’existence de nombreuses tendances
implicatives (Si la propriété A est constatée, alors la propriété
B doit être constatée) concorde avec l’hypothèse de l’auto-
organisation des systèmes linguistiques. En effet trois
hypothèses sont en concurrence :
1. Ces systèmes sont disparates par nature : la variation
des structures linguistiques est corrélée à celle des
cultures (hypothèse relativiste dite de Humboldt, Sapir
et Whorf ).
2. La diversité de ces systèmes se limite à un paramétrage
différent de principes partagés par toutes les langues
(hypothèse de la « grammaire universelle » de Chomsky
et son école).
3. Ces systèmes sont issus d’une auto-organisation à partir
de principes de nature neuro-cognitive et non linguis-
tiques.
Selon l’hypothèse relativiste ou culturaliste, les systèmes
linguistiques devraient varier sans limites, comme le pen-
sait Martin Joos, mais cette hypothèse est contredite par les
tendances implicatives. Quant à l’hypothèse universaliste de
Chomsky, elle a réduit progressivement son champ d’appli-
cation depuis sa première formulation il y a un demi-siècle
pour se limiter actuellement à la validité dans toute langue de
deux opérations, la fusion de groupes syntaxiques et un type
particulier de déplacement (une progression hiérarchique) de
227
certains groupes pour décrire l’ancrage énonciatif de la phrase

(avec les catégories fonctionnelles du temps, de l’aspect et de
la modalité). En revanche l’hypothèse de l’auto-organisation
a l’avantage de considérer les tendances implicatives comme
des principes régulateurs qui délimitent l’espace de liberté des
systèmes.
Ainsi une langue peut développer un procédé plus ou
moins élaboré de rattachement d’une proposition à un groupe
nominal, ou un procédé plus ou moins élaboré de sélection de
sujets grammaticaux « marqués » (c’est-à-dire qui n’occupent
pas l’échelon supérieur de l’échelle d’accès à la fonction de
sujet et font l’objet d’une promotion à cet échelon) à l’aide
de différentes voix également appelées des diathèses. Mais
chacun de ces deux procédés a, pour le locuteur comme pour
l’interlocuteur, un coût cognitif qu’il est inutile de dédoubler.
Pour des raisons qui sont encore à élucider, la communauté
linguistique développe une préférence pour l’un ou l’autre de
ces deux procédés et le système s’auto-organise de manière à
réduire au mieux le coût cognitif12.
12. Par exemple, dans une langue qui ne connaît que des pronoms relatifs en fonction de sujet
de la relative (qui et non que ou à qui), cette limitation est compensée par un éventail de
différentes voix passives, comme cela se passe notamment dans les langues d’Indonésie,
228 des Philippines et en malgache.
En conclusion, le tableau ci-dessous illustre la position

centrale de l’hypothèse de l’auto-organisation des systèmes
linguistiques entre les deux hypothèses universaliste et
relativiste :
Trois hypothèses en concurrence

Grammaire universelle Auto-organisation Corrélation étroite
(Chomsky, Bickerton) des systèmes entre les grammaires
linguistiques et les cultures
(Hurford, Kirby, (Humboldt, Sapir,
Christiansen, Whorf )
Oudeyer, Deacon)
¾ ¾ ¾
impose une contrainte compatible avec l’ob- incompatible avec les

inutile, celle de prin- servation des ten- tendances implica-
cipes universels de dances implicatives (si tives
nature spécifiquement propriété a, alors pro-
linguistique priété b) expliquées
par des principes neu-
rocognitifs
Cet avant-dernier chapitre consacré à la combinatoire

des signes linguistiques minimaux, les morphèmes, nous a
finalement montré qu’en dépit du souhait formulé par les
linguistes formalistes centrés sur les propriétés mathématiques
des langues (ambition parfaitement légitime autour des années
1950 avec le développement de langages informatiques, mais en
voie d’obsolescence avec l’exploration des systèmes dynamiques
multi-agents), les structures de ces dernières se comprennent
au mieux en les considérant comme des manifestations
particulières de propriétés cognitives générales qui transcendent
la simple expression linguistique et dont le principe de l’auto-
organisation est emblématique.
229
Chapitre 8
Les méthodes d’investigation
de la généalogie des langues
À la fin du chapitre 3, j’ai évoqué l’entreprise de Luigi

Cavalli-Sforza, généticien des populations et ancien parte-
naire du linguiste généalogiste et typologue Joseph Greenberg
à l’université de Stanford, laquelle vise à explorer la concor-
dance entre les marqueurs génétiques des populations et les
langues que pratiquent ces populations. Cette entreprise a
deux prérequis du côté linguistique : d’abord, l’exploitation
d’une méthode de comparaison des langues (essentiellement
de leurs lexiques) dite multilatérale ; ensuite, l’hypothèse du
regroupement des familles de langues avérées (indo-euro-
péenne, ouralienne et altaïque en Eurasie, bantoue en Afrique,
sémitique au Moyen-Orient, austronésienne dans le Pacifique
et l’Océan indien, na-dene en Amérique du nord, etc.) en
superfamilles (eurasiatique, amérinde, etc.)
L’application de la méthode de comparaison multilatérale
constitue un développement de la méthode dite historico-
comparative mise en place au xixe siècle pour les langues
indo-européennes, notamment par le grammairien allemand
August Schleicher. Comme la lexicostatistique* et son exten-
sion, la glottochronologie*, la comparaison multilatérale a
été élaborée par Joseph Greenberg pour essayer de filtrer,
dans des langues dénuées de tradition écrite, des mots appa-
rentés à la fois par le sens et par la forme (ce qu’on appelle
des cognats*).
231
Les partisans de la méthode néogrammairienne, notam-

ment l’Américain Lyle Campbell pour les langues amérin-
diennes et le Français Alain Lemaréchal pour les langues
austronésiennes, ont vivement critiqué ces méthodes alterna-
tives. Toutefois, depuis la dernière décennie du xxe siècle, elles
connaissent un regain d’intérêt, soit parce qu’elles s’avèrent
conciliables avec l’approche classique (c’est le point de vue du
russe Georg Starostin), soit parce qu’elles bénéficient désor-
mais d’un soubassement algorithmique robuste (c’est celle
des néo-zélandais Russell Gray, Quentin Atkinson et leurs
collègues).
Le tableau ci-contre fournit un aperçu du développement
des recherches sur la généalogie des langues. Tout au long de
ce chapitre, nous reviendrons sur les six phases caractéristiques
de ce développement.
La famille indo-européenne et la méthode

historico-comparative
À la suite de la découverte en 1786, par le diplomate, juriste
et linguiste anglais William Jones, de rapprochements lexicaux
troublants entre des langues européennes (le latin, le grec clas-
sique et les langues germaniques) et asiatiques (le sanskrit, le
vieux persan), plusieurs philologues et linguistes allemands de
la première moitié du xixe siècle (Franz Bopp, Jacob Grimm,
August Schleicher) ainsi que le linguiste norvégien Rasmus
Rask ont établi des lois d’évolution morphologique et phoné-
tique de nombreuses langues qui ont été bientôt appelées indo-
européennes, ou indogermaniques* dans la tradition allemande.
C’est la morphologie, notamment les paradigmes de
conjugaisons, qui ont attiré en premier leur attention, comme
le montre le tableau ci-après issu du premier traité de gram-
maire comparée, celui de Franz Bopp en 1816 sur le système
232
Les méthodes d’investigation de la généalogie des langues
recherches préalables sur la généalogie des

1
langues (xvie-xviiie s.)
¾
grammaire comparative, 1e génération (Bopp,

2
Grimm, Rask ±1810-1830)
¾
grammaire historico-comparative 2e génération

3
(Schleicher ±1830-1870)
¾
grammaire historico-
comparative,
3e génération :
4
néogrammairiens
(Brugmann, Paul,
MÉTHODES ALTERNATIVES
Meillet ±1870-1930)
¾ ¾
[poursuite de lexicostatistique &

l’héritage des glottochronologie comparaison
néogrammairiens : (1e génération : multilatérale
5
L. Campbell, M. Swadesh, (J. Greenberg
A. Lemaréchal, etc.] R. Lees ±1950- ±1950-1990)
1970)
¾ Â
lexicostatistique
intégration des deux approches classique et
informatisée
alternative à deux niveaux :
(2e génération :
(1) débroussaillage lexicostatistique ;
6 R. Gray,
(2) classement final par la méthode
Q. Atkinson,
néogrammairienne
M. Pagel depuis le
(G. Starostin depuis le tournant du xxie s.)
tournant du xxie s.)
de conjugaison de cinq langues1. J’ai ajouté le latin classique

à son tableau afin de mettre en évidence les rapprochements
concernant les désinences de personne au présent de l’indicatif.
1. Tableau emprunté à Winfred Lehman (1967), A Reader in Nineteenth Century Historical

Indo-European Linguistics. Indiana University Press, p.16. 233
vieux vieux gotique vieux vieil latin

persan saxon (chercher) franconien islandais classique
(porter) (courir) (faire) (brûler) (aimer)
singulier
1. ber+em luf+ige sokj+a mach+on brenn+e am+am1
2. ber+i luf +ast sokj+ais mach+ost brenn+er am+as
3. ber+ed luf +ath sok+eith mach+ot brenn+er am+at
pluriel
1. ber+im luf+iath sokj+am mach+omes brenn+um am+amus
2. ber+id luf+iath sok+eith mach+ot brenn+ed am+atis
3. ber+end luf+iath sok+and mach+ont brenn+a am+ant
1. Forme du subjonctif présent qui a conservé la consonne finale –m contrairement à

l’indicatif am•o.
On voit que pour la 1re personne du singulier deux langues

présentent comme en latin une désinence finissant par une
nasale, pour la 2e trois langues ont une désinence compor-
tant un -s, pour la 3e toutes les langues à l’exception du vieil
islandais ont une désinence finissant par une dentale (sourde,
sonore ou aspirée).
À la 1re personne du pluriel, quatre langues ont une dési-
nence comportant la nasale -m, à la 2e personne toutes ont une
désinence finissant par une dentale et à la 3e trois langues ont,
comme en latin, une désinence finissant par -nd/nt.
Globalement, le vieux franconien (dialecte de la région de
Francfort-sur-le-Main) est la langue la plus proche du latin
en termes de désinences (6/6), suivie du vieux persan et du
gotique* (5/6). Il est donc intéressant de noter qu’en dépit
de l’éloignement géographique – qui témoigne de migrations
234
dans des directions opposées à partir d’une localisation origi-

naire située soit dans les steppes de l’Asie centrale (hypothèse
de Marija Gimbutas) soit plus au sud, en Anatolie (hypothèse
de Colin Renfrew) – le vieux persan à l’est, le gotique et le
vieux franconien au nord et le latin au sud avaient conservé
des désinences de conjugaison très proches.
En 1861, c’est August Schleicher qui synthétise dans son
Compendium de la grammaire comparée des langues indogerma-
niques* édité à Weimar une quarantaine d’années de décou-
vertes cumulées. L’arbre généalogique des langues indo-euro-
péennes (le Stammbaum, voir plus bas) reste le symbole de
cette impressionnante exploration collective. Le classement se
fonde sur des critères d’abord morphologiques (les déclinai-
sons et conjugaisons en priorité) mais aussi phonologiques.
Schleicher était un grand maître de la morphologie, il a établi
un classement remarquable des types d’affixes et de leur com-
binatoire, mais il défendait aussi des thèses qui n’ont pas eu de
suite, en tout cas en son temps, jusqu’à la résurgence actuelle
de la biolinguistique.
Il professait en effet l’idée que les langues sont assimilables
à des espèces biologiques et, dans le prolongement de cette
première idée, que le destin des langues comportait, comme
celui des plantes deux phases, l’une d’épanouissement, sans
aucun effet des processus d’analogie susceptibles de perturber
la belle ordonnance des paradigmes phonologiques et morpho-
logiques, et l’autre de corruption, débouchant finalement sur la
désintégration de ces paradigmes sous le double effet du déli-
tement des affixes et de l’analogie. Il s’agit d’une construction
idéologique qui n’a pas résisté à de nombreux contre-exemples,
comme celui des procédés successifs qui ont permis d’exprimer
le futur entre le latin classique et le français moderne.
On peut ainsi donner l’exemple du verbe latin solvere
(délier, détacher) qui a plusieurs dérivés par préfixation : absol-
235
vere, dissolvere, resolvere, qui ont donné en français absoudre,

dissoudre et résoudre. Ce système lexical est donc bien huilé
en latin classique. En français, les érosions phonétiques pro-
duisent soudre, encore attesté en moyen français, mais qui dis-
paraît ensuite. Absoudre donne lieu à deux participes passés
absous et absolu, de même que dissoudre avec dissous et dissolu,
tandis que résoudre n’a qu’un participe passé résolu. Le système
lexical est donc devenu chaotique et une conséquence est l’ap-
parition du verbe solutionner formé à partir de solution, nom
dérivé de soudre par analogie avec action / actionner, sanction /
sanctionner, etc.
Schleicher considérait aventureusement que le proto-indo-
européen qu’il cherchait à reconstituer avait bien été parlé
par une communauté relativement unifiée de locuteurs, mais
il distinguait explicitement cette langue du sanskrit, ce qui
représentait un progrès notable par rapport à ses prédécesseurs.
Il s’imaginait un tronc commun à partir duquel les langues
s’étaient différenciées une à une, dans leur grammaire et leur
lexique. Il partait des langues modernes (autre progrès décisif
de la démarche historique) et il ordonnait ces divergences en
fonction du nombre de traits communs qu’il repérait dans la
grammaire de ces langues. En ce sens, son arbre généalogique a
été conçu empiriquement de la droite (les familles modernes)
vers la gauche (les regroupements anciens reconstruits). Autre
qualité remarquable de ce Stammbaum : la longueur des
branches est proportionnelle à l’étendue des disparités gram-
maticales (et lexicales). Ainsi les langues slaves et baltes (ces
dernières représentées par le lituanien dont il avait publié la
première grammaire descriptive et historique) se sont séparées
récemment et partagent encore beaucoup de traits communs.
Il en est de même entre les langues celtiques et les langues
italiques (ou romanes). Schleicher identifie une branche maî-
tresse slavo-germanique, une autre gréco-italo-celtique et une
236
troisième « aryenne », laquelle s’est subdivisée récemment (à

l’échelle de l’évolution des langues et des civilisations) entre les
langues de l’Iran et celles de l’Inde (à l’exception des langues
dravidiennes). Et il hésite sur le positionnement de l’albanais,
qui est maintenant considéré comme un rejeton autonome, au
même titre que le grec.
Germanic
Lithuanian
Slavic
vic
Sla Celtic
lto-
Ba
Italic
c
elti
ic o-C
an Ital
erm
c -G Albanian
vi eltic
Original Indo- Sla Ary lo-C
k-Ita
European language
o-Gre
ek- Gree
Italo-C Greek
eltik
Aryan
Iranian
Indic
L’arbre généalogique indo-européen (Stammbaum) de Schleicher,

dans la version de Winfred Lehmann, 1967.
En 1861, l’arménien était à peine étudié et c’est seulement

en 1875 que Heinrich Hübschmann lui a accordé un statut
autonome, alors que cette langue était soupçonnée jusque là
d’appartenir au groupe iranien en raison de l’influence domi-
nante de la Perse sur la culture arménienne. Enfin, deux autres
langues seront reconnues comme indo-européennes au début
du xxe siècle, le tokharien parlé en Chine jusqu’au viiie siècle
et le hittite, parlé en Anatolie à l’époque du puissant empire
hittite (deuxième millénaire avant notre ère). L’arbre généalo-
237
gique de Schleicher reste valide dans son principe – même si

de plus en plus de comparatistes estiment, depuis Hugo Schu-
chardt dans le dernier quart du xixe siècle, qu’une représenta-
tion de ce type est excessivement simplificatrice – mais dans le
détail il a subi de profondes révisions.
Après la mort de Schleicher en 1868, une question a agité
toute la communauté des philologues et linguistes allemands :
les lois du changement phonétique pouvaient-elles présenter
des exceptions ? L’exemple le plus célèbre (à juste titre, car
il est relativement facile à présenter) est celui de la « loi de
Grimm ». En 1822, Jacob Grimm, révisant la première édition
de sa grande grammaire des langues germaniques, lit un court
traité d’un linguiste danois, Rasmus Rask, qui lui révèle (en
danois) une découverte d’une importance équivalente à celle
de la parenté lexicale entre certaines langues d’Europe et d’Asie
due à William Jones quarante ans auparavant : les consonnes
occlusives sourdes, sonores et aspirées du proto-indo-euro-
péen (PIE, reconstituées à partir de la comparaison entre le
latin, le grec classique, le vieux persan, le vieil indien, etc.) ont
subi une mutation systématique en proto-germanique (PGe,
reconstitué à partir de la comparaison entre les langues du
groupe germanique) : les occlusives sourdes y ont été rem-
placées par des fricatives sourdes, les occlusives sonores par
des occlusives sourdes et les occlusives sonores aspirées par
des occlusives sonores dénuées d’aspiration, ce que résume le
tableau ci-dessous :
sourdes sonores aspirées

PIE
p t k kw b d g gw bh dh gh ghw
¾ ¾ ¾ ¾
f þ x xw p t k kw b d g gw
PGe
fricatives sourdes sonores
238
Mais bientôt on s’aperçoit que cette loi n’est pas dénuée

d’exceptions. Ainsi pour la désignation du frère et du père, les
termes du sanskrit brātar et pitár ont comme équivalents en
gotique (la langue des goths) respectivement brōþar [bro:Tar]
comme le prévoit la loi de Grimm, mais aussi fadar [faðar]
(avec une fricative sonore, comme dans l’anglais father) alors
qu’on attendrait faþar (avec une fricative sourde). Grimm et
la majorité des comparatistes de son temps admettent facile-
ment que – pour des raisons encore indécelables – la loi ne
s’applique pas partout. Mais dans le dernier quart du siècle,
le mouvement néogrammairien ne souhaite retenir dans son
panthéon que des lois dénuées d’exception, et après le danois
Rask au début du siècle, c’est maintenant un linguiste norvé-
gien, Karl Verner, qui, avec une modestie exceptionnelle, va
expliquer la raison de cette disparité dans un article paru en
1876. En fait l’explication réside dans la notation adoptée plus
haut pour les deux termes du sanskrit : brātar et pitár. En effet
dans la désignation du frère l’accent frappe la première syllabe
et dans celle du père la seconde syllabe.
De nombreuses autres paires de correspondances analogues
entre le sanskrit et le gotique permettent à Verner de conclure
que la loi de Grimm s’applique toujours à la première syl-
labe, mais qu’elle est bloquée pour la seconde si cette syllabe
est accentuée, ce qui est le cas pour pitár dont l’équivalent
gotique est donc fadar [faðar]. Le passage d’une occlusive
dentale sourde à une fricative dentale sourde (loi de Grimm)
représente un affaiblissement simple (l’occlusion est perdue,
donc un filet d’air se fraie une voie entre les dents, mais les
cordes vocales n’entrent pas en jeu), tandis que le passage à une
fricative dentale sonore (loi de Verner) représente un double
affaiblissement (l’occlusion est perdue et en outre les cordes
vocales entrent en vibration). Quand l’accent tombe sur la
syllabe introduite par la consonne en mutation (domaine
239
d’application de la loi de Verner), la loi de Grimm est donc

en quelque sorte renforcée par la vibration supplémentaire des
cordes vocales.
De telles découvertes ont permis au mouvement néogram-
mairien de s’établir fermement pour plusieurs décennies prin-
cipalement en Allemagne, mais aussi dans le reste de l’Europe
et notamment en France avec Antoine Meillet au Collège de
France et aux États-Unis avec Leonard Bloomfield à l’univer-
sité de l’Illinois. Mais au début du xxe siècle le mouvement
s’est trouvé confronté à un double défi.
Il s’agissait d’abord de la prise en compte de la comparaison
des constructions syntaxiques. travail auquel s’est consacré Ber-
told Delbrück à l’université de Halle. En France, ce sont deux
disciples de Meillet, Jean Fourquet pour le groupe germanique
et Lucien Tesnière pour le groupe slave, qui y travaillent, dans
une perspective typologique, avec la distinction entre les lan-
gues « centrifuges » (où la tête des groupes syntaxiques figure
généralement après les membres, comme en japonais et en
turc) ou inversement « centripète » (où la tête des groupes
figure généralement avant les membres, comme en arabe clas-
sique et en tagalog, langue nationale des Philippines).
Ensuite, deuxième défi, c’était l’extension souhaitable de
la méthode comparative à des langues sans tradition écrite,
extension que les linguistes des États-Unis appelaient particu-
lièrement de leurs vœux, car ils devaient décrire dans l’urgence
un maximum de langues amérindiennes en voie d’extinction.
La généalogie mystérieuse des langues sans

tradition écrite
Dans la phase 5 du diagramme d’évolution de la recherche
en généalogie des langues présenté en introduction à ce cha-
pitre figurent deux orientations alternatives, dont l’objectif
commun est de tenter de modéliser les diversifications linguis-
240
tiques (lexicales) induites par des migrations divergentes ou

des métissages de peuples et leur chronologie relative, voire
si possible leur chronologie absolue. Il s’agit d’une part de la
comparaison lexicostatistique et glottochronologique élaborée
par Morris Swadesh et développée notamment par Geoffrey
Lees et Dell Hymes, et d’autre part de la comparaison multi-
latérale mise en place par Joseph Greenberg et poursuivie par
Merrit Ruhlen.
L’analyse lexicostatistique et la glottochronologie

C’est la perspective historique et donc la glottochronologie
qui a été mise en avant dans les premiers travaux de Morris Swa-
desh2. Cependant les deux approches, lexicostatistique et glot-
tochronologique, sont a priori autonomes, ce que le linguiste et
anthropologue Dell Hymes a bien mis en valeur en 1960 :
« La glottochronologie est l’étude du rythme du changement linguistique
et l’usage de ce rythme pour des inférences historiques, notamment pour
estimer la profondeur chronologique et l’usage de telles profondeurs pour
délivrer un pattern de relations internes dans une famille de langues.
La lexicostatistique est l’étude statistique du vocabulaire pour des infé-
rences historiques3. (…) La lexicostatistique et la glottochronologie
demandent donc à être conçues comme des champs en intersection. ».
Le schéma page suivante représente cette intersection entre

un domaine lexicostatistique qui n’implique pas de perspec-
tive chronologique et un domaine glottochronologique sus-
ceptible de s’appliquer aussi à des changements, notamment
morphologiques, comme Swadesh l’a fait lui-même en rele-
vant des ressemblances entre les marques de personne dans
18 % d’un corpus de 57 langues de l’Amérique du Nord.
2. Les publications de M. Swadesh et R. Lees sont recensées dans D. Hymes (1960),

« Lexicostatistics so far », Current Anthropology, 1(1), 3-44.
3. Inférences historiques : en l’occurrence, repérage de mots d’origine commune. 241
LEXICOSTATISTIQUE
études
lexicostatiques
sans perspective
chronologique études combinant la
lexicostatique et la études glotto-
glottochronologie chronologiques
conduites dans
d’autres secteurs
que le lexique
GLOTTOCHRONOLOGIE
La méthode de comparaison lexicostatistique consiste

d’abord à établir une liste fixe de concepts basiques, tradition-
nellement peu sujets à des emprunts, notamment des noms
de nombres et de parties du corps et des verbes d’action phy-
sique. Les chercheurs ont testé successivement des listes de
cent concepts, étendues ensuite à deux cents, avant de revenir,
compte tenu de l’incertitude croissante sur les emprunts dans
les listes extensives, à des listes réduites à quarante concepts.
Ensuite, les mots désignant ces concepts dans un ensemble de
langues qu’on suppose apparentées sont comparés pour chaque
paire de langues. L’objectif de cette procédure est d’abord
d’écarter les langues dont les mots-tests ne franchissent pas un
seuil minimum de concordance avec ceux des autres langues,
et ensuite de mesurer le degré de concordance entre les paires
de langues restantes et d’en déduire un arbre phylogénétique.
Imaginons par exemple un ensemble de quatre langues
(A, B, C, D) qu’on suppose a priori apparentées et pour les-
quelles on dispose de quatre microlexiques-tests de quarante
termes à comparer. Supposons qu’on obtienne pour chaque
paire de langues les chiffres de concordance ci-après :
242
Paires de langues A~B A~C A~D B~C B~D C~D
Concordances sur 40 30 5 25 5 15 5
On en déduit que A est très proche de B (75 % de concor-

dances) et relativement proche de D (63 %), tandis que B est
relativement éloignée de D (38 % de concordances). Quant
à la langue C, son taux de concordance avec A, B et D ne
dépasse pas 13 %, ce qui est vraisemblablement imputable à
des sources lexicales différentes et invalide son apparentement
(en l’absence de données externes allant dans le sens inverse).
Ces résultats permettent de construire un dendograme4, c’est-
à-dire un diagramme de regroupement hiérarchique qui asso-
cie en priorité les langues A et B en raison de leur taux élevé
de concordance lexicale, puis la langue D au regroupement
[A-B], et qui met en doute (doute symbolisé par un trait dis-
continu) la parenté entre C et la famille [[A-B]-D].
[5%] [63%] A
[5%] [75%]
[5%] [38%] B
C
La démarche de la glottochronologie est plus ambitieuse et
plus fragile, car elle vise à substituer à la chronologie relative
des divergences (implicite dans le dendogramme représenté
plus haut, avec une première divergence entre A-B et D sui-
4. Dans la pratique lexicostatistique, les dendogrammes sont produits automatiquement par

un algorithme statistique. 243
vie d’une seconde divergence entre A et B) par une chrono-

logie absolue. Pour cela il faut évaluer un rythme moyen de
renouvellement du lexique. Geoffrey Lees et ses collaborateurs
se sont attelés à cette tâche ardue en 1953 en comparant le
rythme du renouvellement lexical dans treize langues, onze
indo-européennes dont six romanes, et deux langues d’autres
familles. Ils ont conclu à un taux de rétention lexicale (c’est-
à-dire de conservation des mots sans changement drastique
de sens ni de forme) de ±80 % en un millénaire, la fourchette
allant de 76 % à 85 % selon les langues.
La possibilité d’aboutir à une véritable chronologie abso-
lue des divergences entre langues de même famille a donné
lieu à de vives controverses qui ont conduit à la marginali-
sation de l’approche glottochronologique pendant plusieurs
décennies. En effet, l’un des écueils auxquels cette entreprise
est confrontée tient aux contacts subsistant entre des popu-
lations qui se sont dissociées. Ces contacts favorisent bien
entendu la conservation de mots étroitement apparentés.
C’est le cas entre dialectes, le français actuel du Québec pou-
vant être considéré comme une variante dialectale du français
métropolitain. C’est ce qui s’est produit aussi entre les ger-
mains (Angles et Saxons) émigrés en Grande-Bretagne et ceux
du continent. Selon le calcul de Lees, la divergence entre le
vieil-anglais et le vieux-saxon continental daterait de ±716,
alors que la conquête de la Grande-Bretagne date de 449, soit
une différence notable de plus de deux siècles et demi. Les
échanges réguliers entre l’île et le continent, dont les historiens
savent qu’ils se sont poursuivis jusque vers 600, expliquent en
partie cet écart entre le calcul et la réalité historique.
Ceci n’a pas empêché H.G. Wittman de publier en 1969
une étude glottochronologique, dont les résultats ont été dras-
244
tiquement revus à la hausse ces dernières années5, sur la data-

tion de la divergence entre le hittite (découvert seulement au
tournant du xxe siècle et rattaché en 1917 à la famille indo-
européenne) et le reste des langues indo-européennes. À par-
tir des lexiques du sanskrit, du grec, du germanique, du latin
et du lituanien, Wittman a sélectionné 45 “parfaits cognats”
entre le hittite et l’indo-européen, et en reprenant l’évaluation
à 80 % du taux de rétention des mots sur mille ans calculé par
Lees en 1953, il est parvenu à une date de dissociation d’envi-
ron 3 600 ans avant notre ère, ce qui concordait à l’époque
avec la conclusion d’une étude indépendante menée avec la
méthode comparée classique.
La comparaison multilatérale
Le tableau ci-après6 illustre la comparaison multilatérale
des lexiques élaborée dans les années 1950 par Joseph Green-
berg. La méthode consiste – comme dans l’approche lexico-
statistique – à sélectionner des concepts basiques, dont on sait
qu’ils ont peu de chance de donner lieu à des emprunts entre
langues, notamment des noms de nombres (un, deux, trois) et
des parties du corps (tête, œil, nez, bouche).
On constate alors que pour les mots qui commencent par
une consonne, les cognats sont généralement immédiatement
reconnaissables. Cependant des mutations consonantiques
mises en évidence au xixe siècle, notamment par Jacob Grimm
pour le groupe germanique, ont un effet perturbateur. Ainsi les
cognats germaniques de trois se répartissent en trois variantes
à consonne initiale d- pour le hollandais et l’allemand, t- pour
5. Voir plus loin le dendogramme de Gray et Atkinson (2003) discuté par Ruth Berger (2014,
« L’arrivée des langues indo-européees en Europe », Dossier Pour la Sciences n°82, op.cit.
note 28), qui fait remonter la divergence du hittite à quelque neuf millénaires avant le
temps présent, soit ±7000 ans et non 3600 ans avant notre ère.
6. Tableau emprunté à Colin Renfrew, « La diversification linguistique » (p.48) dans Les
langues du monde (Sylvain Auroux, dir. 1999, « Bibliothèque Pour la Science », Belin). 245
le suédois et th- pour l’anglais, et pour ceux de deux le terme

allemand commence par une consonne affriquée (une occlu-
sive qui s’achève en fricative) ts-.
La reconnaissance de cognats commençant par une voyelle
est moins aisée, comme on le voit pour les désignations de
un, qui commencent par la voyelle antérieure e- en suédois,
hollandais et bulgare, les semi-voyelles w- en anglais et j- en
polonais, la diphtongue aj- en allemand, la voyelle nasalisée
œ- en français, la voyelle centrale a- en russe ou les voyelles
postérieures u- en italien, espagnol et roumain.
groupe
langue un deux trois tête œil nez
linguistique
suédois en tvo tre hyvud øga næsa
hollandais ēn tvē drī hōft ōx nøs
germanique
anglais w{n tuw thrij hed aj nowz
allemand ajns tsvaj draj kopf (haupt) aug{ nāz{
français œ~ dø trwa tet œj ne
italien uno due tre testa okjo naso
italique
espagnol uno dos tres kabesa oxo naso
roumain un doj trej kap okj nas
polonais jeden dva tši glova oko nos
slavique russe adin dva tri galava oko nos
bulgare edin dva tri glava oko nos
ouralique- finnois yksi kaksi kolme pae silmæ nenæ
youkaghir estonien yksi kaks kolm pea silm nina
basque basque bat bi hiryr byry begi sydyr
Globalement on voit que les mots du finnois/estonien

(variantes quasiment dialectales) et du basque ne présentent
pas de parenté visible avec ceux des trois groupes précédents,
ni entre eux. C’est l’un des critères qui permettent de dis-
tinguer la famille indo-européenne de familles géographi-
quement proches mais généalogiquement distinctes. Ces
246
localisations proches remontent à des vagues de migrations

différentes, celle du peuple basque (ou vascon) étant la plus
ancienne. Je reviendrai dans la section suivante sur la variation
entre langues germaniques et sur celle entre langues italiques
(ou romanes) pour les désignations de la tête.
Les superfamilles existent-elles ?

Au début du xxe siècle, l’indo-européaniste danois Hol-
ger Pedersen a fait l’hypothèse d’une superfamille nostratique
(du latin nostra : notre) incluant plusieurs familles de langues
d’Eurasie, à savoir les langues indo-européennes, ouraliennes,
altaïques, caucasiennes du Sud et chamito-sémitiques (plus
tard appelées « afroasiatiques »).
Dans la seconde moitié du xxe siècle, Joseph Greenberg
aux USA et Sergueï Starostin et ses collègues en URSS ont
proposé chacun de leur côté des regroupements se recouvrant
largement et apparentés au nostratique qu’ils ont nommés
« superfamille eurasiatique ». La plupart des linguistes sont
réticents devant de tels regroupements, estimant leurs bases
trop hasardeuses, mais ils retiennent l’attention des anthropo-
logues comme Patrick Manning et des généticiens des popula-
tions comme Luigi Cavalli-Sforza, qui souhaitent en faire état
dans leur exploration des grandes migrations humaines.
Sans entrer dans le détail de ces controverses, voici une
illustration à propos de l’hypothèse largement répandue de la
superfamille ouralo-altaïque. Les deux notices en français et
en anglais de l’encyclopédie en ligne Wikipedia fournissent
des arguments précieux pour et contre cette hypothèse. D’un
côté trois rapprochements ont attiré l’attention des linguistes
depuis le xviiie siècle : sur le plan phonologique la présence
courante de l’harmonie vocalique, sur le plan morphologique
une formation des mots de type essentiellement agglutinant
et sur le plan syntaxique un type centrifuge (la tête syntaxique
247
étant disposée après ses membres, dans la proposition comme

dans les groupes nominaux). Cela étant, une double question
se pose : les langues ouraliennes et altaïques ont-elles effective-
ment une relation généalogique démontrable, et si oui, consti-
tuent-elles un taxon* linguistique valide ?
Jetons à nouveau un coup d’œil sur l’arbre généalogique pro-
posé par Schleicher en 1861 (cf. p. 237). Toutes les langues qui y
figurent sont généalogiquement apparentées, mais elles le sont à
un degré variable. C’est ce que Schleicher a suggéré avec sa hié-
rarchie de divergences toutes binaires. En comptant le nombre
d’embranchements à franchir pour aller d’une sous-famille de
langues à une autre sur cet arbre, on peut mesurer très grossiè-
rement la distance entre deux langues. Elle est la plus courte
(un seul embranchement) entre, par exemple, les deux familles
slave et balte, les deux familles celtique et italique (ou romane)
ou encore les deux familles iranienne et indienne. De ce fait le
slavo-balte constitue un taxon, et l’aryen en constitue un autre.
Un pas plus loin, le grec est distant d’un embranchement du
regroupement celto-italique, mais de deux embranchements
par rapport à chacune de ces deux familles, celtique et italique.
Le grec et le « celto-italique » constituent donc un taxon, mais
non le grec et le celtique ou le grec et l’italique.
Bien que les deux familles ouralienne et altaïque se soient
répandues majoritairement en Asie, elles concernent cepen-
dant une partie de l’Europe, soit comme langue dominante,
soit comme langue de communautés de migrants. La carte de
l’Europe ci-dessous72 indique les populations qui y parlent une
langue finno-ougrienne appartenant à la famille ouralienne
(notée UF : le finnois-estonien, le hongrois et le sam) et celles
qui parlent une langue turque de la famille altaïque (notée
7. https://upload.wikimedia.org/wikipedia/commons/3/38/ Linguistic_map_ of_the_Altaic%2C_

248 Turkic_and_Uralic_languages.png
AT : essentiellement le turc de Turquie et de la diaspora, et le

tatare de Crimée).
Légende partielle
UF : langues finno-ougriennes
< ouraliennes
UF1 : finnois baltique
(incluant l’estonien)
UF 2 : langues sam (lappons)
UF5 : hongrois
AT : langues turques < altaïques
AT12 : turc de Turquie et
communautés en Bulgarie,
Allemagne, France,
Grande-Bretagne
AT12 : tatare de Crimée
Actuellement l’hypothèse du regroupement des langues

ouraliennes et altaïques sous la forme d’un taxon est abandon-
née, les facteurs de rapprochement notés plus haut étant con-
sidérés comme des traits typologiques qui n’impliquent pas
d’origine commune. Et l’arbre phylogénétique8 des langues
eurasiatiques proposé par l’équipe de Georg Starostin à par-
tir de la base de données étymologiques Tower of Babel rat-
tache l’altaïque au paléo-sibérien, regroupant les familles des
langues eskimo et aléoutes, ce regroupement est lui-même rat-
taché à la famille des langues dravidiennes du sud de l’Inde
et c’est seulement à ce niveau que s’effectue le rattachement à
la famille ouralienne avant d’accueillir au niveau supérieur la
famille indo-européenne.
8. Base de données étymologique Tower of Babel. http://starling.rinet. ru/images/globet.png 249

Eurasiatic Kartvelian
Indo-European
Uralic
Dravidian
Altaic
Eskimo+Aleut
Paleo-Siberian
Au final, ces controverses débouchent sur une interroga-

tion et un constat. D’abord, il est difficile de sélectionner
parmi les traits linguistiques très répandus ceux qui attestent
une origine commune : l’harmonie vocalique, la morphologie
agglutinante et l’ordre syntaxique centrifuge sont particuliè-
rement répandus parmi les langues ouraliennes et altaïques,
mais peut-on en conclure que ce sont des facteurs décisifs de
parenté généalogique ?
D’autre part, ces débats sont généralement liés à des hypo-
thèses anthropologiques sous-jacentes sur la répartition des
peuples dans le monde, sur leurs styles de vie et sur leurs migra-
tions. Au milieu du xixe siècle l’indo-européaniste Max Müller
développait aventureusement l’hypothèse « touranienne » qui
associait une large partie des langues de l’Asie à la pratique du
nomadisme. Au tournant du xxie siècle, l’archéologue Colin
Renfrew suit un chemin analogue en associant son hypothèse
de l’origine anatolienne des Indo-européens à la découverte de
l’agriculture.
250
La démarche reconstructive de Georg Starostin

Le linguiste Georg Starostin de l’université de Moscou, fils
de Sergueï Starostin, l’un des fondateurs de l’hypothèse de la
superfamille eurasiatique, est depuis le tournant du xxie siècle
à la tête de deux projets internationaux de recherche au Santa
Fe Institute. Ils sont consacrés, pour le premier, à l’élabora-
tion d’une base de données sur les étymologies de nombreuses
familles de langue (Tower of Babel) et, pour le second, à l’ex-
ploration de la préhistoire linguistique de l’humanité (Evolu-
tion of Human Languages).
Méthodologiquement, son objectif est de concilier l’ap-
proche classique historico-comparative et celle, alternative, de
la lexicostatistique dans un édifice théorique à deux niveaux.
Au premier niveau, la lexicostatistique de Morris Swadesh est
conçue comme un outil préliminaire, destiné à débroussailler le
terrain d’investigation en établissant des compatibilités phoné-
tiques. Le projet considère que la lexicostatistique préliminaire
« a le pouvoir d’établir un plan de travail général du classement
des langues du monde, destiné à être raffiné ou réfuté, en partie
ou en totalité ». Au second niveau intervient « la méthode com-
parative, telle qu’appliquée par les néogrammairiens ».
Par ailleurs, cette démarche échelonnée est associée à quatre
principes :
1. On tire parti à la fois de corpus lexicostatistique vastes
mais entachés d’incertitudes, et de corpus étymolo-
giques classiques limités mais bien étayés, sous la forme
d’une pyramide. A sa base, les étymologistes rassemblent
une multitude de données partielles qui ne forment
pas encore un tout ordonné, après quoi ces données
sont contrôlées de manière à fournir au sommet de la
pyramide un catalogue d’étymologies robustes tenant
compte à la fois du sens, de la forme phonétique et des
structures syntaxiques.
251
2. Les concordances lexicales sont jugées plus décisives que

les concordances grammaticales (même si le lexique fait
l’objet d’emprunts beaucoup plus souvent que la gram-
maire), comme le montre la comparaison entre deux
langues indiscutablement indo-européennes, le russe et
l’anglais, qui révèle le partage de nombreux cognats (des
formes phonologiquement proches supposées avoir une
origine commune), alors que la morphologie des deux
langues est très différente avec beaucoup plus d’affixes
grammaticaux en russe qu’en anglais.
3. Starostin entend intégrer la démarche des spécialistes
d’un groupe généalogique bien structuré (héritiers des
néogrammairiens) et celle des macro-comparatistes
qui compensent leur connaissance plus superficielle de
chaque groupe par une vision plus synthétique, dans le
sillage de la méthode multilatérale de Joseph Greenberg
et Merrit Ruhlen.
4. Enfin, le projet de Starostin ne dénigre pas l’approche
informatique développée notamment à l’Institut Max
Planck d’anthropologie évolutionnaire de Leipzig (MPI-
EVA), mais il juge nécessaire de traiter manuellement
une partie des données et de recourir en complément à
des algorithmes susceptibles de dégager des résultats plus
généraux
À titre d’illustration, le tableau ci-après représente une
partie des informations que la base de données étymologique
Tower of Babel fournit en réponse à la requête « latin : caput »
(1re ligne). Le dictionnaire commence par fournir l’étymon
reconstitué en proto-indo-européen, il renvoie à une étymo-
logie nostratique. On peut suivre cette étymologie notam-
ment dans différentes familles d’Eurasie et en afroasiatique, la
superfamille incluant les langues sémitiques. Cet étymon ne
se retrouve que marginalement en vieil indien (sanskrit), mais
252
FORME
LANGUE (attestée ou SENS
reconstruite :*)
latin caput, -itis n. tête, pointe, dôme, chose
principale, capitale
*proto-IE *kaput- tête
étymologie nostratique ¼ (…)
vieil indien *kaput-’ dans kapúc- tête
chala- n. touffe de cheveux sur la partie
arrière de la tête
germanique *xa(u)b-Vd-a- m., n
proto-germanique *xa(u)bVda-z, -n tête
gotique haubie (-d-) n. (a) tête
vieux norrois haufuo, hOfuo n. tête, commandant, homme
norvégien hovud
suédois huvud
danois hoved
vieil anglais hēafod, tête, chef, source, point de
gen. hēafdes m. départ ou le plus haut
(d’un fleuve, d’un champ, etc.)
anglais head
vieux frison hāved, hāfd
vieux saxon hōvid
moyen néerlandais hōvet, hooft, hoot
néerlandais hoofd n.
vieux franconien hōvid
moyen bas allemand hövet
vieux haut allemand houbit ` tête (viiie siècle)
moyen haut allemand houbet, houpt st. n. tête des hommes et des
animaux
allemand moderne Haupt n.
253
il est parfaitement conservé dans toutes les langues du groupe

germanique, anciennes et actuelles. Le sens de base est partout
la « tête », mais selon les cultures, il connaît des extensions
métaphoriques, en latin autour de la notion de chose ou lieu
principal, ou en vieux norrois et en vieil anglais autour de celle
de chef ou de source.
Nous avons vu plus haut, dans le tableau d’illustration de la
méthode comparative multilatérale de Greenberg (cf. p. 245),
que dans le groupe germanique l’allemand se distinguait avec
Kopf et dans le groupe italique le français et l’italien avec res-
pectivement tête et testa. En fait les deux désignations de la
tête en allemand moderne, Haupt (littéraire) et Kopf (stan-
dard) remontent au même étymon*kap(ut) par deux voies dif-
férentes, celle de la mutation consonantique ancienne k > h
et celle plus récente, sans mutation consonantique, probable-
ment dérivée par analogie de forme du latin tardif cuppa > fr.
coupe/ang. cup. Quant à tête, ce mot dérive du latin testa signi-
fiant « objet en terre cuite », puis « coquille » et finalement
« crâne ». Le français et le latin ont opté pour cet étymon,
c’est un cas de renouvellement lexical, alors que l’espagnol et
le roumain restaient fidèles à l’étymon caput.
Des algorithmes à l’assaut de la famille linguistique

indo-européenne
Dans cette dernière section, j’évoquerai les découvertes
d’une équipe de lexicostatisticiens néo-zélandais qui entendent
renouveler le débat sur l’accès aux cultures orales de l’Anti-
quité et de la préhistoire par le phénomène de la rétention
lexicale à travers les millénaires.
Dans un article paru en 2014, la linguiste et biologiste
Ruth Berger met en application l’approche de Patrick Man-
ning, historien des migrations humaines, à propos du point
de départ controversé de la migration des Indo-européens en
254
Europe9. Les archéologues distinguent, dans l’Europe du néo-

lithique, les peuples de la culture rubannée (ainsi désignée à
partir des rubans ornant leurs céramiques), qui pratiquaient
l’agriculture en Europe à partir de l’espace danubien central il
y a 7 500 ans, et ceux de la culture cardiale (le décor de leurs
céramiques est à base d’empreintes de coquillages) d’origine
méditerranéenne et peut-être libanaise. Sur le plan génétique,
l’ADN mitochondrial des fossiles des premiers présente des
traits qui ne se retrouvent plus dans les populations modernes
de l’Europe. Cela laisse supposer que cette migration, éven-
tuellement identifiée comme celle des Vascons, ancêtres des
basques10, a été refoulée par une seconde, probablement
indo-européenne. Si le peuple de la culture rubannée pra-
tiquait déjà l’agriculture et a été refoulé par une migration
indo-européenne, cela ébranle la thèse de l’archéologue Colin
Renfrew11 selon laquelle les Indo-européens ont inventé l’agri-
culture en Anatolie, censée avoir été leur localisation originelle
(homeland).
Le fait que les grandes familles de langues indo-euro-
péennes (indienne, persane, grecque, slave, germanique, celte
et italique) se soient dissociées en moins de quinze siècles sug-
gère des migrations plus tardives que la diffusion première de
l’agriculture. Et l’hypothèse de l’archéologue Marija Gimbutas
décrivant les premiers Indo-européens comme « des peuples
de cavaliers nomades originaires des steppes entourant la mer
Noire et la mer Caspienne », migrant vers l’Europe il y a envi-
9. R. Berger (2014), op.cit. p.22-26. L’auteure se fonde essentiellement sur l’article de

R. Gray R. & Q. Atkinson (2003), « Language-tree divergence times support the anatolian
theory of Indo-European origin », Nature 426 : 435-8.
10. Cavalli-Sforza a montré que la répartition des groupes sanguins des basques ne ressemble
à aucune de celle de leurs voisins, et comme la langue basque possède des structures
très originales et apparentées à celles de langues du Caucase, il se représente les basques
comme les seuls descendants d’une migration pré-indo-européenne.
11. C. Renfrew (1999), « La dispersion des langues indo-européennes », Les Langues du
monde, « Bibliothèque Pour la Science », Belin, p.74-77. 255
ron 6 000 ans, devient d’autant plus plausible que la racine du

vieux celtique danu (le fleuve) se retrouve dans les noms de
fleuve qui se jettent dans la Mer noire (Don, Donez, Dniepr,
Dniestr, Danube).
Le diagramme qui suit, construit en 2003 par R. Gray &
Q. Atkinson à partir de l’enregistrement de lexiques élémen-
taires de toutes les langues indo-européennes modernes et
anciennes et de leur traitement mathématique à l’aide d’un
algorithme lexicostatistique, confronte les deux hypothèses en
concurrence, celle de la migration de paysans anatoliens il y
a ± 9 000 ans (hypothèse de Renfrew, 1re colonne grisée) et
celle de la migration de guerriers nomades des steppes il y a
± 6 000 ans (hypothèse de Gimbutas, 2e colonne grisée), en
vue de reconstituer les dates de divergence entre les langues de
la famille indo-européenne. L’hypothèse de Renfrew ne cor-
respondrait qu’à la divergence des hittites et de peuples appa-
rentés, qui vivaient effectivement en Anatolie, alors que celle
de Gimbutas s’accorde avec la datation de la plupart des autres
divergences (le grec et l’arménien, les langues de l’Inde et de
la Perse, les langues slaves, celtes, italiques et germaniques) et
recueille donc plus de suffrages.
La structuration de la superfamille eurasiatique

Portons encore une fois notre attention sur la superfamille
eurasiatique chère à J. Greenberg, M. Ruhlen et à S. et G. Sta-
rostin (le père et le fils). Une équipe de lexicostatisticiens
associant Quentin Atkinson, déjà évoqué plus haut, et trois
autres chercheurs a entrepris en 2013 d’étendre à tout l’espace
eurasiatique l’étude consacrée précédemment à la seule famille
indo-européenne12. Ces chercheurs avaient constaté préala-
12. M. Pagel M., Q. Atkinson, A. Calude & A. Meade (2013), «»Ultraconserved words point
to deep language ancestry across Eurasia », Proceedings of the National Academy of Sciences
256 110, p.8471-6.
blement que « la fréquence d’usage de mots particuliers dans

le langage ordinaire exerce une influence générale et régulière
sur leur rythme d’évolution », ce dont G. Lees ne s’était pas
aperçu un demi-siècle plus tôt. Et leurs nouvelles observations
suggèrent « une fidélité remarquable dans la transmission de
certains mots justifiant en théorie la recherche de traits du lan-
gage susceptibles d’avoir été préservés au long de vastes espaces
chronologiques et géographiques ». Ils se plongent donc dans
notre passé linguistique au-delà de 9 000 ans jusqu’à un
ancêtre commun aux Eurasiates daté de 14 500 ans avant le
moment présent.
Atkinson et ses collaborateurs retiennent ving-trois signi-
fiés (ou contenus sémantiques) fournissant des cognats validés
dans au moins quatre des sept familles de la superfamille eura-
siatique13, et cherchent à reconstruire et localiser leurs diver-
gences successives. Leurs résultats se présentent ci-après sous
une double forme, géographique (A) et chronologique (B).
Du point du vue géolinguistique, ils prennent comme
arrière-plan la carte de l’Eurasie et des sept familles de langues
13. PA, proto-altaïque; PCK, proto–chukchi-kamchatkien; PD, proto-dravidien; PK, proto-

kartvélien; PIE, proto–indo-européen; PIY, proto–inuit-yupik; PU, proto-ouralien. 257
qui y sont actuellement parlées pour lui superposer un arbre

phylogénétique en corolle dont le centre se situe approxima-
tivement du côté de l’actuel Kazahkstan, à faible distance
du homeland présumé du proto-altaïque. Le proto-ouralien
(PU) s’est dissocié du proto-indo-européen (PIE), le premier
migrant vers le nord, le second vers l’ouest (avec une locali-
sation du homeland indo-européen au nord de la Mer noire
plus proche de l’hypothèse de M. Gimbutas que de celle de
C. Renfrew), tandis que le proto-dravidien (PD) se dissociait
du proto-kartvélien (PK) vers le sud14. Enfin deux familles se
dissocient du proto-ouralien en direction du détroit de Bering,
le proto-choukchee-kamchatkien et le proto-inuit-youpik (la
ligne discontinue représente la migration de ces populations
vers leur localisation actuelle en Alaska).
14. L’arbre ne tient pas compte de la localisation actuelle des populations dravidiennes,
258 refoulées au sud de l’Inde par les aryens.
Du point de vue chronologique, l’algorithme statistique

délivre un ensemble d’arbres phylogénétiques. Selon le plus
probable (l’arbre « consensuel ») le proto-dravidien (PD) aurait
divergé le premier il y a ±14 500 ans (avec une marge d’erreur
de ±1 700 ans), suivi du proto-kartvélien (PK). On retrouve la
proximité entre le proto-ouralique (PU) et le proto-indo-euro-
péen (PIE) avec un écart de 27 % la divergence étant datée
d’il y a ±10 000 ans, et celle entre le proto-kamchatkien et le
proto-inuit-youpik (30 %), ayant divergé il y a ±10 000 ans et
constituant cependant les deux familles les plus récentes.
B
PD
PK
PU
0.27
PIE
0.55
PA
0.44
PCK
0.3
PIY
15.0 12.5 10.0 7.5 5.0 2.5 0.0

milliers d’années
Identifier des cognats n’est pas une tâche aisée et une telle
entreprise court le risque d’être un colosse aux pieds d’argile,
le colosse étant ici un algorithme statistique permettant d’inté-
grer une multitude de paramètres et les pieds étant le matériau
linguistique qui l’alimente. Pourtant l’équipe d’Atkinson reste
confiante, estimant que son modèle statistique « l’emporte sur
les objections à l’identification et à l’existence de relations pro-
fondes entre cognats, en fournissant un cadre quantitatif pour
259
l’évaluation de tels liens profonds parmi un sous-ensemble

de mots sélectionnés, ajoutant que « sur le plan théorique, il
donne du sens à la recherche d’autres mots candidats à l’unifi-
cation des familles linguistiques ».
La généalogie des langues peut-elle encore faire

rêver ?
Il y a des questions scientifiques qui font rêver à certaines
époques et tombent aux oubliettes en d’autres temps. Il en a
été ainsi pour la genèse du langage et celle des langues, mais
en décalé. La question philosophique de l’origine du langage a
fasciné les philosophes du xviiie siècle15, notamment Etienne
Bonnot de Condillac en 1746, Jean-Jacques Rousseau en 1755
et Johann Gottfried Herder en 1772. Dans le même temps,
des explorateurs de la variété des parlers cherchaient à inven-
torier un maximum de langues et à en donner un minuscule
aperçu avec un seul matériau disponible de manière quasiment
universelle, le Pater noster, traduit dans toutes les langues par
les interprètes des missionnaires catholiques et protestants qui
exerçaient leur ministère sur les cinq continents. C’est ainsi
notamment que le grand linguiste et lexicographe allemand
Johann Christoph Adelung a rassemblé environ 500 traduc-
tions de la prière originelle qu’il a classées par continent. Il en
a fait paraître le premier tome en 1806 dans son Mithridate,
ou science générale des langues16, dont les trois volumes suivants
sont parus jusqu’en 1817 en collaboration avec, puis après sa
mort par le seul Johann Severin Vater. Et Adelung avait été
précédé par d’autres compilateurs, notamment le jésuite espa-
15. E.B. de Condillac (1746), Essai sur l’origine des connaissances humaines, ouvrage où l’on
réduit à un seul principe tout ce qui concerne l’entendement humain [rééd. Vrin 2014];
J.G. Herder (1772), Traité de l’origine du langage, Puf [édition originale 1772] ; J.-J. Rousseau
(1755,) Discours sur l’origine et les fondements de l’inégalité parmi les hommes, Amsterdam.
16. J.Ch. Adelung & J.S. Vater (1806-1817), Mithridate, ou science générale des langues
260 (en allemand), 4 vol., Berlin.
gnol Lorenzo Hervas y Panduro, qui centralisait au Vatican

les informations linguistiques de ses confrères missionnaires,
et l’Allemand Simon Pallas, géographe au service de la tzarine
Catherine de Russie, laquelle lui avait commandé un recense-
ment de ses peuples et de leurs langues.
En dépit de leur maigreur descriptive, l’ensemble de ces
compilations a converti l’interrogation purement spécula-
tive jusqu’alors en un questionnement raisonné qui, avec la
découverte des ressemblances lexicales entre le sanskrit et le
vieux persan côté asiatique, et le grec, le latin et l’allemand
côté européen, remettait en cause l’hypothèse biblique de
l’hébreu comme langue primitive de l’humanité. L’idée même
d’une origine unique (thèse de la monogénèse) devenait un
sujet de débat et au milieu du xixe siècle, August Schleicher
se déclarait trop impressionné par la variété des systèmes mor-
phologiques mis en évidence par Humboldt entre les langues
dites isolantes, agglutinantes, flexionnelles et incorporantes
pour imaginer autre chose qu’une origine multiple (thèse de
la polygénèse).
Au cours du xixe siècle la linguistique s’est donc mise en
ordre de marche comme une science destinée en priorité à
reconstruire l’histoire des langues à tradition écrite. Elle par-
tait d’un savoir philologique qui remontait aux humanistes du
xvie siècle et à leurs premières éditions critiques des écrivains,
philosophes et savants grecs et latins. Pour les autres langues,
qui étaient considérées comme d’un intérêt négligeable en rai-
son de l’équation :
langue de culture langue à tradition écrite

=
langue de nature langue sans tradition écrite
261
on ne voyait ni le moyen ni la raison de s’inquiéter de leur

passé, il suffisait de les décrire de manière à permettre les
échanges commerciaux dans les comptoirs et l’administration
des colonies.
Encore une fois, le centre d’intérêt s’est déplacé à partir
de la fin du xixe siècle aux États-Unis et également en Rus-
sie, chez les premiers parce que les anthropologues commen-
çaient à avoir une connaissance approfondie d’une partie
au moins des peuples amérindiens et se rendaient compte
que leurs langues étaient en voie d’extinction, et en Russie
parce qu’il importait au tsar de savoir au moins qui étaient
ses sujets au-delà de l’Oural (la construction des 9 000 km
de la ligne ferroviaire transsibérienne a débuté en 1891). Une
vaste entreprise anthropolinguistique s’est mise en place et il
est devenu important, non seulement de décrire les langues
de ces peuples, mais de comprendre leurs cultures, l’origine
des unes et des autres et les relations étroites entre culture et
langue, notamment en testant l’hypothèse dite de Humboldt-
Sapir-Whorf selon laquelle la structure des langues influence,
voire détermine celle de la pensée.
Dans le même temps, la généalogie des langues à tradi-
tion écrite n’intéressait plus qu’une petite communauté de lin-
guistes convaincus que tout n’avait pas encore été découvert,
et parmi eux les français Emile Benveniste, Georges Dumézil,
Marcel Cohen et André Georges Haudricourt, tandis que la
majorité se tournait vers des questionnements d’inspiration
soit formelle, par exemple, « Peut-on générer toutes et rien que
les phrases grammaticales dans un maximum de langues ? »,
soit fonctionnelle, par exemple, « Comment les structures lin-
guistiques se répartissent-elles typologiquement et géographi-
quement à travers les langues modernes ? ».
Aujourd’hui, après avoir connu un début historique au
xixe siècle, un premier tournant descriptiviste dans la première
262
moitié du xxe siècle et un second tournant universaliste dans la

seconde moitié, la linguistique connaît un troisième tournant
technologique.
Cela vaut en phonologie avec la synthèse et plus récem-
ment l’analyse automatique efficace de la parole. Cela vaut
également en morphologie avec la possibilité de suivre d’an-
née en année quels processus de formation de mots nouveaux
progressent, stagnent ou régressent. C’est le domaine de la
néologie.
En syntaxe, l’usage de très grands corpus écrits comptant
plusieurs millions de mots permet de repérer dans le présent
et le passé la prégnance et l’évolution des constructions. En
sémantique, la communication homme-machine promet
d’importants résultats.
On n’oubliera pas les ouvertures fascinantes que permet
l’imagerie cérébrale clinique (pour les cas d’aphasie d’origine
vasculaire ou tumorale) et surtout fonctionnelle (permettant
de repérer les aires du cerveau activées par différentes tâches
linguistiques de répétition, de mémorisation, de compréhen-
sion ou de production de mots ou de phrases).
Mais la question des origines continue à tarauder les esprits
avec le retour du naturalisme philosophique, c’est-à-dire de
l’idée que les structures physico-biologiques, anthropolo-
giques (cognitives, sociales et émotives) et celles de l’univers
numérique ont une grille commune, dont le principe généra-
teur est l’auto-organisation entre des pressions concurrentes.
Le jeu toujours renouvelé de ces pressions découpe le réel
entre ce qui est impossible, parce que contraire aux condi-
tions préalables à l’auto-organisation (par exemple, en linguis-
tique une langue dénuée de voyelles, des groupes syntaxiques
dénués d’une tête, des mots dénués de tout noyau sémantique,
etc.), ce qui est possible et, comme sous-classe du possible, ce
qui est profitable.
263
À titre d’exemple, l’islandais, langue éminemment insu-

laire, a conservé depuis un millénaire plus d’une soixantaine
de paradigmes de déclinaison des substantifs. Une telle prolifé-
ration est donc possible, elle peut être acquise par les apprentis
locuteurs et elle est en usage dans les échanges oraux et écrits.
C’est un facteur de cohésion de la communauté linguistique
et à ce titre, elle peut être considérée comme culturellement
profitable. Mais elle n’est pas profitable aux échanges commer-
ciaux, humains et culturels : les populations scandinaves du
continent ont perdu ces structures morphologiques encom-
brantes parce qu’elles étaient en contact constant avec des
populations germanophones, slavophones ou anglophones.
L’islandais est un peu comparable à l’iguane terrestre des îles
Galapagos, un sujet d’émerveillement qui nous plonge dans le
passé du monde animal et qu’on n’aimerait pas voir disparaître.
5
Donc, en réponse à l’intitulé interrogatif de cette section, la
généalogie des langues devrait continuer à faire rêver tous ceux
qui s’interrogent sur l’évolution de l’espèce, sur les rapports
entre la culture, la langue partagée et la pensée individuelle et
sur la capacité des sciences plus ou moins directement concer-
nées par la faculté de langage à fournir collectivement une
image multidimensionnelle, en largeur géographique et en
profondeur historique, de l’éventail fonctionnel des langues
en termes de communication, de représentation cognitive, de
calcul argumentatif et d’évocation affective, par comparaison
avec les langages numériques. Cela concerne en particulier les
sciences de l’ingénieur, avec le traitement automatique des
langues et la reconstruction d’états anciens des langues sans
tradition écrite, ainsi que les sciences de la cognition, avec
l’intelligence artificielle appliquée à la modélisation de dis-
264
cours bien argumentés et de dialogues efficaces entre homme

et machine, et entre machines. Sans oublier les sciences de
la vie, avec l’évaluation de l’analogie entre les langues et les
espèces biologiques et son écho concret dans les études sur la
concordance ou la discordance entre les marqueurs de la géné-
tique des populations et les familles de langues.
265
Épilogue
En quoi la conception du langage

comme un système adaptatif complexe
éclaire-t-elle son évolution ?
Nous avons vu à la fin du chapitre 5 que l’élaboration

de programmes multi-agents de simulation de l’évolution
de la parole, de la grammaire et des langues par de brillants
chercheurs en intelligence artificielle (J. Hurford, L. Steels,
B. De Boer, J. Elman, J.-P. Oudeyer entre autres) a permis
de bâtir des scénarios convaincants qui peuvent être affinés
en jouant sur les hypothèses à tester en fonction de nouvelles
découvertes, notamment archéologiques, neurobiologiques et
génétiques, susceptibles d’induire de nouvelles représentations
anthropologiques.
L’idée de base que partagent également certains linguistes
évolutionnistes est que le langage humain, en tant que
faculté cognitive et sociale, se laisserait décrire sous la forme
d’un système adaptatif complexe, c’est-à-dire d’un système
dynamique présentant, conformément à la théorie du chaos,
des structures émergentes imprédictibles (ce qu’on appelle
des « attracteurs étranges »). Un groupe de chercheurs en
linguistique évolutionnaire s’est réuni en 2008 au Santa Fe
Institute sous le nom humoristique de Five Graces Group et
a rédigé un document de travail consacré à sept propriétés du
267
langage humain vu comme un système adaptatif complexe1. Je

traduis le descriptif de ces propriétés dans l’encadré ci-après .
Robert Logan, physicien et théoricien de l’évolution
de l’esprit, articule cette vision avec son « Modèle de
l’esprit étendu ». Le développement des circonvolutions
du cerveau humain (peu développées chez les grands singes
anthropomorphes et absentes chez les autres primates) a permis
à l’intelligence de se déployer sans que le volume du cerveau
s’accroisse. Paradoxalement, le cerveau moyen de l’homme
de Néandertal était plus volumineux que celui des premiers
hommes modernes. Le volume n’est donc pas le critère décisif :
dans l’espèce humaine, les indices fournis par le langage
permettent au réseau des neurones, notamment ceux du
néocortex, de traiter automatiquement les associations d’idées
et d’avoir une gestion efficace des différentes composantes
de la mémoire (la mémoire de travail, épisodique, à long
terme, sémantique). Par ailleurs, comme nous l’avons vu,
Chris Knight, repris par son collègue Robin Dunbar en 2016,
a montré qu’un grossissement du crâne des nouveaux-nés
aurait été incompatible avec le bassin des parturientes, ce qui
débouchait sur une impasse évolutionnaire qu’a finalement
contournée l’interruption de l’extension quantitative (le
nombre des neurones) au profit d’une extension qualitative (le
nombre des connexions entre les neurones).
Peter Logan décrit techniquement ce processus comme
une « conspiration de la nature » appliquant la théorie du
chaos pour accroître l’intelligence des hominidés à l’aide
d’un software (le réseau des connexions neuronales) au-delà
du hardware (la collection des neurones). Selon Logan, les
processus d’héritage avec modification, selon la terminologie
de Darwin, entraînant la sélection des traits les mieux adaptés,
1. La liste de ces propriétés est empruntée à « Five Graces Group » (2008), Language as a
268 complex adaptive system (Santa Fe Institute Working Paper).
Épilogue
Le langage humain vu comme un système

adaptatif complexe
selon le Five Graces Group (Santa Fe Institute, 2008)
1. Le langage présente deux niveaux d’existence, celui des idio-

lectes (les modes d’expression des locuteurs pris individuellement)
et celui de la langue commune, laquelle est une structure émergente
résultant de l’interaction des idiolectes.
2. Contrairement au postulat de la grammaire générative, il n’y a
pas de locuteur-allocutaire idéal pour l’usage, la représentation et le
développement du langage.
3. Le fonctionnement du langage est à décrire à l’aide de règles
non pas statiques (il n’y a pas à proprement parler de « synchronie »),
mais dynamiques (ou panchroniques1) et ce fonctionnement est par
nature une configuration instable (far-from-equilibrium).
4. Le langage est soumis à différents facteurs concurrents qui inter-
agissent, s’alimentent mutuellement et produisent ainsi une spirale as-
cendante. Deux facteurs décisifs sont la préférence des locuteurs pour
l’économie et la brièveté en production et celle des auditeurs pour
la transparence phonétique et sémantique en réception. Comme les
interlocuteurs échangent régulièrement leurs rôles, ils sont en mesure
de comprendre les motivations de leur partenaire dans la communi-
cation langagière.
5. Dans les systèmes adaptatifs complexes, la non-linéarité (c’est-
à-dire le relatif indéterminisme de leur évolution), est une propriété
prégnante. Les spécialistes du langage en développement ont ainsi ob-
servé de brusques accélérations de l’acquisition lexicale qui entraînent
un développement grammatical rapide.
6. La structure sociale des usagers interactifs du langage a un effet
déterminant sur le changement et la variation linguistique et cette
influence peut faire l’objet de simulations informatiques.
7. Le langage s’est adapté au cerveau humain, mais l’inverse est éga-
lement vrai, le cerveau étant devenu capable de traiter des structures
syntaxiques (par l’élaboration de chaînes récursives) et des structures
sémantiques (par la sophistication accrue de la « théorie de l’esprit »)
de plus en plus complexes. On observe également que la complexité du
langage dans une société est fonction de la complexité de cette dernière.
1. Les règles panchroniques combinent des principes valables en synchronie c’est-à-dire

dans un état de langue déterminé, et en diachronie, c’est-à-dire entre deux états de
langue successifs.
269
s’appliquent tout autant au langage et à la culture qu’à

la formation des organismes, ce qui fait de ces trois ordres
de sélection adaptative des phénomènes émergents. Et il
reprend et étend la thèse de Stuart Kauffman2, biochimiste
et philosophe de l’évolution, selon laquelle les trois lois de la
thermodynamique devraient être complétées par une quatrième
loi, celle de l’émergence persistante du renouvellement ou
de l’innovation (novelty) depuis l’émergence de la vie, au
niveau moléculaire, morphologique, comportemental ou
organisationnel. Kauffman a formulé cette quatrième loi pour
les deux sphères de la vie et de l’économie et Logan en affirme
la pertinence pour ce qu’il appelle la symbolosphère, dont il
observe l’innovation persistante dans la technologie, la science,
le droit, la littérature, la musique et les arts visuels3.
Cette vision ne néglige pas la thèse des biolinguistes
(N. Chomsky, R. Berwick, C. Boeckx, W.T. Fitch entre
autres) pour qui la propriété distinctive décisive des premiers
hommes a été l’aptitude à combiner des concepts et à
échanger des informations complexes à l’aide d’un langage
doté d’une syntaxe hiérarchisée et récursive, mais d’une part
elle lui accorde une place spécifique dans un cadre plus vaste,
et d’autre part elle met en doute son hypothèse sous-jacente,
celle de l’explication de la révolution culturelle et linguistique
du néolithique par la mutation d’un gène qui aurait favorisé un
seul individu et se serait répandue dans sa progéniture, laquelle
aurait finalement éliminé les autres sociétés d’hominidés en
raison de sa seule suprématie intellectuelle.
Le débat reste ouvert et il tourne manifestement autour de
2. Stuart Kauffman s’est rendu célèbre en faisant valoir (dans Origins of order, 1993, Oxford
University Press) que la complexité des systèmes et des organismes biologiques s’explique
mieux par l’auto-organisation et une dynamique adaptative que par le processus de sélec-
tion naturelle imaginé par Darwin.
3. R. Logan (2006), « The extended mind model of the origin of language and culture »,
270 N. Gontier, J.-P. van Bendegem & D. Aerts (eds : 149-168), op.cit.
Épilogue
la question de l’intelligence sociale, c’est-à-dire l’aptitude de

l’individu à comprendre et accepter les pratiques différentes
des siennes et à composer avec autrui.
271
Glossaire
BIOLINGUISTIQUE : Discipline adoptant un point de vue biologique

sur la faculté de langage actuellement associée au programme
minimaliste* de N. Chomsky et imputant l’origine du langage
élaboré à une mutation génétique.
BIOLOGIE ÉVOLUTIONNAIRE DÉVELOPPEMENTALE (« Evo-
Devo ») : Composante de la biologie évolutionnaire qui tire parti
des études sur le développement des facultés chez l’enfant pour
imaginer leur émergence dans l’espèce humaine.
BIOSÉMIOTIQUE : Discipline adoptant un point de vue biologique sur
l’exploitation de systèmes de signes par les humains, les animaux
(zoosémiotique) et même les plantes (phytosémiotique).
CHILDES (Système d’échanges de données sur le langage des enfants) : banque
de donnée textuelles élaborée en 1984 pour servir de dépôt de don-
nées sur l’acquisition du langage, couvrant 26 langues à partir de
130 corpus en accès public (http ://childes. talkbank.org/).
CLASSIFICATEUR : Mot grammatical spécifiant dans certaines langues
l’appartenance du nom qu’il accompagne à une classe d’entités,
p.ex. en chinois les objets « qui peuvent être tenus par une main
qui se referme sur une partie de l’objet »1. En français les noms
de quantité comme une douzaine/poignée/brassée/bouchée (~ de N)
entrent dans cette catégorie.
COGNAT : Mot d’une langue A susceptible de partager une origine com-
mune avec un mot d’une langue B peut-être apparentée. Base de la
lexicostatistique*.
COMPÉTENCE (~ grammaticale). Aptitude des locuteurs natifs d’une
langue à porter un jugement sur le caractère grammatical ou pas
d’une phrase et à produire des phrases grammaticales, c’est-à-dire
conforme aux règles syntaxiques de cette langue. S’oppose à per-
formance* dans la théorie de la grammaire universelle*.
1. Cf. https://fr.wikipedia.org/wiki/Classificateurs_en_chinois 273

EXAPTATION : « Adaptation sélective dans laquelle la fonction actuelle-

ment remplie par l’adaptation n’était pas celle remplie initialement,
avant que n’intervienne la pression de la sélection naturelle »2. L’es-
pace buccal, pharyngé et laryngé, originellement destiné aux fonc-
tions de respiration, d’absorption d’aliment et de cris émotionnels,
a fini par accueillir par exaptation la fonction de production de la
parole.
GESTE ARTICULATOIRE : La production d’un son linguistique résulte
d’un geste articulatoire impliquant une disposition particulière de
la langue (corps et pointe), des dents, des lèvres, des joues, du voile
du palais, etc. et l’émission d’un souffle d’air qui franchit ces obs-
tacles (voyelles) ou est plus ou moins entravé (consonnes).
GLOTTOCHRONOLOGIE : Technique de linguistique historique issue
de la lexicostatistique* visant à dater les bifurcations entre lan-
gues d’une même famille.
GOTIQUE : Langue des goths. La Bible de Wulfila (311-383) est le plus
ancien document conservé de l’ensemble des langues germaniques.
On distingue orthographiquement les deux adj. gothique, s’appli-
quant au peuple des goths et gotique, s’appliquant uniquement à
sa langue.
GRAMMAIRE UNIVERSELLE : Théorie linguistique élaborée dans les
années 1960 par Noam Chomsky, selon laquelle tout enfant a un
accès inné à des principes de structuration des langues supposés
universels. Cf. pauvreté des stimulus*.
GRAMMATICALISATION (langue grammaticalisée) : Processus mis en
lumière par A. Meillet au début du xxe siècle et reconnu comme
décisif à la fin du même siècle par de nombreux linguistes : au fil
des siècles les mots se sont rangés dans des classes grammaticales,
et certaines combinaisons de mots très souvent employées se sont
progressivement figées (au point de changer de genre, cf. quelque
chose<féminin> B un [quelque chose] <masculin> ) et les mots grammaticaux
(pronoms, déterminants, conjonctions, prépositions, etc.) ainsi
créés sont les moellons de l’architecture grammaticale de la langue.
274 2. Cf. https://fr.wikipedia.org/wiki/Exaptation

Glossaire
INDOGERMANIQUE : Qualification favorisée par les philologues et lin-

guistes allemands du xixe siècle pour l’ensemble des langues issues
d’une langue-mère probablement proche du sanskrit. Elle a été
détrônée par indo-européen.
INFINITÉ DISCRÈTE : Selon N. Chomsky, les êtres humains sont dotés
génétiquement de l’aptitude à recombiner des unités dotées de sens
en une variété illimitée de structures supérieures, chacune ayant un
sens systématiquement différent. Cette prédisposition permet de
se représenter et d’exprimer verbalement une infinité de structures
emboîtées et distinctes (ou « discrètes »), p.ex. le jardin > le vaste
jardin > le vaste jardin de la maison > le vaste jardin de la maison
d’en face, etc.).
LEXICOSTATISTIQUE : Méthode de classement des langues à partir du
partage de cognats* lexicaux, c’est-à-dire de mots supposés avoir
une origine commune. Cf. glottochronologie*
MONOGÉNÈSE LINGUISTIQUE (hypothèse de la ~) : Hypothèse
selon laquelle toutes les langues présentes et passées du monde déri-
veraient d’une même langue-mère.
MORPHÈME : Unité linguistique minimale dotée à la fois d’une expres-
sion (une chaîne de phonèmes* organisés en syllabes) et d’un
contenu. Le morphème peut être un mot (ex. livre, mais, beau) ou
un constituant d’un mot. Par ex. court-circuiter, verbe composé de
-er, marque de verbe et du nom court-circuit, lui-même décompo-
sable en une tête qui attribue le statut de nom : circuit et un adjectif
dépendant du nom : court.
NEURONE-MIROIR : Neurone qui entre en activité aussi bien à l’exécu-
tion d’une action qu’à sa simple représentation.
PAUVRETÉ DES STIMULUS : Argument de N. Chomsky et de son
école en faveur de la grammaire universelle* : l’apprenti locuteur
n’est pas confronté à une quantité suffisante d’énoncés bien formés
pour prendre conscience des régularités génératives (les combinai-
sons de morphèmes* bien formées) de sa langue maternelle, il doit
donc disposer de principes innés d’organisation des phrases et il lui
reste seulement à identifier les paramètres qui modulent ces prin-
cipes (p.ex. l’ordre dominant tête-membres ou membres-tête dans
les groupes syntaxiques).
275
PERFORMANCE (~ grammaticale) : Production effective par un locu-

teur d’énoncés plus ou moins bien formés selon les règles gramma-
ticales de sa langue maternelle. S’oppose à compétence* dans la
théorie de la grammaire universelle*.
PHONÈME : Unité linguistique minimale généralement dénuée de sens,
constitutive des morphèmes*. Les phonèmes sont organisés en un
réseau d’oppositions (système phonologique) dans chaque langue
et historiquement dans chacun des états de langue successifs. Ce
sont des unités abstraites regroupant des productions plus ou
moins similaires (domaine d’étude de la phonétique ou physiologie
de la parole), mais suffisamment distinctes des autres phonèmes.
POLYGÉNÈSE LINGUISTIQUE (hypothèse de la ~) : Hypothèse selon
laquelle les langues passées et actuelles prennent leur origine dans
plusieurs langues-mères. S’oppose à l’hypothèse de la monogénèse
linguistique*.
PRÉLINGUISTIQUE (communication ~) : Mode de communication à
l’aide de procédés sémiotiques (c’est-à-dire chargés de sens : gestes,
mimiques, productions vocales) antérieurs dans l’histoire de l’hu-
manité ou dans le développement de l’enfant à l’usage de mots
conventionnels, c’est-à-dire arbitraires. La communication pré-
linguistique est essentiellement iconique, c’est-à-dire en relation
immédiate avec une image visuelle ou sonore. Dans les langues
modernes, les idéophones conservent un caractère iconique (cf.
murmurer, susurrer ≠ craquer, crapahuter, éructer)
PREUVE INDIRECTE : Élément de démonstration extérieur au domaine
d’étude étroit mais permettant des inférences dans ce domaine.
Par exemple, nous ne disposons d’aucun moyen direct d’accès
aux représentations mentales et aux capacités d’échanges verbaux
des premiers hommes, mais l’archéologie préhistorique permet
d’énoncer des inférences à partir de preuves indirectes, notamment
la découverte de parures dont l’usage implique une théorie de
l’esprit* et donc un langage élaboré.
PROGRAMME MINIMALISTE : Théorie syntaxique formelle de
N. Chomsky dérivée de la grammaire universelle* en 1995 qui
vise à réduire au minimum le format des transformations de struc-
tures syntaxiques qui permettent de rendre compte de la hiérarchie
276 et de l’ordre des fonctions syntaxiques dans la phrase (par ex. le
Glossaire
niveau de rattachement des deux adverbes dans la phrase Elle est

certainement partie [en toute hâte]).
PROTOLANGAGE : Hypothèse d’un stade intermédiaire entre la com-
munication prélinguistique* et les langues grammaticalisées*.
D. Bickerton fonde cette hypothèse sur son étude de l’émergence
de langues créoles (à Surinam et à Hawaï) à partir des pidgins (des
parlers constitués de combinaisons de mots en l’absence de toute
grammaire) de travailleurs immigrés.
RÉCURSIVITÉ : Propriété d’une structure syntaxique dans laquelle
un groupe peut contenir un autre groupe de même nature. P.ex.
pour les groupes verbaux [Je crois [l’avoir convaincue [de me faire
confiance]]] et pour les groupes nominaux [le magasin [d’articles [de
sport]] [de la place [du marché]]].
MULTI-AGENT (simulation informatique ~) : Simulation informatique
du comportement interactif d’entités de différents types (êtres
humains, robots, processus). Composante de l’intelligence artifi-
cielle destinée à décrire des systèmes complexes, entre autres l’émer-
gence de régularités linguistiques.
SUPERFAMILLE LINGUISTIQUE : Le regroupement de langues en
familles issues d’une même langue-mère (perspective généalogique)
a été engagé à partir de la fin du xviiie siècle pour les langues finno-
ougriennes, sémitiques et indo-européennes. Cette vaste entreprise
linguistique a tiré parti d’un travail philologique considérable. La
superfamille eurasiatique fait par ex. l’hypothèse du regroupement
hypothétique de diverses familles de langues d’Europe et d’Asie
incluant les langues indo-européennes, ouraliennes (par ex. finno-
ougriennes), altaïques (par ex. turques et mongoles) et est-asia-
tiques (par ex. japonais et coréen).
TAXON : « Groupe d’êtres vivants ou fossiles qui ont des traits communs »
(Office québecois de la langue française). Par ex. le loup et le chien
font partie d’un même taxon, celui des canidés, qui se distingue des
félidés (dont les chats) et des ursidés (ours et grands pandas). Ce
terme est applicable au classement des langues sur le plan phonolo-
gique, morphologique ou syntaxique.
THÉORIE DE L’ESPRIT : Aptitude empathique de tout être humain à
se représenter une situation du point de vue d’autrui et donc à
277
comprendre ses émotions et ses intentions. Chez les primates, ceux

qui sont capables de se reconnaître dans un miroir disposent d’une
théorie de l’esprit comparable à celle d’un petit humain d’environ
2 ans.
VOCALISATION : Terme générique regroupant les cris des mammifères
et les chants des cétacés et des oiseaux. Les vocalisations des grands
singes anthropomorphes sont dénuées de syntaxe et invariable-
ment liées à des besoins primaires, mais celles de certaines espèces
d’oiseaux et de cétacés se révèlent non seulement variées, mais sus-
ceptibles de changer et de se combiner, donc dotées d’une syntaxe
minimale.
Bibliographie commentée
(limitée aux ouvrages en français)
BICKERTON Derek (2010), La langue d’Adam, Dunod.

Depuis que D. Bickerton a élaboré en 1981 son « bioprogramme »
destiné à « construire un scénario original de l’émergence du lan-
gage à partir de ses travaux sur les pidgins et de données préhisto-
riques choisies » (N. Journet), ses thèses ont suscité beaucoup de
remous. Dans son seul ouvrage traduit en français, il suppose que
l’aptitude à nommer des objets absents, évoquée comme un trait
décisif du langage structuré par de nombreux linguistes évolution-
naires (Givón, Dessalles et al. 2010, 2016 ou Hombert et Lenclud,
2013), caractérisait déjà le protolangage des hommes archaïques
(Homo erectus/ergaster).
BUICAN Denis (2008), L’Odyssée de l’évolution, Ellipses.
La section « Du langage des singes et des hommes » de cet ouvrage
(pp. 213-244) évoque les expériences de communication entre
hommes et singes anthropomorphes, de manière toutefois plus
rapide que ne le fait J.A. Rondal (2000).
CAVALLI-SFORZA Luigi (1996), Gènes, peuples et langues, Odile
Jacob, Cours au Collège de France).
En combinant son expérience de généticien des populations et celle
de Joseph Greenberg et Merrit Ruhlen, ses collègues linguistes généa-
logistes à l’université de Stanford, l’auteur examine la corrélation
approximative entre le classement des populations et celui des langues
qu’elles pratiquent. Les vagues successives de migrations depuis le néo-
lithique permettent notamment de comprendre les disparités entre les
deux classements et l’existence d’isolats, comme celui du basque.
CAVALLI-SFORZA Luigi (2010), L’Aventure de l’espèce humaine.
De la génétique des populations à l’évolution culturelle, Odile Jacob,
Travaux du Collège de France.
279
DESSALLES Jean-Louis (2000), Aux origines du langage. Une his-

toire naturelle de la parole, Hermès-Sciences
Dan Sperber et Deidre Wilson avaient proposé en 1986 une théo-
rie de la pertinence pragmatique dans les échanges langagiers. Des-
salles entend lui adjoindre un soubassement, celui de la pertinence
primaire, d’ordre informatif, et dont il voit les origines dès Homo
erectus. Celle-ci permet d’assurer une communication « honnête »,
compte tenu du risque de tromperie mis en avant par Merlin
Donald. Selon Dessalles, le protolangage – encore dénué de seg-
mentation thématique et de récursivité – était déjà apte à délivrer
des scènes concrètes à l’aide d’une « protosémantique ».
DESSALLES Jean-Louis, Pascal PICQ & Bernard VICTORRI
(2010), Les Origines du langage, Éditions du Pommier.
L’ouvrage articule l’expérience d’un biologiste, d’un spécialiste de
la théorie de l’information et d’un sémanticien pour fournir une
vision intégrée de l’origine de la faculté de langage. L’entreprise est
développée dans Dessalles et al. (2016)
DESSALLES Jean-Louis, Cédric GAUCHEREL & Pierre-Henri
GOUYON (2016), Le Fil de la vie. La face immatérielle du
vivant, Odile Jacob.
La thèse centrale de l’ouvrage est que « l’être humain a évolué pour
devenir un spécialiste de l’information ». Les pp. 185-212 examinent
les caractères spécifiques du langage humain : la superposition de plu-
sieurs niveaux de codes combinatoires, les assemblages syntaxiques
de mots codés par le locuteur et décodés par l’interlocuteur et la
hiérarchisation des types de langages, du brame du cerf à la langue
humaine caractérisée par une complexification croissante.
EDELMAN Gerald M. (2008), La Biologie de la conscience, Odile
Jacob.
Le neurobiologiste et prix Nobel G. Edelman distingue deux
niveaux de la conscience. La conscience primaire relie la percep-
tion à la mémoire épisodique (l’événement que je vis me rappelle
un événement précédemment vécu). La conscience supérieure tire
parti de catégorisations préalables par un amorçage sémantique
qui implique le langage, par exemple, l’événement que je vis est
la confrontation avec un fauve, c’est un guépard et tout guépard
280 représente un danger.
FRANÇOIS Jacques (2017), Le Siècle d’or de la linguistique en Alle-

magne ; de Humboldt à Meyer-Lübke, Limoges, Lambert-Lucas.
En 1863 August Schleicher, spécialiste de la grammaire comparée
des langues indo-européennes, lit L’origine des espèces de Charles
Darwin sur la recommandation de son collègue biologiste Ernst
Haeckel et engage une correspondance avec Darwin sur sa vision
des langues comme des espèces naturelles, ce qui va produire un
courant de linguistique naturaliste jusqu’à la fin du xixe siècle.
FRANÇOIS Jacques (2018), De la généalogie des langues à la géné-
tique du langage : une documentation interdisciplinaire raison-
née, Louvain, Peeters.
L’ouvrage articule trois questionnements, celui sur l’origine et le
destin des langues, notamment de celles dénuées d’écriture, celui
de l’émergence et de l’évolution de la faculté de langage et celui
de la genèse de la grammaire par la transformation de mots lexi-
caux (par exemple, ceux désignant des parties du corps et des phé-
nomènes naturels) en mots grammaticaux (c’est-à-dire des verbes
auxiliaires, des déterminants, des conjonctions) selon des « schémas
de grammaticalisation » très généraux.
HOMBERT Jean-Marie (dir. 2005), Les Origines du langage et des
langues, Fayard.
Ce qui est en jeu dans cet ouvrage collectif et qui impose une
approche interdisciplinaire, c’est le rapport du langage au temps
dans ses différentes granulations (temps biologique, historique et
individuel). À noter en particulier le remarquable chapitre 5 de
Christophe Coupé et Jean-Marie Hombert, « Les premières traver-
sées maritimes : une fenêtre sur les cultures et les langues de la pré-
histoire », qui raisonne sur la planification de la traversée du détroit
entre la Nouvelle-Guinée et le cap York au nord-est de l’Australie
pour conclure que les hommes qui ont franchi ce détroit il y a
environ 55 000 ans possédaient un langage suffisamment structuré
pour pouvoir se représenter des futurs possibles et organiser leur
expédition en vue de se donner les meilleures chances de réussite.
HOMBERT Jean-Marie & LENCLUD Gérard (2013), Comment
le langage est venu à l’homme, Fayard.
Dans un cadre d’anthropologie linguistique, J.-M. Hombert et
G. Lenclud, discutant les travaux de nombreux chercheurs de 281
différentes disciplines, considèrent, en accord avec notamment

T. Givón, J. Hurford et J.-L. Dessalles, que le grand tournant de la
communication parlée s’est produit quand des hominidés sont par-
venus à abattre « la barrière de l’ici et du maintenant » et à « com-
muniquer sur des choses qu’ils n’avaient pas sous les yeux ».
LANGANEY André (2000), La Philosophie… biologique, Belin.
Cf. p. 80-89 sur l’incapacité des grands singes anthropomorphes à
saisir la « double articulation » du langage (les deux faces signifiante
et signifiée des signes linguistiques et la composition des signes à
partir de combinaisons bien formées de leurs constituants pri-
maires, les phonèmes ou graphèmes, et des phrases à partir de com-
binaisons bien formées des signes) : «… grâce au langage à double
articulation des signes et des sens, le moins doué au départ acquiert,
dès l’âge de deux ans, des capacités cognitives qui dépassent celles
de n’importe quel autre animal adulte » (p. 89).
OUDEYER Pierre-Yves (2013), Aux sources de la parole : Auto-organisation
et évolution, Odile Jacob.
L’auteur est un spécialiste de robotique qui a développé une théorie
informatique de l’auto-organisation des syllabes dans l’esprit humain,
dans le prolongement de la thèse de Bart De Boer sur l’auto-organi-
sation des systèmes de voyelles. Dans les deux cas la modélisation de
l’émergence de ces systèmes fait l’économie des règles universelles de
la phonologie générative défendue par N. Chomsky.
PINKER Steven (2008), L’Instinct du langage, Odile Jacob.
L’ouvrage de Pinker, paru en anglais en 1994, défendait une vision
dite « nativiste » ou « innéiste » de la faculté de langage, c’est-à-
dire la disponibilité dans l’esprit de l’apprenti locuteur de principes
logico-linguistiques susceptibles de l’aider à repérer les paramètres
spécifiques de la langue dont il saisit des bribes. Il cite, par exemple,
le système distinctif des voyelles et des consonnes ou la distinction
entre des classes de mots et leur ordre habituel dans la phrase. Cette
thèse inspirée de la grammaire générative de N. Chomsky a été
remise en cause au début du xxie siècle par des simulations infor-
matiques (voir Oudeyer, 2013) qui suggèrent que les langues ont
émergé par auto-organisation et que les principes qui permettent
à l’enfant de classer l’univers qui l’entoure sont d’ordre cognitif et
non linguistique.
282
REBOUL Anne (2007), Langage et cognition humaine, Presses Universi-

taires de Grenoble.
Pour l’auteure, spécialiste de philosophie du langage et de prag-
matique linguistique, l’être humain a développé au cours de la
phylogenèse une préférence pour la perception globale alors que
l’animal concentre son attention sur la perception locale. C’est ce
qui a permis le filtrage des impressions perceptives (les percepts) en
concepts. À partir d’un certain amoncellement de concepts, ceux-ci
n’ont pu s’organiser en mémoire que par leur fixation sous forme de
mots partagés par une communauté de locuteurs.
RONDAL Jean Adolphe (2000), Le langage : de l’animal aux origines du
langage humain, Mardaga.
Le chapitre 4, « Origines du langage humain » constitue une bonne
synthèse de l’état des connaissances et de la collaboration interdis-
ciplinaire au tournant du xxie siècle. Il fournit une mine d’infor-
mations sur la capacité langagière des dauphins et celle des phoques
à crinière (pp. 125-36), dont la capacité syntaxique en réception
gestuelle est analogue.
RUHLEN Merrit (1997), L’Origine des langues : sur les traces de la
langue mère, Belin.
M. Ruhlen, disciple et collègue de Joseph Greenberg à l’université
de Stanford, poursuit dans ce livre une entreprise à deux niveaux :
au premier il défend la thèse des superfamilles de langues, tout
comme Georg Starostin, au second degré il cherche à aller encore
plus loin en proposant une méthode d’identification de 27 racines
partagées par ces superfamilles et suggérant une langue mère. Sur
ce dernier point, il n’a pas rencontré d’adhésion car il est obligé de
supposer des variations des racines, notamment des permutations
de consonnes, dont aucune règle générale ne peut rendre compte.
283
Table des matières
Introduction 5
Chapitre 1
L’émergence de la parole 11
Qui ? 11
Quand et où ? 12
Comment ? 14
Pourquoi et pour quoi faire ? 15
Les gestes articulatoires à la source de la parole 15
Les sons de la langue forment système 19
Les mouvements cycliques de la mâchoire
ont produit des syllabes 25
La parole dérive-t-elle du geste ? 30
Chapitre 
Les conditions cognitives
de la genèse du langage 35
Penser le monde avant et avec le langage 38

La catégorisation prélinguistique chez le jeune enfant 40
Une perception globale de l’espace naturel et social 42
L’effet des extensions métaphoriques 44
Le langage comme réseau de réseaux 47
Des motivations concurrentes ou coalisées 50
Le rôle des formules figées 58 285
Chapitre 
Le substrat génétique
de la faculté de langage 63
La mutation de certains gènes a affecté l’aptitude

au langage des premiers hommes 80
Genèse du langage et culture symbolique 83
Édification de la syntaxe : entre architecture et bricolage 86
Quand les populations migrent,
les langues se diversifient 90
Évolution génétique et évolution culturelle
de l’espèce humaine 94
L’esquisse d’une cartographie des aires
d’origine et d’implantation des grandes migrations
du néolithique 96
Les migrations d’Homo sapiens 102
Une illustration de la corrélation incertaine
entre familles de langues et populations 103
Chapitre 
Le point de vue des psychologues
et des anthropologues évolutionnistes 107
Les grands jalons de l’évolution de l’esprit humain 110

Langage et cohésion sociale 113
Homo est devenu sapiens en se projetant dans l’avenir 118
La découverte du langage éclairée par son apprentissage 124
L’émergence de la syntaxe selon Talmy Givón 140
À la recherche d’indices archéologiques 143
286
Table des matières
Chapitre 
La genèse du langage humain selon
la sémiotique, la philosophie et l’informatique
évolutionnaires 151
Comment le sens vient à l’esprit 152

À l’origine de l’épistémologie évolutionnaire 157
L’apport des simulations « multi-agents » 162
Chapitre 
Homo symbolicus,
le manipulateur de symboles 179
Les trois dimensions du langage humain 180

Sans sélection relâchée, pas de langage humain 188
Comment l’évolution culturelle a pu déboucher
sur une assimilation génétique 195
Chapitre 
L’origine des classes de mots
et de leurs combinaisons 203
L’émergence des classes de mots 204

L’émergence des mots grammaticaux 208
De la syntaxe à la morphologie et vice-versa 211
Le destin instable de la morphologie des langues 216
Le classement des langues 219
Des structures néanmoins universelles 222
287
Chapitre 
Les méthodes d’investigation
de la généalogie des langues 231
La famille indo-européenne et la méthode

historico-comparative 232
La généalogie mystérieuse des langues
sans tradition écrite 240
Les superfamilles existent-elles ? 247
La démarche reconstructive de Georg Starostin 251
Des algorithmes à l’assaut de la famille linguistique
indo-européenne 254
La généalogie des langues peut-elle encore faire rêver ? 260
Épilogue
En quoi la conception du langage comme un système
adaptatif complexe éclaire-t-elle son évolution ? 267
Glossaire 273
Bibliographie commentée 279
Achevé d’imprimer en janvier 2018 par CPI Firmin Didot

Dépôt légal : premier trimestre 2018

Jacques François - La Genèse Du Langage Et Des Langues-Sciences Humaines Éditions (2017)

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Jacques François - La Genèse Du Langage Et Des Langues-Sciences Humaines Éditions (2017)

Transféré par

Droits d'auteur :

Formats disponibles

En application de la loi du 11 mars 1957, il est interdit de

© Sciences Humaines Éditions, 2017

En ce début de xxie siècle, en dépit de la disparition irrémé-

les linguistes se sont ainsi demandé si l’albanais était une langue

agents* multiples (représentant un locuteur et son interlocuteur,

nouvelle, celle de combiner logiquement des représentations

TRAITS ± UNIVERSAUX TRAITS PARTICULIERS

lexiques véhiculant ces concepts

voies dominantes inventaire des mots et des

constitution des langues à partir

Les chapitres 1 à 5 qui suivent sont centrés sur l’émergence

que faculté universelle et la genèse des langues particulières, à

Les mots suivis d’un astérisque sont explicités dans

S’interroger sur les conditions et les modalités de l’émer-

gues1 estiment que si ces grands singes anthropomorphes ne

12 1. Notamment Klaus Zuberbühler de l’université de Neuchâtel.

veaux migrants du genre Homo sapiens. Il est difficile actuelle-

L2 en employant les mots de L2 pour déclarer : L’orage menace,

2. Les langues dites polysynthétiques, notamment amérindiennes, pratiquent l’agglutination

tués de morphèmes placés dans un ordre différent (c’est, par

Pourquoi et pour quoi faire ?

Les gestes articulatoires à la source de la parole

de siècle de distance, qui restent actuellement en concurrence.

6. N. Chomsky & M. Halle (1968), The Sound Pattern of English. MIT-Press.

atome Na (sodium) Q /ba/ syllabe

1- Le nombre des électrons varie en fonction de l’ionisation.

Cette organisation hiérarchique assure que – sauf en cas

tions de la motricité orale à la succion, au léchage, à la mas-

Les sons de la langue forment système

Pour le locuteur débutant, les sons constitutifs de signes

lation parfaitement distinctive). En français, à moins que le

Les phonéticiens identifient une succession de points

La figure11 ci-dessous, qui représente la vue du côté droit de la

Les points d’articulation

Pour les consonnes postérieures, on se contente de noter

22 11. Source : http://w3.uohprod.univ-tlse2.fr/UOH-PHONETIQUE6LE/

consonnes antérieures en revanche, on note les deux points

Les chercheurs de Grenoble ont donc raison de parler de

C’est le système vocalique le plus simple

Ce système à quatre voyelles présente une

Dans le principal système à cinq voyelles,

12. Le tableau ci-dessous est un fragment du tableau 5 de N. Vallée, L.J. Boë et

Le premier système à six voyelles est

Le principal système à sept voyelles est

Le premier système à huit voyelles résulte

Enfin le premier système à neuf voyelles

Les mouvements cycliques de la mâchoire ont

13. N. Chomsky & M. Halle (1968), op.cit., note 6. 25

notamment Michael Studdert-Kennedy et Peter MacNeilage,

tique, car les patterns de formation des syllabes observés dans

ALIMENTAIRE RESPIRATOIRE PHONATOIRE ARTICULATOIRE

Les trois systèmes de contrôles moteurs à l’origine

le risque nouveau de s’étrangler, c’est-à-dire de laisser passer

Les syllabes successives tendent à être identiques dans le babil,

rieurs à la production de chaînes de protosyllabes (voir plus

La parole dérive-t-elle du geste ?

tuelle et de l’expression faciale15.

15. Notamment J.Vauclair, T. Givón, M.Corballis et R.Dunbar. 31

Corballis livre une observation sur l’acquisition des apti-

une forme élémentaire de la division du travail16.

susceptibles de se distinguer suffisamment pour former des

Il y a une vingtaine d’années, John Maynard-Smith et

1 de la réplication des molécules aux populations de molécules com-