Vous êtes sur la page 1sur 296

BÉNÉDICTE DE BOYSSON-BARDIES

COMMENT LA PAROLE
VIENT AUX ENFANTS

DE LA NAISSANCE JUSQU'À DEUX ANS


© ÉDITIONS ODILE JACOB, AVRIL 1996
15, RUE SOUFFLOT, 75005 PARIS
INTERNET : http://www.odilejacob.fr
ISBN 978-2-7381-7346-1
Pour Hadrien, Charlotte, Geoffroy, Antoine, Benoît, Martin, Clémence et
Guillaume.

Ainsi que pour tous les petits enfants qui m'ont conviée à partager leur
langage.
Ce livre trouve son origine dans une réflexion commencée il y a
trente ans au Centre d'Étude des Processus Cognitifs et du Langage. Je
ne saurais citer tous ceux qui par leur savoir, leurs idées et leur amitié
ont accompagné ma démarche. J'ai une dette envers François Bresson
et Jacques Mehler qui m'ont initiée aux sciences cognitives. De
nombreuses recherches citées dans ce livre ont bénéficié des
connaissances et de la collaboration de M. Vihman, P. Hallé, N. Bacri,
C. Durand et L. Sagart ainsi que de collègues français, suédois ou
américains fascinés comme moi par le développement de l'enfant. Par
leurs idées et leurs travaux, M. Vihman, P. MacNeilage, P. Jusczyk,
V. Valian, S de Schonen et J. Bertoncini ont contribué à organiser ce
domaine de recherche. Les discussions avec eux m'ont beaucoup
apporté.
Je voudrais remercier de leurs suggestions et commentaires ceux qui
ont bien voulu lire les différents chapitres de ce livre : P. Hallé,
E. Dupoux, C. Jakubovicz, S. Fisher, K. O'Regan. Je remercie
également J. Blamont pour sa relecture attentive.
Catherine Durand a apporté toutes ces dernières années son aide
aussi bien pour les études avec les enfants que lors de la rédaction de
ce livre. Qu'elle en soit particulièrement remerciée. Que s'exprime ici
notre gratitude envers les nombreux parents et éducateurs des crèches
et des hôpitaux sans lesquels nous n'aurions pu poursuivre nos
recherches auprès des enfants. L'hospitalité de l'EHESS m'a permis de
mener à bien ce travail dans une ambiance à la fois studieuse et
agréable.
INTRODUCTION

« Il importe donc de s'interroger sur la place qui revient


aujourd'hui encore au langage dans la définition de l'homme. »
CLAUDE HAGÈGE

« C'est le langage qui enseigne la définition de l'homme. »


ROLAND BARTHES

Tous les petits enfants apprennent à parler. Cette tendance


naturelle à acquérir la parole est un « don » inscrit dans le
patrimoine génétique que nous recevons en tant qu'être humain.
Seuls des handicaps physiques ou psychologiques extrêmement
sérieux peuvent prévenir le développement de cette
merveilleuse capacité qui signe la grandeur et la singularité de
l'homme.
Mais quel est ce don ? En quoi consiste-t-il ? Quel est le rôle
de l'environnement dans son épanouissement ? Que « sait »
l'enfant avant de parler ? Que lui apporte la parole des autres ?
Telles sont les questions qui surgissent lorsque l'on s'interroge
sur la façon dont la parole vient aux enfants. Seuls les tout
petits enfants qui se préparent à parler ou prononcent leurs
premiers mots peuvent ici nous aider à comprendre. Ce livre
repose sur notre dialogue avec eux.

Le don de parole
« Prononce-t-il déjà ses premiers mots ? » Tous les parents
d'enfants d'un an se sont entendu poser cette question. Selon de
nombreuses traditions, le mot est reconnu comme geste créateur
par excellence. Dans l'Orient méditerranéen, c'est sur la
puissance du verbe que l'homme a fondé sa représentation du
monde : « J'ai créé toutes les formes avec ce qui est sorti de ma
bouche alors qu'il n'y avait ni ciel ni terre », dit le dieu égyptien
Ptah. Le monde apparaît alors comme illuminé par ce principe
de la création : mot et chose ne sont que deux aspects
correspondant à une même pensée créatrice.
Dans le livre de la Genèse, même idée. « Au commencement
était le Verbe. » Au début de chaque jour, la seule parole de
Dieu fait jaillir du néant ce qui n'est pas. Jusqu'au dernier des
six jours où Dieu dit : « Faisons l'homme à notre image. »
L'homme à son tour pourra « dire » et assurera ainsi sa
prééminence sur tous les animaux.
La puissance créatrice ou révélatrice du mot se retrouve dans
les contes de notre enfance. Il faut connaître le mot magique
pour que s'opère l'enchantement, pour accéder à la possession
de l'objet du désir. La connaissance du mot ouvre la porte du
monde mystérieux qui recèle les trésors : « Sésame ouvre-toi ! »
Sans le mot, on ne peut entrer dans le monde du savoir et du
pouvoir. Ainsi, mythologiquement créé par le verbe, l'homme
n'en finit pas de s'en rapporter à la valeur créatrice de la parole.
Aujourd'hui, il n'est que de voir l'influence de l'écriture et l'aura
qui entoure les romanciers pour constater qu'a perduré et que
perdurera l'essence magique des mots. Tant il est vrai qu'avec ce
don de parole, l'homme a créé un monde mental qui enrichit la
communication avec les autres, alimente la pensée intérieure et
bouleverse les rapports avec le temps. Avec un passé retrouvé et
un futur imaginé.

Un don complexe
La parole est l'activité du sujet parlant, c'est l'aspect de
réalisation du langage, dont elle n'est pas dissociable. Les
définitions du Petit Robert et du Larousse ne séparent pas
parole et langage. Si, pour le premier, le langage est « la
fonction d'expression de la pensée et de la communication entre
les hommes, mise en œuvre par les organes de la phonation
(parole) ou par une notation au moyen de signes matériels
(écriture) », pour l'autre, la parole est aussi « l'expression
verbale de la pensée ». Ces définitions mettent en évidence la
double fonction du langage : fonction d'expression de la pensée
et fonction de communication. Elles laissent en revanche dans
l'ombre sa nature et le fait qu'il est un système. Or, pour
comprendre le développement du langage et de la parole, il faut
d'abord rappeler avec Saussure1 que « tout propos sur l'essence
du langage commence par énoncer le caractère arbitraire du
signe ». Le mot « chien » et le mot « dog » désignent un même
animal dans deux langues différentes. Ni l'un ni l'autre de ces
mots n'a de rapport physique avec l'apparence ou avec un
attribut de l'animal, contrairement par exemple à l'onomatopée
« wouah wouah ». C'est pourquoi on dit que le mot est un signe
arbitraire, lié au sens. Il faut aussi remarquer que les langues
sont des systèmes combinatoires dont les règles organisent la
combinaison des éléments (phonèmes*, mots) en expressions
linguistiques. Toutes les langues parlées dans le monde, et il y
en a des milliers, reposent ainsi sur un système de signes
agencés selon des règles qui leur sont propres. Toutes les
langues ont en commun certains principes fondamentaux dont
nous donnerons quelques exemples : toutes sont fondées sur des
phonèmes qui se combinent en syllabes, toutes ont des
équivalents de noms et de verbes qui se combinent en
syntagmes et en phrases non pas par simple alignement, mais
selon une structure en « arbre ». Ces éléments, parmi d'autres,
représentent les principes fondamentaux pour lesquels notre
esprit est dessiné, ceux qui traduisent notre aptitude génétique
au langage. Par la suite, chaque langue sélectionne et organise
différemment ces éléments de base. Ainsi la séquence de sons
(phonèmes) « z » et « d », « zd » se retrouve-t-elle dans
certaines langues mais est exclue en français ; un ordre de
constituants de phrase sujet-objet-verbe (l'enfant la soupe
mange) est correct en birman mais incorrect en français ; les cas
sont indiqués par des flexions en russe et par des prépositions
en français, etc. Les langues déploient des procédures
extrêmement variées pour mettre en œuvre les principes
fondamentaux universels auxquels Noam Chomsky2 a donné le
nom de Grammaire Universelle (G.U).
Les pensées s'expriment à travers ce système constitué qu'est
le langage. Système pour transmettre de l'information, il est
d'abord un système de représentation qui permet de
« manipuler » nos pensées et nos connaissances sur le monde. Il
s'actualise par la parole. Si les hommes étaient de purs esprits,
ils se transmettraient directement leurs pensées mais, corps
autant qu'esprit, ils doivent recourir à un support physique pour
communiquer. L'art de communiquer nos idées dépend moins
des organes qui servent à cette communication que de la faculté
propre à l'homme d'avoir un langage fondé sur une
combinatoire de signes arbitraires – le langage des signes
utilisés par les sourds l'atteste. La parole reste cependant le
vecteur premier du langage.
Peut-on donc confondre langage et pensée ? Il est possible de
penser sans langage, en images mentales. Celles-ci se laissent
manipuler dans l'esprit sans le recours aux mots. Ainsi pouvons-
nous parfois penser des figures géométriques, des itinéraires
d'un lieu à un autre, ou des créations artistiques. Quant aux
bébés, ils forment des concepts avant de connaître des mots.
Don de l'évolution
Le langage est un don, c'est un cadeau de l'évolution.
Phylogénétiquement, l'homme ne préexiste pas au langage. Nos
cousins primates possèdent des systèmes visuels et auditifs
semblables aux nôtres, ils forment des sociétés organisées et ont
des systèmes de communication complexes. Ainsi, le singe
« vervet » avertit ses congénères d'un danger grâce à des cris
qui précisent si l'agresseur est un aigle, un serpent ou un
guépard. En ce qui concerne les grands singes, on a des doutes
sur leurs possibilités d'acquérir des fragments de langage, et ils
ne possèdent en tout cas pas de langage articulé. Phénomène
subtil, abstrait et culturel, le langage s'est sans doute ancré
tardivement dans le système biologique humain. On pense que
c'est entre l'Homo habilis et l'Homo sapiens, notre ancêtre le
plus sûr, que s'est inscrite dans le code génétique de l'espèce
cette aptitude à la parole. Elle a alors fondé l'univers biologique
et mental de l'homme.
L'appareil physique permettant la parole articulée a évolué
avec la station debout. Celle-ci a permis aux systèmes
respiratoire et phonatoire de prendre une orientation verticale.
Dans le même temps, la partie postérieure du système
articulatoire devenait verticale, mais non la partie antérieure ; il
en résulte ce fameux tube « coudé » qui distingue l'homme des
autres primates dont le tube vocal est diagonal. Cette évolution
a eu pour conséquence d'augmenter considérablement la
possibilité de produire des sons nouveaux et d'en accroître le
rythme et le contrôle. Mais tout autre est la question de savoir
comment organiser les possibilités phonatoires ainsi dégagées.
L'accroissement du volume cérébral et son remodelage ont
accompagné ces changements. C'est à partir d'eux
essentiellement que doivent s'imaginer les séquences de
changements génétiques qui ont abouti à inscrire dans notre
code génétique l'aptitude au langage parlé.

Le don de parole et l'enfant


Environ deux ans après sa conception, une année après sa
naissance, l'enfant a dit son premier mot. La faculté et la
rapidité avec lesquelles il apprend à parler ont toujours fasciné
les hommes qui parfois oublient de s'en étonner tant cela est
habituel. Et pourtant, quel prodige ! Produire des mots, les
combiner en des phrases originales, comprendre les propos des
autres sont des prouesses bien plus remarquables que d'autres,
accomplies plus tardivement et avec plus de difficultés par les
enfants. Deux et deux font quatre semble une notion simple.
Elle ne sera pourtant consciemment accessible à l'enfant que
bien après qu'il aura prononcé des centaines de phrases
différentes. Avant de savoir coordonner les gestes de ses mains
pour rattraper une balle, l'enfant comprendra à peu près toutes
les phrases que lui adresse l'adulte, et il aura pratiquement
maîtrisé sa langue avant de savoir nouer les lacets de ses
chaussures.
Les hommes ont toujours eu l'intuition que cette aptitude de
l'enfant à acquérir si rapidement le langage ne pouvait provenir
que d'un « don ». Déjà dans les textes de gnostiques d'Égypte, il
est présenté comme un don de Dieu préexistant à son
acquisition. Bien plus tard on parlera de « don de la raison ».
Dans son passionnant Discours physique de la parole publié en
1704, Géraud de Cordemoy3 écrit : « Je désire seulement qu'on
observe une vérité très importante que nous découvre cet
exemple des enfants, qui est que dès la naissance ils ont la
raison tout entière, car enfin cette manière d'apprendre à parler
est l'effet d'un si grand discernement et d'une raison si parfaite
qu'il n'est pas possible d'en concevoir de plus merveilleux […].
Il est évident que la raison tout entière est dès le
commencement puisqu'ils apprennent parfaitement la langue du
pays où ils naissent et même en moins de temps qu'il ne le
faudrait à des hommes déjà faits. »
Après une courte période d'un siècle, au cours duquel la
psychologie anglo-saxonne présente l'acquisition du langage
comme le fruit exclusif de l'apprentissage et de l'imitation, il a
été reconnu que son développement ne pouvait être réduit à un
mécanisme de liaisons élémentaires entre des images ou des
sensations et des sons. En 1965, Noam Chomsky4 démontre
l'impossibilité d'acquérir le langage avec des approches de ce
type. La rapidité de cette acquisition, la régularité de son
développement malgré des conditions de réception loin d'être
idéales, sa relative indépendance aux différences d'intelligence
et d'expériences entre enfants, la créativité et la particularité des
phrases des enfants, tout cet ensemble de faits concourt à rejeter
les approches théoriques fondées exclusivement sur
l'apprentissage de formes et sur l'imitation. Seul un dispositif
inné puissant peut permettre à l'enfant d'extraire, de la parole
adulte, le modèle de sa langue. À partir de ce constat, Noam
Chomsky structure scientifiquement l'intuition immémoriale
d'un « don » présent à la naissance. Il affirme que les nouveau-
nés possèdent « un équipement génétique puissant incluant une
connaissance implicite des principes universels qui structurent
les langues ». Cet équipement consiste en un dispositif
universel qui fait partie du cerveau humain, et qu'il nomme
« grammaire universelle ». Cette grammaire est le schéma de
base qui fonde les grammaires de toutes les langues humaines.
Une « circuiterie mentale » inscrite dans les contraintes
biologiques présidant au développement du cerveau de l'enfant
sous-tend ce schéma et lui permet de sélectionner les sons, les
signes et les combinaisons de signes de la langue parlée dans
son environnement.
Pourquoi s'étonner de connaissances implicites chez le
nouveau-né ? Toutes les espèces animales possèdent des
connaissances inscrites dans leurs système cognitif spécifique.
Celles de l'hirondelle lui permettent de bâtir un nid et de
retrouver la route de sa migration, les connaissances implicites
propres à l'araignée font d'elle une remarquable tisseuse de toile
et celles de l'abeille lui permettent d'être une architecte.
Comment a-t-on pu penser que le cerveau de l'être humain était
une ardoise vierge ?
Faut-il parler pour autant d'un « instinct » du langage ?
Charles Darwin5 écrivait dans La Descendance de l'homme que
« le langage n'est certainement pas un véritable instinct car tout
langage doit être appris. Il diffère toutefois beaucoup de tous les
arts ordinaires en ce que l'homme a une tendance instinctive à
parler, comme nous le prouve le babillage des jeunes enfants,
tandis qu'aucun enfant n'a de tendance instinctive à brasser ou à
faire du pain ». Cette « tendance instinctive » s'appuie sur un
programme d'acquisition qui se développe à partir d'aptitudes
inscrites dans le code génétique de l'enfant.

Sous quelle forme ?


Cette « circuiterie mentale » inscrite dans le patrimoine
génétique de l'enfant se confond-elle avec l'ensemble des
capacités cognitives générales propres aux humains ? À
première vue le langage nous semble indissociable des autres
facultés supérieures. Il est cependant remarquable de voir que ni
le retard mental ni certaines privations importantes en qualité et
en quantité de l'environnement linguistique ne sont des
conditions suffisantes pour entraîner l'incapacité d'acquérir le
langage. Certains cas d'enfants ayant des retards intellectuels
graves d'origine génétique montrent que peuvent être
conservées des capacités linguistiques. En revanche, celles-ci
peuvent être atteintes sélectivement chez des enfants ayant des
facultés intellectuelles intactes. Le système, ou sous-système du
langage, serait un « module ». Ce terme a été défini par Jerry
Fodor6 qui présente notre appareil psychique comme un
système modulaire, c'est-à-dire un système composé de sous-
systèmes fonctionnels spécifiques, ayant chacun une base
neurale distincte. Ces modules sont caractérisés entre autres par
une certaine autonomie de fonctionnement et de
développement. Le langage est un de ces modules spécialisés. Il
« prend » pour objet l'information linguistique, sonore ou
visuelle et la traite jusqu'au moment où elle est prise en charge
par un système central qui, lui, est encyclopédique en ce sens
qu'il traite toutes les informations issues des modules
spécialisés. Apprendre et traiter la parole repose ainsi sur des
mécanismes précis, spécifiques et jusqu'à un certain point
indépendants des connaissances générales.
Certes, cette idée de la modularité du langage a des
adversaires acharnés. Pour ceux-ci, le développement du
langage est étroitement lié au développement cognitif général
dont il est un des aspects. Sans entrer dans ce débat, il faut noter
d'une part que les discordances entre le développement du
langage et le cours des acquisitions cognitives révèlent bien une
relative indépendance entre les deux. Mais d'autre part que les
enfants ne sont capables de se servir du langage que parce qu'ils
ont commencé à comprendre ce qui se passe autour d'eux et en
eux, ce que font les gens, ce que sont les choses et ce qu'ils
ressentent. Un minimum dans ce domaine est requis. C'est en ce
sens que l'utilisation du langage ne serait pas indépendante du
reste de la cognition.

Un système interactif
L'enfant naît donc avec la connaissance implicite des
principes universels qui structurent le langage, et avec un
programme génétique d'acquisition. Mais il est indispensable,
pour que ce programme se déroule, que l'enfant entende parler.
Les nouveau-nés humains doivent acquérir leur langue. Sans
informations linguistiques, les aptitudes initiales resteraient non
accomplies.
Quelles sont les conditions initiales majeures pour le
développement du langage ? D'abord la possibilité d'organiser
les informations sensorielles. L'enfant doit distinguer puis
extraire les sons linguistiquement pertinents, ceux que
produisent les adultes en parlant. L'aboiement du chien de la
maison n'est pas un bruit linguistiquement pertinent,
contrairement à la voix du père disant « Bonjour » à un ami.
Seules des prédispositions à traiter les caractéristiques
acoustiques des sons qui constituent la parole peuvent permettre
une rapide organisation de sa perception. La parole se présente
comme une onde continue : l'enfant doit donc, dans un
deuxième temps, la segmenter, la catégoriser et en organiser les
variations selon leur valeur de signification. Les partitions
comme les catégorisations sont des attributs du langage que
l'enfant doit organiser pour réussir à parler. La troisième
condition porte sur le sens. Il s'agit de reconnaître, dans la
parole des autres, l'intention de signifier.
Chacune de ces compétences se déclenche en suivant une
série d'étapes réglées par une horloge biologique dès avant la
naissance. La première étape est constante chez tous les enfants.
Mais au fur et à mesure que le traitement de la parole se fait
plus complet, et par là plus complexe, la variété des réponses
disponibles se fait plus grande. L'individualité de l'enfant se
marque ainsi dans son rapport au langage mais le conduira sans
encombre à la connaissance de sa langue.
La première question à laquelle les psycholinguistes ont
voulu répondre, nous le verrons, est celle de la réalité des
mécanismes « innés ». Puis il s'est agi de voir la nature de ces
mécanismes, la façon dont ils opèrent, et les conditions
nécessaires et suffisantes de leur interaction avec un
environnement, sans oublier les formes de cet environnement.
Ces derniers points mettent en jeu le rôle de l'expérience avec
les langues.
La parole est donc pour l'enfant le support de l'information
qu'il reçoit sur la structure de sa langue. Mais elle a une autre
fonction essentielle, et qui se présente souvent en premier à
l'esprit, celle de communication.

Fonction de communication
Chez les êtres vivants, les formes de communication sont
diverses : gestes, regards, cris, signaux. Tous les sens peuvent
servir à donner des informations. La communication ne peut
donc être confondue avec la faculté de langage. Nous avons vu
que, expression de la pensée à travers un système structuré, le
langage, est bien plus qu'un moyen privilégié de communiquer.
Mais le langage parlé est aussi le système de communication
spécifique de l'espèce humaine, système dont la puissance et
l'efficacité ont bouleversé les possibilités de communication
entre les membres de la communauté humaine. Cependant les
hommes ont conservé d'autres moyens de communication : les
expressions de physionomie, les mimiques, les gestes des mains
et du corps, les figurations, etc. C'est à travers certains d'entre
eux que, bien avant de savoir parler, le nourrisson reçoit des
informations de son entourage et lui en transmet. Dès la
naissance, les regards, les odeurs, les sons, les caresses forment
un univers plein de significations auquel le nourrisson est
particulièrement sensible. L'enfant vit ainsi dans un contexte de
communication nécessaire à sa survie. Pour se développer
normalement, il doit non seulement recevoir des informations,
mais aussi désirer en communiquer. Il le fait d'abord grâce à son
corps, son regard et son sourire.
S'il entend parler, lui ne parle pas. L'écoute de la parole
adulte lui donne deux modèles. Le premier est simplement un
modèle de comportement : l'enfant voit que parler fait partie des
procédés de communication. Le second est le modèle de la
langue. Le langage reçu lui fournit les éléments qui
caractérisent la structure de la langue à apprendre ainsi que son
vocabulaire. Ces deux modèles doivent être fournis par
l'entourage social. Certes, il n'existe pas d'expériences dans ce
domaine pour affirmer que la communication entre personnes
physiques est indispensable à l'acquisition du langage,
qu'entendre parler à la radio ne suffit pas, mais tous les indices
le montrent. La communication vocale entre êtres humains
éveille et maintient chez le bébé le « désir » de parler. Il en va
de même pour la communication gestuelle dans le langage des
sourds-muets. Désir d'échanger des affects, des besoins et des
demandes, désir de s'inclure dans le groupe familial ou le
groupe des pairs par le langage, désir aussi de pouvoir dire et
entendre dire le monde qu'il découvre. Privés d'écoute du
langage, les « enfants sauvages » auraient perdu jusqu'à la
capacité d'apprendre à parler. Privés d'un minimum de soutien
social et linguistique, les petits enfants « mis au placard » sont
susceptibles d'avoir des carences qui parfois empêchent la mise
en place d'un langage normal. Cependant nous verrons que les
mécanismes de développement de la parole sont robustes et
résistent souvent à des situations extrêmes. Le désir de
communiquer n'est pas, en tant que tel, primordial dans la mise
en place des mécanismes de parole. Certains enfants autistes le
donnent à penser, qui parlent mais n'utilisent pas leur langage
pour communiquer. Ils articulent, sous forme de phrases
stéréotypées, des expressions formellement correctes mais qui
semblent dénuées d'intention de communiquer. Ils montrent
ainsi qu'un certain rejet ou une certaine incapacité à employer
des formes de communication n'entravent pas automatiquement
la mise en place des mécanismes de parole, bien qu'ils en
inhibent la fonction.

De l' infans à l'enfant


L'entrée du bébé dans le monde du langage est une étape
essentielle. Selon le sens étymologique du mot latin « in-fans »
(in privatif et fari parler), l'enfant devrait être celui qui ne parle
pas, mais ce sens n'a pas été conservé en français. Ce mot infans
s'opposait en latin à un autre terme, puer, qui désignait l'enfant
plus âgé. En anglais, la distinction subsiste entre infant, utilisé
pour le nourrisson et le bébé dans sa première année, et le terme
child utilisé pour l'enfant plus âgé. Deux termes pour désigner
deux âges : celui du non parlant et celui du parlant.
Notre propos, en suivant des enfants depuis leur naissance
jusqu'à la production de phrases, est d'essayer de montrer
comment les capacités initiales que possèdent tous les êtres
humains pour le langage s'organisent en étapes successives et
déterminées pour permettre à l'infans de devenir un sujet
parlant. C'est donc une approche cognitive de l'acquisition de la
parole que nous souhaitons livrer. Celle-ci se fonde sur la
recherche des procédures qui guident l'apprentissage de la
parole à partir de « connaissances innées », connaissances qui
peuvent en partie être mises à jour expérimentalement. Dans un
premier temps, nous verrons les prédispositions qui rendent
l'enfant capable de relever les indices lui permettant de
discriminer et de catégoriser les aspects des sons
linguistiquement pertinents. Puis nous montrerons comment les
processus de sélection se manifestent dans le babillage tandis
que le bébé extrait la structure et le sens des sons de parole.
Avec les premiers mots qui lient le sens aux formes produites,
nous verrons apparaître la diversité des choix individuels et
l'influence des langues et des cultures dans l'accès au langage.
Enfin, nous accompagnerons l'enfant lorsqu'il commence à fixer
les paramètres caractérisant la grammaire particulière de sa
langue. Nous évoquerons l'environnement social dans lequel se
fait le développement de la parole et les échanges
d'informations de tout genre et de toute nature qui y prévalent.
C'est un travail complexe, car la parole et le langage sont
complexes et supportent plusieurs descriptions du même
phénomène dont il est nécessaire de rendre compte ! C'est un
travail complexe car l'enfant est complexe et change vite : les
procédures du nouveau-né qui discrimine et catégorise les sons
ne sont pas celles du bébé qui segmente ces sons, ni celles de
l'enfant qui attribue un sens aux mots et les produit. Les
environnements eux aussi sont complexes car ils diffèrent selon
les cultures, la structure des langues, le mode de transmission
des informations, les habitudes parentales et la socialisation.
Comprendre comment la parole vient aux enfants, assister à
la naissance des premiers sons, les voir s'organiser en suites
modulées, se structurer en syllabes pour voir enfin émerger des
formes que l'adulte peut entendre comme des mots ou des
expressions, tout cela ne se passe pas sans illusions, sans
étonnements, sans erreurs et sans émerveillements, tant sont
fines les capacités de traitement des nourrissons, subtiles et
efficaces les procédures de segmentation et de catégorisation
des bébés, et variées les voies d'accès à la parole des jeunes
enfants.
* Pour tous les termes techniques, voir le glossaire en fin d'ouvrage.
1 Saussure F. de, Cours de linguistique générale, Paris, Payot, première édition 1916
(nouvelle édition, Payot, 1972).
2 Chomsky N., Syntactic Structures, La Haye, Mouton 1957 (trad. fr. : Structures syntaxiques,
Paris, Éd. du Seuil, 1969).
3 Cordemoy G. de, Discours physique de la parole, Paris, Copedith, Bibliothèque du Graphe,
1970 (reproduit d'après l'édition de 1704).
4 Chomsky N., « A review of Skinner's Verbal Behavior », Language, 35, 1959, p. 26-58
(trad. fr. dans Langages, 4, 1969, n° 16, p. 16-49).
5 Darwin C., La Descendance de l'homme et la sélection sexuelle, Paris, Reinwald et Cie,
1873.
6 Fodor J., The Modularity of Mind, Cambridge, Mass., MIT Press, 1983.
CHAPITRE I

Le nourrisson ne parle pas, mais…

« Notre opinion est qu'il sied à l'homme de supposer qu'il y a


quelque chose d'inconnaissable, mais qu'il ne doit pas mettre de
limite à sa recherche. »
GOETHE

Le nouveau-né, cet inconnu

Le nouveau-né reconnaît la voix et l'odeur de sa mère. Il regarde les


visages qui se penchent sur son berceau. Il distingue les goûts et écoute
les paroles avec un plaisir sans fin. La seule observation, le seul esprit
critique des mères suffisent à reconnaître ces extraordinaires capacités
du nourrisson, qui balayent les poncifs millénaires entourant les
nouveau-nés. Selon ces poncifs, heureusement dépassés, les
nourrissons, dépourvus de toute connaissance, ligotés dans leurs
langes, auraient tout à apprendre, comme si les structures sonores et
spatiales du monde devaient être « transférées » dans leur organisme.
Jusque-là, le nouveau-né demeurerait « vide », il serait, selon
l'expression d'Aristote, une ardoise vierge.
Or non seulement le cerveau du bébé n'est pas vide, mais d'une
certaine façon, il est plus plein que celui du plus brillant des
polytechniciens ! Chez celui-ci, le cerveau contient environ dix
milliards (1010) de neurones, chez le bébé on peut estimer que leur
nombre est encore supérieur. Dans le cerveau qui se déve-loppe – au
cours de l'embryogenèse* –, les neurones sont engendrés à un rythme
d'un peu plus de 250 000 par minute. La création de tous les neurones
corticaux a lieu entre la sixième et la dix-septième semaine de
gestation. Par la suite, et durant toute la vie, plus aucun neurone ne sera
créé. La perte de neurones et d'axones commence dès la fin de la
gestation1. Après la naissance, le développement cognitif consiste en
une épuration et un aménagement : la perte de neurones s'accompagne
en effet d'une création exubérante de jonctions entre les neurones.
Ceux-ci vont se lier en réseaux de communication, réseaux d'une
efficacité à rendre envieux tous les médias ! Un neurone forme en effet
autour de mille connexions et en reçoit plus encore. Il peut recevoir dix
mille messages en même temps. Puisque le cerveau de l'homme
contient 1010 neurones, on peut estimer à 1015 le nombre de jonctions.
Plus que d'étoiles dans l'univers !
Si la densité synaptique commence à croître dans les derniers mois
de gestation, elle explose littéralement à la naissance. Grâce à des
études anatomiques faites sur des cerveaux de primates non humains,
on peut avoir une idée raisonnable de ce développement synaptique
chez l'être humain (à condition d'extrapoler les rythmes de
développement qui correspondent à des durées de croissance et de vie
plus longues chez l'homme que chez le primate non humain). Chez
celui-ci, le pic de densité synaptique se trouve entre deux et quatre
mois de vie, ce qui correspond sans doute à huit-dix mois chez les
bébés humains. La création de synapses tend ensuite à se stabiliser,
pour atteindre le niveau adulte à la maturation sexuelle. Chez les jeunes
humains, la densité des connexions synaptiques courtes est encore,
entre neuf et vingt-quatre mois, de 150 % plus importante que celle
observée chez les adultes. Elle commencera à décroître au cours de la
troisième année.
Bien que ni la signification de cette exubérance neuronale et
synaptique, ni la signification de l'élimination de neurones et de
synapses ne soient encore bien connues, on suppose qu'elles sont liées
à des processus de compétition et de stabilisation sélective : la
redondance neuronale et synaptique que l'on trouve chez le bébé
fournit un potentiel de développement. Après la naissance, cette
connectivité maximale de contacts synaptiques encore labiles procure
une chance sans égale pour que puissent s'effectuer des choix, des tris,
des renforcements en relation avec les apports du monde extérieur. Le
cerveau se « sculpte » ainsi sous l'influence de l'expérience interne et
externe qui en détermine l'architecture finale et les modes de
fonctionnement2.
Ainsi constitué, le cerveau du bébé lui procure un potentiel
d'évolution et de plasticité permettant, comme l'écrit Jean-Pierre
Changeux, cette « frange d'adaptabilité qui introduit une marge
d'adaptation3 ».

La parole ne peut être son langage

L'adaptation qui a permis la production de la parole articulée est tout


à fait particulière à l'espèce humaine. À l'exception de quelques
oiseaux, perroquets et mainates, capables de reproduire de façon peu
harmonieuse certains aspects des sons qui constituent la parole, seuls
les êtres humains peuvent articuler la gamme des sons qu'utilisent les
langues parlées.
Pour parler, il est nécessaire de maîtriser un appareil vocal aux
caractéristiques particulières. Il faut contrôler et coordonner les
mouvements du larynx, de la glotte, du voile du palais, de la mâchoire,
des lèvres, de la langue. Il faut en outre que les activités respiratoires et
les activités des cordes vocales soient combinées et synchronisées. La
coordination des muscles en jeu dans l'articulation est extrêmement
complexe. Ainsi, quand vous entrez dans une pièce et dites simplement
« Bonjour, il fait beau aujourd'hui », votre rythme normal d'élocution
correspond à quinze sons de parole à la seconde et vous avez mis en
jeu des capacités motrices impliquant l'utilisation coordonnée de plus
de cent muscles !
Or l'évolution n'a pas favorisé, dans l'espèce humaine, la rapidité du
développement moteur. Si les études sur la perception des bébés
révèlent l'existence de « dons » surprenants et quasi mystérieux, la
vision qu'offre le nouveau-né au fond de son berceau est celle d'un être
fragile, démuni et dépendant, à la tête instable, trop lourde pour son
corps, incapable de contrôler sa posture et sa motricité.

FIGURE 1 - a) Conduit vocal de l'adulte


b) Conduit vocal du nourrisson

Ainsi, riche de potentialités d'écoute, l'être humain ne contrôle à la


naissance aucun des organes qui lui permettront de parler. Ceux-ci
n'étant pas encore fonctionnels, le conduit vocal du nouveau-né est
physiquement inapte à la parole.
Le langage parlé est un phénomène plus subtil, plus abstrait, plus
culturel que d'autres comportements moteurs, mais il suit certains
schémas qui se retrouvent dans la biologie du développement du
contrôle moteur. L'apprentissage de la parole est lié à un processus de
maturation et de réorganisation des organes servant à celle-ci. Dans les
premiers mois, des changements physiques vont accompagner les
changements dans la production des sons. Même si ces changements
physiques ne suffisent pas à eux seuls à expliquer l'évolution des
productions vocales durant la première année – une écoute de la parole
est également nécessaire –, il convient d'examiner le réaménagement
du conduit vocal au cours des premières années.
Le conduit vocal du nouveau-né ne présente pas la fameuse courbure
en angle droit, liée à la posture debout et qui a fondé, au cours de la
phylogenèse, le développement du langage articulé. Chez le nouveau-
né, la forme du conduit vocal ressemble à celle des primates non
humains. En fait, le conduit vocal du nourrisson n'est pas simplement
une fragile miniature de celui de l'adulte. Il en diffère radicalement par
sa configuration. Comme chez les primates, la courbure du canal
oropharyngal est graduelle. Steven Pinker4 décrit ainsi le conduit vocal
du nouveau-né : « Le larynx monte comme un périscope et s'engage
dans le passage nasal, forçant l'enfant à respirer par le nez et rendant
possible pour lui de respirer et boire en même temps. »Le pharynx du
nourrisson est proportionnellement plus court que celui de l'adulte alors
que sa cavité orale est relativement plus grande. La masse de la langue,
très importante, est située plus en avant. Elle remplit la bouche, et sa
possibilité de mouvement en est limitée. Le velum et l'épiglotte sont
relativement proches l'un de l'autre. Ainsi constitué, le conduit vocal du
nourrisson ne lui permet pas de produire des sons articulés5. En outre,
le nourrisson ne contrôle pas sa respiration, qui doit alimenter la
production des sons.
Dès trois mois, le palais s'avance, s'abaisse et peut fermer l'arrivée
d'air au nez. La langue s'allonge, sa musculature se développe et
l'ouverture du pharynx lui permet de se mouvoir d'avant en arrière. Le
premier effet net de ces changements se manifeste dans le contrôle du
cycle respiratoire. Le contrôle de la phonation est alors assez
rapidement acquis : dès cinq mois, les bébés sont capables d'utiliser
leur activité respiratoire et leur larynx à peu près comme les adultes6.
Le développement du contrôle de l'articulation est, lui, plus long. Il
s'agit ici de gouverner l'ensemble de la « machine » (langue, lèvres,
pharynx, larynx). Si le conduit vocal est profondément remodelé entre
deux et six mois, sa transformation ne sera pas encore achevée à la fin
de la première année7. Au cours de la seconde moitié de la première
année, le conduit vocal de l'enfant commence à ressembler à celui de
l'adulte et lui permet de produire des schémas sonores plus variés,
tendant à se rapprocher de ceux produits par l'adulte. Mais ce n'est pas
avant l'âge de cinq-six ans que le contrôle de l'ensemble des
articulateurs deviendra possible. Leur maturation commence par les
organes les plus centraux, pour gagner ensuite les organes
périphériques. Les mouvements globaux sont maîtrisés avant les
mouvements fins, le contrôle du bout de la langue et des lèvres sera le
dernier à être acquis, peu avant l'âge de cinq-six ans.
Ce remodelage général continuera à affecter les capacités de l'enfant
à produire certains groupes de sons pendant ces trois ou quatre
premières années. Cette lente évolution explique par exemple pourquoi
les enfants continuent assez tard à dire « Alisk » ou « Obélisk » pour
« Alix » ou « Obélix ».

Un nouveau-né compétent
« Où l'on sait déjà tout, mais où rien n'est commencé. »
MADAME DE STAËL

Si le cerveau humain possède une disposition innée ou même,


diraient certains, « un instinct » d'acquisition du langage, il doit exister
des corrélations de cette spécification génétique dès le plus jeune âge,
dès la naissance sans doute. Mais quelles sont-elles ? Et comment
interroger le bébé ? On ne peut attendre de lui ni le moindre
acquiescement ni le moindre refus de la tête ou de la main, et bien
entendu pas de réponses vocales !
Toutes les recherches récentes tendent à montrer comment, grâce à
un équipement biologique et cognitif sophistiqué, le nourrisson peut
percevoir les sons qui constituent la parole. Comment il peut non
seulement les entendre, mais aussi les extraire, les disséquer, les
reconnaître, les organiser et les analyser ! Or un premier problème, un
problème gigantesque, surgit immédiatement : il n'existe pas de
correspondance stricte entre le signal acoustique et les segments
phonétiques. Malgré des années de recherche et l'étude de tous les
paramètres acoustiques présents dans la réalisation d'un phonème, les
phonéticiens ont toujours été déçus dans leur quête : les occurrences
d'un même segment ne sont jamais identiques acoustiquement. Elles
dépendent des contextes dans lesquels se trouve ce segment. Ainsi le
[b] dans le mot « bas » est acoustiquement différent du [b] dans le mot
« snob ». Comment dès lors s'effectue la reconnaissance des sons
permettant l'identification des mots ? Comment attribuer à des
segments dont la manifestation physique est très variable une valeur
stable permettant d'en reconnaître l'identité dans tous les contextes ?
Les chercheurs du laboratoire de Haskins se sont consacrés à ce
problème dans les années quarante. Ils n'ont pas trouvé de réponse à
cette énigme dans les caractéristiques du signal, mais dans l'être
humain lui-même et dans ses capacités biologiques.
Voyons tout d'abord ce qui se produit chez l'adulte. Le système
psycho-acoustique de l'homme lui impose naturellement des frontières,
à l'intérieur desquelles les sons entendus forment des catégories stables.
Ainsi, malgré la continuité physique du signal, nous découpons l'espace
acoustique en catégories successives. Cette capacité du système
psycho-acoustique à percevoir les sons de façon discontinue et sous
forme d'unités discrètes est connue sous le nom de « perception
catégorielle8 » : les phonèmes sont perçus de façon discontinue sur des
séries sonores continues du point de vue physique. On peut imaginer
qu'au cours de l'évolution, une propriété du système auditif des
primates a été exploitée pour servir à l'organisation des sons qui
constituent la parole. Chez l'homme, la perception catégorielle est
devenue un des mécanismes fondamentaux servant à discriminer ces
sons de parole.
S'il en est ainsi chez l'adulte, que se passe-t-il pour le nouveau-né ?
Naît-il avec cette capacité fondamentale à organiser l'écoute de la
parole ? Et si oui, comment le savoir ? Comment valider l'hypothèse de
mécanismes biologiques innés permettant d'apprendre un langage ?
En 1969, E. Siqueland et C. Delucia9 ont eu l'idée remarquable
d'exploiter le seul comportement bien maîtrisé dont dispose le
nouveau-né, celui de la succion. Pour survivre, un nouveau-né doit
savoir téter. La plupart du temps, il le fait avec enthousiasme ! Grâce à
cet enthousiasme, Siqueland et Delucia ont mis au point la méthode qui
a permis les premières recherches expérimentales sur les nourrissons et
l'apprentissage du langage.
Cette méthode est connue en anglais sous le nom de HAS (High
Amplitude Succion) et en français, dans une traduction médiocre, sous
le nom de « succion non nutritive ». Pour interroger le nourrisson, on
commence par l'installer dans un baby relax. Une tétine, maintenue
dans sa bouche par un bras rigide, est reliée à un ordinateur.
L'amplitude des mouvements de succion du nourrisson est mesurée
pendant deux minutes pour chaque enfant, de façon à définir sa ligne
de base personnelle d'amplitude de succion en l'absence de toute
présentation sonore. Après l'établissement de cette ligne de base
commence la période de familiarisation. Durant cette période, chaque
succion d'une amplitude dépassant la ligne de base active le circuit
sonore et donne lieu à la présentation d'un son : ainsi le nombre de sons
présentés dépend-il de l'application du bébé à sucer sa tétine. Après un
certain laps de temps, le taux de succion décroît. On passe alors à la
phase du test proprement dit, qui s'ouvre par un changement de type de
stimulus. Le son que reçoit l'enfant lors de la prochaine succion assez
forte est différent de celui qu'il a entendu pendant la familiarisation.
L'idée est que d'une part, les bébés « aiment » être stimulés, et que
d'autre part, ils ont une grande capacité à relier des événements entre
eux. Ils établissent donc une relation entre l'apparition des sons et leur
succion. Dans un premier temps, intéressés par ce qu'ils entendent, ils
vont téter assez vigoureusement. Puis « l'ennui naissant de
l'uniformité », une lassitude s'installe et leur ardeur à téter s'atténue.
Réciproquement, la nouveauté suscite un regain d'intérêt et doit, si elle
est perçue par l'enfant, inviter le bébé à reprendre ses succions pour
bénéficier de la nouvelle stimulation. La reprise de succion lors d'un
changement de stimulus indique donc que le bébé a bien perçu une
différence entre les deux stimuli. À l'inverse, l'absence de reprise
indique que la différence entre les stimuli n'a pas été perçue.
Cet ingénieux dispositif de la succion non nutritive a permis
d'interroger le nourrisson sur ses aptitudes à discriminer les sons qui
forment l'ossature des langues parlées autour de lui. La première
question a été : les bébés discriminent-ils les sons de parole de façon
catégorielle, comme le font les adultes ?
En 1971, P. Eimas et ses collègues10 ont donné une première
réponse. Oui, des bébés de quatre mois distinguent les syllabes [ba] des
syllabes [pa], non pas en fonction de leur seule différence acoustique,
mais lorsque la différence acoustique place ces syllabes de part et
d'autre d'une frontière qui est proche de celle utilisée par les adultes
pour distinguer [ba] et [pa]. Les nourrissons discriminent bien
catégoriellement.

FIGURE 2 - Les taux de succion des nourrissons signalent leur réactions


lors d'un changement de stimulus. Sur le graphique sont montrées les
variations de taux de succion des bébés lorsqu'on présent a) un
contraste phonologique /p/ vs /b/, b) un changement acoustique /p/ vs
/p'/ et c) le même stimulus /p/ vs /p/ (groupe témoin). La ligne
pointillée indique le moment du changement de stimulus. Seul le
premier groupe de bébés augmente de façon nette son taux de succion
lors du changement de stimulus et marque ainsi qu'il perçoit une
différence entre les deux sons. Cette réaction ne peut s'expliquer par
l'écart de délai de voisement entre les deux sons qui est du même ordre
entre /p/ et /b/ et /p/ et /p'/ (d'après Eimas e al 1971).

Depuis 1971, des dizaines d'expériences11, dont certaines faites avec


des bébés de trois-quatre jours de vie, ont montré que le nourrisson
savait discriminer la quasi-totalité des contrastes utilisés dans les
langues naturelles. Il discrimine les contrastes de voisement, les
contrastes de place et les contrastes de mode d'articulation qui fondent
les catégories phonétiques. Le bébé de quelques jours se révèle dans ce
domaine un petit génie : c'est l'émerveillement !
Les questions se sont alors multipliées. Les prédispositions des
bébés pour traiter les sons du langage se limitent-elles à un talent pour
discriminer les segments ? Les bébés sont-ils précoce-ment sensibles à
d'autres aspects du langage particulièrement importants, comme le
contour prosodique des phrases, avec leur mélodie et leur rythme ? Les
expériences ont vite confirmé l'importance de la prosodie pour les
bébés. Les nouveau-nés de quelques jours préfèrent écouter la voix de
leur mère quand celle-ci est présentée en concurrence avec celle d'une
autre mère parlant à son bébé. Mais il faut que l'intonation de la mère
soit naturelle. Si l'on joue la bande à l'envers, la préférence de l'enfant
ne se voit plus. Cette préférence est liée aux aspects dynamiques de la
parole maternelle, telle l'intonation, et non à des aspects statiques des
sons puisque ceux-ci sont préservés lorsqu'on fait passer la bande à
l'envers. L'attention de l'enfant ne se porte donc pas sur les
caractéristiques statiques de la voix mais sur celles de la voix dans un
processus normal de communication12.
Préférence pour la voix de la mère et préférence aussi pour la langue
maternelle13. Lorsque des séquences de français succèdent à des
séquences de russe, les nourrissons français de quatre jours montrent
une reprise plus importante de la succion que lorsque les séquences
sont présentées dans l'ordre inverse. Ce n'est pas un effet de locuteur
puisqu'un même locuteur bilingue a enregistré les deux échantillons.
Cette « préférence » se maintient lorsque les séquences ont été filtrées
de façon à enlever la majeure partie de l'information phonétique tout en
laissant intacte la prosodie. Les différences prosodiques entre la langue
maternelle et la langue étrangère sont donc suffisantes pour susciter
une réaction plus vive lors de la présentation de la langue maternelle.
Cette familiarisation avec la langue maternelle est-elle issue
uniquement des contacts des tout premiers jours ? Si peu de temps a-t-
il vraiment suffi pour orienter l'attention du nourrisson vers certaines
des propriétés générales qui caractérisent la prosodie de la langue
parlée dans son environnement ? Cette familiarisation n'a-t-elle pas
commencé plus tôt, dès la vie prénatale ?

Il s'est préparé avant la naissance

Sans doute l'embryon des premiers mois n'a-t-il pas grand-chose à


nous dire sur la parole. Mais le fœtus, si. Confortablement installé dans
le sein de sa mère, baignant dans le liquide amniotique, l'enfant à venir
jouirait-il d'un agréable silence lui permettant de se développer dans le
calme avant d'affronter le bruyant milieu aérien où il va vivre ? On sait
maintenant que non. Pendant longtemps, les médecins ont voulu
ignorer les observations des mères qui sentaient le fœtus réagir aux
bruits intenses et sursauter à une sonnerie de téléphone trop forte.
« Imagination maternelle ! », disait-on. On pensait alors le fœtus à
l'abri des bruits extérieurs. On sait maintenant qu'avant la naissance les
sens de l'enfant entrent en fonction graduellement. Le système auditif
du fœtus est fonctionnel dès la vingt-cinquième semaine de gestation et
son niveau d'audition se rapproche de celui des adultes vers la trente-
cinquième semaine. Les données sensorielles auditives parviennent au
fœtus à la fois de l'espace intra-utérin, du corps vivant de sa mère, et de
l'extérieur. Les premiers enregistrements des sons parvenant au fœtus
présentaient l'image d'un milieu intra-utérin très bruyant. Les bruits
internes (respirations, bruits cardio-vasculaires ou gastro-intestinaux)
auraient donc masqué en partie les bruits extérieurs, déjà atténués par
la membrane utérine et par le bruit puissant du cœur de la mère. Les
enregistrements plus récents changent un peu ce tableau de
l'environnement acoustique du fœtus. Réalisés en glissant un
hydrophone dans l'utérus de femmes enceintes au repos14, ils montrent
que le bruit de fond intra-utérin se situe dans des fréquences basses, ce
qui limite son effet de masquage. La voix maternelle ainsi que les
autres voix de l'environnement émergent bien de ce bruit de fond.
L'intensité de la voix de la mère in utero n'est pas très éloignée de son
intensité ex utero. Les hautes fréquences sont atténuées, mais les
propriétés spectrales de la parole de la mère restent les mêmes et les
principales propriétés acoustiques du signal sont préservées. La
transmission des paroles de la mère passe par la voie aérienne mais
aussi par son propre corps. Elles sont donc plus perceptibles que les
sons venant de l'extérieur, bien que ceux-ci soient aussi parfaitement
audibles par le fœtus. La prosodie est particulièrement bien préservée :
l'intonation de la parole enregistrée in utero est parfaitement reconnue
par les auditeurs adultes ; il en va de même pour 30 % des phonèmes.
Mais comment explorer des capacités prénatales pour la parole ? La
technique de succion non nutritive joue sur une interruption et une
reprise d'attention lors d'un changement de stimulus. Ce même type
d'approche a été utilisé pour tester la perception du fœtus. Nous
connaissons des indices physiologiques reflétant ses états de veille et
de sommeil plus ou moins profonds. Les réponses cardiaques et les
réponses motrices peuvent nous donner des indications sur ce qui
surprend et alerte le fœtus alors qu'il se trouve dans un état de repos.
Lorsqu'on présente un son de façon répétitive, à l'aide d'un haut-parleur
situé à vingt centimètres au-dessus de l'abdomen de la mère, on habitue
le fœtus à ce son. Le début de la présentation du son entraîne une
réaction d'éveil primitive, qui se traduit par une décélération cardiaque.
Celle-ci s'atténue puis disparaît et le cœur reprend son rythme lors de la
présentation répétitive du son. C'est la période d'« habituation ». Si,
après l'« habituation », on change le son, une nouvelle décélération
cardiaque indique que la nouveauté du son a été perçue. Ce paradigme
habituation-déshabituation fonde les méthodes utilisées pour tester les
capacités du fœtus15. De nombreuses études16-17 ont ainsi révélé que le
fœtus, en fonction de son état comportemental, réagit aux variations
des caractéristiques physiques de la stimulation. Les différences
d'intensité et de fréquence des stimuli sonores entraînent toutes deux
des réactions de discrimination sous forme de décélération cardiaque. Il
en est de même pour les variations dans la structure de sons de parole.
J.-P. Lecanuet18 a présenté à des fœtus de trente-six à quarante
semaines une série de seize dissyllabes / babi / ; lorsque le fœtus a été
« habitué », ce dissyllabe a été changé en / biba /. Le changement
d'ordre des syllabes a provoqué une décélération cardiaque chez le
fœtus testé en état de sommeil calme. Cette décélération indique que
les deux séquences sont discriminées. Rien évidemment ne permet de
dire que le fœtus les « reconnaît ». Mais il réagit à un simple
changement dans l'ordre des deux syllabes phonétiquement proches qui
composent les dissyllabes. Le second dissyllabe est pour lui
« nouveau » par rapport au premier.
La question se pose alors de savoir si une exposition des fœtus à la
langue maternelle peut favoriser, dès avant la naissance, un réglage
perceptif sur les paramètres phonétiques et/ou les paramètres
prosodiques qui caractérisent cette langue et la différencient des autres.
Nous avons vu que la discrimination catégorielle du nouveau-né était
universelle mais que celui-ci reconnaissait la voix de sa mère lorsque la
prosodie était maintenue. Existe-t-il un modelage prénatal contribuant à
régler certaines des capacités perceptives sophistiquées des
nourrissons ? Les stimulations externes laissent-elles une empreinte sur
le cerveau du fœtus ? Celui-ci peut-il mémoriser des stimulations
auditives ? Ou bien les réactions obtenues sont-elles de simples
réactions d'alerte en face de changements de stimulation ?
Pour mieux cerner la nature des discriminations observées chez le
fœtus et leur impact sur les capacités des nouveau-nés, on a cherché si
se retrouvaient chez ceux-ci des souvenirs des expériences prénatales.
En utilisant la méthode bien rodée de la succion non nutritive, on a,
dans un premier temps, simplement demandé à des nouveau-nés de un
à trois jours si l'expérience prénatale de la voix de leur mère leur
permettait de distinguer cette voix de celle d'autres locuteurs19. Alors
qu'ils n'ont pas plus de douze heures de contact effectif (ex utero) avec
elle, les nouveau-nés préfèrent la voix de leur mère à celle d'une autre
femme. Les questions se sont faites ensuite plus précises.
L'imprégnation des fœtus à des caractéristiques acoustiques
importantes pour la parole laisse-t-elle des traces chez les nouveau-
nés ? Pour le savoir, A. DeCasper et M. Spence20 ont utilisé une
variante, plus sensible, de la procédure de la succion non nutritive. Un
des stimuli est présenté lorsque le nouveau-né fait des pauses longues
entre des succions, l'autre stimulus est présenté pour les pauses brèves.
Le nouveau-né règle son rythme de succion selon sa préférence pour le
stimulus : des succions lentes engendrent un des stimuli et des succions
rapides l'autre.
En utilisant cette méthode, les auteurs ont montré que les nouveau-
nés rythment leur succion pour recevoir le passage de prose récité par
la mère, à haute voix, durant les six dernières semaines de grossesse,
plutôt qu'un autre passage en prose, lu par celle-ci, mais non entendu
auparavant. On pourrait penser que la voix de la mère a un statut tout
spécial et sert de modèle pour reconnaître l'intonation et les régularités
du passage longtemps entendu. Mais les nouveau-nés continuent à
préférer le passage lu par leur mère avant leur naissance, même si,
pendant le test, ce n'est plus la mère qui le lit, mais une autre femme.
Le fœtus serait donc réceptif à des propriétés acoustiques générales du
signal de parole et pas seulement à la voix et aux intonations
spécifiques de la mère. Cela demandait vérification : les auteurs ont
refait une expérience en testant la reconnaissance non plus chez les
nouveau-nés, mais chez les fœtus21. On a demandé à des futures mères
de lire à voix haute tous les jours, pendant quatre semaines, un poème.
À la fin de ces quatre semaines, alors que la mère est à trente-sept
semaines de gestation, on donne à écouter aux fœtus des séquences
dans lesquelles alternent le poème que la mère a récité et un autre
poème, jamais entendu. Ces séquences sont enregistrées par une tierce
personne et retransmises par un haut-parleur situé à hauteur de la tête
du fœtus. Les variations du rythme cardiaque du fœtus servent d'indice
de discrimination. Cette technique confirme bien le rôle de l'imprégna-
tion prénatale. En effet, les battements cardiaques ne décroissent
systématiquement qu'en réponse au poème lu par les mères durant les
quatre semaines précédentes et ne varient pas lors de la lecture de
l'autre poème. Quels sont les indices qui permettent aux fœtus de réagir
au poème familier ? Ce ne sont pas les caractéristiques de la voix de la
mère, puisque pour la situation de test les poèmes ont été enregistrés
par une autre femme. Ce n'est pas un rythme singulier propre à un
poème très particulier et choisi comme tel, car la précaution avait été
prise de ne pas habituer tous les fœtus à un même poème. Il faut donc
conclure que tout échantillon de langage avec une intonation et un
rythme normaux alerte le fœtus et le pousse à régler son écoute sur cet
échantillon dont l'empreinte persiste pour au moins quelque temps.
Une familiarisation avec la langue maternelle a donc lieu dans les
derniers mois de la vie prénatale. Les stimulations sonores reçues
pendant les derniers mois de vie intra-utérine sont susceptibles de
contribuer au modelage des voies sensorielles et de préparer un
calibrage perceptif pour certaines caractéristiques des sons de la parole,
sans doute plus particulièrement pour les caractéristiques prosodiques
des langues.

Les talents des nourrissons

Mais revenons aux nourrissons, pas si naïfs qu'on le pensait, puisque


préparés à écouter durant la période prénatale. Dès la naissance, ils sont
capables de discriminer un éventail important de contrastes
consonantiques et vocaliques, que ces contrastes appartiennent ou non
au répertoire de la langue parlée dans leur environnement. De plus, très
rapidement, les bébés font preuve de « constance perceptive », c'est-à-
dire qu'ils reconnaissent la similitude de sons appartenant à une même
catégorie phonétique, en dépit de leurs variations physiques. Les sons
peuvent en effet varier sous de nombreuses dimensions. Prenons un
exemple : le son /a/ dit par un homme à voix grave de basse, par un
enfant à voix aiguë, par un Marseillais ou par un Parisien, avec une
intonation montante ou un ton descendant, dans différents contextes,
doit être catégorisé comme la même voyelle /a/. Dès cinq mois, le bébé
néglige les variations d'une voyelle dues aux changements de locuteur
et d'intonation22. Il range les différents échantillons dans une même
catégorie.
Autre talent des nourrissons de deux mois : le traitement particulier
qu'ils accordent à la syllabe. Pour eux, celle-ci est perçue comme un
tout plutôt que comme une combinaison d'éléments distincts. Une
expérience permet de le montrer : on familiarise des bébés de deux
mois avec une suite de syllabes, par exemple /bi si li mi/ (voyelle
commune, consonnes différentes) ou /bo ba bu be/ (consonne
commune, voyelles différentes). On constate alors que les nourrissons
sont capables de détecter l'ajout d'une nouvelle syllabe, /di/ ou /bou/
par exemple, à la suite à laquelle ils ont été familiarisés. Les bébés
trouvent que /bou/ est différent de /bo… be/ autant que l'est /dou/. Ils
n'ont donc pas extrait le phonème /b/ comme propriété commune aux
stimuli d'habituation, autrement dit ils ne décomposent pas les syllabes
en éléments plus petits23-24. La prise en compte de la syllabe comme
unité de perception est confirmée par une autre expérience. Grâce à elle
on peut montrer que les bébés discriminent des listes composées de
suites de dissyllabes variés et des suites de trissyllabes, alors même que
la durée totale des séquences reste identique pour les dissyllabes et les
trissyllabes25. C'est le nombre de syllabes qui organise la perception
séquentielle de la suite sonore.
Cependant ces aptitudes sont mises en évidence par des expériences
dans lesquelles les indices acoustiques sont présentés de façon isolée.
Les mêmes performances se retrouvent-elles lorsque l'attention du bébé
est requise par d'autres sollicitations auditives, par exemple par la
prosodie ? C'est ce qu'ont cherché à montrer les expériences récentes
de Denise Mandel et ses col-lègues26. Ceux-ci ont formé l'hypothèse
que les indices prosodiques détectés dès les premières semaines par les
nourrissons sont susceptibles de jouer un rôle très important en aidant
l'enfant à organiser les informations de la parole. Ils ont donc testé la
discrimination de contrastes phonétiques dans des phrases. Les
résultats de ces expériences montrent que des bébés de deux mois
détectent mieux des changements de phonèmes lorsqu'ils sont intégrés
dans des petites phrases que lorsqu'ils se trouvent dans des listes de
mots. Le taux de succion des bébés augmente fortement lorsqu'à une
série de phrases du type : « le (r)at poursuit la souris blanche » succède
la phrase : « le (ch)at poursuit la souris blanche ». Les bébés réagissent
moins fortement au changement de phonème /r/ en /ch/ lorsqu'il
apparaît dans une liste de mots lus à la suite que lorsqu'il apparaît dans
des phrases dites avec une intonation naturelle. Dans la vie de tous les
jours, la prosodie naturelle « force » l'écoute des bébés. Elle aiderait
par ce fait leur attention à se porter sur les variations phonétiques.
Comme le proposent les auteurs, la prosodie serait une « glu
perceptive » pour les séquences de parole. Les mères le sentent bien,
qui amplifient les variations d'intonation et jouent de leur voix
lorsqu'elles parlent à leur enfant. Grâce à ces variations, non seulement
les bébés ne perdent pas leurs capacités de discrimination, mais celles-
ci se trouvent renforcées par l'exagération du rythme et des contours
prosodiques. On constate d'ailleurs que les bébés discriminent mieux
les contrastes phonétiques lorsque les phrases sont lues par une femme
censée s'adresser à un enfant, que lorsqu'elles sont lues par un adulte
s'adressant à un autre adulte.

Le prénom : un premier signal

Les nourrissons ne sont-ils sensibles qu'aux caractéristiques


fondamentales de la parole ? Certains schémas particuliers ne
commencent-ils pas à avoir un sens ?
Le nom de l'enfant est souvent prononcé quand les parents le
câlinent ou jouent avec lui. Cette forme sonore, qui revient souvent
avec des sensations de bien-être personnel, acquiert-elle valeur de
signal particulier ? L'enfant peut-il reconnaître la manière de dire son
prénom ? D. Mandel, P. Jusczyk et D. Pisoni27 ont cherché à savoir si
le prénom avait un statut spécial pour des bébés de quatre mois et
demi.
La méthode de succion non nutritive n'est plus valable pour les
enfants de cet âge. En revanche, il devient possible de leur demander
plus directement leurs préférences. Deux haut-parleurs sont placés de
part et d'autre d'un bébé. Au-dessus de chaque haut-parleur, une petite
lumière. Aussi longtemps que l'enfant oriente son regard vers l'une des
lumières, un stimulus sonore (son prénom d'une part, trois autres
prénoms dits sur le même ton d'autre part) est joué par le haut-parleur
correspondant. Les temps cumulés d'écoute – ou plus exactement de
regard vers les sources – indiquent la préférence de l'enfant pour l'un
ou l'autre stimulus.
Il s'avère que le bébé est plus attentif à l'écoute de son prénom qu'à
celle des prénoms de ses petits copains. Le prénom est donc un signal
reconnu. Cependant, dire qu'il est un signal pour le bébé de quatre mois
n'implique pas que celui-ci peut relier des schémas sonores à des sens.
Les chiens reconnaissent leur nom, celui-ci est pour eux un signal
comme l'est la vue de leur laisse ou celle de leur maître mettant son
manteau. Pour le chien comme pour le bébé, les noms ou prénoms sont
des signaux sonores éveillant l'attention dans une ou des situations
particulières. Le bébé de quatre mois réagit à son prénom, sans pour
cela se rendre compte que les formes sonores ont pour fonction de faire
référence.
Le cerveau du nouveau-né est donc loin d'être vierge. Mais est-il
pour autant organisé comme celui de l'adulte en ce qui concerne les
sons de parole ?

Organisation du cerveau pour le langage

La caractéristique principale du cortex cérébral est le fait qu'il est


compartimenté en zones sous-tendant des modalités particulières telles
les modalités motrices, sensorielles, ou les fonctions cognitives. Depuis
un siècle, on sait que les aires discrètes du cortex sont impliquées dans
des traitements spécifiques à la compréhension et la production de la
parole et du langage. Chez l'adulte, les aspects cognitifs du langage
sont représentés dans l'hémisphère gauche du cortex cérébral, le long
de la scissure de Sylvius. Les deux principales aires impliquées dans la
compréhension et la production de la parole sont l'aire de Broca28 et
l'aire de Wernicke29 dont les fonctions, jusqu'à l'entrée récente de
l'imagerie cérébrale dans le champ des recherches, ont été déterminées
à partir d'études de pathologie. Les lésions impliquant l'aire de Broca,
située dans la troisième circonvolution du lobe frontal au pied de la
scissure de Sylvius, entraînent une quasi-impossibilité de parler avec
perte de la « grammaire », mais elles laissent intacte la compréhension
des mots et des phrases. Adjacent à l'aire de Broca se trouve le système
de représentations pour le contrôle précis de la musculature orale.
Les lésions impliquant l'aire de Wernicke, dans la partie postérieure
du lobe temporal à sa jonction avec les lobes pariétal et occipital,
entraînent une perte de compréhension tout en laissant la possibilité de
parler, la plupart du temps de façon incompréhensible. Le faisceau
arqué (de Burdach) relie l'aire de Wernicke à l'aire de Broca.
Fondamentalement, l'hémisphère gauche interfère avec le traitement
rapide de l'information acoustique et donc avec le traitement des sons
de parole.

FIGURE 3 - Localisation des zones de Broca et de Wernicke dans le


cerveau humain. Sont également indiquées des zones motrices
impliquées dans l'articulation et la phonation (aire supplémentaire
motrice et zone du contrôle de la voix).

En revanche, c'est l'hémisphère droit qui a en charge la perception


des événements acoustiques répartis sur une longue durée. C'est lui qui
contrôle la prosodie. Les lésions de l'hémisphère droit n'entraînent pas
d'aphasies ou d'apraxies mais des troubles du traitement et de la
production de la prosodie et de la musique. Les composants du
traitement de la prosodie et des variations d'intonation dues à
l'affectivité sont aussi traités à droite, et leur organisation anatomique
se situe en miroir de celle du langage cognitif et analytique traité à
gauche.
Les composants prosodiques sont particulièrement importants dans
l'acquisition de la parole. Le bébé est, on l'a vu, d'abord attentif à
l'intonation, il vocalise avant d'articuler. Il produit des syllabes isolées
avant de produire des séquences de syllabes ; l'organisation
phonologique et syntaxique de la parole est plus tardive. Actuellement
on sait qu'in utero et à la naissance, la maturation de l'hémisphère droit
est plus rapide que celle de l'hémisphère gauche. Les décalages dans
les rythmes de maturation hémisphérique dans la première année sont à
la source de différences dans l'émergence des fonctionnalités30. Ils
pourraient expliquer certaines caractéristiques du développement du
langage telles que la forme du premier codage des mots. Nous y
reviendrons.
L'imagerie cérébrale apporte des informations supplémentaires : les
fonctions fondamentales sont localisées de façon plus variable qu'on ne
le pensait et selon des schémas pouvant changer pour chaque individu.
Les fonctions plus élaborées sont, elles, dérivées d'interconnexions
entre plusieurs régions du cerveau.
À la latéralisation gauche des aires du traitement du langage
correspondent des asymétries anatomiques et histologiques. Le planum
temporale qui incorpore l'aire de Wernicke, dont le rôle est primordial
dans la compréhension du langage, est plus important à gauche qu'à
droite chez 65 % des individus31.
Puisque les nouveau-nés naissent sans langage, puisqu'ils ne parlent
pas, pourquoi devrait-on trouver chez eux cette latéralisation
cérébrale ? Existe-t-elle dès la naissance ou se développe-t-elle en
même temps que le langage ? P. Broca32 pensait qu'elle accompagnait
le développement du langage. Le modèle d'acquisition développé par
Eric Lenneberg en 196733 repose sur la même idée. Pour E. Lenneberg,
l'acquisition du langage et la latéralisation procèdent de façon
complémentaire à partir de deux ans pour s'achever aux approches de la
puberté vers dix-douze ans. Des observations assez surprenantes
montrent en effet que de jeunes enfants cérébro-lésés apprennent à
parler et à bien parler. Ces enfants, victimes soit d'une lésion périnatale
gauche, soit d'une ablation de l'hémisphère gauche à la suite d'une
opération chirurgicale (lobotomie), récupèrent d'autant mieux la
capacité de parler que l'accident ou l'opération ont eu lieu à un âge
précoce. Lorsque la lésion s'est produite avant l'âge de un an, la
récupération est totale. Dans le cas de lésions plus tardives, on observe,
à long terme, des déficits dans certains aspects du traitement de la
syntaxe. La possibilité de restructurer l'architecture du cortex et celle
de ses connexions, d'inverser la propension de l'hémisphère gauche à
traiter et produire le langage existe donc chez les bébés et les jeunes
enfants. La plasticité cérébrale permet au cerveau lésé de fournir les
substrats pour le langage à partir de l'autre hémisphère. E. Lenneberg
en concluait que l'équipotentialité fonctionnelle des hémisphères existe
dans les deux premières années et que la latéralisation cérébrale est
issue des processus d'apprentissage.
Les possibilités de réorganisations fonctionnelles ou structurales
précoces ne sont pourtant pas forcément l'indice d'une absence de
« vocation » de l'hémisphère gauche à prendre en charge le langage.
Dans un cerveau qui fonctionne normalement, les fonctions
linguistiques dépendent du fonctionnement de certaines structures
cérébrales de l'hémisphère gauche. Seul un changement dramatique,
altérant profondément l'activité cérébrale, amène d'autres structures à
supporter ces fonctions. La plasticité cérébrale, importante chez le tout
jeune enfant, n'équivaut pas obligatoirement à une équipotentialité
hémisphérique originelle.
Il existe des asymétries anatomiques chez le nouveau-né et le
nourrisson, entre autres celle du planum temporale, qui est plus étendu
à gauche qu'à droite dès la trente et unième semaine de gestation34.
Qu'en est-il des asymétries fonctionnelles ? Pour pouvoir réfuter l'idée
d'équipotentialité initiale et de latéralisation progressive, il faut
démontrer la précocité de la spécialisation de l'hémisphère gauche pour
le traitement de la parole. Cette démonstration est-elle possible ?
Des indices, mais seulement des indices, d'une latéralisation
fonctionnelle précoce ont été rapportés grâce à certaines techniques.
L'imagination des chercheurs a dû se surpasser pour trouver des
méthodes permettant de faire dire aux nouveau-nés s'ils utilisaient de
préférence l'un ou l'autre hémisphère pour traiter les sons du langage !
Les approches psychologiques, telle la succion non nutritive, et
certaines approches physiologiques ont permis d'apprendre si un
hémisphère semble plus spécialement impliqué que l'autre dans des
tâches de discrimination de syllabes ou de discrimination de notes
musicales.
La méthode de l'écoute dichotique repose sur le fait que les
principales voies de transmission des signaux auditifs sont croisées :
les sons parvenant à l'oreille droite sont transmis d'abord à l'hémisphère
gauche alors que les sons parvenant à l'oreille gauche atteignent
d'abord l'hémisphère droit.

FIGURE 4 - Schéma montrant le croisement des voies auditives. La


présentation d'un son à l'oreille droite arrive d'abord à l'hémisphère
gauche.
Lorsque, dans l'écoute dichotique, on présente simultanément et de
façon synchronisée, deux sons différents, l'un à l'oreille droite, l'autre à
l'oreille gauche, le sujet rapporte un seul son : le son dominant. Chez
les adultes, le son présenté à l'oreille droite (donc arrivant à
l'hémisphère gauche) est dominant lorsqu'il s'agit d'un son de parole.
Le son arrivant à l'oreille gauche (hémisphère droit) est dominant
lorsqu'il s'agit d'un son musical.
En 1977, A. Entus35 a utilisé ce phénomène, en l'associant à la
succion non nutritive. On présente à des bébés de deux mois un son
musical dans une oreille, un son de parole dans l'autre. Ces sons sont
répétés jusqu'à habituation, c'est-à-dire jusqu'à ce que le bébé retrouve
son rythme normal de succion. À ce moment, un de ces sons est changé
pour un autre de même nature. La reprise de la succion indique que
l'enfant a perçu le changement. Cette reprise est plus nette lors d'un
changement du son de parole dans l'oreille droite et d'un changement
de notes de musique dans l'oreille gauche. Parfois discutés, ces
résultats ont été le plus souvent retrouvés, soit avec la même approche
expérimentale36, soit avec des potentiels évoqués37, soit avec des
mesures de décélération cardiaque38-39. Ils signifieraient en tout cas
que, dès deux-trois mois, l'hémisphère gauche répond mieux pour la
discrimination des sons de parole, et l'hémisphère droit pour la
discrimination des sons musicaux.
Les réponses de potentiels évoqués auditifs lors de présentations
phonétiques ou musicales donnent des mesures de l'activité électrique
du cerveau générée par les présentations acoustiques. Ces réponses
sont difficiles à interpréter, particulièrement chez les bébés, mais elles
fournissent des données très importantes. Les premiers travaux dans ce
domaine ont favorisé la thèse d'une activation préférentielle de
l'hémisphère gauche lors de la présentation de syllabes. Dans une étude
récente, cette méthode a permis à G. Dehaene-Lambertz et
S. Dehaene40 de montrer que des nourrissons de trois mois peuvent
détecter très rapidement, en moins de 400 ms, un changement de
première consonne d'une syllabe. Les corrélats électrophysiologiques
de cette discrimination phonétique montrent une asymétrie
fonctionnelle tem-porale « modérée » pour l'hémisphère gauche. Celui-
ci posséderait un avantage pour traiter acoustiquement et
phonétiquement des syllabes courtes. Cependant les réponses de
potentiels évoqués obtenues chez les bébés sont sujettes à des
variations individuelles considérables qui obligent les auteurs à
modérer leur constat. Ils concluent que « la latéralisation en faveur de
la potentialité de discrimination rapide de syllabes pour l'hémisphère
gauche apparaît plutôt comme un avantage modeste pour cet
hémisphère que comme une division radicale des fonctions des deux
hémisphères41 ».
Il faudrait donc conclure que le cerveau code quelque chose de façon
asymétrique pour les stimuli de parole et le fait précocement. Mais on
ne peut que spéculer sur la nature du mécanisme qui produit cette
asymétrie. Il est possible que des stimuli acoustiques aient des substrats
neuronaux similaires à ceux qui sont utiles pour traiter la parole. Ainsi
l'hémisphère gauche pourrait avoir la vocation de percevoir les
séquences de stimuli auditifs caractérisés par des spectres acoustiques
changeant constamment. Ce genre d'analyse peut rendre compte d'une
discrimination auditive précoce et d'une tendance à une latéralisation,
sans qu'il soit nécessaire d'en inférer un traitement de la parole par
l'hémisphère gauche chez les bébés de trois mois. Mais il est aussi
possible de penser qu'une asymétrie fonctionnelle correspondant à
l'asymétrie anatomique observée chez les nouveau-nés sous-tendrait
une tendance de l'hémisphère gauche à traiter les syllabes par
opposition aux sons mélodiques ou aux sons non articulables dans les
langues42.
Le processus d'acquisition est sans doute essentiel pour la maturation
corticale et la latéralisation hémisphérique. Si, pour des raisons
extérieures, l'acquisition du langage ne peut se faire dans les délais
normaux, la latéralisation semble en être grandement affectée. Chez
Genie, une enfant séquestrée et isolée qui n'a retrouvé un milieu
linguistique ambiant normal qu'à douze ans, l'hémisphère droit est
dominant pour la forme inachevée de lan-gage qu'elle a pu acquérir43.
Le petit nombre de cas similaires ne permet pas de généraliser cet
exemple qui manifeste la relation entre l'architecture des centres du
langage et l'expérience des faits linguistiques.
Ainsi les nouveau-nés sont-ils loin d'être cette « ardoise vierge » que
décrivait Aristote. Ils manifestent des dons innés pour traiter
l'environnement linguistique, discriminent et catégorisent les phonèmes
des langues, sont sensibles aux voix et aux caractéristiques prosodiques
de leur langue maternelle. Leur système perceptif est préparé pour
traiter les sons du langage. Mais les bébés ne sont-ils que de brillants
auditeurs ? Certes non ! Si la parole n'est pas encore leur langage, ils
s'y préparent déjà en affûtant leurs possibilités vocales, en organisant
leurs capacités perceptives et aussi en dialoguant avec l'adulte par le
regard, la voix et le geste.

* Pour tous les termes techniques, voir le glossaire en fin de volume.


1 Rakic P., Bourgeois J.-P., Eckenoff M.F., Zecevic N. & Goldman-Rakic P.S., « Concurrent
overproduction of synapses in diverse regions of the primate cerebral cortex », Science, 232,
1986, p. 232-235.
2 Changeux J.-P. & Danchin A., « Selective stabilization of developing synapses as a
mechanism for the specification of neuronal networks », Nature, 1976, 264, p. 705-721.
3 Changeux J.-P., L'Homme neuronal, Paris, Éditions Fayard, 1983.
4 Pinker S., The Language Instinct, New York, William Morrow Company, 1994, p. 265.
5 Kent R.D. & Murray A.D., « Acoustic features of infant vocalic utterances at 3, 6, and 9
months », Journal of Acoustic Society of America, 72, 1982, p. 353-365.
6 Koopmans-van-Beinum F. & Van-der-Stelt J., « Early stages in infant speech
development », Proceedings of the Institute of Phonetic Sciences, University of Amsterdam, 5,
1979, p. 30-43.
7 Kent R.D., « Anatomical and neuromuscular maturation of the speech mechanism :
Evidence from acoustic studies », Journal of Speech and Hearing Research, 19, 1976, p. 421-
445.
8 Liberman A.M., Harris K.S., Kinney J.A. & Lane H., « The discrimination of relative-onset
time of the components of certain speech and nonspeech patterns », Journal of Experimental
Psychology, 61, 1961, p. 379-388.
9 Siqueland E.R. & DeLucia C., « Visual reinforcement of nonnutritive sucking in human
infants », Science, 165, 1969, p. 1144-1146.
10 Eimas P.D., Siqueland E.R., Jusczyk P. & Vigorito J., « Speech perception in infants »,
Science, 171, 1971, p. 303-306.
11 Jusczyk P.W., « On characterizing the development of speech perception », dans J. Mehler
& R. Fox (Eds), Neonate Cognition : Beyond the Blooming Buzzing Confusion, Hillsdale, N.J.,
Lawrence Erlbaum associates, 1985.
12 Mehler J., Bertoncini J., Barrière M. & Jassik-Gershenfeld D., « Infant recognition of
mother's voice », Perception, 7, 1978, p. 491-497.
13 Mehler J., Jusczyk P.W., Lambertz G., Halsted N., Bertoncini J. & Amiel-Tison C., « A
precursor of language acquisition in young infants », Cognition, 29, 1988, p. 143-178.
14 Querleu D., Renard X. & Versyp F., « Les perceptions auditives du fœtus humain »,
Médecine et Hygiène, 39, 1981, p. 2101-2110.
15 Lecanuet J.-P., Granier-Deferre C., DeCasper A.J., Maugeais R., Andrieu A.J. &
Busnel M.-C., « Perception et discrimination fœtale de stimuli langagiers, mise en évidence à
partir de la réactivité cardiaque. Résultats préliminaires », Comptes rendus de l'Académie des
Sciences de Paris, t. 305, Série III, 1987, p. 161-164.
16 Lecanuet J.-P. & Granier-Deferre C., « Speech stimuli in the fetal environment », dans
B. de Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage & J. Morton (Eds.),
Developmental neurocognition : Speech and face processing in the first year of life, Dordrecht,
Kluwer Academic Publishers, 1993.
17 Lecanuet J.-P., Granier-Deferre C. & Schaal B., « Continuité sensorielle transnatale »,
dans V. Pouthas et F. Jouen (Eds.), Les Comportements du bébé : Expression de son savoir ?,
Liège, Mardaga, 1993.
18 Lecanuet J.-P. & Granier-Deferre C., 1993, op. cit.
19 DeCasper A.J. & Fifer W.P., « Of human bonding : Newborns prefer their
mothers'voices », Science, 208, 1980, p. 1174-1176.
20 DeCasper A.J. & Spence M.J., « Prenatal maternal speech influences newborn's perception
of speech sounds », Infant Behavior and Development, 9, 1986, p. 133-150.
21 DeCasper A.J., Lecanuet J.-P., Busnel M.C., Granier-Deferre C. & Maugeais R., « Fetal
reactions to recurrent maternal speech », Infant Behavior and Development, 17(2), 1994, p. 159-
164.
22 Kuhl P.K., « Perception of auditory equivalence classes for speech in early financy »,
Infant Behavior and Development, 6, 1983, p. 263-285.
23 Jusczyk P.W. & Derrah C., « Representation of speech sounds by young infants »,
Developmental Psychology, 23, 1987, p. 648-654.
24 Bertoncini J., Bijeljac-Babic R., Jusczyk P., Kennedy L. & Mehler J., « An investigation of
young infants' perceptual representations of speech sounds », Journal of Experimental
Psychology : General, 117, 1988, p. 21-33.
25 Bijeljac-Babic R., Bertoncini J. & Mehler J., « How do four days old infants categorise
multisyllabic utterances », Developmental Psychology, 29, 1993, p. 711-721.
26 Mandel D.R., Jusczyk P.W. & Kemler-Nelson D.G., « Does sentential prosody help infants
organize and remember speech informations ? », Cognition, 53, 1994, p. 155-180.
27 Mandel D.R., Jusczyk P.W. & Pisoni D.B., « Infants' recognition of the sound patterns of
their own names », Pyschological Science, 6, p. 315-318.
28 Broca P., « Remarques sur le siège de la faculté du langage articulé, suivies d'une
observation d'aphémie (perte de la parole) », Bulletin de la Société d'Anthropologie, 6, 1861,
p. 330-357. Reproduit dans H. Hécaen et J. Dubois (Eds.), La Naissance de la neuropsychologie
du langage, 1825-1865, Paris, Flammarion, 1969, p. 61-91.
29 Wernicke C., Der aphasische symptomencomplex Cohn, Breslau, Weigert, 1874.
30 Schonen S. de, Van Hout A., Mancini J. & Livet M.O., « Neuropsychologie et
développement cognitif », dans X. Seron et M. Jeannerod (Eds.), Neuropsychologie humaine,
Liège, Mardaga, 1994, p. 487-527.
31 Geschwind N. & Galaburda A.M., « Cerebral lateralization : Biological mechanisms,
associations and pathology, I-III : A hypothesis and a program for research », Archives of
Neurology, 42, 1987, p. 428-459, 521-552 et 634-654.
32 Broca P., « Sur le siège de la faculté du langage articulé », Bulletin de la Société
d'Anthropologie, 6, 1865, p. 337-393. Reproduit dans H. Hécaen et J. Dubois (Eds.), La
Naissance de la neuropsychologie du langage, 1825-1865, Paris, Flammarion, 1969, p. 108-
121.
33 Lenneberg E., « Biological foundations of language », New York, Wiley, 1967.
34 Geshchwind N. & Galaburda A.M., op. cit.
35 Entus A.K., « Hemispheric asymmetry in processing of dichotically presented speech and
nonspeech stimuli by infants », dans S.J. Segalowitz et F.A. Gruber (Eds.), Language
development and neurological theory, New York, Academic Press, 1977.
36 Bertoncini J., Morais J., Bijeljac-Babic R., MacAdams S., Peretz I. & Mehler J.,
« Dichotic perception and laterality in neonates », Brain and Language, 1989, 37, p. 591-605.
37 Molfese D.L. & Molfese V.J., « Hemisphere and stimulus differences as effected in the
cortical responses of newborn infants to speech stimuli », Developmental Psychology, 15, 1979,
p. 505-511.
38 Glanville B.B., Best C.T. & Levenson R., « A cardiac measure of cerebral asymmetries in
infant auditory perception », Developmental Psychology, 13, 1977, p. 54-59.
39 Best C., Hoffman H., Glanville B.B., « Development of infant ear asymmetries for speech
and music », Perception and Psychophysics, 31(1), 1982, p. 75-85.
40 Dehaene-Lambertz G. & Dehaene S., « Speed and cerebral correlates of syllables
discrimination in infants », Nature, 370, 1994, p. 292-295.
41 Dehaene-Lambertz G., « Bases cérébrales de la discrimination syllabique chez le
nourrisson », Annales de la Fondation Fyssen, n° 9, 1994, p. 43-49.
42 Bertoncini J., Morais J., Bijeljac-Balbic R., MacAdams S., Peretz I. & Mehler J., 1989,
op. cit.
43 Curtiss S., Genie : a psycholinguistic study of a modern-day « wild child », London,
Academic Press, 1977.
CHAPITRE II

L'émergence de la parole

« In the beginner's mind there are many possibilities, but in the


expert's there are few. »
SHUNZYA SUZUKI

Les expressions vocales des premiers mois

Le nouveau-né crie en arrivant au monde. À moins de maladie, la


production de sons ne cesse pas chez les êtres humains, de leur premier
cri à leur dernier souffle. De la première syllabe au dernier mot,
l'homme est une machine à engendrer de la parole.
Durant les deux mois qui suivent la naissance, la production vocale
du nourrisson sera complètement contrainte par la physiologie de son
conduit vocal et par ses états physiologiques. En dehors des trop
fameux pleurs qui bercent les nuits de tous les heureux parents, le
nourrisson n'émet que des sons végétatifs ou réactionnels qui traduisent
son bien-être ou son malaise.
Le nourrisson est cependant, comme nous l'avons vu,
extraordinairement attentif à la parole : il regarde et écoute. Il suit avec
attention les mouvements de la bouche et tente de les imiter. Il
distingue les voix avec une préférence particulière pour celle de sa
mère. Il est sensible aux rythmes et aux intonations des propos des
adultes et, habitué à la prosodie de sa langue maternelle, peut
« s'étonner » quand l'ami anglais en visite chez ses parents prend la
parole ! Selon Antoine Grégoire, un psychologue belge de Wallonie qui
a publié en 1937, à partir d'une étude de ses deux fils, un livre
remarquable1 sur les deux premières années du langage, les
phénomènes de la parole d'autrui intéressent et excitent le nourrisson
autant que les événements de la vie qui tombent sous ses sens.
L'approche expérimentale des dernières années permet de confirmer
cette observation. Cependant cet intérêt pour les faits de parole ne se
traduit que bien pauvrement dans les sons que le nouveau-né produit.
Entre deux et cinq mois, les bébés ne vocalisent qu'en position
couchée. Aussi leurs productions, les célèbres [arrheu] ou [ageu],
incluent-elles presque uniquement des sons issus du larynx ou du
velum2. Le nourrisson ne maîtrise pas sa phonation : ce n'est que vers
quatre ou cinq mois qu'il devient capable de moduler les variations de
sa voix. Ses vocalisations deviennent alors progressivement
volontaires. Vocaliser est, de fait, un des premiers comportements
volontaires de l'enfant. Dès ce moment, le nourrisson va chercher à
étendre son répertoire sonore. Il développe toute une série de jeux
vocaux au cours desquels il manipule aussi bien les traits prosodiques
de hauteur de la voix (cris aigus ou grognements), le niveau sonore
(hurlements ou chuchotements), que les traits consonantiques : bruits
de friction, de murmure nasal [m:::], bilabiales roulées [prrr], [brrr],
trilles uvulaires (sortes de roucoulements). Le bébé joue aussi avec ses
articulateurs, claque la langue, ouvre et ferme la bouche, etc. Les
premières voyelles apparaissent durant cette période.
Vers la seizième semaine, on entend les premiers rires et les cris de
joie émis avec la bouche grande ouverte. Les rires du bébé sont
merveilleux à entendre comme à voir ! Tout son être participe à la
succession de gloussements qui manquent presque de l'étouffer ! Avec
le contrôle de la phonation, acquis vers cinq mois, l'enfant peut
moduler plus finement la durée, la hauteur et l'intensité de ses
productions vocales. La fréquence fondamentale des vocalisations se
situe aux environs de 450 Hz pour la plupart des bébés. Cependant, les
variations de hauteur dans une même vocalisation peuvent être
surprenantes et atteindre jusqu'à trois octaves. Prémonition des plaisirs
que lui apporteront les mots dits et entendus, le petit humain semble
avoir déjà un plaisir infini à jouer de sa voix. Souvent il s'en étonne,
parfois en rit. Mais surtout, il semble devenir conscient de l'impact de
ses gazouillis et commence à en user de façon sociale pour
communiquer ses émotions et ses demandes.
Vers la fin du sixième mois, le bébé est capable de coordonner
globalement des ajustements phonatoires et supraglottaux : il
commence à pouvoir interrompre ses vocalisations à volonté, ce qui est
un acquis essentiel pour le contrôle vocal. Il peut aussi régler la hauteur
de ses vocalisations sur celles de son interlocuteur : sa voix est plus
haute quand il est avec sa mère que quand il est avec son père. Il peut
également imiter des schémas d'intonation simples à la suite
d'exemples adultes3-4. La capacité d'imitation de comportements
vocaux ainsi rétablie sera régulièrement enrichie dans les mois
suivants.
Entre quatre et sept mois, le nourrisson a également étendu son
répertoire de mouvements articulatoires à des mouvements qui mettent
en jeu l'avant de l'appareil articulatoire. Aux [arrheu] ou [ageu] du
début succèdent des sons un peu incertains mais contenant des quasi-
consonnes [aw:a], [abwa], [am:am] et des voyelles isolées prolongées
et modulées. Dès quatre et cinq mois, certaines des productions sont
plus courtes et incluent des sons de type consonantique ressemblant à
des syllabes. Mais ces pseudo-syllabes n'ont pas les caractéristiques
requises pour être des syllabes de langues parlées5. En fait, durant cette
période préparatoire au babillage, l'enfant fait des gammes en
manipulant des sons vocaliques [aï:], [eï:], [a:e]. Il joue à faire varier
les intonations, les successions, les durées. En répétant ainsi certains
types familiers, le bébé se familiarise avec des routines et devient de
plus en plus apte à produire des effets sonores variés.
Il est probable que ces jeux lui permettent de découvrir d'une part,
les relations entre l'intensité et la durée du son qu'il produit, et d'autre
part, le mode d'agencement des articulateurs nécessaires à cette
production. Progressivement, le bébé s'exerce à de petits mouvements
de fermeture de la partie avant du tractus vocal, qui lui permettent de
préciser l'activité de la mâchoire, des lèvres et de la langue. Les
gazouillis du premier âge, « travail combiné de l'attention, des
sensations, des sentiments et de l'imitation inconsciente6 », vont
prendre fin. L'enfant s'apprête à babiller. Il est dans l'antichambre de la
parole.

De rapides spécialistes
de leur langue maternelle

Bien qu'elles lui soient toutes accessibles à la naissance, le bébé ne


parlera pas toutes les langues.
Acquérir une langue requiert d'associer des sons et des sens selon les
règles phonologiques et syntaxiques de cette langue. Dans un premier
temps, l'enfant doit sélectionner les sons (segments phonétiques ou
syllabes) pour constituer le répertoire des sons utilisés dans sa langue et
se représenter la combinatoire de ces sons. Il doit également assimiler
les traits prosodiques (accent, rythme et intonation) qui lient les unités
en formes organisées (mots, syntagmes, phrases). Les différentes
langues parlées dans le monde se différencient sur un grand nombre de
ces points. Or l'enfant n'apprendra que sa langue maternelle, ou que ses
langues maternelles dans le cas de familles bilingues.
Dès les premiers jours, on l'a vu, il a commencé à repérer et
mémoriser des caractéristiques prosodiques de sa langue maternelle. En
revanche, la discrimination des contrastes phonétiques est chez le
nourrisson universelle, non spécifique. Elle ne va pas le rester. Nous,
adultes, ne pouvons pas ou avons le plus grand mal à discriminer
certains contrastes de sons appartenant à des langues étrangères
lorsqu'ils n'existent pas dans notre langue. Quand donc se produit cette
« perte » de capacité ? Est-elle précoce ou relativement tardive ? Un
sage a dit qu'en face d'une tâche à résoudre, il y a beaucoup de
possibilités dans l'esprit du débutant, et peu dans l'esprit de l'expert.
Pour devenir expert en sa langue, il faut que l'enfant sélectionne les
« bons » gestes à accomplir, les « bons » signaux sonores à écouter.
Patricia Kuhl7 a cherché à savoir quand les catégories vocaliques
devenaient spécifiques à la langue parlée dans l'environnement de
l'enfant. Chaque langue possède une façon typique de prononcer les
voyelles. Les « prototypes » ne sont pas les mêmes selon les langues.
Ainsi, il existe en anglais comme en français une voyelle /i/ dont la
prononciation diffère d'une langue à l'autre. Pour réorganiser les
catégories vocaliques selon l'espace vocalique propre à sa langue,
l'enfant acquiert un « modèle » de voyelle typique du système
phonologique de sa langue. Afin de tester l'organisation de l'espace
vocalique des bébés, Patricia Kuhl et son équipe8 ont étudié la
discrimination des voyelles /i/ chez des bébés anglais et suédois de six
mois pour déterminer si un effet du prototype de cette voyelle dans
chacune des deux langues se manifestait dès cet âge.
L'idée est la suivante : si les enfants ont déjà une représentation des
voyelles de leur langue organisée autour des prototypes de cette langue,
la différence des prototypes entre l'anglais et le suédois se marquera,
chez les bébés anglais et suédois, par des différences dans l'assimilation
au prototype de voyelles distinctes de ce prototype. On montrera ainsi
que les enfants n'ont plus une représentation universelle de l'espace
vocalique, mais une représentation de celui-ci adaptée à leur langue.
Pour déterminer cette existence de catégories vocaliques organisées
autour de prototypes, on place un enfant en présence d'un son de
référence qui se répète une fois par seconde. Puis ce son change. Si
l'enfant tourne la tête au moment du changement, il est récompensé : un
petit jouet animé s'éclaire. Si l'enfant ne tourne pas la tête, le jouet,
enfermé dans sa boîte en plexiglas, reste invisible. Ainsi l'enfant
apprend-il à tourner la tête quand le son de référence change, et l'on
peut observer quelles différences entre les sons sont effectivement
perçues par lui.
Or les bébés américains et suédois n'ont pas réagi de manière
identique dans cette expérience. Les premiers ont eu d'autant plus de
difficultés à distinguer les échantillons de /i/ que ceux-ci se trouvaient
proches du prototype de la voyelle /i/ de l'anglais ; en revanche, la
proximité des échantillons de /i/ avec le prototype anglais n'a pas joué
pour les bébés suédois. Mais ceux-ci ont eu du mal à distinguer les /i/
lorsqu'ils se rapprochaient du prototype du /i/ suédois. À six mois, les
bébés ont donc bien une représentation de l'espace vocalique adaptée à
leur langue.
Selon Patricia Kuhl, l'espace acoustique initial est divisé par des
frontières psycho-acoustiques universelles. À six mois, sous l'effet du
contact avec la langue parlée dans leur entourage, les bébés ont
réorganisé et simplifié cet espace : ils l'ont rendu pertinent pour leur
langue particulière. Ainsi disparaissent les frontières entre catégories
non pertinentes dans la langue maternelle. Seules demeurent celles qui
cernent des prononciations suffisamment proches du prototype de la
langue.

FIGURE 1 - Partition hypothétique de l'espace acoustique permettant des


distinctions phonétiques universelles, et frontières de l'espace
vocalique de l'anglais parlé (d'après P. Kuhl, 1995).

Au fil des semaines, l'enfant a donc sélectionné les éléments


compatibles avec son environnement linguistique. Il commence à
négliger « d'entendre » ceux qui sont généralement absents des
structures phonétiques qu'il perçoit dans son entourage habituel.
Ce mécanisme de sélection compare des représentations internes
constamment générées par le cerveau aux formes qui se présentent
dans l'environnement linguistique9. Sont retenues celles qui sont
compatibles avec les contrastes, les structures syl-labiques et les traits
prosodiques qui existent dans la langue de l'enfant. Les « engrammes »
constitués de cette façon resteront dans son cerveau. Ainsi, à travers ce
qu'il entend, les capacités de perception de l'enfant se réorganisent pour
sélectionner et traiter les éléments de sa langue maternelle. Ingénieux
comme tous les bébés, ceux des familles bilingues devront se
débrouiller pour mener à bien ces sélections et ces réorganisations en
parallèle pour les deux langues qu'ils entendent.
Vers cinq-six mois commence à s'éloigner le petit génie à l'écoute
encyclopédique, et à poindre un petit génie « phonéticien » qui va
organiser en quelques mois un objet particulier : la langue de son pays.
Si, dès ce moment, une sensibilité aux catégories vocaliques de leur
langue apparaît chez les bébés, c'est seulement vers dix mois que
commence le déclin de leur capacité à discriminer tous les contrastes
consonantiques. Les voyelles et les consonnes ont en effet des rôles très
différents dans la parole. Les premières, qui portent l'information
prosodique, sont plus aptes à « aimanter » l'attention de l'enfant.
Dans de jolies expériences, Werker et Tees10 ont comparé la capacité
d'enfants anglais du Canada à discriminer des consonnes de l'hindi,
langue parlée en Inde, et du thompson, langue indienne du Canada. Les
adultes anglais ne sont pas capables d'entendre la différence qu'il y a
entre le /ḱi/ et le / i/ du thompson, pas plus que le constraste
rétroflexe/dentale de l'hindi. Pour eux, ces phonèmes bien distincts
pour les locuteurs de ces langues s'entendent comme un même son.
Tous les bébés anglophones de six-huit mois sont parfaitement
capables de discriminer les phonèmes étrangers. Mais entre dix et
douze mois, ils deviennent incapables de discriminer les phonèmes du
thompson ou de l'hindi. La performance des enfants de huit-dix mois se
situe entre ces deux extrêmes : environ la moitié des bébés discrimine
encore les contrastes, tandis que l'autre moitié n'y parvient plus.
FIGURE 2 - Pourcentage d'enfants de milieu anglophone qui distinguent
les contrastes hindi et thompson (salish). Dans le panneau du haut, les
groupes d'âge correspondent à des enfants différents. Dans le panneau
du bas, l'étude est longitudinale. On voit que les enfants de milieu
anglophone perdent graduellement l'aptitude à distinguer les contrastes
étrangers à leur langue (d'après J. Werker 1984).

L'incapacité à discriminer le /r/ du /l/, qui nous surprend chez les


adultes japonais, et qui, à l'aéroport de Tokyo, a failli me faire partir
pour Bali plutôt qu'à Paris (« Pali »), trouve son origine dans cette
précoce perte d'attention des enfants japonais pour un contraste qui
n'existe pas dans leur langue.
Plus tardive que celle des voyelles, la réorganisation des
discriminations consonantiques paraît liée aux débuts de la
reconnaissance des mots. Celle-ci accélère les processus de sélection :
ce qui n'est pas pertinent ne doit pas encombrer le cerveau au moment
où l'enfant commence à mémoriser les formes ver-bales qui vont
constituer son lexique. Alors, la discrimination des sons perd son
caractère « gratuit » pour rendre compte de différences de sens.
La façon dont se réorganise la perception des catégories
consonantiques est relativement complexe. Quand les enfants
commencent à sélectionner les catégories propres à leur langue et à
discerner leurs propriétés spécifiques, leur perception des contrastes
non pertinents dans celle-ci se modifie. Mais tous les contrastes non
pertinents ne seront pas éliminés dès dix-douze mois : certains
resteront assimilés à des catégories de la langue jusqu'au moment, plus
tardif, où tous les contrastes prendront une valeur linguistique dans le
cadre du système phonologique de la langue de l'enfant. Ce moment se
produit vers deux ans. De subtiles expériences de Catherine Best11
montrent l'évolution de ces réorganisations dont certaines laissent des
traces chez les adultes.

Le babillage
« On pourrait, en suivant le même exemple, montrer comment un
enfant apprend à parler tout à fait, mais il suffit d'avoir observé
les commencements et l'on peut comprendre aisément la suite. »
G. DE CORDEMOY, XVIIIe siècle.

Enfin, le grand jour arrive ! L'enfant commence à babiller. Les


débuts du babillage, aussitôt perçus par les adultes, sont généralement
très brusques. Aux sons incertains des jours précédents, succèdent les
premiers « pa pa pa » ou « ba ba ba », nets et bien articulés,
immédiatement repérés par les parents. Ceux-ci ont parfois tendance à
les interpréter comme des ébauches de premiers mots. Quelques pères
un peu pressés clament que l'enfant a dit son premier mot et que ce mot
est, naturellement, « papa ».
Le babillage marque une étape importante dans le développement de
la parole. Aux balbutiements se substituent des productions qui
constituent le début de ce développement. Certes, le babillage n'est pas
le langage, mais il est un langage qui fournit un cadre pour le
développement de la parole. Pour reprendre une expression poétique de
A. Grégoire12, c'est « un langage dont le tissu phonétique ondoie avec
fréquence mais qui obéit néanmoins aux principes des possibilités
phonétiques ». Avec moins de poésie, nous dirons que dans le babillage
l'enfant commence à produire des syllabes qui respectent les
contraintes des syllabes dans les langues naturelles13.
Sans trop entrer dans des détails qui occupent les linguistes, nous
dirons que la syllabe est l'unité rythmique de base des langues
naturelles. Toutes les langues sont syllabiques. Dans toutes les langues,
la structure syllabique s'analyse en termes de consonnes et de voyelles,
c'est-à-dire selon une opposition de traits entre un tractus vocal
contracté (consonnes) et un tractus vocal ouvert (voyelles), entre des
sons apériodiques (consonnes) et des sons périodiques (voyelles). La
syllabe est composée d'un noyau (la voyelle), d'une ou de marges (les
consonnes) et d'une transition entre les formants du noyau vocalique et
les marges consonantiques.
À chaque voyelle correspond une syllabe. La durée d'une syllabe
dans les langues naturelles est comprise entre 100 et 500 ms. Son
noyau est une voyelle, c'est-à-dire un son émis par une source d'énergie
périodique dont le schéma de résonance correspond à celui d'un
conduit vocal ouvert. Les transitions entre la ou les marges
consonantiques et le noyau vocalique doivent se faire selon une pente
continue.
Ces notions nous permettent de cerner les changements d'articulation
qui marquent le passage des quasi-syllabes produites entre quatre et
sept mois – avant le babillage – aux syllabes du babillage, dont les
caractéristiques, semblabes à celles que nous venons de définir,
correspondent à la forme matérielle des syllabes des adultes.

Que disent les enfants entre sept et dix mois ?


C'est entre six et dix mois, souvent vers sept mois, mais avec de très
importantes variations selon les enfants, que l'on peut entendre le
premier babillage. Le plus souvent, ces premières formes – ce que l'on
appelle « babillage canonique » – se caractérisent par la production de
syllabes simples : une séquence consonne-voyelle telle que [pa], [ba],
[ma]. Les sons consonantiques introduisant la syllabe sont le plus
souvent des occlusives ou des nasales. Les sons [p] [b] [t] [d] et [m], en
général combinés avec des voyelles centrales basses : la voyelle [a],
des voyelles d'avant basses [ae] ou des voyelles centrales [ᴧ], forment
la base du babillage. Jusqu'à dix mois, les autres voyelles sont
relativement rares dans les productions. Certains enfants préfèrent
produire des consonnes vélaires [g], [k], plutôt que des labiales. Le fils
de Grégoire par exemple n'en était pas avare. C'est dire que les
différences entre les enfants commencent tôt. Les syllabes sont très
souvent groupées en suites répétitives : /ba ba ba/, /dae dae dae/, /be be
be/. Cependant ce type de production n'est pas exclusif. Dès les débuts
du babillage, l'enfant peut s'abandonner à certaines fantaisies de
transformations phonétiques. Mais rien de trop ! Il procède par petites
touches, avec parfois une variation plus originale. A. Grégoire, qui note
les « productions des petits matins de son fils de huit mois », trouve au
milieu des fréquents /pa pa/ et /ta ta ta/, des /de de de/, /emawma/, /aba
abwou/, /go agou ga/, /go agé eka/. Les suites voyelle-consonne-
voyelle /aba/, /aedae/, /éka/ sont assez fréquentes, les syllabes fermées,
c'est-à-dire ayant une consonne en finale, telles que /dat/ ou /bam/, sont
très rares.
Les séquences rythmiques formées de syllabes consonne-voyelle
répétées /ba ba ba ba/, qui caractérisent le babillage canonique,
pourraient aider à relier les aspects sensoriels et moteurs des
vocalisations. En réitérant le geste articulatoire, l'enfant apprend à y
associer les schémas acoustiques correspondants. La régulation des
possibilités phonétiques serait facilitée par les variations acoustiques et
articulatoires de répétitions rythmiques.
Quel est le rôle de la motricité dans les productions du babillage ?
Les suites de syllabes répétées sont produites par une alternance
rythmique d'ouverture et de fermeture de la bouche, accompagnée de
phonation. Un conduit vocal relativement ouvert pendant la phonation
entraîne la production d'une voyelle, tandis que la production de sons
de type consonantique implique un conduit vocal relativement fermé.
Pour P. MacNeilage et B. Davis14, ce cycle d'oscillations de la bouche
fournit la base du babillage et rend compte de la forme de ses
productions. Les catégories de consonnes qui demandent le plus de
fermeture (de constriction) du conduit vocal sont les consonnes
occlusives (p,b,t,d,k,g) et les consonnes nasales (m,n,ng). Elles
représentent plus de 80 % des consonnes au début du babillage, avec
un avantage pour les consonnes qui mettent en jeu les articulateurs
supérieurs comme les labiales et les dentales. À une tendance à la
fermeture maximale du conduit vocal dans les consonnes, correspond
une ouverture relativement importante de la bouche pour les voyelles.
Les voyelles les plus fréquentes sont donc [a] et [ae]. Ainsi
s'expliqueraient, par le mouvement relativement simple d'une
succession d'ouvertures et de fermetures de la mâchoire, les
productions de type /ba ba ba/, /da da da/ ou /ma,mam/ du début du
babillage. L'oscillation mandibulaire fournirait « le cadre » articulatoire
dont le contenu serait ensuite donné par les mouvements de la langue.
Le babillage, avec des syllabes répétées, refléterait la formation de
« cadres » dans lesquels les différents segments phonétiques seront
insérés au fur et à mesure qu'ils deviendront accessibles à l'enfant.
Ce modèle prédit la fréquence des productions /ba ba ba/ : labiale et
voyelle centrale basse, /dé dé dé/ : dentale et voyelle d'avant, et /go go
go/ : vélaire et voyelle d'arrière.
Mais si les premières productions peuvent s'interpréter selon cette
description, nous verrons que très vite le bébé s'avère bien trop malin
pour se laisser enfermer dans un cadre aussi rigide !
Dans les premiers mois, l'enfant s'est exercé à varier sa voix et ses
intonations. Il a ainsi acquis un certain contrôle sur la durée, l'intensité
et la hauteur de ses vocalisations. Mais qu'en est-il de l'intonation dans
le babillage ? Un point de vue aujourd'hui dépassé considérait
l'intonation comme un simple ajout surimposé aux productions
phonétiques. Or la diversité des prosodies dans les langues implique
une maîtrise des relations temporelles et des variations d'intonation
ainsi que des modalités d'attaque ou de relâchement des sons.
Les analyses acoustiques de R. Kent et A. Murray15 sur des
vocalisations de bébés aux États-Unis offraient un tableau uniforme de
contours tombants dont on pensait qu'ils étaient une tendance générale
représentant le corrélat physiologique de la « fin du groupe de
respiration ».
Cependant, les écoutes attentives de bébés de sept-huit mois de
différents pays étonnent le chasseur de babillage : certes, les babillages
offrent des ressemblances, mais ils ne sont jamais les mêmes. À leur
écoute, il nous semblait bien qu'existaient des caractéristiques qui
définissent une qualité de voix, une manière d'articuler, de moduler des
syllabes, tout à fait indépendantes de ce que l'on dit, et qui sont
l'apanage de chacun. Mais cette qualité de voix, cette manière de parler
n'étaient pas seulement individuelles, elles dépendaient aussi de la
langue et de la culture. On trouvait chez les bébés français une manière
de vocaliser, d'attaquer ou de relâcher les sons qui n'était déjà plus la
même que celle des bébés arabes. Cette impression, si contraire aux
positions académiques des années soixante-dix, était-elle le fruit de
notre imagination ? Cela demandait à être vérifié.
Une simple expérience16, dans laquelle nous avons présenté à des
adultes « naïfs » des paires d'échantillons de babillage d'enfants de huit
mois, français, arabes et cantonais, a permis de nous en assurer. Les
adultes devaient indiquer, au besoin deviner, quel était, selon eux, sur
deux échantillons entendus l'un à la suite de l'autre, le babillage du
bébé français. Les choix, corrects à plus de 70 %, suggèrent que, chez
les bébés de huit mois, des caractéristiques d'intonation et de qualité
vocale, spécifiques à chaque langue, ont déjà influencé la manière de
produire des sons et de les grouper en contours d'intonation. On trouve
chez les bébés arabes des attaques dures, des bruits de friction dans le
relâchement des sons, et des syllabes accentuées. Chez les bébés
français, on rencontre des allongements et des modulations plus
douces, alors que les fins de productions brusques avec « ton entrant »
ainsi que de multiples petites variations de hauteur préfigurent les
variations de tons chez les bébés cantonais. Ainsi, peut-on conclure, le
type de phonation, l'organisation rythmique et les contours d'intonation
des babillages reflètent des caractéristiques de la langue de
l'environnement dès le huitième mois.

Que disent les enfants entre dix et douze mois ?

Vers dix-onze mois, l'articulation devient plus nette, plus assurée, et


les suites de syllabes variées deviennent plus nombreuses.
Après la période de babillage dit « canonique », durant laquelle les
séries de syllabes répétées ont formé la majeure partie des productions,
il arrive un moment où l'enfant augmente considérablement sa
production de suites polysyllabiques dans lesquelles sont
systématiquement variées les voyelles et les consonnes. Bien que le
champ des combinaisons soit encore restreint et phonétiquement
circonscrit, certains enfants affectionnent la difficulté : « /apabouyé oyé
oyé pabouyé…/ », dit Jeanne, tandis que Léa propose un petit
discours : « /baepach :ebape'hae chlxo/ ». Cependant la majorité des
productions restent mono ou bisyllabiques et les occlusives comme les
nasales continuent à être prédominantes. Les productions uniquement
vocaliques diminuent.
Observons un bébé de dix mois, Pierre. On a posé le micro pas trop
loin de lui et on s'est éloigné dans la chambre d'à côté tout en le
surveillant par la porte ouverte. Pierre joue et babille. Quand il frappe
sur un cube, il produit des sons brefs, des syllabes isolées, puis il
s'arrête et, tout en regardant dans le vague, produit une longue série de
/bababa/, suivie d'une série de /dadada/ puis de /gagaga/. Que fait le
bébé en parcourant cette gamme ? Ce n'est pas par hasard si ces trois
séries qui jouent sur les places d'articulation se suivent : labiale, dentale
puis vélaire. Pierre a modulé ses productions d'avant en arrière en
rétractant la langue et en changeant le point d'articulation dans le
conduit vocal. Le lendemain, Pierre produit des séries /apff, pepff/.
Cette fois, il garde la même place d'articulation, mais il joue sur le
mode d'articulation ([p] est une occlusive labiale et [f] une fricative
labiale). On remarque d'autres régularités : les syllabes isolées
précèdent les suites de syllabes mais les suivent rarement, les
séquences de sons répétés précèdent les séries de sons variés. Si nous
suivons Pierre au jour le jour, nous pourrons donc remarquer, à côté de
régularités dans l'ordre de ses productions, une évolution dans la façon
dont il contraste les effets de la place et du mode d'articulation des
sons. Entre le babillage canonique et le babillage varié que l'on trouve à
cette période, le bébé a exploré assez systématiquement la gamme du
jeu articulatoire et il peut s'amuser à produire des suites de variations
jouant sur la position des articulateurs. Il a ainsi en quelque sorte
construit un tremplin pour la parole.
Mais déjà se marque une grande variabilité entre les enfants. Le
babillage de Carole contient beaucoup de suites avec des vélaires /ga/
ou /ka/ : elles représentent la moitié des occlusives qu'elle produit ;
Charles, en revanche, ne produit quasiment pas de vélaires. Noël ne
produit aucun /l/ dans son babillage, alors que Laurent les inclut dans
plus du tiers de ses productions de babillage. On ne trouve pas
d'occlusives labiales (p,b) dans le babillage de Laurent à dix mois, ce
qui est rare : pour Charles, Carole, Marie et Noël, les suites introduites
par /b/ et /p/ sont très fréquentes. Pour Marie, elles représentent plus du
tiers des productions. Anne, moins habile à varier ses syllabes, joue
beaucoup sur l'enveloppe prosodique. Elle groupe des suites de
/mémémémé/ sous des contours d'intonation montants ou descendants,
rythmés par les syllabes, qui donnent l'impression de petites phrases
dans des conversations animées. Son tremplin pour la parole est plus
prosodique.
Ainsi, des préférences pour certaines configurations se marquent
nettement dans les productions des enfants de dix-douze mois. Aucun
enfant n'explore systématiquement toutes les possibilités articulatoires
dont il dispose. Il choisit et privilégie certaines routines de production
qui lui serviront quand il s'agira de programmer des mots. L'important
demeure la faculté que lui a donné l'exercice de ses capacités
articulatoires d'arrêter un cadre rythmique et syllabique qui fournira la
base de la programmation articulatoire des premiers mots.
Mais pourquoi les bébés babillent-ils ? Est-ce un jeu ? Est-ce un
prélangage ?
Quand des esprits sérieux se penchent sur la nature
et la fonction du babillage

Quelle est donc la fonction du babillage ? Que fait l'enfant quand il


babille ? Est-il seulement attentif aux jeux de sa voix ? Pourquoi cet
intérêt pour les sons du babillage quand l'étude de celui-ci,
historiquement, a longtemps laissé les psychologues et les phonéticiens
relativement indifférents, à quelques remarquables exceptions près ?
Antoine Grégoire17 est une de ces exceptions. Il privilégiait
l'hypothèse d'une grande précocité de l'influence des sons de la langue
sur les vocalisations des bébés. Mais les moyens de vérifier ces
intuitions manquaient. Sans le recours à des enregistrements qui
permettent la confrontation entre des transcriptions issues de différents
observateurs, il est en effet difficile de comparer les observations et
notations de vocalisations de bébés appartenant à des milieux
linguistiques différents, quelque méticuleuses et obstinées que soient
les observations.
Les premières cent vingt pages du livre d'Antoine Grégoire,
consacrées à l'analyse phonétique des sons du gazouillis et du
babillage, disent toute l'importance que cet auteur attribuait aux
vocalisations des bébés. Grâce à des observations systématiques des
premiers mois, A. Grégoire pensait suivre ce qu'il appelait la
« normalisation » phonétique. Il estimait celle-ci précoce. Selon lui en
effet, le « gazouillis » n'échappe pas à l'influence du milieu et les
modalités articulatoires des langues modèlent les productions du babil.
« Si on suivait au jour le jour des nourrissons de divers pays, écrivait-il,
on observerait à coup sûr une normalisation phonétique relative dans le
sein même d'une masse de faits en apparence désordonnés. »
Les minutieuses analyses des productions du babil de ses deux fils
lui faisaient prédire, en 1937 : « Pour nous en tenir, une fois de plus, à
l'aspect matériel de la parole, à quelle époque commencera la
régularisation du système phonétique, autre-ment dit sa mise au point
progressive, conformément aux usages du terroir ? L'opinion
généralement adoptée fixe une date assez tardive à cette phase
nouvelle, soit la fin de la première année. Jusqu'à ce moment, le
babillage de l'enfant est présumé échapper à l'influence du milieu. À
cet égard, nous nous sommes déjà permis d'exprimer des doutes. Nous
croyons à la vraisemblance d'effets plus précoces. »
Antoine Grégoire aurait souhaité comparer le gazouillis des bébés
des Alpes bernoises à celui des jeunes Parisiens. Les Alpes bernoises
n'étaient pas choisies au hasard : l'écart du registre vocal devait
permettre de vérifier plus particulièrement si une différence entre
l'articulation « gutturale » chez les bébés des Alpes bernoises et
antérieure chez les bébés parisiens correspondait à la prononciation
propre à chacun des deux endroits. Hélas les moyens pour le faire lui
manquaient. Cela ne l'empêchait pas de situer les gazouillis et le
babillage comme des étapes d'une normalisation phonétique précoce,
une sorte de laboratoire où s'effectuait une préparation à la production
des sons de la langue avec leur spécificité articulatoire.
Les approches structuralistes et générativistes ont, au contraire, mis
l'accent sur les facteurs universels du développement dans le langage.
Dans ce cadre, au moins dans un premier temps, la genèse du
développement du langage a paru de peu d'intérêt.
Le grand linguiste structuraliste Roman Jakobson, dans son fameux
livre Langage enfantin et aphasie18, publié en 1941, établit une
discontinuité de nature radicale entre les productions du babillage et
celles qui appartiennent au langage. Selon lui, ces productions n'ont
aucune relation avec le répertoire des premiers mots. D'emblée, il
élimine l'intérêt de toutes les études des sons du babillage pour
l'acquisition de la parole. Le babillage ne serait qu'un exercice donnant
lieu à des suites de sons, aléatoires et extrêmement variés. Une période
de silence séparerait d'ailleurs ces productions, qui seraient non
linguistiques, de la production des premiers sons linguistiques
apparaissant avec les premiers mots.
Une opinion aussi radicale, venant d'un esprit aussi respecté que
R. Jakobson a, durant des années, figé les opinions des chercheurs vis-
à-vis des productions prélinguistiques. Et cela d'autant plus que son
analyse rejoignait celle de E. Lenneberg19, de N. Chomsky20 ainsi que
de la plupart de leurs disciples dans les années soixante. Pour eux, les
productions de babillage correspondent à un stade donné de la
maturation et évoluent selon des processus de maturation. Leurs formes
sont universelles et doivent se retrouver chez tous les enfants d'un
même âge, même chez les enfants sourds. Cela avant que ne se
manifestent des régularités « phonologiques ».
L'avantage des propositions de Jakobson tenait dans la possibilité de
les vérifier. Elles ont stimulé les recherches, et les études sur le
développement phonologique se sont multipliées, bientôt suivies par
des études portant sur les formes « prélinguistiques ». Or les données
empiriques qui devaient appuyer les propositions de Jakobson se sont
révélées fort peu convaincantes. Ni l'affirmation que le babillage n'a
aucun rapport avec les productions plus tardives ni les schémas
universels proposés pour le développement phonologique n'ont été
vérifiés par l'analyse des productions des enfants21.
Dans les années soixante-dix, une autre approche de la nature du
babillage se dessine. Un groupe de linguistes22-23-24 met alors l'accent
sur les contraintes biomécaniques de l'appareil articulatoire et sur les
relations de celles-ci avec la perception. Si cette position semble
rejoindre celle de E. Lenneberg en insistant sur la biologie du
développement, elle s'en distingue en fait par son rejet de mécanismes
privilégiés spécialisés pour le langage, et par son interprétation de la
nature et de la fonction du babillage.
Selon cette approche, tous les mouvements issus de l'équipement
biologique de l'être humain possèdent des caractéristiques structurales
fondamentales ayant des formes d'organisation comparables fondées
sur un assemblage de mouvements coordonnés25. Un geste
fondamental sous-tend toutes les productions articulatoires du
babillage. Il implique un mouvement cyclique alterné d'ouverture et de
fermeture du conduit vocal, produit d'abord par l'ouverture et la
fermeture de la bouche26. Cette configuration motrice qui rend compte
des syllabes canoniques du babillage ne requiert pas un contrôle
moteur spécifique. Un simple mécanisme fournit les régularités qui
rendent compte des syllabes que l'on trouve dans tous les babillages de
tous les enfants, quel que soit leur groupe linguistique. L'explication
causale des schémas prélinguistiques ainsi que des schémas des
premiers mots, repose donc sur la biomécanique. Les changements
anatomiques seront un facteur essentiel sinon suffisant du
développement. Avec le modèle biomécanique, les auteurs cherchent à
montrer que les systèmes phonétiques émergent en tant qu'adaptations
aux contraintes de production et de réception du langage27.
Cette approche rejoignait les travaux de phonéticiens sur la nature
des inventaires phonétiques de langues parlées dans le monde. Selon
eux, les aspects généraux du babillage pouvaient s'expliquer par la
présence, en chaque langue, d'un « cœur » commun de sons, ou d'un
sous-ensemble d'articulations qui for-merait la base des systèmes de
sons que les enfants devraient apprendre. Ce « cœur » se développerait
plus tôt et plus systématiquement que les combinaisons de segments
plus rares ou plus élaborés.
Ces approches réduisent les possibilités pour un enfant d'échapper à
l'universalité des schémas de babillage. La variabilité que l'on
remarque entre les vocalisations des enfants s'expliquerait par des
préférences individuelles pour certains de ces schémas, à l'intérieur des
limites imposées par les tendances biomécaniques qui contrôlent les
coxcurrences consonnes-voyelles.
Les modèles biomécaniques de l'articulation ont eu le mérite de
replacer le babillage dans le cours du développement phonétique
général. Avec ce type de modèle, les formes du babillage canonique
sont en effet liées à des gestes qui fondent les structures de base de
l'articulation dans les langues. Leur valeur pour le développement de la
parole est ainsi reconnue. Mais, avec ces approches, l'influence du
milieu linguistique sur le babillage a continué à être sous-estimée.
Curieusement, c'est au moment où étaient mises en évidence les
capacités perceptives des nourrissons qu'un courant de pensée très
puissant a minimisé leur effet sur la production.
Les propositions d'une interprétation essentiellement biomécanique
du babillage contiennent une part de réalité. Elles rendent compte de la
fréquence de certains types de productions dans le babillage.
Cependant elles sous-estiment le rôle des processus de sélection qui
permettent le réaménagement des capacités précoces de perception.
Certes, ces propositions ne rejettent pas le rôle des sources
d'information (auditives, visuelles, proprioceptives) qui établissent une
autorégulation entre l'écoute et la production, mais elles ne situent ce
rôle que tardivement et avec timidité.
Et cependant le seul fait d'entendre des paroles modifie déjà le
comportement vocal de l'enfant ! Des preuves en sont données par la
différence que l'on trouve entre les enfants sourds et les enfants
entendants28. Les premiers ne commencent à babiller que plusieurs
mois après les enfants entendants.
Le traitement perceptif est-il donc sans influence sur les pro-
ductions ? Cela paraît bien surprenant quand on considère à quel point
le bébé est une remarquable machine à établir des correspondances !
Ce bébé si attentif à la parole, qui dès les premiers jours « préfère » sa
langue maternelle, distingue si bien dès la naissance /ba/ de /be/, /da/,
/bi/, /ga/ ou /gu/, ce bébé qui, dès les premiers mois, imite les gestes de
la bouche et, à quatre-cinq mois, fait correspondre des sons à des
mouvements de la bouche, ce bébé qui au même âge reproduit des
contours d'intonation, est-il vraiment passif devant ce qu'il entend, voit
et ressent, lorsqu'il s'agit de gérer ses propres productions ?
Dans les années quatre-vingt, l'hypothèse d'une interaction précoce29
a vu le jour (ou plutôt a été relancée, si l'on considère que certains
psycholinguistes comme A. Grégoire la prédisaient). Cette hypothèse
stipule un jeu d'ajustement entre l'équipement génétique et
physiologique des enfants d'une part, et les effets de l'expérience avec
la langue parlée par les parents d'autre part. Avant la naissance, cette
interaction module les capacités perceptives pour la prosodie. Dans le
deuxième quart de la première année, nous l'avons vu, elle remplit le
même rôle pour la phonétique. En production, cette interaction se
marque par l'évolution de l'organisation phonétique et intonative du
babillage. Le mécanisme qui la régit est biologiquement déterminé,
donc universel ; c'est celui qui permet aux enfants de faire des
sélections parmi les données de l'environnement. Le cerveau de l'enfant
produit constamment des variations internes, que l'on peut assimiler à
des hypothèses grâce auxquelles il teste le monde extérieur30-31. Le
processus de développement repose ainsi sur la sélection des données
empiriques qui permettent de fixer certaines des hypothèses. Petit à
petit se bâtissent des niveaux d'organisation de plus en plus adaptés au
monde extérieur.
Les productions vocales des enfants sont ainsi modelées par des
processus de sélection. Les formes phonétiques et les schémas
d'intonation spécifiques à la langue de l'environnement sont
progressivement retenus aux dépens des formes non pertinentes pour le
système phonologique de la langue. Ce processus commence dès la
naissance, sinon avant. Cependant, les premiers effets sur les
performances vocales en sont retardés particulièrement par le cours lent
du développement moteur.
Les réponses aux propositions issues de ces différents modèles
(maturationnel, biomécanique, interactif) se trouvent dans les données
empiriques. Mais des réponses vocales ou « circonstanciées » des
bébés ne sont pas faciles à obtenir et leur fantaisie brouille parfois les
pistes ! Heureusement, les faits sont têtus et les appels des enfants se
sont faits de plus en plus insistants pour nous obliger à revenir à la
compréhension chaleureuse d'un Antoine Grégoire à l'égard de leurs
productions vocales.

Les bébés français babillent-ils en français


et les bébés yoruba en yoruba ?

Quand Mary, petite fille anglaise de dix mois, babille, on croirait


entendre Madame Thatcher. Les séries de « djodj » qu'elle dit avec un
ton un peu pincé seraient invraisemblables chez un bébé français ou
chez un bébé cantonais ! Mais des exemples aussi caricaturaux
suffisent-ils à montrer l'influence de la langue sur les vocalisations ?
Mary est peut-être tout simplement une bonne imitatrice de quelque
lady de son entourage, déplorant les bêtises d'un certain Georges.
Seules des analyses interlangues systématiques peuvent apporter des
réponses. Elles doivent permettre de séparer ce qui est universel des
modifications systématiques dues à l'expérience d'une langue
particulière.
L'influence des langues maternelles sur le babillage des enfants a été
mise en évidence à partir d'expériences et d'observations parallèles
d'enfants appartenant à des communautés linguistiques différentes. Des
traits généraux, communs à tous les enfants, caractérisent les premières
productions de babillage, mais la variabilité qui apparaît durant le
dernier trimestre de la première année montre qu'un simple niveau
biomécanique de production n'est plus seul en jeu. Cette variabilité
indique-t-elle simplement la présence de possibilités aléatoires de
productions plus nombreuses ou rend-elle compte de processus de
sélection révélant un certain niveau d'organisation phonétique ?
Autrement dit, la variabilité phonétique des vocalisations des enfants
est-elle réelle et si oui, quelle est, dans cette variabilité, la part de la
structure phonétique spécifique de la langue de l'environnement ?
À une approche comparative doit s'adjoindre une approche
prédictive. Le système phonologique des langues peut-il permettre
d'élaborer des prédictions sur les processus épigénétiques qui sous-
tendent le développement des formes prélinguistiques ? Nous avons
mentionné plus haut comment, dès huit mois, l'organisation prosodique
et rythmique des productions de babillage permet à des adultes
d'identifier, parmi différents échantillons, ceux appartenant à des
enfants de leur propre communauté linguistique. La question restait
posée d'une influence de l'organisation phonologique de la langue de
l'environnement sur la structure phonétique du babillage.
L'étude systématique comparative interlangue du babillage doit
commencer par l'étude des voyelles. Celles-ci en effet sont
perceptivement saillantes dans la chaîne parlée, elles demandent moins
de précision que les consonnes dans le contrôle articulatoire. Dès 1980,
P. Lieberman32 a mis en évidence, pour les bébés anglais, l'émergence
d'une cohérence de l'espace vocalique dans le dernier quart de la
première année. Il était intéressant de voir si, au cours de ce
développement, s'affirmait une influence précoce de l'environnement
linguistique. Une étude des voyelles produites par des enfants de dix
mois appartenant à des groupes linguistiques très différents devait le
montrer.
Chaque langue a en effet un « espace vocalique » qui lui est propre ;
le nombre des voyelles dans les langues peut être extrêmement
différent : il varie entre trois à plus de seize dans certaines langues. On
peut étudier le système vocalique d'une langue au moyen de l'analyse
spectrale des voyelles produites par les locuteurs de cette langue : une
voyelle est en quelque sorte un son « musical » produit par la vibration
des cordes vocales modulée par la configuration du conduit vocal qui
amplifie certaines fréquences et en atténue d'autres. Les voyelles ont
chacune un timbre, une « couleur », qui leur est propre. Ce timbre est
lié au schéma des formants. Par exemple, un [u] a un timbre dit
sombre : ses deux premiers formants se situent à des fréquences
basses ; un [i] a un timbre « clair » : ses deuxième et troisième
formants se situent à des fréquences élevées. En bref, la couleur ou le
timbre d'une voyelle dépend de la configuration du conduit vocal qui
est définie par la position des différents articulateurs : lèvres, langue,
larynx, etc.
S'il y a influence précoce de l'environnement sur la sélection
phonétique dans le babillage, on doit trouver des différences
systématiques dans la distribution des sons vocaliques selon les
groupes linguistiques. Ces différences doivent en outre refléter celles
que l'on trouve dans le répertoire vocalique des langues adultes.
La réponse devait être recherchée aux quatre coins du monde. Il
fallait d'abord trouver des langues ayant des espaces vocaliques bien
différents. Ainsi des bébés français, anglais, cantonais et algérois ont-
ils reçu notre visite33. Les Anglais adultes ont plus de voyelles d'avant
[i] [I] [ae], les Français plus de voyelles arrondies [oe] [ø], les
Cantonais plus de voyelles d'arrière [ɔ] [ɑ], les Algériens n'ont que
trois voyelles dans leur système phonologique et les réalisations de ces
voyelles sont surtout centrales. Les bébés sont si sensibles aux sons du
langage qu'il est nécessaire de les interroger dans leur pays d'origine où
l'on peut espérer qu'ils n'ont pas entendu d'autres langues. Nous avons
donc enregistré des bébés anglais, cantonais et algériens de dix mois
dans le Sussex, à Hongkong et à Alger. Les bébés français étaient des
petits Parisiens.
Chacun des cinq enfants de chaque communauté linguistique a été
enregistré durant soixante minutes et les productions ont fourni entre
cinquante et soixante voyelles analysables par enfant. Nous avons
mesuré les caractéristiques acoustiques des voyelles (les fréquences des
formants F1 et F2). Ceci permet la représentation classique des
voyelles dans le plan F1 x F2 qu'illustre par exemple le fameux triangle
vocalique [a], [i], [u].
La figure ci-dessous présente les données de tous les enfants de
chaque groupe (les ellipses groupent 75 % des voyelles pour chaque
groupe).
FIGURE 3 - Espace vocalique de bébé de dix mois a) anglais b) français
) algériens d) cantonais. Les voyelles trouvées dans les babillages ont
été reportées selon la valeur du premier et du deuxième formants. On
voit des tendances différentes selon les groupes linguistiques (d'après
B. de Boysson-Bardies et al 1989).

La distribution des voyelles apparaît bien différente pour les quatre


groupes. Les enfants anglais ont tendance à produire plus de voyelles
hautes et d'avant /i/ et /I/ alors que les Cantonais, à l'extrême opposé,
favorisent les voyelles basses d'arrière /ɔ, /o/. Les Algériens ont un
espace vocalique plus centralisé que les Français dont le /a/ se
distingue déjà du /ae/ anglais et sonne bien français.
Ces variations reflètent-elles les caractéristiques des voyelles dans
les langues de chaque enfant ? Pour le savoir nous avons choisi de nous
pencher sur le caractère plus ou moins « compact » des voyelles pour
chaque groupe, et de comparer le degré de compacité pour l'espace
vocalique des adultes et des enfants des différents groupes : le rapport
des deux premiers formants des voyelles caractérise la « compacité »
des voyelles ou, par opposition, leur caractère diffus. Pour les voyelles
« compactes » le rapport F2/F3 est plus faible que pour les voyelles
diffuses qui sont en général des voyelles plus avant ou plus hautes. Les
voyelles dites diffuses sont des voyelles d'avant (/i/ et /é/). Comparer
les voyelles sur cet axe compact-diffus est commode car il s'agit d'une
dimension peu affectée par la longueur du conduit vocal.
La figure suivante donne le rapport F2/F1 chez les enfants et dans la
langue adulte.
FIGURE 4 - Les rapports entre le deuxième et le premier formants des
voyelles du babillage d'enfants de dix mois de différents groupes
linguistiques correspondent à ceux que l'on trouve dans leur langue
maternelle.

On observe un parallélisme des rapports de compacité entre voyelles


des enfants des différents groupes et voyelles des langues adultes :
rapport F2/F1 plus élevé chez les Anglais, plus faible chez les
Cantonais. Ce parallélisme montre qu'il existe déjà chez l'enfant une
représentation de l'espace vocalique de la langue qui lui permet de
réaliser les voyelles en fonction des caractéristiques des voyelles
perçues.
Les travaux de P. Kuhl34 sur les catégorisations perceptives, menés
aux États-Unis et en Suède, ont montré ultérieurement qu'il existait
bien, dès six mois, une plus grande sensibilité des bébés aux voyelles
prototypiques de leur langue. Ce codage précoce des catégories
vocaliques de la langue parlée dans l'environnement est en accord avec
les données montrant des différences précoces dans les productions. Et,
en retour, ces différences témoignent d'une utilisation du codage
perceptif des voyelles pour la production dès le babillage. Cette
convergence montre bien qu'une interaction entre le traitement
perceptif et le codage d'éléments du répertoire phonétique a lieu au
cours de la première année.

Il restait à vérifier qu'une influence du répertoire de la langue se


retrouvait pour les consonnes et les syllabes. De fortes résistances
s'opposaient à cette idée. La prédominance marquée des occlusives –
particulièrement des labiales et des dentales – dans le babillage des
bébés et dans les premiers mots fondait les approches articulatoires :
les consonnes sont plus complexes à produire que les voyelles, qui sont
plus stables, et requièrent donc plus d'habileté motrice. L'idée prévalait
d'une détermination uniquement articulatoire des consonnes.
À côté des enfants français et américains, ce sont, cette fois, des
bébés japonais et suédois qui ont bien voulu nous informer35-36.
Comme nos collègues américains et suédois qui ont mené avec nous
cette recherche, nous avons commencé, dans les différents pays, à
enregistrer les enfants lorsqu'ils avaient dix mois et ne produisaient pas
encore de mots. Cette étude s'est poursuivie jusqu'à ce que les enfants
produisent environ vingt-cinq mots au cours d'une séance : ils avaient
alors entre seize et dix-neuf mois. Babillage et mots ont été analysés
indépendamment et pour les différentes tranches d'âge.
La distribution des consonnes a été étudiée selon la place
d'articulation pour les trois catégories principales : labiales, dentales et
vélaires, et selon le mode d'articulation : occlusives, fricatives, nasales
et liquides.
Dans les données de babillage, comme dans celles des premiers
mots, le pourcentage important des consonnes labiales et dentales, la
prépondérance des occlusives, la rareté des fricatives et des latérales
(les [l] et [r]) rendent compte de tendances générales universelles
prédites par des considérations de nature physiologique.

FIGURE 5 - Pourcentage de consonnes labiales par sessions dans les


productions d'enfants français, anglais, suédois, japonais. Ces
pourcentages sont indiqués à quatre étapes : lorsque les enfants ne
disent pas encore de mots, lorsqu'on trouve quatre mots différents dans
la session d'enregistrement, quinze mots différents et vingt-cinq mots
différents. Les différences dans la production des labiales entre les
groupes linguistiques restent stables sur la période étudiée commençant
avec des enfants de dix mois et se terminant vers dix-sept mois pour la
plupart des enfants (d'après B. de Boysson-Bardies et al 1991).

Cependant on trouve des différences nettes dans la distribution des


places et modes articulatoires des consonnes entre les quatre groupes
d'enfants. Ainsi, dès l'âge de dix mois, les enfants français produisent
plus de labiales que les enfants japonais ou suédois.
Les analyses interlangues confirment aussi que le répertoire des
consonnes, aussi bien dans le babillage que dans les premiers mots, se
rapproche de la distribution que l'on trouvera plus tard dans les mots
habituels des enfants : le processus consistant à construire des
représentations phonétiques spécifiques à la langue a commencé. Les
enfants, dès dix mois, ont déjà sélectionné un répertoire de consonnes
qui reflète des tendances statistiques du répertoire de la langue de
l'environnement.

FIGURE 6 - Pourcentage des labiales dans le babillage, dans les premiers


mots et dans les formes prédites par la langue maternelle pour les
enfants français, américains, suédois et japonais. Ce tableau montre
l'influence précoce de la langue maternelle sur la production de labiales
(d'après B. de Boysson-Bardies et al, 1991). (B : babillage, M : mots, C
: cibles adultes).

La distribution des consonnes ne change pas de façon significative


entre le babillage et les premiers mots. On trouve cependant quelques
différences. Le répertoire des premiers mots est plus simple, il inclut un
pourcentage encore plus élevé d'occlusives et de labiales. En effet, la
production d'un mot demande l'élaboration d'un programme moteur
spécifique, qui implique des contraintes sur les formes et sur l'ordre des
séquences articulatoires. Si ces contraintes sont trop fortes, l'enfant
revient à des formes plus simples et tente de les adapter au mot qu'il
veut produire. Cela entraîne des « stratégies » différentes selon les
enfants.
La syllabe, en tant qu'unité de production, fonde l'organisation de la
parole. Les structures possibles de syllabes varient avec les langues.
Mais, chez les jeunes enfants, les contraintes motrices impliquent des
contraintes dans la structure des syllabes. Les structures prédominantes
dans le babillage sont simples : essentiellement consonne-voyelle et
parfois consonne-voyelle-consonne. On trouve fréquemment des suites
syllabiques voyelle-consonne-voyelle et consonne-voyelle-consonne-
voyelle.
Les approches biomécaniques font des prédictions fortes sur les
cooccurrences consonnes-voyelles que l'on devrait trouver aussi bien
dans le babillage que comme syllabe de « base » des langues. Une
synergie maximale des articulateurs et des changements minimaux de
l'articulation sont invoqués pour prédire des formes privilégiées
d'association consonne-voyelle. Selon ces mêmes approches, la
structure consonne-voyelle est fortement privilégiée et les associations
labiale-voyelle centrale, dentale-voyelle d'avant et vélaire-voyelle
d'arrière doivent être favorisées de façon universelle37.
Si on pense que l'influence de la langue de l'environnement joue, les
prédictions sont fonction des langues. Ainsi les petits Nigérians parlant
le yoruba38, langue dans laquelle la plupart des mots commencent par
une voyelle, devraient très tôt produire plus de formes voyelle-
consonne-voyelle que les Français. Et en effet les petits Yorubas se
moquent joyeusement des contraintes mécaniques et produisent bien
plus de formes voyelle-consonne-voyelle que de formes consonne-
voyelle. Ils ont avant tout à apprendre à parler yoruba ! Les petits
Français, Anglais et Suédois produisent entre 65 et 75 % de dissyllabes
consonne-voyelle-consonne-voyelle alors que les enfants yorubas ont
38 % de consonne-voyelle-consonne-voyelle et 62 % de voyelle-
consonne-voyelle dans leurs productions dissyllabiques39.
Certes des tendances communes se retrouvent, mais les associations
consonne-voyelle à dix et douze mois montrent que les associations
prédites par l'approche biomécanique et son principe d'articulation
« minimale » ne se retrouvent dans les babillages que quand elles sont
aussi prédites par la structure de la langue maternelle. Les bons
apprentis que sont les bébés tendent à préférer les associations les plus
fréquentes dans les mots courants de leur langue maternelle. Ainsi les
enfants parlant le yoruba, appelés à la rescousse pour vérifier ces
données, montrent-ils une prédilection pour les formes /ki/ et /ké/,
formes qui devraient être relativement rares selon les prédictions
motrices.
Cette dernière étude montre encore la précocité des sélections
effectuées par l'enfant. Entre neuf et douze mois, l'interaction entre la
perception et les performances motrices a permis aux enfants
d'organiser leur babillage. Cela révèle une adéquation entre la
réorganisation de la perception et les premières productions. Les
expériences sur les capacités de discrimination suggèrent que vers dix-
douze mois, les bébés se sont désintéressés des sons qui n'appartiennent
pas au système phonologique de leur langue. Au même moment, on
voit que les performances des enfants s'orientent vers la production de
voyelles, consonnes et syllabes privilégiées dans leur langue.
Certes les différences entre les modes d'acquisition et la variabilité
des formes que l'on trouve chez quelques enfants d'un même groupe
linguistique rendent prudent sur les généralisations que l'on pourrait
faire pour tous les enfants de ce groupe linguistique. Cependant le fait
que les variations individuelles n'arrivent pas à masquer les tendances
spécifiques des différents groupes linguistiques renforce l'idée de
processus sélectifs organisant dès neuf-dix mois un niveau phonétique
dans la production.

Ils commencent à parler leur langue sans accent

Nous l'avons vu, les adultes français distinguent les vocalisations


d'enfants français de huit mois des échantillons de vocalisations de
bébés étrangers. Lorsqu'ils tentent d'expliquer leur choix, les adultes
invoquent des indices d'intonation, de rythme. Mais cette coloration
donnée très tôt aux vocalisations est-elle reliée à des caractéristiques
d'organisation prosodique spéci-fiques du français ? Les indices
prosodiques facilitent le découpage des énoncés, et dès deux mois les
enfants y sont sensibles. Mais les utilisent-ils avant que leurs
productions soient organisées en mots ou en phrases ?
A. Levitt & Q. Wan40 ont analysé, chez des enfants français et
américains de sept à onze mois, des formes de babillage consistant en
syllabes répétées. Elles ont pu mettre en évidence, dès ces âges, des
schémas de hauteur et d'organisation temporelle de la syllabe terminale
qui tendent à la rapprocher des formes caractéristiques des syllabes
terminales du langage ambiant. Ainsi l'allongement de la durée et la
montée des contours de fréquence fondamentale (Fo) de la syllabe
terminale s'observent-elles bien plus souvent chez les enfants français
que chez les enfants anglophones (54 % contre 24 %). P. Hallé et ses
collègues41 ont comparé l'organisation temporelle et les contours Fo
dans les dissyllabes d'enfants français et japonais de dix-huit mois. Ce
travail a confirmé les travaux précédents. La montée de la voix et
l'allongement terminal sont de règle chez les enfants français alors que
chez les Japonais un contour descendant et l'absence d'allongement
terminal caractérisent les syllabes finales des productions
dissyllabiques. Ces données concordent avec les caractéristiques de la
prosodie en français et japonais. En japonais, contrairement à la langue
française, les syllabes terminales ne sont pas allongées.
Une des perspectives les plus intéressantes qui restent encore à
étudier pour comprendre comment la parole vient aux enfants est
certainement l'étude de l'organisation de l'intonation et du rythme à
cinq-six mois, c'est-à-dire avant même les premières productions de
babillage mais quand l'enfant maîtrise sa phonation. Si la prosodie a le
rôle qu'on lui attribue dans la segmentation de la parole continue, la
possibilité de vérifier sa participation au traitement perceptif des
formes organisées à travers les productions des enfants paraît
extrêmement importante. Des
FIGURE 7 - Histogrammes montrant la distribution des contours
d'intonations dans des dissyllabes : a) enfants français; b) enfants
japonais. Les enfants français produisent plus de contours montants à
l'inverse des enfants japonais (d'après P. Hallé et al 1991).

facteurs de postures orales ou de positionnements laryngés globaux, en


relation avec les modes de production caractéristiques de certaines
langues, ainsi que l'organisation de contours d'into-
FIGURE 8 - Histogrammes montrant la distribution des allongements
terminaux dans des dissyllabes : a) enfants français; b) enfants
japonais. Les enfants français se conforment à la tendance du français à
allonger la syllabe terminale alors que les enfants japonais comme les
adultes japonais la raccourcissent (d'après P. Hallé et al 1991).
nation se rapprochant de ceux de la langue maternelle pourraient se
manifester avant six mois. Cela confirmerait une évolution parallèle,
quoique décalée, du traitement perceptif et de l'organisation des
productions pour la prosodie.
Les enfants ne commencent pas à parler avec le rythme et
l'intonation d'un espéranto universel. Certes, les voix d'enfants ont des
points communs tout autour du monde mais l'écoute des babillages et
des premiers mots montre que la couleur et le ton caractéristiques de la
langue ont déjà été bien saisis par nos jeunes apprentis.

Un babillage en langue des signes

L'importance du babillage dans l'accession au langage se voit dans


l'universalité de cette étape qui transcende les modes de réalisation du
langage. Jusqu'à cinq ou six mois, le bébé sourd congénital vocalise
comme le bébé entendant. La rupture ne se marque qu'au moment du
babillage : le bébé sourd ne babille pas, c'est-à-dire qu'il ne commence
pas à produire des syllabes ou des suites syllabiques à l'âge où
commence à le faire le bébé entendant, vers sept mois. Au contraire, à
partir de cet âge, les vocalisations du bébé sourd tendent à diminuer. Ce
n'est qu'après un an qu'on trouve un babillage composé principalement
de syllabes labiales /ba/ que l'enfant peut « voir » prononcer. Les bébés
sourds qui grandissent dans un milieu où l'on parle une langue des
signes sont, comme les bébés entendants, plongés dès leur naissance
dans un monde linguistique. La forme du langage que reçoit l'enfant et
les modalités sensorielles impliquées sont radicalement différentes : les
informations linguistiques sont transmises à travers des gestes manuels
et elles sont reçues visuellement. Le contrôle moteur des articulateurs
oraux et manuels met en jeu des circuits distincts. Quoique la tâche qui
attende l'enfant diffère dans sa réalisation physique, l'accès au langage
se fait selon des étapes de développement très similaires à celles que
l'on trouve chez les enfants non sourds qui apprennent à parler. Ainsi
remarque-t-on que les bébés sourds babillent manuellement vers huit
mois. Laura Petitto42, qui a étudié ces formes de babillage, pense que
les gestes sont assimilables aux syllabes du babillage de l'enfant
entendant. Comme celui-ci, le bébé sourd produit des gestes
« gratuits » qui évoquent des éléments sublexicaux de la structure des
signes servant à représenter des mots. Ces gestes sans signification se
distinguent à la fois des gestes habituels dans d'autres activités
manuelles et des gestes de communication que l'on peut retrouver chez
l'enfant entendant, tel que le geste de montrer du doigt. Ils consistent en
des mouvements rythmiques d'ouverture et de fermeture et en des
configurations particulières de la main. Ces gestes effectués dans un
espace délimité et dans des circonstances particulières se rattachent
clairement aux gestes utilisés dans la langue des signes. Des
comparaisons systématiques avec la gestuelle des enfants entendants en
confirment clairement la spécificité.

Ainsi, très tôt, les bébés subissent l'influence du langage parlé par
leur entourage. Dans les limites que leur impose leur manque d'habileté
articulatoire, ils sélectionnent un répertoire phonétique et accentuel
approprié à leur langue. Comme l'écrivait Antoine Grégoire43 dans son
étude sur ses deux enfants, « dès une époque qu'il est difficile de
préciser, mais assez rapprochée de la naissance, les deux enfants
donnaient l'impression de pratiquer, dans les traits généraux, la
prononciation du français ». Depuis, les études expérimentales ont
confirmé la réalité de ces impressions et montré qu'au moins dans la
seconde moitié de la première année – sinon avant –, l'intonation et la
phonétique des productions des enfants tendaient vers celles de leur
langue. L'idée de productions prélinguistiques complètement
indépendantes des premiers mots n'est aujourd'hui plus guère
soutenable.
Il n'existe pas de solution de continuité nette entre la phonétique et
l'intonation des productions de babillage d'une part et celles des
premières formes reconnues comme mots d'autre part. Cependant la
survenue de mots, ou d'expressions possédant un sens, marque une
étape essentielle dans le mode de développement. Les sélections ne
seront désormais plus « statistiques » mais dirigées vers un but.
Commence alors un processus d'adaptation au cours duquel l'intérêt du
chercheur se déplace vers de nouvelles questions : comment va se faire
l'acquisition du lexique ? et à travers elle, celle du système
phonologique de la langue ? Comment se constitue le sens des mots ?
Quelles relations peut-on établir entre la cognition et l'apprentissage
des mots ? Autant de questions auxquelles les enfants, dans le cours de
leur deuxième année, vont nous aider à répondre.

1 Grégoire A., L'Apprentissage du langage. Les deux premières années, Paris, Felix Alcan,
1937.
2 Koopmans-van-Beinum F. & Van-der-Stelt J., « Early stages in infant speech
development », Proceedings of the Institute of Phonetic Sciences, University of Amsterdam, 5,
1979, p. 30-43.
3 Masataka N., « Pitch characteristics of Japanese maternal speech to infants », Journal of
Child Language, 19, 1992, p. 213-223.
4 Kuhl P.K. & Meltzoff A.N., « The intermodal representation of speech in infants », Infant
Behavior and Development, 7, 1984, p. 361-381.
5 Oller D.K., « The emergence of the sounds of speech in infancy », dans G. Yeni-Komshian,
C. Kavanagh et C. Ferguson (Eds), Child phonology 1 : Production, New York, Academic Press,
1980.
6 Grégoire A., op. cit.
7 Kuhl P.K., « Innate predispositions and the effects of experience in speech perception : The
native language magnet theory », dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk,
P. MacNeilage & J. Morton (Eds), Developmental neurocognition : Speech and face processing in
the first year of life, Dordrecht, Kluwer Academic Publishers, 1993, p. 259-274.
8 Kuhl P.K., Williams K.A., Lacerda F., Stevens K.N & Lindblom B., « Linguistic experience
alters phonetic perception in infants by 6 months of age », Science, 255, 1992, p. 606-608.
9 Changeux J.-P., L'Homme neuronal, Paris, Fayard, 1983.
10 Werker J.F. & Tees R.C., « Cross-language speech perception : Evidence for perceptual
reorganization during the first year of life », Infant Behaviour and Development, 7, 1984, p. 49-
63.
11 Best C., « Emergence of language-specific constraints in perception of non-native speech :
A window on early phonological development », dans B. de Boysson-Bardies, S. de Schonen,
P. Jusczyk, P. MacNeilage & J. Morton (Eds.), Developmental neurocognition : Speech and face
processing in the first year of life, Dordrecht, Kluwer Academic Publishers, 1993, p. 289-304.
12 Grégoire A., op. cit.
13 Oller D.K. & Lynch M.P., « Infant vocalizations and innovations in infraphonology :
Toward a broader theory of development and disorders », dans C.A. Ferguson, L. Menn &
C. Stoel-Gammon (Eds.), Phonological development : models, research, implications, Timonium,
Maryland, York Press, 1992.
14 MacNeilage P.F. & Davis B.L., « Acquisition of speech production : Frames, then
content », dans M. Jeannerod (Ed.), Attention and performance, XIII. Motor representation and
control, Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1991.
15 Kent R.D. & Murray A.D., « Acoustic features of infant vocalic utterances at 3, 6 and
9 months », Journal of Acoustic Society of America, 72, 1982, p. 353-365.
16 Boysson-Bardies B. de, Sagart L. & Durand C., « Discernible differences in the babbling
of infants according to target language », Journal of Child Language, 11, 1984, p. 1-15.
17 Grégoire A., op. cit.
18 Jakobson R., Kindersprache, Aphasie und allgemeine Lautgesetze, Uppsala, 1941, (trad.
fr. : Langage enfantin et aphasie, Paris, Éditions de Minuit, 1969).
19 Lenneberg E., « The capacity for language acquisition », dans J.A. Fodor et J.J. Katz
(Eds.), The structure of language : Readings in the philosophy of language, Englewood-Cliffs,
NJ, Prentice Hall Inc., 1964, (trad. fr. : « Aptitude à l'acquisition du langage », dans J. Mehler et
G. Noizet (Eds.), Textes pour une psycholinguistique, Paris, Mouton, 1974).
20 Chomsky N., « A review of Skinner's Verbal Behavior », Language, 35, 1959, p. 26-58,
(trad. fr. dans Langages, 4, 1969, n° 16, p. 16-49).
21 Oller D.K., Wieman L.A., Doyle W. & Ross C., « Infant Babbling and Speech », Journal
of Child Language, 3, 1975, p. 1-11.
22 MacNeilage P.F., « The control of speech production », dans G. Yeni-Komshian,
C. Kavanagh et C. Ferguson (Eds.), Child phonology 1 : Production, New York, Academic Press,
1980, p. 9-21.
23 Lindblom B., MacNeilage P. & Studdert-Kennedy M., « Self-organizing processes and the
explanation of phonological universals », dans B. Butterworth, B. Comrie et Ö. Dahl (Eds.),
Explanations of linguistic universals, The Hague, Mouton, 1983.
24 Studdert-Kennedy M.G., « Language development from an evolutionary perspective »,
dans N. Krasnegor, D. Rumbaugh, R. Schiefelbusch & M. Studdert-Kennedy (Eds.),
Biobehavioral Foundations of Language Development, Hillsdale, N.J., Lawrence Erlbaum
Associates, 1991.
25 Thelen E., « Motor aspects of emergent speech : a dynamic approach », dans
N.A. Krasnegor, D.M. Rumbaugh, R.L. Schiefelbusch & M. Studdert-Kennedy (Eds.), Biological
and behavorial determinants of language development, Hillsdale, NJ, Lawrence Erlbaum
Associates, 1991, p. 339-362.
26 MacNeilage P.F. & Davis B.L., op. cit.
27 Lindblom B., « Phonological units as adaptative emergents of lexical development », dans
C.A. Ferguson, L. Menn et C. Stoel-Gammon (Eds.), Phonological development : Models,
research, implications, Timonium, Maryland, York Press, 1992.
28 Oller D.K., Eilers R.E. & Steffens M., « Speech-like vocalizations in infancy : An
evaluation of potential risk factors », Journal of Child Language (sous presse).
29 Boysson-Bardies B. de, Hallé P., Sagart L. & Durand C., « A cross-linguistic investigation
of vowel formants in babbling », Journal of Child Language, 16, 1989, p. 1-17.
30 Changeux J.-P. & Dehaene S., « Neuronal models of cognitive functions », Cognition,
1989, 33, p. 63-110.
31 Edelman G.M., Neural Darwinism, New York, Basic Books, 1987.
32 Lieberman P., « On the development of vowel production in young children », dans
G. Yeni-Komshian, J. Kavanagh & C. Ferguson (Eds.), Child Phonology 1 : Production, New
York, Academic Press, 1980.
33 Boysson-Bardies B. de, Hallé P., Sagart L. & Durand C., op. cit.
34 Kuhl P.K., Williams K.A., Lacerda F., Stevens K.N. & Lindblom B., op. cit.
35 Boysson-Bardies B. de, Vihman M.M., Roug-Hellichius L., Durand C., Landberg I. &
Arao F., « Material evidence of infant selection from the target language : A cross-linguistic
phonetic study », dans C. Ferguson, L. Menn et C. Stoel-Gammon (Eds.) Phonological
development : Models, research, implications, Timonium (Maryland), York Press, 1992, p. 369-
391.
36 Boysson-Bardies B. de & Vihman M.M., « Adaptation to language : Evidence from
babbing and first words in four languages », Language, 67 (2), 1991, p. 297-319.
37 MacNeilage P.F. & Davis B.L., op. cit.
38 Les données sur le yoruba ont été recueillies au Nigeria par Grégoire Lyon.
39 Boysson-Bardies B. de, « Ontogeny of language-specific phonetic and lexical
productions », dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage &
J. Morton (Eds.), Developmental neurocognition : Speech and face processing in the first year of
life, Dordrecht, Kluwer Academic Publishers, 1993.
40 Levitt A. & Wang Q., « Evidence for language-specific rythmic influences in the
reduplicative babbling of French – and English-learning infants », Language and Speech, 34,
1991, p. 235-249.
41 Hallé P., Boysson-Bardies B. de & Vihman M., « Beginnings of prosodic organization :
Intonation and duration patterns of disyllabes produced by Japanese and French infants »,
Language and Speech, 34 (4), 1991, p. 299-318.
42 Petitto L. & Marentette P., « Babbling in the manual mode : Evidence for the ontogeny of
language », Science, 251, 1991, p. 1493-1496.
43 Grégoire A., op. cit., p. 254.
CHAPITRE III

L'univers communicatif du bébé

« La parole étant la première institution sociale ne doit sa forme


qu'à des causes naturelles. »
JEAN-JACQUES ROUSSEAU

Communication et expressions

Depuis Darwin1, on sait que la compréhension de certains


comportements de l'homme passe par l'appréciation de l'évolution
phylogénétique. Ceci est particulièrement vrai pour la faculté de
communication. Chez les espèces animales, cette faculté existe sous
des formes diverses, avec des moyens de transmission très variés
(odeurs, chants, attitudes, gestes, mimiques, couleurs, vocalisations).
Dans la plupart des espèces, la réaction très précoce – sinon
instantanée – des petits aux signaux de l'espèce permet leur survie. Elle
fonde leurs réactions « sociales », c'est-à-dire leurs réactions
d'attachement ou d'évitement, et, plus tard, organise leur vie sexuelle et
la défense de leur territoire.
Encore dans l'œuf, le poussin réagit au gloussement de sa mère-
poule : celui-ci l'encouragera à briser sa coquille et sera le signe de
ralliement qui lui permettra de suivre sa mère en compagnie de ses
frères de couvée.
Chez le nouveau-né humain, il existe des réponses génétiquement
programmées pour recevoir les signaux de communication de l'espèce.
La faculté de communication du nourrisson repose sur des modes de
transmission et de réception des informations dont on peut montrer
l'extrême précocité, pour ne pas dire l'innéité. En effet, la plupart, sinon
tous ces comportements de communication dits innés sont affectés par
les premières interactions avec l'environnement. Parfois très tôt, avant
même la naissance, parfois à la naissance, les mécanismes cognitifs
sont déclenchés et calibrés par des facteurs ou des aspects de
l'environnement spécifiques à l'espèce. Les mécanismes qui permettent
la communication résultent aussi de ces interactions primitives.
Dans le couple mère-enfant s'établissent des interactions tout à fait
particulières, ne nécessitant qu'un minimum d'expérience. Le nouveau-
né « connaît » la voix de sa mère, qu'il a entendue dans l'utérus. Il
préfère écouter celle-ci plutôt que la voix d'une autre femme2. Il réagit
à l'odeur maternelle, elle aussi repérée avant la naissance, en se
tournant vers le vêtement imprégné de cette odeur3-4 ; il est sensible,
dès sa naissance, aux visages humains5 et se tourne vers eux. Très tôt il
reconnaîtra le visage et certaines expressions de sa mère6-7. Dès sa
naissance aussi, il interagit avec le comportement de sa mère,
l'influençant dans sa manière de l'allaiter par de micro-mouvements
auxquels la mère répond inconsciemment8. Receveurs d'informations,
les nouveau-nés en livrent aussi, permettant ainsi une adaptation
réciproque des conduites de la mère et du nourrisson.
Les individus des espèces doivent reconnaître et accepter leurs
congénères. Des mécanismes ou des stratégies propres à résoudre ce
problème ont évolué dans l'espèce humaine. La reconnaissance de la
figure humaine et les réponses aux sollicitations vocales, l'expression
d'émotions à travers des mimiques font partie de ces programmes
génétiques qui permettront au nourrisson de s'intégrer dans un système
de relations.
Les signaux de communication reposent sur un répertoire inné,
universel, d'expressions faciales et de gestes. Un dispositif de
reconnaissance des expressions, tout aussi inné et universel que le
dispositif de production, en code le sens. L'étude expérimentale de
l'expression faciale des émotions montre que les mimiques
émotionnelles sont stéréotypées. Les mimiques et les expressions
fondamentales (plaisir, peur, détresse, apaisement) sont semblables
chez tous les humains quels que soient la race et l'environnement social
et éducatif9. On les retrouve chez les bébés aveugles comme chez les
voyants, elles ne doivent donc rien à l'imitation. Elles fondent les
relations sociales en permettant aux partenaires sociaux d'interpréter les
émotions de l'autre. Ces mimiques d'expression sont non seulement
précoces mais précises : des nourrissons de quelques semaines
auxquels on donne soit une cuillère de liquide sucré soit une cuillère de
liquide amer réagissent avec des mimiques déjà bien typées : lèvres
entrouvertes et petits léchages rythmiques pour le sucre, bouche fermée
avec les coins abaissés et des clignements d'yeux pour le liquide amer.
Il ne s'agit certes pas ici de s'aventurer dans le vaste champ des
moyens et des modes de communications du petit humain. C'est le
développement d'un mode particulier et spécial de communication qui
nous intéresse : celui de la parole. Celle-ci croît en grande partie de ses
propres racines. Mais les conduites de réciprocité et les interprétations
des émotions ou des comportements d'autrui dont l'évolution structure
le système de communication de l'enfant au cours de la première année,
fondent le milieu naturel où s'ancrera le langage. Des équivalences
fonctionnelles entre les formes de communication non linguistiques et
certaines des premières expressions linguistiques manifesteront le lien
qui existe entre ces aspects de la communication. Nous présenterons
donc certains modes de relations ou d'expressions non linguistiques
dont l'impact est particulièrement sensible pour établir l'enfant comme
interlocuteur.

Le regard

Les nouveau-nés fixent souvent la bouche de l'adulte, surtout quand


celui-ci parle, mais ce sont les yeux qui retiennent particulièrement leur
attention. Le regard est un composant essentiel de la communication
non verbale. Dans la vie de tous les jours, c'est souvent à travers le
regard que nous interprétons les états émotionnels des autres, vivacité,
langueur, anxiété, gaieté, tristesse. Toutes les émotions se lisent dans
les yeux. « On parle aux yeux bien mieux qu'aux oreilles », disait J.-
J. Rousseau10. La recherche du contact avec les yeux engage et
maintient un lien de communication très fort, qui non seulement suscite
des relations affectives mais organise la temporalité des échanges.
En face d'un nourrisson « rêveur », que fait une mère pour
communiquer avec lui ? Elle essaye d'établir un contact par le regard.
Établir un contact par le regard permet une première modification de
son comportement. La mère le sait. En l'appelant, en lui parlant, en le
touchant, elle éveille l'attention de l'enfant. Entre le nourrisson et la
mère, ce lien est d'abord fragile et intermittent, mais quand il s'établit,
il permet de capter et de retenir l'attention du bébé. Ce comportement
de recherche du regard et par le regard est lui aussi inscrit très
fondamentalement dans la nature humaine. On retrouve un processus
ana-logue chez le bébé né aveugle qui tourne son visage et le garde fixé
vers la voix de sa mère.
Les mères réagissent profondément quand l'enfant, aux alentours de
la quatrième semaine, commence à rechercher systématiquement leur
regard. Entre deux et trois mois, les échanges soutenus par le regard et
alimentés par des gestes ou des expressions permettent de lier des états
émotionnels à des formes d'organisation temporelle des relations.
Ainsi, à côté des liens affectifs, les échanges de regards préparent
d'autres formes de relations : celles qui reposent sur des conduites de
réciprocité.

Les conduites de réciprocité

L'imitation fait partie des interactions auxquelles le nourrisson


participe dès les premiers jours de la vie. De nombreuses études
expérimentales, dont celle de A. Meltzoff et M. Moore11, ont montré
qu'il tire la langue, ouvre la bouche ou ferme les yeux quand, en face
de lui, un adulte produit ces gestes lentement et de façon répétitive,
choisis parce qu'ils existent dans le registre de productions spontanées
du nouveau-né.
Ces imitations précoces ont-elles le même statut que celles, plus
tardives, que l'on trouve vers huit-neuf mois ? Cette question a fait
l'objet de longs débats contradictoires. Pour Henri Wallon12, elles
traduisent un mécanisme mimétique qui conduira au partage des
émotions. Pour A. Meltzoff et M. Moore, elles sont fondées sur la
capacité des enfants à enregistrer des équivalences entre les
transformations de leur propre corps et celles qu'ils voient chez l'autre.
Ces premières imitations pourraient aussi aider l'enfant à singulariser et
à identifier les personnes de son entourage qu'il reconnaîtrait non
seulement grâce à leur visage mais aussi par leurs gestes et leurs
comportements. Ces derniers acquièrent ainsi une valeur
d'identification sociale.
L'évolution des traitements intermodaux de l'environnement est aussi
particulièrement importante pour l'organisation cognitive. Dès deux
mois, l'enfant détecte des équivalences entre le toucher et la vue13. Il
peut reconnaître visuellement un objet qu'il a eu dans la main, sans le
voir, un instant auparavant. À cinq mois, le bébé repère la
correspondance entre des paroles et des mouvements de la bouche.
Cela peut être prouvé par une simple expérience : on place l'enfant
devant deux écrans de télévision, au centre desquels se trouve un haut-
parleur. Sur l'un des écrans, une femme articule silencieusement un son
tel que /mi/. Sur l'autre écran, la même femme articule, là encore
silencieusement, le son /ta/. Le haut-parleur transmet l'un des deux
sons. L'enfant choisira systématiquement de regarder l'image qui
correspond au son transmis14-15. Cette aptitude à lier la vision et
l'audition est d'une importance extrême pour le développement de la
parole. En regardant le visage et la bouche de sa mère lorsque celle-ci
lui parle, l'enfant approfondit ses connaissances des relations entre la
perception des sons et leur articulation. On a vu que les sons les plus
« visibles », comme les labiales, sont parmi les plus fréquents et les
plus précoces dans le babillage. Ce sont aussi les premiers que diront
les enfants mal entendants.
Des formes élaborées d'imitation se développent à partir du
cinquième mois16. Fréquemment, c'est la mère qui les sollicite en
imitant un geste ou une vocalisation du bébé. À travers ces échanges
réciproques, au cours desquels il adopte tour à tour un rôle passif puis
actif, l'enfant apprend à reconnaître et à partager les émotions et les
connaissances du monde. Les jeux comme celui de cache-cache, les
échanges d'objets, les greetings prendront un peu plus tard la relève des
premiers comportements interactifs et, sous des formes à peine plus
élaborées, se maintiendront durant toute la vie sociale adulte.

Le turn-taking

Parmi les conduites se rapprochant de l'imitation précoce, il faut


donner une place particulière aux échanges vocaux du troisième mois.
Vers trois mois (entre dix et seize semaines en général), et seulement
durant une courte période, apparaît la conduite étrange et assez peu
étudiée jusqu'ici que l'on appelle le turn-taking, le « chacun son tour ».
Elle se marque par un échange spectaculaire de vocalisations au cours
duquel mère et enfant se répondent en vocalisant chacun à leur tour.
L'enfant répond à la sollicitation vocale de l'adulte sous forme
d'« échos », il commence à vocaliser quand l'adulte cesse de lui parler
et cette situation se reproduit plusieurs fois, donnant l'impression d'une
« conversation ». Cette conduite stéréotypée est fugitive, elle ne dure
que deux ou trois semaines et correspond à une période très limitée du
développement maturationnel. Elle s'observe aussi chez l'enfant sourd,
signe qu'elle est déclenchée par l'ensemble des composants physiques
qui signalent une production vocale : le son vocal certes, mais aussi la
vue des mouvements de la bouche accompagnés de souffle et les
échanges de regards. Le contrôle de l'éveil qui sous-tend les rythmes du
« chacun son tour » chez les nourrissons est d'ailleurs essentiellement
visuel : le contact intermittent des yeux règle l'attente mutuelle de la fin
des vocalisations.
Part programmée du développement, la conduite de turn-taking a
une fonction encore mal connue, mais on pense qu'elle détermine
certaines fonctions programmées pour la communication. Sa valeur
adaptative semble particulièrement riche. Elle met en jeu des
stimulations intermodales pour la reconnaissance et pour la production
des conduites liées à la parole. L'attention portée sur les facteurs
visuels impliqués dans le turn-taking préfigure sans doute l'aptitude des
bébés de cinq mois à mettre en correspondance les sons et les
mouvements de la bouche. C'est une des sources du traitement
intermodal de l'information sonore et visuelle. L'organisation cognitive
se structure donc à travers le turn-taking mais celui-ci permet aussi à
l'enfant de construire un système plus personnel d'échange dans un
contexte de communication. Enfin cette conduite maximise, chez
l'enfant, l'opportunité d'entendre et de répondre à la mère et, chez la
mère, celle d'entendre et de répondre à son enfant. Elle fait d'eux des
partenaires de parole.

Expression des émotions

Les nouveau-nés expriment leurs états physiologiques ou leurs


émotions par des cris – cris de faim, de détresse ou simplement de
malaise –, par des mimiques faciales, par des trépignements de bras et
de jambes, par leurs regards et, très tôt, par des sourires. Ces derniers
sont très précoces. Le nouveau-né, même prématuré, sourit déjà. Selon
une jolie légende du Moyen Âge, le ciel étoilé, dans sa rotation, produit
une musique enchantée que perçoivent les petits enfants ; ceux-ci
croient alors entendre chanter les anges dans le Paradis et en sourient
de plaisir dans leur sommeil. Mais « ce sourire aux anges », expression
de la béatitude et du bien-être de l'enfant repu, à moitié endormi, n'est
pas le seul. Il existe aussi un sourire spontané, un vrai sourire en état
d'éveil, un sourire social de réponse. Lui aussi fait partie de ces
comportements de base inscrits dans le génome de l'espèce humaine :
en plus du plaisir qu'il exprime, il a une fonction sociale. Il sert à
apaiser l'autre et à établir avec lui des liens affectifs. Le sourire du bébé
ravit la mère et, si l'on en croit la légende de Cypselus, apaise les
adultes même les plus endurcis. Selon cette légende, Cypselus, futur roi
de Corinthe, aurait dû être tué à sa naissance, mais il sourit à ses
assassins qui, émus et désarmés, l'épargnèrent.
Assez vite la gamme de mimiques s'accroît. Chez l'enfant de sept ou
huit mois, des mimiques variées expriment la joie, la peur, le dégoût, le
plaisir, la tendresse, toutes expressions que l'adulte interprète
facilement17.
Mais le bébé, lui, interprète-t-il les expressions fondamentales des
adultes ? Dès les premiers jours de vie, le nouveau-né est sensible à
l'expressivité des visages. Son malaise devant un visage figé et
inexpressif peut aller jusqu'à des pleurs exprimant une détresse devant
l'absence d'indices de mouvement, de vie. À l'âge de dix semaines, les
nourrissons réagissent de façon appropriée aux expressions de leur
mère : les sourires et les encouragements vocaux provoquent des
réactions positives, les visages tristes les troublent18. Dès quatre mois,
si on les familiarise avec des portraits de femmes souriantes, ils
réagissent devant un changement d'expression sur les portraits qu'on
leur présente ensuite. Dans une étude de 1930 sur les bébés d'une
institution pour enfants abandonnés, C. Bühler19 remarque que l'enfant
répond, à cinq mois, aux émotions lorsqu'elles sont exprimées à la fois
par le visage et la voix, qu'à six mois la voix seule suffit, tandis qu'à
sept mois une légère expression du visage l'informe de l'attitude
heureuse ou fâchée de l'adulte. Mais C. Bühler ajoute qu'à huit ou neuf
mois l'enfant considère parfois comme une « bonne blague »
l'expression fâchée d'un visage. Sans doute ne peut-il croire à quelque
culpabilité de sa part ! La capacité de distanciation qui perce dans ce
comportement suggère une considérable évolution cognitive. Les
réponses de l'enfant ne sont plus systématiquement et, pourrait-on dire,
physiquement, liées aux mimiques mais sont perçues comme pouvant
être traitées de façon différente. Un autre type de communication naît
avec les premières propensions à comprendre, puis bientôt à faire de
« bonnes blagues ».
L'attribution d'un sens aux diverses émotions traduites par les
expressions d'un visage permet-elle à l'enfant de partager cette
émotion ? Darwin20 avait remarqué que son fils âgé de six mois
adoptait une expression mélancolique avec les coins de la bouche
tombants quand il voyait sa nurse faire semblant de pleurer. Mais cette
« copie » n'implique pas que l'enfant partage la même émotion, il peut
seulement en imiter les effets sans que cela éveille la même sensation.
Le vrai partage des émotions semble plus tardif, il accompagne cette
capacité de distanciation que nous avons vu poindre à la fin de la
première année.
Les expressions du bébé exercent un effet de régulation sur le
comportement de l'adulte et les expressions de l'adulte exercent un effet
de régulation des comportements du bébé. Ainsi, à un an, l'enfant
interprète et prend en compte les réactions de l'adulte pour régler son
comportement d'exploration du monde. Sur le point de toucher un objet
nouveau, de s'aventurer sur un espace inconnu ou de réagir en face
d'une personne inconnue, le bébé se retourne vers sa mère pour y lire
sur son visage l'approbation ou l'interdiction de ce qu'il se propose
d'entreprendre. Il traite l'expression de sa mère comme un commentaire
qui lui est destiné et en tient compte. Une expression positive
encourage le bébé à agir ou lui fait sourire à l'inconnu, tandis qu'une
expression négative le fait se rétracter et se blottir auprès de ses
parents.

L'attention partagée vers le monde extérieur

Communiquer c'est aussi transmettre des informations sur le monde


extérieur. Nourrisson, l'enfant communique essentiellement ses affects.
Plus tard, lorsqu'il commence à s'intéresser aux objets et aux
événements du monde, ses regards et ses gestes sont interprétés par les
adultes en fonction de l'environnement. Les mères ont tendance à
donner un sens à ces gestes et à les commenter, partageant ainsi avec
l'enfant un cadre sémantique.
On peut suivre expérimentalement ce partage d'informations sur le
monde extérieur à travers l'évolution des jeux de regards21. Vers six
mois, l'enfant suit la direction du regard de sa mère à condition
toutefois que l'objet fixé par la mère soit bien en vue. À douze mois, il
interprète plus précisément le regard de l'adulte : en présence de deux
cibles identiques, il peut isoler celle que l'adulte fixe. Mais il est
toujours incapable de localiser, sur seule indication du regard, un objet
qui se trouve derrière lui ou hors de son champ visuel. Il ne pourra le
faire qu'à dix-huit mois.
Mais déjà, à cet âge, la communication vocale a pris le relais et a
permis bien d'autres échanges d'information sur le monde des objets !
Cependant, l'interprétation des modulations de la voix, des expressions
du visage, de la direction des regards sont et resteront pour l'enfant,
comme pour l'adulte, des supports et des compléments d'information
indispensables.
L'attention partagée sous-tend aussi le geste de pointer dont on a
beaucoup, et parfois trop, souligné l'importance. Ce geste repose sur la
capacité d'orienter son regard dans la direction indiquée par le doigt de
l'autre, et secondairement sur l'attribution à l'autre de la capacité
d'orienter son propre regard vers ce que l'on indique soi-même en
faisant ce geste22-23.
À douze mois, presque tous les enfants sont capables de regarder
dans la direction indiquée par le geste de l'adulte, toutefois ce n'est
qu'entre onze et quinze mois que la plupart d'entre eux commencent à
pointer leur doigt vers un objet lointain. Dans un premier temps, ils
pointent uniquement vers des objets que peut voir un tiers. Plus tard, ce
geste, destiné à indiquer une demande ou à signaler des objets
intéressants, servira à demander le nom d'un objet. Le geste de pointer
est fondamentalement un geste de communication, mais on ne trouve
pas de relation entre le développement du langage et la précocité des
enfants à pointer leur doigt vers des objets. Beaucoup d'enfants qui
pointent pour se faire dire le nom de l'objet emmagasinent leur savoir
et ne révéleront que plus tard le vocabulaire ainsi accumulé.
Le bébé dispose de ce langage naturel, commun à toutes les nations,
qui consiste en jeux de physionomie, mimiques, gestes, ton de la voix,
regards. Ces jeux de physionomie qui traduisent « les passions de
l'âme » accompagnent souvent l'expression orale des adultes. Ils
aideront l'enfant quand il s'agira d'interpréter des paroles. L'entourage,
en comprenant et répondant aux signaux du bébé de façon pratique
et/ou de façon affective, établit avec lui un courant de communication
qui s'enrichit très rapidement au cours des mois. Le développement et
l'épanouissement du bébé seraient compromis sans ces échanges
coordonnés de messages affectifs et cognitifs. De trop nombreux
exemples montrent les ravages occasionnés par le manque de soins
affectueux et par l'absence d'entourage disposé à écouter et comprendre
les messages corporels du bébé. Privés d'un minimum d'amour et
d'interaction avec les adultes, les nourrissons souffrent et s'étiolent24.
Cependant le développement de la parole passe fondamentalement par
son écoute. Pour s'actualiser, les capacités de l'enfant ont
essentiellement besoin d'un modèle de langage, du modèle de la langue
maternelle. Ce n'est pas sans raison que la langue de la société dans
laquelle l'enfant grandit est appelée, en français du moins, « langue
maternelle ». La mère tout spécialement, mais elle n'est pas la seule
pour cela, accompagnera l'émergence du langage en fournissant ce
modèle formel de la langue sous une forme à laquelle l'enfant est tout
particulièrement sensible. Comment ? Pourquoi ?

La parole des mères

Qui n'a vu, avec un regard un peu moqueur mais attendri, une mère,
un père ou une grand-mère se pencher sur un berceau et raconter au
bébé d'étranges « histoires » où se mêlent des mots tendres, des
onomatopées, des vocalisations, des encouragements ? Tout cela avec
une voix de falsetto et de larges glissandi. Qui n'a remarqué
l'application d'une mère, son articulation claire, et l'emphase sur le mot
ou le message qu'elle veut transmettre lorsqu'elle explique un « fait de
vie » à un jeune enfant ?
Victor Hugo25 ne connaissait pas seulement l'art d'être grand-père,
mais aussi celui de recréer, grâce aux mots, la fulgurance des images et
des émotions. Dans un ravissant poème, il montre l'effet du trop plein
d'amour maternel sur le vocabulaire de la mère.
Elle gazouille… Alors de sa voix la plus tendre
Couvant des yeux l'enfant que Dieu fait rayonner
Cherchant le plus doux nom qu'elle puisse donner
À sa joie, à son ange en fleur, à sa chimère :
– Te voilà réveillée, horreur, lui dit sa mère.
VICTOR HUGO (Jeanne endormie / La sieste)
Voix tendre de la mère, intonation modulée et claire des hôtesses des
aérogares, baryton dynamique des annonceurs de publicité, parole
sucrée des héroïnes de soap series, ton doctrinal du maître, toutes ces
utilisations des registres de la voix, de l'intonation et du tempo des
mots sont autant d'indications qui situent et complètent le contenu
sémantique du message. Modifier la manière dont on parle fonde la
plupart des interventions incitatives, érotiques ou didactiques, que
celles-ci soient conscientes ou inconscientes de la part du locuteur.
Imaginez que vous vous trouviez dans un autobus et que l'on vous
demande de deviner à qui parle l'homme ou la femme qui se trouve
derrière vous. Si c'est à un jeune enfant que parle l'inconnu(e), vous ne
vous y tromperez pas, et nul adulte ne s'y trompera. Presque tous les
adultes, quel que soit leur sexe ou leur âge, modifient leur façon de
parler pour s'adresser aux nourrissons et aux très jeunes enfants.
L'adulte manifeste sa sollicitude et la volonté de s'adapter aux capacités
de l'enfant en réglant le registre de sa voix, en adoptant un ton
affectueux et en articulant clairement et plus lentement les mots.
L'environnement linguistique des jeunes enfants est composé, en
grande partie tout du moins, de formes particulières du langage
appelées motherese et baby-talk dans la littérature anglaise. Si le terme
« parler bébé » est utilisé en français, aucun mot ne traduit motherese
dans notre langue. Ce terme renvoie plutôt aux modulations de la
prosodie et de la voix de la mère ou des adultes parlant aux bébés,
tandis que l'expression « parler bébé » insiste sur la simplification du
vocabulaire, de la syntaxe et de la forme des mots du langage adressé à
l'enfant un peu plus âgé, sans pour autant négliger les modes
d'intonation qui y sont joints.
Penchés sur le berceau d'un nourrisson ou s'occupant du bébé, les
adultes, lorsqu'ils parlent, se proposent d'abord d'établir un contact
affectif et de solliciter des vocalisations.
Le poète Zanzotto26 a créé le néologisme « pétel » pour parler de ce
langage maternel. « Le pétel… est la langue câline par laquelle les
mères s'adressent aux enfants très petits, qui voudrait coïncider avec
celle par laquelle s'expriment ces derniers. » Quelles sont les
caractéristiques de ce langage mater-nel ? On y remarque
particulièrement des modifications de la voix et de la prosodie : un
registre de voix plus haut qu'à l'habitude, une gamme de contours
d'intonation restreinte mais aux modulations et variations de hauteur
très exagérées, des formes mélodiques longues, douces, avec des
glissandi abrupts et des excursions amples. L'effet de rythmicité
prosodique de ces productions est amplifié par la fréquence des
répétitions. Cette élévation de la hauteur de la voix, ces modulations
exagérées des contours d'intonation, ces fréquences des répétitions
syllabiques et des schémas prosodiques sont parfaitement adaptées aux
capacités de perception et d'attention des jeunes nourrissons. D'autant
plus que les mères accompagnent souvent ces modifications vocales
d'expressions faciales exagérées (contacts des yeux, haussement des
sourcils, grands sourires), ainsi que de mouvements rythmiques du
corps ou d'ajustements de postures (prise dans les bras, rapprochement
du visage) qui focalisent l'attention du bébé, accentuent son intérêt et
fondent sa préférence pour cette forme de communication27-28-29.

Voix maternelle

L'intérêt très spécial que manifeste l'enfant pour la parole ayant les
caractéristiques mélodiques du motherese est confirmé par toutes les
expériences. Les bébés de deux à quatre semaines préfèrent la voix de
leur mère à celle d'une autre femme, mais seulement si la mère parle
avec une intonation normale. Dès sept semaines, les bébés préfèrent
écouter une femme parlant à un bébé, c'est-à-dire de la parole ayant les
caractéristiques mélodiques et rythmiques du motherese, plutôt que des
propos extraits de conversations entre adultes dans lesquels ces caracté-
ristiques sont absentes ou pour le moins très atténuées30-31. Cette
préférence, très forte, se retrouve jusque chez des enfants d'âge
préscolaire. Elle est indépendante de la langue utilisée par l'adulte.
J. Werker et ses collègues32 ont étudié les réactions de bébés cantonais
et américains de cinq mois quand on leur présente l'enregistrement
audio-vidéo d'une femme cantonaise parlant à son bébé de quatre mois,
et l'enregistrement de cette même femme parlant à un ami adulte. Les
bébés anglophones, comme les bébés cantonais, ont écouté plus
longtemps l'enregistrement de la mère cantonaise parlant à son bébé.
Un score prenant en compte les réactions affectives des bébés a donné
les mêmes résultats. Les bébés préfèrent écouter de la parole destinée à
des bébés, que ce soit dans leur langue ou non, qu'il s'agisse de leur
mère ou d'une femme étrangère. Le motherese a bien pour eux un statut
particulier.
À quoi sert le motherese ? Destinés, d'une part, à capter l'attention de
l'enfant et d'autre part, à le motiver pour favoriser les échanges, ces
premiers « messages vocaux » convoient d'abord, à travers des
contours mélodiques, des valeurs affectives. Chez les nourrissons, la
voix, plus que tout autre stimulus, provoque des sourires, attire le
regard, permet de maintenir un face-à-face avec l'enfant et enfin motive
des échanges de communication verbale. Ces précoces échanges
vocaux avec la mère orientent le bébé vers un mode de communication
oral. Il en va ainsi, vers la fin du deuxième mois, du comportement de
turn-taking durant lequel le nourrisson réagit aux sollicitations vocales
de la mère en gazouillant quand elle s'arrête.
L'utilisation par les parents d'une hauteur de voix plus élevée, plus
proche de celle du bébé, indique à celui-ci qu'il en est le bénéficiaire.
Les bébés sont si sensibles à cette « identification » par la hauteur de la
voix que, dès cinq mois, nous l'avons vu, ils répondent à leur père avec
une voix plus basse que celle qu'ils utilisent pour vocaliser en présence
de leur mère. La façon dont les adultes modifient les patterns
mélodiques en fonction du contexte de l'échange avec le bébé est « si
régulière et si consistante que les contours mélodiques sont la première
catégorie de messages vocaux que l'enfant peut traiter et imiter avant
d'être capable de produire les premières syllabes33 ». Aussi, dès quatre
mois, le bébé répond avec des signes affectifs plus positifs aux
vocalisations gratifiantes qu'aux vocalisations neutres ou à celles dont
le ton est plus répréhensif.
Le parler bébé

Les attitudes parentales, le style et le contenu du « langage


maternel » se modifient avec l'évolution du nourrisson mais les
principales caractéristiques prosodiques du motherese se retrouveront
jusqu'à la troisième année de l'enfant.
Dans nos civilisations, à partir de six-sept mois, la nature et la forme
des propos que tiennent les parents changent nettement. Les « sujets de
conversation » des mères avec les tout-petits consistent en
commentaires sur les sensations que pourrait ressentir l'enfant et sur ses
états internes. À partir de six mois, les mères parlent plus du monde
extérieur et s'intéressent plus à l'activité de l'enfant. Lorsque leur bébé
atteint sept-huit mois, les parents se rendent compte qu'il commence à
reconnaître puis à comprendre des mots : les propos qui lui sont
destinés se doivent alors de l'y préparer34. Ils deviennent plus clairs,
mieux articulés, les énoncés sont plus courts et dits plus lentement,
avec des pauses plus longues. Les adultes cherchent à se faire
comprendre. Les caractéristiques prosodiques restent importantes. La
voix continue à être plus élevée, les intonations sont très marquées, les
fins de phrases aussi. L'organisation prosodique tend ainsi à valoriser la
structure phonétique et rythmique des mots et des phrases. Ces
dernières sont simples, courtes, avec des répétitions. La fréquence des
mots comprenant des syllabes redoublées est importante. Au Moyen
Âge déjà, Bar-thélemy l'Anglais35 conseillait à la nourrice de « faire
ses paroles comme si elle était bègue » : le redoublement des syllabes
devait permettre à l'enfant de mieux apprendre ! À la même époque, au
XIII e siècle, Aldebrandin de Sienne36 donne quelques conseils aux
mères pour que l'enfant puisse commodément dire ses premiers mots :
« Lui frotter la bouche au sel gemme ou au miel, lui laver la bouche au
lait d'orge surtout s'il tarde à parler. Qu'on lui fasse dire des mots où il
n'y ait pas trop de lettres qui fassent mouvoir la langue comme maman,
papa, baboir. » Ces conseils sont liés à l'idée que les dents sont
nécessaires pour parler, mais montrent déjà des observations fines sur
les tendances articulatoires des bébés. Elles rejoignent les analyses
actuelles montrant la plus grande fréquence des labiales et des syllabes
n'impliquant pas trop de mouvements des articulateurs supérieurs dans
les premières productions des bébés et dans le vocabulaire des mères !
Celles-ci emploient spontanément plus de mots commençant par des
labiales (m, b, f, v,) quand elles parlent aux enfants. Dans tous les
groupes linguistiques que nous avons étudiés, le répertoire phonétique
des mères inclut plus de labiales que ne le prédit le répertoire de la
langue. Les parents ont plus de chance en effet d'obtenir de « bons »
résultats en proposant pour modèles des mots faciles à prononcer et
dont la prononciation est bien visible. De tels mots sont
particulièrement représentés dans le lexique utilisé avec les enfants.
Ainsi, en français, on relève parmi les mots les plus fréquents du
vocabulaire enfantin : maman, papa, poupée, bébé, bravo, pain, bain,
poum, boum, balle, biberon, miam, etc. ; en anglais, on retrouve une
série du même genre avec : mummy, baby, ball, bunny, bottle ; en
suédois : pappa, mamma, blomma, bil, bulle, etc. Mais ce n'est pas tant
la façon de parler de chaque mère en particulier qui structurera la
parole de l'enfant que les formes du langage destiné aux enfants dans
leur environnement linguistique et culturel. Une analyse de l'influence
de la structure phonétique des mots utilisés par les mères d'enfants d'un
an appartenant à quatre groupes culturels montre qu'il n'y a pas de
relation directe entre le répertoire phonétique de la mère et celui de
l'enfant dans chacune des dyades mère-enfant37. Le répertoire de
l'enfant reflète celui de la langue parlée dans son entourage plus que tel
aspect particulier du répertoire phonétique de la mère.

Cultures et modes de parler aux bébés

En étudiant « l'universalité » de ce comportement langagier des


parents, Charles Ferguson38 a relevé une vingtaine de caractéristiques
retrouvées dans différents groupes linguistiques à travers le monde :
répétition des mots ou de la phrase, exagération des contours
d'intonations, ralentissement de la prononciation, accentuation d'une
consonne ou d'une voyelle importante par l'allongement ou le
redoublement, jeu sur le déplacement de l'accent dans les homonymes,
forte présence des consonnes labiales ou palatales qui rendent « plus
douce » la prononciation, effacement des clusters et des consonnes plus
difficiles à réaliser telles que les [r] et les [l], « harmonisation »
consonantique ou vocalique par des structures simplifiées de type
consonne-voyelle-consonne-voyelle (exemple du français : dodo),
harmonie nasale (on rajoute une consonne nasale dans un mot qui n'en
contenait qu'une : exemple du japonais /meme/ pour /dame/, qui
signifie /mauvais/). La généralité de ces processus a fait penser qu'ils
rendaient compte d'un comportement universel des adultes, et plus
particulièrement des parents quand ceux-ci s'adressaient à leurs
« petits ». Qu'en est-il ?
L'utilisation d'un registre distinct pour parler aux enfants semble
bien attestée – sinon vérifiée – dans de nombreuses cultures aussi
diverses que celles où l'on parle l'arabe39, l'espa-gnol40, le marathi41,
etc. La prosodie des mères a été systématiquement étudiée, analyses
acoustiques à l'appui, en anglais américain42-43, en japonais44, en
chinois mandarin45 et dans des études interlangues : anglais américain,
anglais britannique, français, italien et japonais46. Dans toutes ces
études, on a retrouvé des différences significatives entre la parole
destinée aux enfants et celle qui l'est à des adultes. Toutes les mères et
tous les pères, dans ces cultures, augmentent la hauteur de leur voix,
produisent des énoncés plus courts incluant des pauses plus longues.
Mais on trouve des différences assez nettes entre groupes culturels dans
l'utilisation des diverses caractéristiques : les modifications de
l'intonation chez les parents américains sont systématiquement plus
extrêmes que celles des parents dans les autres pays. Il en est de même
pour l'exagération des expressions faciales qui les accompagnent. Les
parents japonais – les mères comme les pères – ainsi que les pères
français modulent relativement peu leur intonation lorsqu'ils s'adressent
à leurs enfants.
On peut alors se poser la question de savoir si cette adaptation du
comportement langagier des adultes à l'égard des enfants est vraiment
un phénomène universel, biologiquement induit, pour les
communications adultes-enfants dans l'espèce humaine.
Quelques études culturelles remettent en cause l'universalité des
caractéristiques relevées par C. Ferguson. L'élévation de la hauteur de
la voix n'est pas de règle dans certaines langues non occidentales,
particulièrement dans les langues à tons où prévalent les contours
tombants, telles que le mandarin47 et le thaï48. Il n'y a pas de registre
prosodique spécial pour les bébés et les jeunes enfants chez les Indiens
parlant le quiché-maya49. L'élévation de la hauteur de la voix est un
signe général de déférence qui n'est pas de mise avec les enfants. Au
contraire, les mères réduisent souvent leur voix jusqu'au murmure
lorsqu'elles s'adressent aux bébés. D'autres cultures font dépendre
l'élévation de la voix du sexe de l'enfant auquel on s'adresse. Dans des
populations indiennes du Guatemala, les adultes usent d'un ton
monotone avec les enfants. En revanche, ils sont prêts à répéter autant
qu'il est nécessaire pour faciliter la compréhension. Dans ces cultures,
la pratique de répétitions pourrait remplacer les modifications
prosodiques.
Chez les Kwara'ae des îles Salomon, les mères parlent peu
directement à leurs nourrissons : un comportement fréquent consiste à
parler de lui ou pour lui, en le tournant vers la personne à qui l'on
s'adresse ; l'objectif de ces civilisations est d'intégrer le plus tôt et le
mieux possible l'enfant dans la communauté sociale, plutôt que d'en
faire un locuteur précoce50. Chez les Kaluli de Nouvelle-Guinée, les
adultes parlent rarement aux nourrissons et les regardent peu en face.
Les bébés ne sont pas censés comprendre. À six-huit mois, ils reçoivent
quelques directives. On les empêche de toucher un objet en leur
« faisant honte », et en disant : « Est-ce qu'il est à toi ? » ou : « Pour qui
te prends-tu ? » Certes, les bébés de cette société vivent en
communauté et entendent beaucoup parler autour d'eux, mais la parole
leur est rarement transmise autrement que sous forme d'ordres avant
qu'ils sachent parler. Quand ils commencent à parler, en particulier
quand ils disent certains mots qui marquent leur entrée dans le langage
tels que les mots : « no » (maman) et « bo » (sein), les adultes Kaluli
appliquent une technique d'apprentissage très directive. Après chaque
phrase, ils ajoutent « éléma » ce qui veut dire : « Dis comme ça ». Les
fautes de prononciation de l'enfant sont corrigées, ainsi que les fautes
sur le « fond ». Les mères n'essaient pas de montrer des objets et d'en
enseigner le nom, elles font répéter des mots ou des phrases. Il serait
intéressant de connaître les formes que prennent les acquisitions du
langage chez les enfants Kaluli. Malheureusement, les auteurs ne se
sont pas particulièrement penchés sur ce point et signalent simplement
que dans la deuxième année les enfants répètent très bien51.
Dans nos sociétés, lorsque les enfants atteignent un an, les
particularités du motherese, tout en conservant les fonctions qu'elles
avaient jusqu'alors, se remodèlent pour faciliter aux enfants
l'apprentissage de nouveaux mots et la compréhension du sens des
phrases qu'ils entendent. Les parents continuent à exagérer la prosodie
de leurs phrases tout en cherchant à élargir l'horizon linguistique de
l'enfant. Dans une étude, R. Aslin52 montre que pour apprendre des
mots nouveaux à leurs enfants, les mères présentent ces mots dans des
phrases et non comme des mots isolés. Les enfants doivent donc
extraire le mot à apprendre. Ils sont pour cela aidés par des stratégies
maternelles. La première stratégie est prosodique : dans plus de deux
tiers des cas, les mères américaines mettent plus d'emphase sur les
mots qu'elles désirent faire apprendre. La deuxième stratégie est
syntaxique : les mères placent les mots nouveaux en fin de phrase dans
89 % des cas. Cette position facilite l'extraction des mots. On retrouve
cette stratégie même chez les mères turques, bien que dans la langue
turque il ne soit pas grammatical de pla-cer un nom en fin de phrase,
l'ordre canonique imposant le verbe dans cette position.
On attend alors de l'enfant qu'il réponde aux messages qu'il reçoit
des adultes. Il lui faut donc en analyser le contenu et la forme. Les
mères utilisent plusieurs « astuces » pour se faire comprendre. L'une
d'elles consiste en la répétition des phrases. Les psycholinguistes qui
ont analysé le discours des mères ont trouvé qu'un tiers des phrases de
leurs productions consistent en des répétitions, souvent simplifiées, de
l'énoncé précédent. D'autres mères reformulent leur énoncé ou celui de
l'enfant sous une forme différente. Les mères japonaises reformulent
assez systématiquement les énoncés des enfants pour les rendre
culturellement acceptables. D'autres mères choisissent d'expliciter leurs
propos en les commentant. Cette technique est beaucoup plus rentable
pour l'enfant.
Dans l'ensemble les phrases des adultes sont courtes et
grammaticalement correctes, quoique souvent inachevées ;
contrairement à une idée reçue, relativement peu de phrases adultes
dans le langage adressé aux enfants sont non grammaticales53-54. Les
sujets évoqués concernent des objets ou des événements présents dans
le champ de vision, ce qui facilite le travail de compréhension de
l'enfant.
Dans nos cultures occidentales, les enfants sont en général
considérés comme autonomes dans le choix de leurs activités. On leur
pose donc beaucoup de questions auxquelles ils ont le choix de
répondre par « oui » ou « non ». Dans les propos des parents, les
phrases interrogatives sont d'autant plus nombreuses qu'elles marquent
aussi une formule polie de ce qui dans d'autres cultures apparaît sous
forme d'ordres : « Peux-tu faire cela pour moi ? » Les phrases
interrogatives convoient aussi fréquemment le sens d'une phrase
déictique : « Tu vois ce ballon ? ».
Peut-on conclure que les types de phrases varient selon que les
adultes s'adressent à l'enfant ou à un autre adulte ? E. Newport55 a
comparé le pourcentage des formes de phrases dans les deux situations.
Elle a relevé moins de phrases déclaratives (30 %) à l'égard des enfants
que pour les adultes (87 %), plus d'impératives, 18 % contre 2 % et
beaucoup plus d'interrogatives, 44 % contre 9 %.
Dans nos sociétés, les phrases impératives sont relativement peu
fréquentes et ce aussi bien quand on parle aux petites filles que
lorsqu'on parle aux petits garçons. Ce n'est pas toujours le cas ! Dans
certaines cultures, les formes des phrases varient aussi selon que l'on
parle à un homme ou à une femme, à un petit garçon ou à une petite
fille. Chez les Luo, on trouve 3 % de phrases à l'impératif chez un père
parlant à son fils de deux ans et demi et 43 % lorsque le père s'adresse
à une petite fille du même âge56 ! Dans la société luo, dans la plupart
des circonstances, l'homme donne des ordres à la femme. Les adultes
s'adressant à une petite fille, spécialement les hommes, emploieront
donc tout naturellement un plus grand nombre de phrases à l'impératif
qu'en s'adressant à un petit garçon. D'autre part, dans cette culture
comme dans beaucoup d'autres, les enfants sont considérés comme des
interlocuteurs « inférieurs », sans initiative dans leurs activités : on leur
pose des questions ou bien on leur donne des instructions. Le
pourcentage des phrases déclaratives qui leur sont adressées est faible
(10 %).

Les variations culturelles ne doivent cependant pas masquer des


comportements langagiers spécifiques que les adultes emploient en
s'adressant aux bébés pour les faire entrer dans la communauté du
langage. Ce qui est très général, sinon universel, est un mode spécial de
communication verbale adulte-enfant. Les caractéristiques de celle-ci
peuvent varier. Certains groupes sociaux ont ritualisé l'apprentissage de
la parole avec pour objectif principal d'intégrer l'enfant à un groupe
social très fortement organisé et structuré. L'enfant doit avant tout y
connaître sa place et savoir y jouer son rôle. Dans d'autres cultures, les
mères favorisent les relations affectives et les performances
individuelles de l'enfant. Cependant, dans toutes les cultures, la
transmission du langage accompagne l'insertion de l'enfant dans une
communauté sociale. Aussi est-elle assujettie aux attentes et aux règles
de celle-ci. En dépit des variations culturelles touchant aux modes de
présentation du langage, tous les bébés du monde apprennent à parler à
peu près aux mêmes âges. En outre, la plupart des études montrent qu'il
y a peu de corrélations entre le langage de la mère et le développement
linguistique de l'enfant. Les parents « n'enseignent pas » la langue à
leurs enfants, ils leur fournissent des modèles : modèle de la langue et
modèle culturel. Les enfants s'attachent à relever dans le modèle de
leur langue les indices qui leur permettront de saisir la structure et le
sens des énoncés. Ils relèvent dans le modèle de leur culture, les formes
sociales de leur statut d'interlocuteur. Plus tard sans doute, la qualité et
la richesse de l'environnement linguistique influeront plus directement
sur le développement langagier des enfants. Mais, lorsqu'il s'agit des
fondements du langage, le dispositif génétique est assez puissant pour
atténuer des disparités « normales » de réception. Il permettra parfois
de remédier à certaines lacunes. Ainsi les enfants élevés dans des
milieux parlant un langage appauvri, tel que le « pidgin », tendent-ils à
utiliser des formes plus grammaticales que celles de leurs parents. Ce
dispositif génétique puissant ne connaît-il donc pas de contraintes ?

Périodes sensibles

On utilise les termes « période sensible » ou « période critique »


pour parler de la fenêtre temporelle durant laquelle l'influence de
l'expérience a un effet significatif sur un comportement. L'expérience
peut avoir plusieurs fonctions : grâce à elle, certaines capacités se
maintiennent qui disparaîtraient sans elle ; dans d'autres cas seul le
rythme du développement est affecté par un défaut d'expérience, enfin,
dans un troisième cas de figure, l'expérience peut être indispensable à
l'apparition du comportement. Dans les espèces animales, de nombreux
exemples prouvent le rôle indispensable de l'environnement dans le
déclenchement du développement normal de mécanismes spécifiques à
l'espèce. C'est le cas du chant dans nombre d'espèces d'oiseaux
chanteurs : les jeunes oiseaux ne développent le chant de l'espèce que
s'ils l'ont entendu de leurs congénères durant les premières semaines de
vie57. Existe-t-il aussi chez les humains une période critique pour
apprendre à parler ?
On sait trop bien, par expérience personnelle, qu'il existe des
périodes critiques chez les humains pour certaines aptitudes ! Prenons
l'exemple de l'apprentissage des secondes langues. Alors que les
enfants apprennent sans mal une ou plusieurs langues étrangères, les
adultes ont souvent grand mal à le faire, et ce d'autant plus qu'ils sont
âgés et sont restés plus longtemps monolingues. L'aptitude à apprendre
une langue étrangère et plus encore celle de la parler sans accent,
déclinent fortement avec l'âge. On pense qu'une langue étrangère
apprise après l'adolescence sera toujours parlée avec un accent.
En présentant les capacités perceptives des bébés, nous avons vu que
ceux-ci commencent à perdre, vers onze mois, leur talent pour
discriminer les contrastes phonétiques non pertinents dans leur langue
maternelle. Les enfants japonais de deux ans, comme les adultes
japonais, sont incapables de discriminer le /r/ du /l/. Ils auront le plus
grand mal à distinguer ces sons lorsqu'ils voudront apprendre une
langue étrangère et leurs difficultés deviendront quasi insurmontables
lorsqu'il s'agira de les reproduire.
Il existe donc des périodes sensibles pour certaines aptitudes
linguistiques. Ces périodes critiques ne sont pas une propriété de la
croissance en tant que telle mais traduisent la perte de plasticité qui se
produit quand les liaisons neuronales se sont spécialisées.
Y a-t-il une période sensible pour apprendre à parler, pour apprendre
un premier langage ? Il est difficile de répondre à cette question. Dans
ce domaine, l'expérimentation est impossible et l'on doit s'appuyer sur
des observations plus ou moins pertinentes pour fixer une éventuelle
période critique au-delà de laquelle on ne pourrait accéder au langage.
Personne actuellement n'est prêt à renouveler les tentatives que l'on
prête au pharaon Psantik I et à Frédéric de Prusse. Ces souverains,
d'esprit curieux, ont fait élever des bébés dans un lieu isolé avec
interdiction de leur parler. L'idée était de savoir quelle était la langue
« originelle » qu'ils développeraient « spontanément ». On voit par là
combien est anciennement ancrée l'idée d'un don ou d'un instinct de
parole ! La petite histoire dit que les « sujets expérimentaux » du
pharaon ont parlé phrygien : le berger qui prenait soin d'eux était
phrygien et, pris de pitié, avait désobéi aux consignes du pharaon !
Quant aux bébés isolés de tout contact linguistique sur ordre de
Frédéric III, ils ont dépéri faute de contacts relationnels.
On a en général répondu « oui » à la question de savoir s'il existait
une période sensible après laquelle on ne pouvait plus apprendre le
langage. Eric Lenneberg58 pensait que la période sensible s'étendait
jusqu'à la puberté. Actuellement, on pense qu'elle se situe plutôt aux
alentours de sept ans. Des enfants au-delà de cet âge, qui n'auraient
entendu aucune langue humaine dans leur enfance, seraient inaptes à
accéder au langage plus tard. Sur quels faits se base-t-on pour avancer
cet âge ?
Les cas des enfants dits « enfants sauvages » ou « enfants loups »
sont heureusement relativement rares, quoique plus d'une dizaine aient
été rapportés depuis le XVII e siècle. Découverts dans des endroits très
isolés, ces enfants sont censés avoir grandi hors de tout contact humain.
Ils ne produisent aucune vocalisation humaine, marchent à quatre
pattes et se nourrissent comme des animaux. Les exemples dramatiques
de ces enfants ne sont pas faciles à exploiter scientifiquement. Le livre
de Jean Itard59 raconte le cas de Victor, « enfant loup » découvert au
XVIII e siècle, à l'âge d'environ dix-douze ans, dans l'Aveyron. Malgré
les efforts prolongés et intelligents de son éducateur, Victor n'est jamais
parvenu à acquérir le langage. Mais dans ce cas, comme dans les rares
autres que l'on connaît, on ignore si l'abandon n'était pas causé par la
présence préalable de handicaps, tels qu'une profonde débilité ou un
autisme. De toute façon, les conditions de vie, ou plutôt de survie, de
ces enfants ont été si anormales qu'on peut difficilement en tirer des
conclusions valables sur leur incapacité à apprendre à parler.
Le cas des enfants séquestrés, élevés dans des circonstances
extrêmes de privation, est un peu différent. Ils ont entendu par-ler, bien
que pour la plupart de façon très minimale60. Tous, sauf Genie, ont été
remis dans un milieu normal avant sept ans et presque tous, à
l'exception de ceux chez lesquels ont été trouvées des atteintes
sensorielles ou cognitives graves, ont récupéré un langage normal ou
quasi normal. Le cas de Genie est spécial61. Genie n'a été découverte
qu'à treize ans. Elle avait été privée d'écoute normale du langage depuis
l'âge d'un an et demi. Malgré un considérable travail de la part des
éducateurs qui l'ont prise en charge lors de sa découverte, elle n'a
jamais appris à parler normalement. Elle a acquis un certain
vocabulaire mais est demeurée incapable de faire des phrases
syntaxiquement correctes. Le cas de Genie pourrait confirmer qu'il
existe une limite temporelle pour l'acquisition du langage. Mais les
conditions atrocement pénibles qui ont été celles de sa vie durant treize
ans lui ont laissé des troubles psychologiques et cognitifs importants et
l'on ne peut dire si elle était vraiment « normale » avant sa
séquestration. Son cas, comme celui de Victor de l'Aveyron, permet
cependant de penser qu'il y a une période sensible au-delà de laquelle
les aptitudes pour le langage s'amenuisent ou disparaissent lorsqu'il n'y
a pas eu de modèle linguistique.
Les sourds congénitaux, exposés dès leur naissance à la langue des
signes, comme les enfants aveugles, tout naturellement exposés au
langage parlé, acquièrent le langage au même rythme ou à un rythme
proche de celui des enfants sans handicaps sensoriels. Si l'on sait que la
surdité profonde a des conséquences sévères pour l'acquisition d'un
langage parlé, on est souvent moins conscient que des niveaux plus
modérés de perte d'audition ou des otites moyennes répétées durant les
deux premières années entraînent parfois un déficit durable de la
réception du langage. Elles affecteraient les capacités de traitement de
la parole et montreraient ainsi qu'une écoute appauvrie ou biaisée,
même de façon intermittente, dans les deux premières années, gauchit
le développement phonologique.
Pour parler, les enfants ont besoin d'être dans un environne-ment
linguistique. L'apport linguistique peut n'être pas très riche, il n'est nul
besoin qu'il repose sur un enseignement directif, mais il faut que le
modèle reçu soit suffisant pour que l'enfant puisse catégoriser les sons
de parole et spécifier les principaux paramètres de sa langue. Il faut
aussi que cet environnement linguistique soit humain, c'est-à-dire
fourni par des êtres humains physiquement présents : on croit savoir,
ou l'on préfère penser, qu'entendre parler à travers la radio ou la
télévision ne permettrait pas d'accéder au langage. Le modèle
linguistique doit être présenté dans un cadre de communication
interactive entre l'enfant et ceux qui l'entourent.
Nous avons volontairement évité d'insister ici sur l'importance des
apports affectifs ; ce n'est pas pour en amoindrir le rôle fondamental.
Les bébés élevés en isolation par Frédéric de Prusse sont morts et l'on
sait combien sont essentiels pour la survie et l'intégrité psychique du
jeune enfant l'amour et la tendresse des adultes. On sait aussi
l'importance d'une insertion sociale normale. Même s'ils n'en sont pas
une conséquence inéluctable, des troubles durables d'acquisition du
langage naissent de conditions psychologiques ou sociales déficientes.
Nous ne nous étendrons pas non plus sur les souffrances
psychologiques qui entraînent des mutismes passagers. Nous voulons
insister en revanche sur la robustesse du dispositif génétique pour
l'acquisition du langage. Un dispositif « intact » permet en général aux
enfants, en dépit de handicaps sensoriels, affectifs ou cognitifs parfois
graves, d'accéder au langage à la seule condition nécessaire et
suffisante d'être avec un ou des êtres humains qui communiquent à
l'aide d'une des langues parlées par l'espèce humaine. Cela est aussi
remarquable que réconfortant.

1 Darwin C., The Expression of Emotions in Man and Animals, Murray, London, 1872. (Trad.
fr. : L'Expression des émotions chez l'homme et les animaux, Paris, Reinwald et Cie, 1877.)
2 Mehler J., Bertoncini J., Barrière M. & Jassik-Gershenfeld D., « Infant recognition of
mother's voice », Perception, 7, 1978, p. 491-497.
3 Macfarlane J.A., « Olfaction and the development of social preferences in the human
neonate », dans R. Porter & M. O'Connor (Eds.), Parent-Infant Interaction, CIBA Foundation
Symposium 33, Amsterdam, Elsevier-North Holland, 1975, p. 103-117.
4 Schaal B., Montagner H., Hertling E., Bolzoni D., Moyse E. & Quichon R., « Les
stimulations olfactives dans les relations entre l'enfant et la mère », Reproduction, Nutrition,
Développement, 20, 1980, p. 843-858.
5 Johnson M.H. & Morton J., Biology and Cognitive Development. The case of face
recognition, Oxford (UK) et Cambridge (USA), Basil Blackwell, 1991.
6 Schonen S. de, Gil De Diaz M., Mathivet E., « Hemispheric assymetry in face processing in
infancy », dans H.D. Ellis, M. A. Jeeves, F. Newcombe, A. Young (Eds.), Aspects of face
processing, Dordrecht, Martinus Nijhoff Publishers, 1986, p. 199-208.
7 Trevarthen C., « Descriptive analyses of infant communicative behavior », dans
H.R. Schaffer (Ed.), Studies in Mother-infant Interaction, New York, Academic Press, 1977,
p. 227-270.
8 Zack M., Étude du comportement de refus de poursuivre la tétée. Thèse de doctorat de
3e Cycle, Paris, École des Hautes Études en Sciences Sociales, 1987.
9 Eibl-Eibesfeldt I., Ethology. The Biology of Behavior, New York, Holt, Rinehart and
Winston, 1970.
10 Rousseau J.-J., Essai sur l'origine des langues : Où il est parlé de la mélodie et de
l'imitation musicale, Belin, 1817, réédition Paris, Bibliothèque du graphe, s.d.
11 Meltzoff A.N. & Moore M.K., « Imitation of facial and manual gestures by human
neonates », Science, 198, 1977, p. 75-78.
12 Wallon H., De l'acte à la pensée, Paris, Flammarion, 1942, rééd. 1970.
13 Streri A., « Tactile discrimination of shape and intermodal transfer in 2- to 3-months old
infants », British Journal of Developmental Psychology, 5, 1987, p. 213-220.
14 Kuhl P.K. & Meltzoff A.N., « The intermodal representation of speech in infants », Infant
Behavior and Development, 7, 1984, p. 361-381.
15 MacKain K., Studdert-Kennedy M., Spieker S. & Stern D., « Infant intermodal speech
perception is a left-hemisphere function », Science, 219, 1983, p. 1347-1349.
16 Uzgiris I.C., « L'imitation dans les interactions précoces », in V. Pouthas et F. Jouen
(Eds.), Les Comportements du bébé : expression de son savoir ?, Liège, Mardaga, 1993.
17 Izard C.E., Huebner R., Risser D., McGinnes G. & Dougherty L., « The young infant's
ability to produce discrete emotion expressions », Developmental Psychology, 16, 1980, p. 132-
140.
18 Termine N.T. & Izard C.E., « Infants' responses to their mothers' expressions of joy and
sadness », Developmental Psychology, 24, 1988, p. 223-229.
19 Bühler C., Die ersten sozialen Verhaltensweisen des Kindes, Quellen und Studien zur
Jugendkunde, 5, 1927, p. 1-102.
20 Darwin C., op. cit.
21 Butterworth G.E. & Grover L., The origins of referential communication in human
infancy, dans L.E. Weiskrantz (Ed.), Thought without language, Oxford, Clarendon Press, 1988,
p. 5-24.
22 Scaife M. & Bruner J., « The capacity for joint visual attention in the infant », Nature,
253, 1975, p. 265-266.
23 Butterworth G. & Cochran E., « Towards a mechanism of joint visual attention in human
infancy », International Journal of Behavioral Development, 3, 1980, p. 253-270.
24 Cyrulnik B., Les Nourritures affectives, Paris, Éd. Odile Jacob, 1993.
25 Hugo V., « Jeanne endormie / La sieste », dans L'Art d'être grand-père, Paris, Flammarion,
1985 (première édition, Paris, A. Lemerre, 1881).
26 Zanzotto A., « Élégie du pétel », Arcanes 17, 1986.
27 Fernald A. & Simon T., « Expanded intonation contours in mothers' speech to newborns »,
Developmental Psychology, 20, 1984, p. 104-113.
28 Fernald A. & Kuhl P., « Acoustic determinants of infant reference or motherese speech »,
Infant Behavior and Development, 10, 1987, p. 279-283.
29 Papousek M., Papousek H. & Haekel M., « Didactic adjustments in fathers' and mothers'
speech to their three-month-old infants », Journal of Psycholinguistic Research, 16, 1987, p. 491-
516.
30 Fernald A., « Four-month-old infants prefer to listen to motherese », Infant Behavior and
Development, 8, 1985, p. 181-195.
31 Pegg J.E., Werker J.F. & McLeod P.J., « Preference for infant-directed over adult-directed
speech : Evidence from 7-week-old infants », Infant Behavior and Development, 15, 1992, p. 325-
345.
32 Werker J.F., Pegg J.E., McLeod P.J., « A cross-language investigation of infant preference
for infant-directed communication », Infant Behavior and Development, 17(3), 1994, p. 323-
333.
33 Papousek H. & Papousek M., « Apprentissage chez le nourrisson : un point de vue
synthétique », dans V. Pouthas et F. Jouen (Eds.), Les Comportements du bébé : expression de son
savoir ?, Liège, Mardaga, 1993, p. 120.
34 Cohen N.J. & Beckwith L., « Maternal language in infancy », Developmental Psychology,
12, 1976, p. 371-372.
35 Barthélemy l'Anglais, Livre des Propriétés des Choses, rédigé au XIIIe siècle, dont les
propos sont repris par de nombreux auteurs au Moyen Âge ; tiré de L'Enfance au Moyen Âge, de
Pierre Riché et Danièle Alexandre-Bidou, Paris, Seuil et Bibliothèque de France, 1994.
36 Aldebrandin de Sienne écrivait en français (médecin italien du XIII e siècle s'exprimant en
anglais), Le Régime du corps, édité par L. Landouzy et R. Pépin, Paris, 1911.
37 Vihman M.M., Kay E., Boysson-Bardies B. de, Durand C. & Sundberg U., « External
sources of individual differences ? A cross-linguistic analysis of the phonetic of mothers' speech
to One-year-old children », Developmental Psychology, 30(5), 1994, p. 651-662.
38 Ferguson C.A., « Baby talk in six languages », American Anthropologist, 1964, 66, (6 part
2), p. 103-104.
39 Ferguson C.A., 1964, ibid.
40 Blount B. G., Padgug E., « Mother and father speech : Distribution of parental speech
features in English and Spanish », Papers and Reports on Child Language Acquisition, 12, 1976,
p. 47-59.
41 Kelkar A., « Marathi baby talk », Word, 20, p. 40-54.
42 Garnica O., « Some prosodic and paralinguistic features of speech to young children »,
dans C.E. Snow et C.A. Ferguson (Eds.), Talking to children : Language input and acquisition,
Cambridge, Cambridge University Press, 1977, p. 63-68.
43 Stern D. N., Spieker S., Barnett R.K. & MacKain K., « The prosody of maternal speech :
Infant age and context related changes », Journal of Child Language, 10, 1983, p. 1-15.
44 Fernald A. & Morikawa H., « Common themes and cultural variations in Japanese and
American mothers' speech to infants », Child Development, 64, 1993, p. 637-656.
45 Grieser D.L. & Kuhl P.K., « Maternel speech to infants in a tonal language : Support for
universal prosodic features in motherese », Developmental Psychology, 24, 1988, p. 14-20.
46 Fernald A., Taeschner T., Dunn J., Papousek M., Boysson-Bardies B. de & Fukui I., « A
cross-language study of prosodic modifications in mothers' and fathers' speech to preverbal
infants », Journal of Child Language, 16(3) 1989, p. 477-501.
47 Grieser D.L. & Kuhl P.K., op. cit.
48 Tuaycharoen P., « An account of speech development of a Thai child : From babbling to
speech » dans T.L. Thongkum, V. Panupong, P. Kullavanijaya et M.R. Tingsabadh (Eds.), Studies
in Thai and Mon-Kmer phonetics and phonology : in honour of Eugenie J.A. Henderson,
Bangkok, Chulalongkorn University Press, 1979.
49 Ratner N.B. & Pye C., « Higher pitch is not universal : Acoustic evidence from Quiche
Mayan », Journal of Child Language, 11, 1984, p. 515-522.
50 Watson-Gegeo K.A. & Gegeo D.W., « Calling-out and repeating routines in Kwara'ae
children's language socialization », dans B.B. Schieffelin et E. Ochs (Eds.), Language
socialization across cultures, New York, Cambridge University Press, 1986, p. 17-50.
51 Schieffelin B.B., « Teasing and shaming in Kaluli children's interactions », dans
B.B. Schieffelin & E. Ochs (Eds.) Language socialization across cultures, New York, Cambridge
University Press, 1986.
52 Aslin R.N., « Segmentation of fluent speech into words : Learning models and the role of
maternal input », dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage &
J. Morton (Eds.), Developmental neurocognition : Speech and face processing in the first year of
life, Dordrecht, Kluwer Academic Publishers, 1993.
53 Newport E.L., « Motherese : The speech of mothers to young children », dans
N.J. Castellan, D.B. Pisoni & G.R. Potts (Eds.), Cognitive theory : vol. II, Hillsdale, New Jersey,
Lawrence Erlbaum Associates, 1976.
54 Valian V.V., Parental replies : Linguistic status and didactic role, MIT Press, Bradford,
Cambridge, MA, (sous presse).
55 Newport E.L., ibid.
56 Blount B., « The pre-linguistic system of Luo children », Anthropological Linguistics, 12,
1970, p. 326-342.
57 Marler P., « Song learning : Innate species differences in the learning process », dans
P. Marker & H.S. Terrace (Eds.), The Biology of Learning, Berlin, Springer Verlag, 1984.
58 Lenneberg E., Biological Foundations of Language, New York, Wiley, 1967.
59 Itard J., « Mémoire et rapport sur Victor de l'Aveyron » (rapport de 1801), publié dans
l'ouvrage de Lucien Malson, Les Enfants sauvages : mythe et réalité, Paris, Éditions France
Loisirs, 1981.
60 Skuse D.H., « Extreme deprivation in early childhood », dans D. Bishop & K. Mogford
(Eds.), Language Development in Exceptional Circumstances, Hillsdale New Jersey, Lawrence
Erlbaum Associates, 1993, p. 29-46.
61 Curtiss S., Genie : A Psycholinguistic Study of a Modern-day « Wild Child », London,
Academic Press, 1977.
CHAPITRE IV

À la découverte du sens des mots


(neuf-dix-sept mois)

« Ce qui est important, ce qui est acquis durant le développement,


n'est pas une représentation abstraite du produit mais une
possibilité de recréer des procédures. »
G. EDELMAN

Découper et assembler

Plusieurs tâches attendent l'enfant pour la constitution de son


lexique. En premier lieu, il lui faut extraire les unités de sens du
discours qu'il entend. Ce n'est pas un problème simple ! La parole se
présente en effet comme une onde acoustique relativement continue et
les frontières entre les mots donnent lieu à peu d'indices acoustiques
distincts.
Il s'agit ensuite de mémoriser les mots sous une forme qui permette
de les reconnaître et de les utiliser.
L'étude des processus de segmentation de la parole par les bébés a
longtemps été le monstre du Loch Ness pour les psycholinguistes du
développement. Parmi toutes les énigmes qui ont surgi lorsqu'on a
essayé de comprendre comment l'enfant acquiert les mots de sa langue,
celle de la segmentation de la parole dans la première année est
pendant longtemps restée la plus troublante. La façon dont l'enfant
arrive à distinguer et à extraire des mots de l'onde acoustique continue
qu'il entend garde, aujourd'hui encore, un certain mystère. La parole
natu-relle « s'écoulant » comme un flot, il n'y a pas de pauses
systématiques entre chaque mot. Contrairement aux blancs d'un texte
écrit qui permettent de distinguer les mots, les silences dans une phrase
orale ne constituent pas un fondement adéquat pour extraire des unités
de sens.
Certes, dans leurs efforts pour être accessibles aux enfants, les
adultes parlent plus lentement. Toutefois ils ne s'arrêtent pas entre
chaque mot ! La question se pose alors : comment, dans le signal de
parole, comment, dans ce flot continu, l'enfant parviendra-t-il à extraire
les phrases, les syntagmes et les mots, bref les unités qui font sens ?
Nous, adultes, avons intuitivement tendance à penser que le
processus de segmentation dépend de la reconnaissance des mots. Nous
pourrions en effet découper un discours à partir de notre connaissance
préalable des termes qui le composent. Comme nous le verrons, une
telle position n'est que partiellement juste. Et de toute façon, elle n'est
pas valable pour les jeunes enfants ; le bébé ne connaît pas les mots
composant les propos qui lui sont adressés ou qu'il entend autour de lui.
Les enfants sont confrontés à un problème épineux : contrairement aux
adultes, qui disposent d'un lexique constitué dans lequel chaque mot est
codé avec ses caractéristiques sémantiques et grammaticales, ils ne
possèdent pas ce lexique qui les aiderait à segmenter le discours en
mots. Bien sûr, certains mots sont parfois isolés et répétés par la mère
et peuvent être plus facilement repérés par le bébé. Mais on a vu que ce
type de comportement maternel est rare. Et la possibilité de localiser un
mot dans une suite n'est de toute façon pas suffisante pour permettre le
découpage des autres unités du discours.
La clef du problème a été recherchée dans les dons des bébés et
particulièrement dans la remarquable capacité des nourrissons à
détecter les variations des caractéristiques physiques des sons de la
parole. S'il existe des indices physiques, acoustiques, de segmentation
dans la parole, alors le nourrisson pourrait y être sensible. Ces indices
existent-ils ? Quels sont-ils ? Les bébés sont-ils vraiment capables de
les déceler ?
Dans toutes les langues, le rythme et l'intonation font partie de la
structure formelle de la parole. Dans certaines d'entre elles, les traits
mélodiques convoient des différences de sens et de structure. Ainsi, en
chinois mandarin, la forme « ma » peut avoir quatre sens différents
correspondant aux quatre tons utilisés dans cette langue. Au début du
structuralisme et particulièrement à la suite du livre des linguistes
N. Chomsky et M. Halle1, ces variables prosodiques ont été négligées
par les linguistes. Elles étaient considérées comme non pertinentes
pour caractériser les universaux linguistiques. On est revenu depuis sur
cette position. L'hétérogénéité de l'utilisation des indices prosodiques
dans les différentes langues a montré leur rôle dans la structuration de
ces langues. Les psycholinguistes ont, eux aussi, vite reconnu
l'importance des indices prosodiques dans le traitement de la parole.
Leur poids dans l'organisation des capacités perceptives des bébés a
permis de fonder sur des assises nouvelles le problème de la
segmentation de la parole continue chez le bébé.
Les adultes disposent d'un lexique constitué, dans lequel chaque mot
est codé avec ses spécifications phonologiques, grammaticales et
sémantiques. De ce fait, on a pu proposer qu'ils n'ont pas besoin de
procédures de segmentation explicites autres que celles issues de la
reconnaissance des mots. Cela n'est pas exact.
Les temps de traitement des messages seraient inutilement allongés
si toutes les possibilités de segmentation d'une forme acoustico-
phonétique étaient explorées pendant l'écoute. Le recours à des
adéquations entre cette forme et les mots du lexique peut aussi s'avérer
trompeur. Ainsi les mots longs contiennent-ils des formes acoustico-
phonétiques enchâssées correspondant à des mots du lexique. Dans le
mot « courgette » se trouvent les mots possibles « cour », « cours », la
forme au présent du verbe courir « court », ainsi que la forme au
présent du verbe « jeter », tous mots qu'il n'est pas nécessaire
« d'activer » dans son lexique pour extraire le sens d'une phrase telle
que : « Dans une courgette il y a des pépins. » L'extraction du mot
« cour » mènerait à une fausse piste : « dans une cour… »,
consommatrice de temps de traitement. L'absence de marque de
segmentation entre « cour » et « jette » et la métrique bref-long des
mots français permettent d'éviter une segmentation erronée où seraient
activés les mots « cour » et « jette ».
Certes, s'il y a eu erreur, le contexte permettra assez rapidement aux
auditeurs fourvoyés d'éliminer les choix erronés, mais l'efficacité et la
rapidité de compréhension en seront affectées. De même, le choix
rapide entre certains homophones du type « vert-vers » sera donné par
le sens de la phrase dans laquelle ils apparaissent. Les indices
prosodiques permettent en fait d'extraire le mot correct avant même
que ne joue le contexte sémantique. Ainsi les phrases : « Derrière ce
pré vert, lequel nous appartient… » et : « Derrière ce pré vers lequel
nous nous dirigeons » perdent leur ambiguïté avant la fin de la phrase
grâce aux indices de segmentation prosodique qui marquent la fin des
groupes phonologiques. Dans la première phrase, la frontière se trouve
après « vert », et dans la deuxième après « le pré ». Dans ces énoncés,
la suite de la phrase vient confirmer l'interprétation.
Mais dans d'autres phrases l'ambiguïté ne peut être levée que par des
indices d'intonation. Ainsi, pour distinguer deux phrases telles que :
« J'ai admiré le chapeau élégant que ce dandy de Paul a acheté ce
matin », et : « J'ai admiré le chapeau et les gants que ce dandy de Paul
a achetés ce matin », la présence d'indices d'intonation de segmentation
est indispensable. Un traitement rapide, en temps réel, du discours
engage ainsi le traitement perceptif d'indices prosodiques.
Ces indices sont d'abord la pause, qui n'est pas de règle mais qui peut
exister entre des frontières importantes comme les propositions et les
phrases ou peut être créée par des hésitations, des reprises.
Les frontières plus fortes (celles entre phrases ou propositions) sont
mieux marquées dans la prosodie que les frontières plus faibles, celles
entre syntagmes ou mots de contenu.
Plus spécifiques et plus subtils, variant selon les langues, viennent
des schémas rythmiques de durée, des modulations de la hauteur de la
voix et des variations d'intensité sur les syllabes. Les variations de
durée syllabique aux frontières entre des unités de sens consistent en
allongements ou raccourcissements de la durée des voyelles et des
consonnes. Les variations d'intonation – montée ou chute de la hauteur
de voix – signalent aussi les frontières de mots, de syntagmes ou de
phrases. Enfin les variations d'intensité sont importantes,
particulièrement dans les langues à accent.
Les règles prosodiques sont spécifiques pour chaque langue. En
français, les frontières sont marquées principalement par l'allongement
des dernières syllabes ainsi que par des variations de la fréquence
fondamentale et de l'intensité. Les Français tendent plus que d'autres à
monter nettement leur intonation à la fin du syntagme nominal2.

FIGURE 1 - Contour d'intonation d'une phrase en français.


On voit une montée d'intonation en fin de syntagme (mot « beige »).

Pour l'anglais, l'accent tonique (le stress), situé en général sur la


syllabe initiale du mot, est un indice de segmentation important. Des
expériences de A. Cutler et D. Norris3 ont mis en évidence les
stratégies des adultes anglais : ceux-ci segmentent la chaîne parlée au
début des syllabes accentuées. Ils font implicitement l'hypothèse,
justifiée par la fréquence des mots commençant par une syllabe forte en
anglais, que cette syllabe a plus de chance qu'une syllabe non
accentuée d'indiquer le début d'un mot. Cependant, les indices
prosodiques ne sont pas les seuls à aider à la segmentation des
discours.
Selon les langues, la structure des mots obéit à différentes règles de
construction phonémique. Ainsi, des terminaisons admises dans une
langue ne peuvent se rencontrer dans une autre. Certaines séquences de
phonèmes ne sont possibles qu'à la frontière entre deux mots et sont
donc des indices de segmentation. En français, un mot ne peut se
terminer par les sons [ls], si bien que la suite « elle sait voir »
[elsevwa : R] est segmentée par des Français après [el] et non entre
[els] et [evwa :R]). En revanche, en Allemand la succession de sons
[ls] est possible en fin de mot et par conséquent la suite
[derfelsistGro :s] peut être segmentée après [ls] : « Der fels ist gross. »
Les frontières de mots dans les diverses langues sont donc régies par
des principes qui gouvernent les successions de sons admises dans la
langue. Ces principes permettent d'identifier des probabilités de
frontière entre les mots. On peut objecter que les indices prosodiques
ne sont pas toujours en bonne adéquation avec la structure syntaxique
des énoncés, que la relative indépendance de l'intonation et le fait
qu'elle véhicule des facteurs affectifs et pragmatiques importants ne
permettent pas d'en faire un vecteur fiable à 100 %. Cependant pour les
adultes, les avantages de ces stratégies de segmentation, prosodiques
ou phonétiques, sont évidents. Elles exploitent plus d'informations et
permettent ainsi des traitements plus rapides et plus fiables. Mais y a-t-
il là une stratégie possible pour les bébés ?

Le nourrisson à l'œuvre

La tâche de segmenter les unités de la parole continue ne peut être


que perceptive chez le bébé. C'est à partir de leur inscription dans les
propriétés physiques du signal que seront repérées des formes
organisées de la parole. Les indices prosodiques se traduisent par des
marques temporelles et des variations de fréquence. Or nous avons vu
que les nourrissons sont de petits experts quand il s'agit de les détecter.
La question se pose alors de voir quand et comment s'effectue, à travers
la sélection de ces indices, le repérage de formes organisées telles que
phrases, syntagmes, mots ou syllabes.
Les psycholinguistes du développement sont de véritables Sherlock
Holmes quand il s'agit de rechercher les indices que pourraient utiliser
les bébés dans leurs approches. Ils y sont bien obligés, ayant découvert
que les nourrissons sont eux-mêmes bien supérieurs à tous les
détectives pour relever ce qui pourrait être utile à leur entrée dans la
terre promise de la parole. Nés pour y séjourner, et équipés de tous les
outils pour en pénétrer les arcanes, nos bébés sont imbattables dans ce
grand jeu de piste. Ils obligent les psycholinguistes à être tous les jours
plus imaginatifs. Quoique sachant qu'ils seront en fin de compte
perdants, ceux-ci façonnent sans se décourager des questions à poser
aux bébés.
Anne Christophe4 a étudié la réaction de nouveau-nés de trois jours
aux marques temporelles des frontières de mots. Ces marques sont
principalement la durée de la consonne initiale et la durée de la voyelle
terminale. Les stimuli consistaient en dissyllabes de type /mati/ ou
/menta/. Dans un cas, le dissyllabe /mati/ était extrait d'un mot tel que
« mathématicien » prononcé naturellement et, dans l'autre cas, il était
extrait de deux mots prononcés naturellement à la suite tels que
« schéma tigré ». Dans le cas du dissyllabe /mati/ issu de la séquence
de deux mots, on retrouve entre /ma/ et /ti/ les indices qui marquent
une frontière de mot, c'est-à-dire un allongement de la voyelle
terminale de la première syllabe, ainsi qu'un allongement de la
consonne initiale de la seconde syllabe. Ces indices doivent permettre
de distinguer le dissyllabe issu de la jonction entre deux mots (inter-
mots) du dissyllabe interne (intra-mot) issu de « mathématicien ». Les
nouveau-nés testés avec le paradigme de la succion non nutritive (HAS)
réagissent en reprenant leur succion lorsqu'à une suite de /mati/ intra-
mots, succèdent des dissyllabes /mati/ inter-mots. Anne Christophe
conclue que « quelque chose de perceptible pour les nouveau-nés se
produit autour des frontières de mots ». Bien sûr, elle se garde de
conclure que les bébés segmentent effectivement la parole aux
frontières de mots ; mais elle considère avoir établi l'existence d'une
condition nécessaire pour que les indices prosodiques prélexicaux
étayent des capacités de repérage de l'organisation de la parole.
Les expériences spécifiquement consacrées à ce problème sont
encore très peu nombreuses sur les nourrissons. On sait cependant que
ceux-ci sont sensibles à des variations de rythme et à des variations de
hauteur5-6.
Cependant, il ne faut pas oublier que le nourrisson et le bébé plus
âgé ne travaillent pas sur le même « objet ». Pour le nourrisson, cet
objet consiste en sons pour lesquels il possède des mécanismes de
discrimination fine. Plus âgé, le bébé a été sensibilisé aux
caractéristiques de l'objet « parole » tel qu'il se présente autour de lui.
Cet objet a alors un statut nouveau : ce ne sont plus des sons que traite
l'enfant, mais de la parole, des sons porteurs de sens.

L'assemblage des pièces du puzzle

Quand et comment l'aptitude à percevoir des indices potentiels de


frontières dans le flot continu de la parole sert-elle à organiser les
unités de sens que sont les propositions, les syntagmes et les mots ?
C'est ce qu'ont cherché à analyser les récents travaux des équipes de
K. Hirsh-Pasek7 et de P. Jusczyk8-9. Grâce à eux on a pu montrer que
les différents types d'unités de parole (propositions, syntagmes, mots)
en tant que formes organisées sont repérés progressivement : les
premières segmentations porteront sur des unités larges, bien définies
prosodiquement, qui ensuite faciliteront l'identification de structures
plus fines qui à leur tour permettront l'identification de mots.
Pour tester les enfants, les chercheurs ont recouru à la méthode, déjà
évoquée plus haut, de l'écoute préférentielle : l'enfant est placé entre
deux haut-parleurs qui émettent des stimuli différents. À chaque haut-
parleur est reliée une lampe qui s'allume quand le stimulus sonore de
« son » haut-parleur se déclenche. Tant que l'enfant regarde la lampe
allumée, il entend le stimulus. S'il détourne la tête pendant plus de deux
secondes, la lumière s'éteint et avec elle la présentation du son.
L'enfant apprend ainsi que le temps d'écoute est lié à son regard, qu'il
peut le « régler ». On peut dès lors déterminer la préférence de l'enfant
pour tel ou tel stimulus, selon qu'il l'écoutera plus ou moins longtemps.
Pour déterminer quelles sont les frontières prosodiques pertinentes
pour l'enfant, on insère des pauses artificielles d'une seconde dans des
phrases émises par les haut-parleurs. Ces pauses correspondent ou non
au découpage prosodique naturel des phrases. La mesure expérimentale
est le temps d'écoute des différentes versions par l'enfant : un temps
d'écoute plus long est considéré comme une mesure de préférence.
Si l'enfant détecte qu'une pause est plus appropriée à un moment de
la phrase qu'à un autre, il préférera entendre la phrase qui comporte une
interruption « correcte ».
FIGURE 2 - Dispositif utilisé pour tester la « préférence » des enfants
auxquels sont présentés deux stimuli auditifs.

Dans une première phase, les pauses sont insérées aux frontières de
propositions, ou à l'intérieur des propositions. Ainsi le choix est-il
donné à des bébés de cinq mois d'écouter des suites telles que :
Un petit garçon promenait un gros chien // qui tirait fort sur sa laisse.
// Le petit garçon était habillé de bleu // mais son béret était rouge, etc.
ou bien :
Un petit garçon promenait un // gros chien qui tirait // fort sur sa
laisse. Le petit garçon était // habillé de bleu mais son // béret était
rouge, etc.
Dès cinq mois, les enfants montrent une préférence pour les histoires
avec des pauses insérées aux frontières de propositions, à condition
toutefois que l'histoire soit lue avec l'intonation caractéristique du
motherese. Cet effet se maintient lorsque le contenu phonétique est
effacé par un filtrage qui laisse la prosodie intacte mais « efface » les
consonnes et les voyelles. Le rôle des indices prosodiques apparaît
alors bien clairement. Cette aptitude à découper les propositions est très
générale puisqu'on retrouve une préférence pour les scansions aux
frontières de propositions lorsqu'on fait entendre au nourrisson des
phrases en langues étrangères. Toutefois cette sensibilité générale se
restreint rapidement. Très vite, à neuf mois, les bébés perdent la
capacité de réagir aux frontières de propositions des langues
étrangères. Parallèlement se produit un affinement des compétences
pour reconnaître les pauses pertinentes dans la langue maternelle.
Les mêmes méthodes ont été utilisées pour tester la sensibilité des
enfants aux marques prosodiques de segmentation pour des unités plus
petites telles que le syntagme. On a présenté à des bébés de six et de
neuf mois des phrases telles que :
1) Un petit garçon // promenait un gros chien. Ce gros chien // tirait
sur sa laisse. Tous les arbres du chemin // étaient en fleurs.
2) Un petit garçon promenait un // gros chien. Ce gros chien tirait //
sur sa laisse. Tous les arbres du // chemin étaient en fleurs.
Les enfants de six mois ne montrent aucune préférence pour l'une ou
l'autre de ces phrases. En revanche, à neuf mois ils manifestent une
préférence pour la première dans laquelle les pauses coïncident avec
les frontières situées entre sujet et prédicat.
Les nourrissons sont donc sensibles aux variations des marques
prosodiques de la segmentation : variations temporelles (durée des
segments, allongement des syllabes terminales, pauses) et variations de
hauteur. Durant les premiers mois, les enfants répondent à des
propriétés très générales qui se retrouvent dans la plupart des langues.
Puis l'organisation fournie par les traits prosodiques s'affine et, après
six mois, s'ajuste aux caractéristiques de la langue maternelle.
La prosodie doit donc fournir aux enfants des possibilités de
segmenter la parole continue en unités de sens. Certes, les corrélations
entre les unités syntaxiques et les formes prosodiques sont loin d'être
parfaites dans la parole des adultes. Mais la sim-plification des
structures et l'intonation particulière qui caractérisent les formes
verbales que les mères ou les adultes utilisent en parlant aux enfants
facilitent leur segmentation syntaxique. Dans le motherese, on a
remarqué que les propositions sont généralement groupées sous un
contour d'intonation qui est une « bonne forme », bien marquée par
l'allongement du segment terminal et la modulation de hauteur de la
voix à la fin de la proposition. Ce groupement ou, pourrait-on dire, cet
« emballage » prosodique est en général cohérent avec l'organisation
des principales unités syntaxiques. Les relations entre les indices
prosodiques et les indices syntaxiques ressortent ainsi de façon plus
nette et plus fiable que dans le langage entre adultes.
Les valeurs des indices temporels et fréquentiels qui marquent la
segmentation des énoncés ne sont pas des propriétés absolues de la
segmentation. Ces valeurs ont des poids différents selon les langues. À
neuf mois, la sensibilité du bébé se restreint aux modèles rythmiques et
aux marques prosodiques de la langue parlée dans son environnement
et de celle-là seule. La rapidité avec laquelle l'enfant a pu ainsi relever
et sélectionner des informations complexes, pertinentes dans sa langue,
montre combien est « préparé » et « canalisé » chez l'être humain le
développement du langage et de la parole.
On est loin des propositions de certains « grammatistes » des années
soixante : le primat de la syntaxe avait alors amené à poser l'inutilité de
la prosodie pour traiter les phrases. Celle-ci ne pouvait guider un enfant
vers la syntaxe, la structure syntaxique devant d'abord être reconnue
pour que l'enfant puisse relever les traits prosodiques.
Certains points dans le parcours que nous avons suivi peuvent
sembler étranges. En effet, on sait que le nourrisson est capable de
discriminer des stimuli brefs : 40 ms de stimuli lui permettent de
discriminer les consonnes selon leur place d'articulation ainsi que la
qualité vocalique dans des syllabes de type consonne-voyelle (CV).
Les études de A. Christophe10 révèlent que des nouveau-nés sont
sensibles à des variations faibles d'indices temporels, de l'ordre de
15 ms pour les voyelles et de 20 ms pour la fermeture des sons
consonantiques. Cependant, les études sur les enfants plus âgés
montrent qu'à six mois l'enfant n'intègre que les indices spectraux et
temporels jouant sur des temps plus longs, comme ceux qui marquent
les frontières de phrases. Les indices prosodiques plus brefs ne
deviennent pertinents pour marquer une organisation linguistique plus
fine et plus spécifique que vers neuf-dix mois. Pourquoi ces écarts ?
Les facteurs d'attention et de mémoire, mis en jeu pour traiter la parole
courante que l'enfant entend dans son environnement, changent entre
les premiers mois et la deuxième moitié de la première année. Les
aptitudes à cet âge (neuf-dix mois) se démarquent des capacités
précoces de discrimination.
L'enfant engagé à relever les informations sur les propriétés
pertinentes aux unités linguistiques de la langue parlée est un enfant
qui a découvert – sans doute vers huit ou neuf mois – que l'organisation
des sons de la parole avait une fonction : elle transporte du sens. Le
nouveau-né opérait de façon très sophistiquée, en fonction d'un certain
but, celui de discriminer des phonèmes, alors que l'enfant plus âgé
réagit plus tard, de façon bien moins différenciée, en fonction d'un but
différent, celui de traiter des unités de sens, de reconnaître des mots.

Quelques questions supplémentaires méritaient d'être posées aux


bébés : « Chers enfants, est-ce que le dispositif acoustique programmé
dont vous êtes pourvus à la naissance vous permet de relever les
caractéristiques de l'organisation syllabique des mots ? Bien que, selon
les langues, ces unités ne soient pas toujours coextensives aux mots
adultes, pouvez-vous nous dire si les syllabes saillantes ou accentuées
vous fournissent une base valable pour l'extraction des mots ?
Remarquez-vous si des syllabes s'organisent de façon plus ou moins
systématique pour former des mots ? Comment repérez-vous cette
organisation ? Nous savons d'autre part que les indices phonotactiques
(sur les séquences permises dans la langue) sont aussi impliqués dans
la segmentation et le traitement des mots. Les régularités
phonologiques des langues vous aident-elles à segmenter ce que vous
entendez ? ».
Nous pouvions justifier ces questions en précisant aux enfants : « Il
nous semble, à nous psycholinguistes, qu'un modèle incorporant les
prédispositions perceptives pour l'extraction et la représentation des
mots demande que soient étudiées vos prédispositions pour l'extraction
des syllabes sur la base de leur sail-lance perceptive et de leur validité
dans la langue. Il demande aussi que soient prises en compte vos
capacités de traitement des distributions fréquentielles dans la langue
de l'environnement. »
Nous ne doutions pas que les enfants allaient répondre à toutes ces
questions : il ne restait qu'à formuler celles-ci de façon à obtenir des
réponses !
En anglais, comme dans beaucoup d'autres langues, l'accent tonique
tombe sur des mots de contenu et, dans ces mots, sur la racine et non
sur les inflexions. C'est pourquoi l'anglais comprend principalement
des mots qui portent l'accent sur la première syllabe. Dans un corpus de
deux cent mille mots, A. Cutler et D. Carter11 ne trouvent que 4 % de
mots polysyllabiques débutant par une initiale faible. Les adultes
anglophones peuvent utiliser la prédominance massive du rythme
fort/faible pour segmenter la chaîne parlée en mots. Le bébé de milieu
anglophone manifeste-t-il une tendance semblable, et, si oui, à partir de
quand ? Il devrait alors « préférer » des séquences trochaïques, c'est-à-
dire consistant en une première syllabe accentuée et une deuxième non
accentuée, plutôt que des séquences iambiques, consistant en une suite
non accentuée-accentuée.
Une équipe de chercheurs12 a fait entendre à des bébés américains de
six et neuf mois des listes de mots dissyllabiques formés d'une syllabe
accentuée suivie d'une syllabe non accentuée, et des listes de mots
dissyllabiques, composés d'une syllabe non accentuée suivie d'une
syllabe accentuée. À six mois, les enfants n'ont manifesté aucune
préférence, mais à neuf mois ils ont été plus intéressés par les listes de
mots avec un schéma d'accentuation fort/faible que par les listes de
mots présentant le schéma faible/fort. Peut-on exclure l'hypothèse selon
laquelle cette préférence révèle seulement un biais général pour un
tempo fort/faible chez les enfants de neuf mois ? Oui, car les bébés
entendant de l'hébreu préfèrent, au même âge, le schéma iambique
faible/fort qui est prédominant en hébreu. On peut donc penser que
c'est l'environnement linguistique qui a infléchi la préférence des bébés
pour la distribution des accents prédominant dans la langue de leur
environnement.
En français, le rythme est syllabique ; il n'est pas fondé sur une
alternance fort/faible. On ne devrait donc trouver aucune préférence.
Mais cette question n'a pas encore été posée à nos petits compatriotes.

Le problème des petites pièces


Il ne faut cependant pas surestimer le rôle des accents. Dans
certaines langues, leur distribution peut non pas aider mais perturber la
segmentation. Ainsi en quiché maya, langue indienne d'Amérique, les
morphèmes et les frontières de syllabes ne coïncident-ils pas13. La
stratégie d'extraction des syllabes accentuées aboutit souvent à une
unité linguistique qui n'a pas de sens dans la langue adulte, car elle
contient seulement la fin d'un morphème et le début d'un autre (ce qui
reviendrait à dire en français « gévi » pour la phrase « il a mangé
vite »).
Problème de la poule et de l'œuf ! L'aide apportée par l'extraction de
syllabes accentuées ne peut venir d'une « préprogrammation » de
l'organisme mais émerge d'un traitement du langage de
l'environnement. Celui-ci trouve sa puissance dans les mécanismes
spécialisés dont dispose l'être humain pour résoudre les problèmes
posés par la perception du langage.
Pour segmenter et extraire les mots, le bébé fait-il « attention » aux
caractéristiques phonétiques de ceux-ci ? Nous avons vu que le
nourrisson arrive au monde avec une certaine expérience, une
sensibilité aux contrastes phonétiques, et qu'il pourrait se représenter
les syllabes. C'est dire que les sons de parole ont très tôt la propriété
d'amorcer un traitement qui se poursuit ensuite à un niveau plus élevé
d'organisation de ces sons pour aboutir à des variétés constitutives
pertinentes14.
L'enfant doit apprendre que, dans sa langue, certaines suc-cessions
de phonèmes sont impossibles au début ou à la fin des mots, tandis que
d'autres sont fréquentes ou possibles. L'enfant français, par exemple,
doit pouvoir « rejeter » des séquences telles que [gd] comme début de
mot. Cette séquence de sons existe en revanche dans une langue telle
que le polonais. Quand donc les bébés deviennent-ils sensibles à ces
aspects de la distribution des sons dans leur langue ?
On a donné à écouter à des enfants américains de six et neuf mois
des listes de mots anglais et des listes de mots hollandais15. Certaines
propriétés segmentales et phonotactiques du hollandais violent la
structure phonétique et les contraintes phonotactiques de l'anglais :
ainsi, les mots hollandais « zwetsen » ou « vlakte » seraient
impossibles en anglais où les suites /zw/ et /vl/ ne sont pas admises. En
revanche, la structure prosodique de l'anglais et du hollandais sont
proches. Chaque liste comprenait quinze mots que l'on avait choisis
parmi des mots abstraits, donc non familiers à l'enfant. Selon la
procédure habituelle, le temps d'écoute pour chacune des listes sert de
mesure de « préférence ». Aucune préférence n'a été trouvée chez les
enfants de six mois, pour lesquels les temps d'écoute des deux listes
sont comparables. En revanche, les enfants américains de neuf mois
écoutent plus longtemps la liste de mots anglais (8.93 sec) que la liste
de mots hollandais (5.03 sec). Cette expérience montre que les indices
phonotactiques pourraient être accessibles aux enfants de neuf mois.
Lorsqu'aux contrastes phonotactiques des listes de mots de deux
langues s'ajoutent des différences d'organisation prosodique, ce qui est
le cas dans une comparaison anglais-norvégien, on s'aperçoit que, dès
six mois et non plus seulement à neuf mois, les bébés préfèrent écouter
la liste des mots de leur langue. La sensibilité aux différences dans
l'organisation prosodique est donc plus précoce ou du moins mieux
établie que la sensibilité à l'organisation phonotactique.
Certes, comme le fait justement remarquer Peter Jusczyk, démontrer
que les enfants reconnaissent quand des items non familiers sont
conformes aux contraintes phonotactiques de leur langue maternelle
n'équivaut pas à montrer qu'ils les utilisent pour segmenter la parole.
Pourtant, le fait qu'entre six et neuf mois l'enfant extrait des régularités
et des propriétés phonotactiques de sa langue permet de penser que
celles-ci lui servent pour traiter la parole.
Mais nous nous trouvons encore une fois devant une contradiction
entre les aptitudes pour le traitement de la parole, que nous venons de
mettre en évidence, et les aptitudes à extraire des « mots ». La
perception des indices de frontières de mots a été étudiée avec la même
technique chez des bébés de cinq, neuf et onze mois16. Des pauses
d'une seconde sont insérées dans des histoires racontées aux enfants.
Elles sont insérées sans référence aux propositions, mais placées entre
deux mots différents ou entre deux syllabes d'un même mot. Les
enfants, comme les nourrissons dans l'expérience d'Anne Christophe,
sont-ils sensibles aux indices qui permettent de distinguer les frontières
de mots ?
C'est seulement à onze mois qu'ils montrent une préférence assez
nette pour les échantillons dans lesquels les pauses coïncident avec des
frontières de mots. Alors que les indices qui marquent le groupement
ou « l'emballage » prosodique permettent à l'enfant de préférer des
propositions dès six mois et des syntagmes dès neuf mois, il faut
attendre onze mois pour obtenir des données comparables pour les
mots. Les seuls indices prosodiques ou rythmiques ne permettraient-ils
donc pas aux enfants de segmenter des mots avant cet âge ? L'enfant
reconnaît des mots bien avant onze mois. Il faut donc penser que
d'autres indices se sont surajoutés aux indices prosodiques.

Reconnaître et comprendre

Quand donc l'enfant commence-t-il à comprendre, à répondre de


façon différente aux mots ou aux phrases de son entourage ? Certains
parents, qui se trouvaient être psycholinguistes, ont tenu des cahiers
d'observation très précis des productions, gestes et réactions de leurs
enfants. Les réactions les plus précoces à des mots semblent se
produire vers six-sept mois. M. Lewis, à qui l'on doit, en 1936, une
bonne étude des commen-cements du langage17, note que son fils agite
la main entre huit et neuf mois, quand on dit « good bye ». À sept mois,
Henri bat des mains quand on lui dit « bravo » et se retient de toucher
un objet quand on lui dit « chut » en chuchotant. Bien des parents
auront observé des comportements précoces de ce type. Mais, avant
neuf mois, la plupart de ces gestes sont reliés à des situations précises
et sont appris en réponse à des mots dits dans des contextes bien
délimités. On considère que la plupart des enfants commencent à
comprendre des mots seulement vers neuf mois, même s'il n'est pas
facile de déterminer jusqu'où va cette compréhension. Le plus souvent,
le ton de voix de la mère et la situation restent des appoints nécessaires
pour obtenir une réponse de l'enfant. Une intonation particulière de la
mère suffit parfois à l'enfant pour comprendre une intention ou une
situation. Ainsi Henri, à huit mois, se déplace-t-il fort bien à quatre
pattes et aime-t-il tirer les feuilles d'une plante verte située à sa portée.
Quelques froncements de sourcils accompagnés de « grosse voix », une
petite tape symbolique sur la main et un éloignement rapide de la
position stratégique se sont opposés jusqu'alors aux tentations d'une
vive curiosité. Un jour cependant, Henri s'approche de la plante et tend
la main. Un « non » bien senti l'arrête. Mais alors commence un jeu.
Henri recommence à tendre la main et regarde l'adulte en souriant,
attendant le « non » qui ne manque pas de venir. Il retire la main et ne
touche pas la plante, puis recommence son petit jeu. Il relie
parfaitement le geste à l'interdiction et, capable de se représenter la
réaction de l'adulte, cherche à « faire une blague ». Le jeu continue
pendant un long moment au grand plaisir d'Henri. A-t-il compris le
sens du mot « non » pour autant ? Un « oui » prononcé avec la même
intonation brusque que « non » aura le même effet ! L'enfant de neuf
mois, qui réagit à la phrase « on va se promener » en allant vers la
porte, est souvent aidé par des indices tels que la présence de l'anorak
ou du bonnet qu'il met pour aller se promener. N'oublions pas que
l'enfant est une merveilleuse machine à mettre en correspondance ! À
cet âge, il a identifié des formes sonores, les a liées à des contextes et a
ainsi mémorisé une séquence sonore plus la situation qui y correspond.
Jusqu'à ce jour, il n'a pas été possible de prouver que les capacités
perceptives mises en évidence chez les nourrissons incluaient la
représentation d'entités de « connaissance » c'est-à-dire de formes
auxquelles sont attachés des sens. Mais nous avons constaté une
évolution dans le traitement de la parole. Le déclin des capacités à
discriminer les sons de la parole qui ne sont pas phonologiques dans la
langue de l'environnement et la perte des possibilités de segmenter les
langues étrangères signalent un changement dans les « intérêts » lors
du traitement de la parole. Le traitement d'entités organisées et la
sélection perceptive convergent pour permettre le codage d'unités de
représentation et donc de mots.
Les mots ont une forme phonologique stable et ils ont un sens.
Reconnaître et mémoriser un schéma phonétique et reconnaître et coder
une représentation linguistique sont deux tâches différentes. Mais ce
sont deux aspects complémentaires de la mise en place des systèmes
qui vont permettre à l'enfant d'abord de reconnaître des mots puis de
leur adjoindre un sens afin d'organiser un peu plus tard un lexique
mental de type adulte.
Dans cette quête pour cerner l'émergence du vocabulaire s'est
d'abord posée la question de la reconnaissance et de la mémorisation
des formes phonétiques stables, indépendamment de leur sens.

Retrouver le même objet

La première question est de savoir quand les enfants mémorisent des


formes organisées stables et les retrouvent dans des contextes divers.
Pour y répondre, des bébés de sept à huit mois ont été « interrogés » en
partant du principe qu'ils manifesteraient une préférence pour des
formes reconnues plutôt que pour des formes inconnues. P. Jusczyk et
R. Aslin18 ont ainsi familiarisé les enfants avec des mots
monosyllabiques ou dissyllabiques. Pendant soixante secondes, les
bébés entendent ces mots, répétés toutes les deux secondes. Ils sont
ensuite testés avec la procédure habituelle de préférence d'écoute.
Chaque enfant a le choix entre l'écoute de deux petites histoires : dans
l'une d'entre elles le mot familier a été inséré plusieurs fois, dans l'autre
un mot « inconnu » se retrouve avec la même fréquence d'apparition.
Transposons en français l'expérience de Peter Jusczyk et suivons
Alice, un petit sujet de huit mois. Sa mère l'installe sur ses genoux dans
le box d'expérience. Pendant soixante secondes, le mot « parc » lui est
présenté. Puis par le haut-parleur situé à gauche, Alice entend l'histoire
avec le mot « parc » : « La petite fille se promène dans le parc. Ce parc
est très beau. Les arbres de ce parc sont centenaires et les grilles du
parc dorées… etc. » Le mot « parc » revient quinze fois, tantôt au
début, tantôt au milieu de la phrase. De l'autre côté, à droite, l'histoire
présentée contient le mot « coupe » qui revient aussi quinze fois. « La
petite fille a une coupe rouge. Sa coupe est en cristal. Le bord de sa
coupe était cerclé d'argent et le fond de la coupe doré… »
Alice, familiarisée avec le mot « parc », marquera une nette
préférence pour la première histoire en tournant plus longtemps la tête
vers le haut-parleur gauche, tandis que Paul, familiarisé avec le mot
« coupe », préférera la seconde : il tournera plus longtemps la tête vers
le haut-parleur droit. Des résultats semblables sont obtenus avec des
mots de deux syllabes tels que « tambour » et « marteau ». On les
retrouve aussi lorsque l'enfant a été entraîné avec les phrases contenant
des mots-cibles puis testé sur la reconnaissance de ces mots.
Le terme « mot » doit être compris ici avec toutes les limitations
qu'impliquent ces expériences. On n'y fait pas appel au sens. Les
enfants reconnaissent les formes phonétiques avec lesquelles ils ont été
familiarisés sans les relier nécessairement à une signification. Dans ces
expériences, les mots n'ont pas été choisis pour être compris par
l'enfant. Des « non-mots » acceptables dans la langue tels /kark/ et
/poup/ auraient conduit aux mêmes résultats.
Cependant cette mémorisation est durable. Peter Jusczyk montre
que, quinze jours après la fin de la période de familiarisation, des bébés
de huit mois continuent de marquer plus d'intérêt pour des histoires
contenant les mots avec lesquels ils ont été familiarisés, ou pour des
mots issus d'histoires qu'ils ont entendues chaque jour durant une
semaine. Cependant, tous ces résultats ne sont obtenus que si la forme
phonétique de ces mots reste stable au cours de l'expérience. Le
locuteur peut changer sans que cela gêne outre mesure l'enfant, mais la
modification d'une consonne dans le mot avec lequel l'enfant a été
familiarisé empêche la « reconnaissance » de ce mot. D'où l'idée que la
reconnaissance des mots, avant que ne joue la compréhension, repose
sur une adéquation stricte entre la forme phonétique mémorisée et la
forme présentée dans les histoires. Les enfants de sept-huit mois
montrent des capacités à généraliser puisqu'ils sont capables d'ignorer
certaines dimensions acoustiques telles que la voix, le timbre du
locuteur ou la prosodie, mais ils sont sensibles à la modification d'un
segment : consonne ou voyelle. Autrement dit, les mots mémorisés
sont codés en mémoire sous une forme détaillée et ils ne sont reconnus
que s'ils correspondent exactement à cette forme.
Peut-on penser que se prépare ainsi le répertoire sonore pouvant
servir de base au lexique ? Dans la vie quotidienne, les enfants ne sont
pas entraînés à écouter de façon répétitive les mots ; certes, plusieurs
mots ou expressions reviennent fréquemment dans les propos tenus par
les adultes qui les entourent. Mais les bébés doivent les extraire de
phrases et les coder en tant qu'exemplaires reçus à des moments variés
de la journée, sinon à des jours plus ou moins éloignés dans le temps.
En fait, une description trop stricte assignée à une unité de parole peut
rendre difficile la reconnaissance de cette unité dans le langage
courant. L'adéquation entre une représentation de mot stockée en
mémoire et les nouveaux exemplaires de ce mot est souvent loin d'être
bonne. Les différents locuteurs, les modalités de prononciation, les
variations d'intonation, les conditions d'insertion dans le discours sont
autant de variations qui, cumulées, rendent difficile la reconnaissance
d'un mot. Un point critique est atteint lorsque l'enfant commence à
attacher une signification linguistique à la parole. À partir de neuf
mois, il a pris conscience que les mots ont un sens et son but principal
est alors de comprendre, de reconnaître des mots pour les relier à un
sens. Un changement radical se produit alors dans le traitement des
sons avec la constitution du premier répertoire de mots. L'enfant
devient attentif au sens, il cherche à mémoriser et à représenter les
formes auxquelles il peut attribuer une signification. Cela entraîne une
redistribution des capacités d'attention et de représentation. On peut
penser que l'intérêt primordial de l'enfant, son plaisir, sera alors de
reconnaître, le plus souvent possible, des mots familiers et de leur
donner un sens. Cette quête focalise ses capacités.

Reconnaître les mots familiers

Avec le nourrisson et le jeune bébé, l'expérimentation nous avait


permis de découvrir un inconnu plein de dons, réagissant aux variations
les plus subtiles des sons de parole. Voilà que, quand se pose la
question des mots, de leur extraction, de la découverte de leur sens,
l'expérimentation trébuche. L'enfant n'est plus la mécanique de
précision sensible à toutes les caractéristiques des sons de parole, il a
affiné ses choix, modulé ses capacités de réponse. La perception de
l'enfant est maintenant au service d'un autre but : celui d'extraire du
sens. Il devient difficile de le suivre dans cette quête. On a donc
commencé par rechercher sous quelle forme il mémorisait les mots.
Pour étudier les débuts du codage « spontané » des mots, il fallait
d'abord savoir quand les bébés préféraient des mots fréquents dans leur
entourage linguistique, hors de tout contexte et sans entraînement
expérimental préalable. P. Hallé et B. de Boysson-Bardies19 ont
sélectionné douze mots supposés « familiers » des bébés car ils font
partie du répertoire fréquemment utilisé par les adultes français dans
leurs relations avec les enfants. On les retrouve parmi les premiers
mots dits par les enfants français. Ces mots tels que : « biberon »,
« chaussure », « chapeau », « gâteau », « lapin », « ballon » ont
beaucoup de chances d'appartenir à l'univers linguistique de l'entourage
de l'enfant. On peut faire l'hypothèse que ces mots ont un « sens » pour
les enfants car ils accompagnent des contextes stables du point de vue
de la forme ou de la situation. Pour ce test de préférence, les enfants ne
reçoivent donc aucun entraînement préalable. Dans le montage
expérimental, l'influence de l'intonation ou du contexte est gommée.
L'enfant, assis sur les genoux de la mère qui porte un casque et écoute
de la musique pour ne pas influencer l'enfant, entend d'un côté la liste
des mots considérés comme « familiers », d'où sont exclus des mots
dont la charge affective est très importante comme « papa » et
« maman ». De l'autre côté est présentée une liste de mots français de
même complexité phonétique mais dont l'usage, rare dans la langue,
permet de penser que les bébés les ont rarement, sinon jamais,
entendus : caduc, bigot, volute, busard, etc. Le temps d'écoute pour
chaque liste est pris comme un indice de « préférence » marquant la
reconnaissance de mots.
Une nette préférence apparaît chez les enfants de dix mois et demi à
onze mois et demi : sur seize enfants, douze ont préféré écouter la liste
des mots « familiers ». Les enfants ont donc extrait et codé ces mots
fréquents dans l'environnement linguistique habituel, et une forme de
représentation à long terme s'est forgée dont on peut faire l'hypothèse
qu'elle constitue la base du premier répertoire de l'enfant.
FIGURE 3 - Temps de regard des enfants lors de la représentation des
mots familiers et des mots rares. Dès onze mois, les enfants marquent
une préférence pour l'écoute de mots « familiers » (d'après P. Hallé et
B. de Boysson-Bardies 1994).

Mais la méthode de préférence ne permet certes pas de dire quel sens


les enfants ont attaché aux mots. Certaines de leurs réactions à l'écoute
de la liste des mots familiers laissent clairement penser que la
reconnaissance est bien liée à un sens : ainsi beaucoup d'enfants ont-ils
regardé vers leurs pieds à l'écoute du mot « chaussure » !

La représentation mentale des mots

Pour reconnaître un mot, il faut qu'existe une représentation mentale


correspondant à ce mot. Chez les adultes, l'ensemble des informations
qui le caractérisent : l'aspect acoustique, le sens, la catégorie
syntaxique, les connotations particulières qui y sont attachées par
chaque locuteur, sont toutes représentées et peuvent toutes servir pour
accéder au mot dans le lexique mental des individus. L'accès au lexique
mental a fait l'objet de nombreuses études chez les adultes sans qu'il
soit encore vraiment compris, tant la subtilité et la diversité de l'esprit
humain rendent difficile d'en cerner les modes de travail. En effet, les
processus d'accès au lexique, non seulement mettent en jeu différents
niveaux de représentation et différentes étapes de traitement, mais sont
aussi sensibles à la forme des langues20.
Chez l'enfant de sept mois, lors de la reconnaissance de formes
verbales, seul l'aspect formel est reconnu. Chez les jeunes enfants qui
commencent à comprendre des mots, les informations qui spécifient
ces mots sont sans doute très incomplètes mais impliquent que le sens
(ou un sens) et/ou une connotation particulière soient attachés à une
forme acoustique. À dix ou onze mois, les enfants ont codé un certain
nombre de mots. Comment ces mots sont-ils représentés dans le
premier répertoire de l'enfant ? Comment l'enfant accède-t-il à son
répertoire lorsqu'il entend un mot ?
Les nourrissons possèdent un dispositif sophistiqué de traitement
phonétique reposant sur des mécanismes acoustico-phonétiques de type
analytique. Ces mécanismes qui permettent la discrimination de
phonèmes et de syllabes peuvent-ils fonder la représentation des
premiers mots ? Chez les adultes, l'accès au lexique, en compréhension,
est facilité par la représentation du mot comme combinaison unique
d'un petit nombre d'unités dont la nature varie selon la structure de la
langue maternelle21-22. Ces unités de représentation intermédiaires
seraient : la syllabe pour le français, le pied pour l'anglais (il rend
compte de l'opposition accentuée/non accentuée des syllabes), la more
pour les Japonais (une unité de taille inférieure à la syllabe mais
supérieure au phonème). L'organisation en syllabes a également un rôle
essentiel dans la perception23 et la production des premiers mots24.
Mais, dans les processus de segmentation, le rôle de l'organisation
prosodique et phonotactique des unités de parole paraît essentiel
lorsqu'il s'agit de la compréhension des mots. Dans les contextes de
réception quotidienne de la parole, la représentation des mots serait
codée sous une forme relativement plus « holistique » qui prendrait en
compte principalement les supports des indices prosodiques aux dépens
d'une description segmentale fine. Cette hypothèse a été proposée par
les psycholinguistes qui ont étudié les productions des enfants25-26.
Pour eux, les premières représentations des mots chez les enfants ne
comportent pas une description segmentale complète mais se feraient
sous forme d'un mot « prosodique », une structure globale, syllabique,
sur laquelle sont repérés certains traits articulatoires. On peut objecter à
cette position que les simplifications trouvées dans les premiers mots
proviennent de différentes contraintes sur les programmes de
réalisation des mots. On peut aussi se demander si les représentations
utilisées pour l'accès aux mots sont les mêmes que celles utilisées pour
la production des mots et discuter la valeur des productions pour
comprendre la forme des représentations codées dans le premier
répertoire de mots des enfants. Ces questions longuement débattues
n'ont pas encore trouvé de réponses claires.
La représentation d'un mot émerge des traces laissées dans la
mémoire par les différents exemplaires de ce mot entendus jusque-là.
La forme représentée dans le lexique est nécessairement plus abstraite
que chacune des traces individuelles puisqu'elle doit répondre pour
toutes ou pour chacune d'elles. Accepter l'équivalence des formes dites
gravement par son père, d'une façon plus aiguë par sa petite sœur, avec
l'accent chantant d'un oncle de province, modifiés par un bon rhume de
la mère, ou tout simplement dans des phrases variées, demande que les
mots soient représentés d'une façon « idéalisée » ou « schématique »
plutôt que décrits de façon exhaustive et détaillée. Ce choix, qui est une
abstraction, conserve ce qui est pertinent pour l'utilisation visée :
reconnaître et coder des mots dans cette période d'acquisition durant
laquelle un lexique mental de type adulte n'est pas constitué. Un
codage sous-spécifié est sans doute suffisant pour reconnaître des mots
quand le répertoire est restreint et ne contient pas trop de formes
proches27. Ce qui est le cas du répertoire des enfants d'un an.
Pour tester la forme du codage des mots connus dans le premier
lexique de réception, il fallait d'abord vérifier que la reconnaissance des
mots résistait à la modification d'un segment. Si les enfants
reconnaissent ces mots en dépit de la modification d'une consonne, cela
démontre la différence qualitative dans la façon de coder et de
retrouver des mots entre les enfants de sept mois et les enfants de onze
mois. En effet nous avons vu que les enfants plus jeunes, entraînés avec
des mots qu'ils ne comprennent pas, ne peuvent identifier les mots ainsi
modifiés.
L'enquête s'est donc poursuivie28. Les mots familiers utilisés dans
l'expérience de reconnaissance ont été modifiés. Dans un premier
temps, le trait de voisement de la première consonne a été
systématiquement inversé. Ainsi le mot [biberon] devenait [piberon], le
mot [gâteau] devenait [kâteau] et le mot [chapeau] [japeau], etc. Foin
de cette modification, les enfants de dix-onze mois ont continué à être
bien plus intéressés par ces mots que par les mots rares. Qui plus est,
lorsque la liste des mots ainsi modifiés est proposée avec la liste des
formes familières non modifiées, on ne trouve pas de différence dans
les temps d'écoute. Ceci donne à penser qu'il y a « équivalence » entre
les deux listes. Des résultats identiques ont été obtenus lorsque l'on a
modifié le mode d'articulation de la première consonne. Ainsi [biberon]
devient-il [viberon], [gâteau] [jateau] et [chapeau] [kapeau], etc.
Malgré l'importance de la déformation, les enfants ont continué à prêter
autant d'attention à la liste des mots familiers déformés et à ne pas
marquer de préférence pour la liste des mots familiers non déformés,
quand celle-ci est opposée à la liste des mots familiers déformés.
FIGURE 4 - Temps de regard vers les mots altérés familiers et les mots
rares. Dans les mots familiers altérés, la première consonne est
remplacée soit a) par une consonne de voisement opposé (par exemple
/b/ remplacé par /p/) soit b) par une consonne différant sur le mode
d'articulation (par exemple /b/ remplacé par /v/). Dans les deux cas les
enfants de onze mois continuent de préférer les mots familiers ainsi
altérés aux mots rares.

La représentation des mots n'est donc pas assez spécifiée dans la


mémoire de l'enfant pour qu'un changement de trait sur la première
consonne des mots empêche leur reconnaissance. Ces expériences
donnent ainsi à penser que la représentation perceptive des mots dans
le premier répertoire des enfants ne spécifie pas une séquence de
phonèmes mais des unités plus globales, moins analysées. Ces unités
dépendent sans aucun doute de la structure de la langue. En français la
syllabe joue un rôle fondamental dans la structuration des mots. Si la
première consonne du mot familier est supprimée, les enfants ne
marquent plus de préférence pour les mots familiers. Il semble donc
qu'ils aient représenté les premières syllabes des mots sous une forme
consonne + voyelle sans cependant en coder précisément la consonne.
Une étude de C. Stager29 montre que dans des expériences dans
lesquelles on apprend aux enfants à lier un mot à un objet, les enfants
de quatorze mois ont des difficultés avec les mots trop semblables
phonétiquement. Ils ne les différencient pas, alors qu'ils réussissent
bien cette tâche quand les mots ont des formes clairement distinctes.
Ceci est confirmé dans les études de D. Barton30 qui remarque que la
discrimination de mots se différenciant par une seule consonne tels que
/boire/ et /poire/ se révèle une tâche trop difficile pour les enfants
jusqu'à vingt mois.
Les résultats de ces expériences montrent que les enfants n'ont pas
de représentations assez détaillées pour différencier des mots
phonétiquement proches. Semblables résultats paraissent à première
vue contradictoires avec les données sur la reconnaissance des mots
chez les enfants plus jeunes, mais permettent en fait de suivre
l'organisation des différents niveaux de traitement de la parole. Ils
révèlent une réorganisation des capacités de l'enfant lorsque entrent en
jeu des invariants d'ordre de plus en plus élevés : tel ici le lien entre le
son et le sens. Pour comprendre et parler, l'enfant abandonne une
représentation des unités sonores à la fois trop détaillée, trop
« universaliste » et non organisée. Il s'adapte à la découverte
éblouissante qu'il a faite : les mots ont un sens. Celui-ci focalise son
intérêt.
On ne sait pas actuellement dans quelles limites la présentation
« globale » d'un mot suffit pour sa reconnaissance. Jusqu'à quel degré
de transformation l'enfant peut-il encore assimiler une forme à un mot
de son répertoire ? Cela dépend certainement en partie de la structure
des mots dans la langue et du nombre de mots phonétiquement proches
que l'enfant possède dans son répertoire : quand ceux-ci deviennent
trop nombreux, ce mode de codage n'est plus valable. Nous verrons
alors comment l'enfant commence à réorganiser son lexique et le mode
de codage. Pour l'instant il serait intéressant de savoir ce qui le porte à
maintenir l'équivalence entre un mot et une représentation déformée de
ce mot, et quelles conditions l'amènent à distinguer deux mots dont les
formes sont proches. Ainsi chemine lentement la recherche des
bouleversements qui agitent l'enfant : bouleversements dans le
traitement de la parole et bouleversements cognitifs qui vont se traduire
par l'éclosion de la compréhension et par la production des premiers
mots.

Comprendre les mots

Dans la vie de tous les jours, le petit enfant extrait les informations
linguistiques de sources variées : phonétiques, prosodiques,
syntaxiques, contextuelles. Toutes contribuent à lui permettre de saisir
le sens des mots. Il a également appris à s'exprimer. Des semaines ou
parfois des mois avant que l'adulte ne reconnaisse des mots, l'enfant
dispose d'une panoplie de gestes ou de formes particulières
d'expressions verbales qui lui permettent de communiquer avec l'adulte
ou d'exprimer ses émotions. Un enfant de neuf à dix mois montre du
doigt, agite la main pour dire au revoir, tourne la tête pour refuser,
enfin dispose d'une série de gestes « socialisés » ou personnels qui lui
permettent d'exprimer désirs, intérêts, refus.
D'autre part, son babillage à la fin de la première année n'est pas
aléatoire et on peut découvrir des correspondances systématiques entre
certaines expressions et certaines situations. On a pu montrer que
l'enfant accompagne de vocalisations particulières des demandes, des
manipulations d'objets comme le rangement des cubes, ou des gestes
comme celui de s'asseoir31.

Les études fondées sur les observations d'enfants et sur des enquêtes
auprès des parents montrent que la compréhension précède assez
nettement la production de mots. Dans une étude datant de 197932,
Helen Benedict avance l'âge de neuf mois pour les premières
compréhensions de mots. Cependant, son étude, comme la plupart de
celles qui portent sur la compréhension des mots chez les bébés de
moins de douze mois, ne permet pas de séparer la compréhension de
mots de celle d'indices non linguistiques. Nous avons vu la façon dont
un enfant de neuf mois répond à un « non » et à un « oui » prononcés
dans les mêmes circonstances avec la même intonation. La simple
observation d'enfants suggère que, vers huit ou neuf mois, ils
commencent à reconnaître des mots comme séquences de sons
accompagnant une situation particulière.
Il est difficile de distinguer la reconnaissance d'objets ou de
situations de la compréhension des termes qui les accompagnent.
Semblable difficulté rend complexe l'étude de la compréhension de
mots chez le très jeune enfant. Les méthodes expérimentales
s'emploient à éliminer les situations et les indices familiers habituels
pour essayer de voir si la forme verbale est comprise indépendamment
du contexte. La plupart des tâches utilisées pour tester la
compréhension des mots, jusqu'à ces dernières années, reposent sur la
relation entre un ordre et un objet visuel. L'expérimentateur met
l'enfant en face de trois ou quatre objets et lui dit : « Prends le
camion », « Donne-moi le livre ». Dans d'autres tâches, l'enfant doit
montrer un objet dont on dit le nom, ensuite le nom de l'objet est inséré
dans une phrase et l'on regarde si l'enfant est encore capable de
désigner l'objet. La plupart de ces tâches se sont avérées décevantes.
Faire comprendre ce que l'on recherche à des enfants d'un an n'est pas
simple et l'enfant n'est pas toujours prêt à obéir quand on lui demande
de « faire » ce qu'on dit ou de prendre l'objet qu'on nomme. Il fait ce
qui lui plaît et prend l'objet qui lui paraît le plus attirant ! Les
« erreurs » sont difficiles à interpréter et les « réussites » parfois
chanceuses !
Toutes les études indiquent cependant un changement important
entre onze et treize mois. La capacité de mémoriser – au moins pendant
un temps bref – les noms d'objets inconnus associés à ces objets
émerge vers onze-douze mois. S. Oviatt33 appelle cela « la
compréhension de reconnaissance ». Elle requiert la reconnaissance
d'une forme linguistique, l'association de cette forme avec un
événement de l'environnement, et la conscience d'un lien entre la forme
linguistique et un référent. Cependant cette « compréhension de
reconnaissance » se distingue de la « compréhension symbolique ».
Cette dernière requiert que le mot puisse se référer à un objet en
l'absence de celui-ci, qu'il puisse en tenir lieu. Les expériences plus
récentes utilisent les temps de regard et non plus la prise d'objets. Elles
commencent à montrer une compréhension de mots vers treize-
quatorze mois. Roberta Golinkoff et ses collègues34-35 ont testé la
compréhension de noms et de verbes chez des enfants au début de la
deuxième année avec une procédure de temps de regards. L'enfant est
assis sur les genoux de sa mère, tandis que d'un haut-parleur situé entre
les deux téléviseurs s'élève une voix de femme qui demande « Où est le
camion ? ». Les téléviseurs s'allument ensuite simultanément et l'on
voit sur l'écran gauche un camion et sur l'écran droit une chaussure. La
voix de femme dit alors : « Trouve le camion ». Chaque paire d'objets
est présentée deux fois, et en tout six paires sont présentées au cours de
trente-six essais.
Les temps de fixation du regard sont plus longs et les latences des
réponses moins longues pour l'objet qui correspond à la demande. Neuf
des treize sujets ont des scores plus élevés pour les images qui
concordent avec la demande. Cependant, sur certaines paires, les
réponses ne vont pas dans le bon sens, sans que l'on puisse savoir
pourquoi. Une expérience du même type faite avec des verbes donne
des résultats similaires. Au cours de cette expérience on présente des
petites scènes. Celles-ci sont jouées par une actrice qui mime l'action,
par exemple : boire une tasse de café, danser, souffler sur une feuille de
papier. Les temps de regard pour l'action qui concorde avec la demande
sont plus longs, et onze des douze enfants ont des scores plus élevés
pour les actions qui correspondent à ce qu'ils entendent. Les
expériences faites avec de courtes phrases conduisent à des résultats
similaires. Mais ce n'est pas avant treize mois que certains enfants
regardent plus longtemps l'objet dont on dit le nom, et pas avant seize
mois que les réponses aux verbes se généralisent. Toutes les
expériences faites montrent, qu'avec une bonne préparation, seul un
enfant sur dix, entre neuf et onze mois, regarde assez systématiquement
les objets qu'on lui nomme, cinq enfants sur dix le font entre douze et
quatorze mois lorsqu'il
FIGURE 5 - Dispositif utilisé pour tester la compréhension de mots et de
phrases par une méthode de préférence visuelle (d'après Golinkoff et al.
1995).

s'agit d'animaux, et ce n'est qu'entre quinze et dix-sept mois que ce


comportement se retrouve chez huit enfants sur dix. Les résultats des
expériences ne concordent pas avec les impressions des parents. Ils
montrent les écarts que l'on peut trouver entre des « observations » en
milieu naturel et une approche expérimentale. Peut-être, dans ces
expériences, la demande imposée à l'enfant dissocie-t-elle trop la
référence du mot et l'intention de référer. Les premiers mots prennent
leur valeur dans la communication avec d'autres personnes en
interaction dans un monde commun. Quand les mots ne s'insèrent pas
dans un processus communicatif habituel, l'enfant a sans doute plus de
mal à les retrouver. Il a besoin que concordent un maximum d'indices
pour accéder au mot et retrouver son sens. Cela explique pourquoi plus
tard il aura parfois du mal à détacher le sens d'un mot du contexte où il
a appris ce mot.
Peut-on dans ce cas estimer le vocabulaire de compréhension en
milieu naturel ? Une étude systématique menée aux États-Unis par
l'équipe d'E. Bates36 auprès des parents de mille six cents enfants s'est
fondée sur l'estimation par les parents des mots que leurs enfants
étaient censés comprendre. Les parents estiment que les enfants
comprennent en moyenne cinquante-huit mots à dix mois, cent vingt-
six mots à treize mois et deux cent dix mots à seize mois. Comme
toujours, les variations individuelles sont importantes. Certains enfants
sont crédités de cent quatre-vingt-trois mots à dix mois tandis que
d'autres ne comprendraient que huit mots. Les modalités de recueil de
cette étude laisse libre cours aux appréciations subjectives : les parents
devaient cocher, sur des listes spécialement préparées, les mots qu'ils
pensaient compris par leur enfant ! On connaît les illusions auxquelles
l'amour parental peut conduire ! Ce type d'études tend donc souvent à
surestimer les capacités des enfants à comprendre des mots.

FIGURE 6 - Estimation du nombre de mots compris par les enfants, entre


huit mois et seize mois. La courbe du haut indique les performances
des 10 % d'enfants les plus avancés, la courbe centrale indique les
performances de la moyenne des enfants (80 %) et celle du bas les
performances des 10 % d'enfants les moins avancés (d'après E. Bates et
al 1995).

Un même test, proposé à des parents français, donnerait sans doute


des résultats moins spectaculaires ! Ceux-ci ont bien moins tendance à
voir dans leur progéniture des petits prodiges ! Les données
interculturelles sont à cet égard tout à fait intéressantes. Cependant on
peut penser qu'une moyenne de quarante à cinquante mots compris à
douze mois lorsqu'ils sont dans des contextes situationnels pertinents,
semble raisonnable et c'est celle avancée par plusieurs
psycholinguistes.

En l'an 400, saint Augustin37 écrivait, en parlant de la façon dont il


avait appris à parler : « Rien d'un enseignement de grande personne ne
m'aurait instruit de mots avec ordre et méthode […] j'apprenais moi-
même, grâce à l'intelligence […] je captais par la mémoire les noms
que j'entendais donner aux choses et qui s'accompagnaient de
mouvements vers les objets […]. Cette volonté se découvrait à moi par
les mouvements du corps, par ce langage naturel à toutes les nations
qui consiste en jeu de physionomie, clins d'yeux, gestes, ton de la voix
[…]. Ainsi, ces mots que les différentes phrases me faisaient entendre
fréquemment à leur place respective, je comprenais peu à peu leur
signification. »
Toutes les sources qui aident l'enfant à comprendre le sens des mots
sont mentionnées ! À la fin de la première année, chacune d'elles n'a
pas le même poids. Le contexte joue alors sans doute un rôle bien plus
important que la syntaxe. Cela va évoluer au cours de la deuxième
année et d'autres sources linguistiques prendront alors toute leur
importance.
Notre enfant a un an. Il a appris des gestes de communication, extrait
des formes de son environnement linguistique, commencé à contrôler
son articulation. Pour la première fois, il associe des sons à des
événements, des personnes ou des objets. Il a dit ses premiers mots.
Mais au fait qu'est-ce qu'un mot pour l'enfant ? Comment prend-il sens
pour lui ?

1 Chomsky N., & Halle M., The sound pattern of English, New York, Harper and Row,
1968.
2 Hirst D.J. & Di Cristo A., « French intonation : A parametric approach », Die Neueren
Sprachen, 83, 5, 1984, p. 554-569.
3 Cutler A. & Norris D.G., « The role of strong syllables in segmentation for lexical access »,
Journal of Experimental Psychology : Human Perception & Performance, 14, 1988, p. 113-
121.
4 Christophe A., Dupoux E., Bertoncini J. & Mehler J., « Do infants perceive word
boundaries ? An empirical study of the bootstrapping of lexical acquisition », Journal of the
Acoustical Society of America, 3, 1995, p. 1570-1580.
5 Demany L., McKenzie B. & Vurpillot E., « Rythm perception in early infancy », Nature,
266, 1977, p. 718-719.
6 Trehub S.E., Bull D. & Thorpe L., « Infants' perception of melodies : The role of melodic
contour », Child Development, 55, 1984, p. 821-830.
7 Hirsh-Pasek K., Kemler Nelson D.G., Jusczyk P.W., Wright Cassidy K., Druss B. &
Kennedy L., « Clauses are perceptual units for young infants », Cognition, 26, 1987, p. 269-
286.
8 Jusczyk P.W., Hirsh-Pasek K., Kemler-Nelson D.G., Kennedy L., Woodward A. & Piwoz J.,
« Perception of acoustic correlates of major phrasal units by young infants », Cognitive
Psychology, 24, 1992, p. 252-293.
9 Myers J., Jusczyk P.W., Kemler-Nelson D.G., Charles-Luce J., Woodward A. & Hirsh-
Pasek K., « Infants' sensitivity to word boundaries in fluent speech », Journal of Child Language
(sous presse).
10 Christophe A., Dupoux E., Bertoncini J. & Mehler J., op. cit.
11 Cutler A. & Carter D.M., « The predominance of strong initial syllables in the English
vocabulary », Computer Speech and Language, 2, 1987, p. 133-142.
12 Jusczyk P.W., Cutler A. & Redanz N.J., « Infants' preference for the predominant stress
patterns of English words », Child Development, 1993, 64, p. 675-687.
13 Pye C., « Mayan telegraphese : Intonational determinants of inflectional development in
Quiché Mayan », Language, 59, 1983, p. 583-604.
14 Jusczyk P.W. & Bertoncini J., « Si “d'instinct” nous apprenions à percevoir la parole ? »
dans V. Pouthas et F. Jouen (Eds.), Les Comportements du bébé : expression de son savoir ?,
Liège, Mardaga, 1993, p. 257-270.
15 Jusczyk P.W., Friederici A., Wessels J., Svenkerud V. & Jusczyk A.M., « Infants'
sensitivity to the sound patterns of native language words », Journal of Memory and Language,
32, 1993, p. 402-420.
16
Myers J., Jusczyk P.W., Kemler-Nelson D.G., Charles-Luce J., Woodward A. & Hirsh-
Pasek K., op. cit.
17 Lewis M.M., Infant Speech : A Study of the Beginnings of Language, London, Routledge
and Kegan Paul, 1936.
18 Jusczyk P.W. & Aslin R.N., « Infants' detection of the sound patterns of words in fluent
speech », Cognitive Psychology, 29, 1995, p. 1-23.
19 Hallé P.A. & Boysson-Bardies B. de, « Emergence of an early receptive lexicon : Infants'
recognition of words », Infant Behavior and Development, 17, 1994, p. 119-129.
20Cutler A., Mehler J., Norris D. & Segui J., « A language specific comprehension
strategy », Nature, 304, 1983, p. 159-160.
21 Mehler J., Segui. J., Frauenfelder U., « The role of the syllable in language acquisition and
perception », dans T. Myers, J. Laver & J. Anderson (Eds.), The Cognitive Representation of
Speech, Amsterdam, North Holland, 1981.
22
Mehler J., Dupoux E. & Segui J., « Constraining models of lexical access : The onset of
word recognition », dans G. Altman (Ed.), Cognitive Models of Speech Processing, Cambridge,
Mass., MIT Press, 1990, p. 236-262.
23 Bertoncini J. & Mehler J., « Syllables as units in infants speech behavior », Infant
Behavior and Development, 4, 1981, p. 247-260.
24
Ferguson C.A. & Farwell C.B., « Words and sounds in early language acquisition »,
Language, 51, 1975, p. 419-439.
25Menn L., « Phonological units in beginning speech », dans A. Bell et J. Hooper (Eds.),
Syllables and Segments, Amsterdam, North Holland, 1978.
26 Macken M., « Developmental reorganization of phonology », Lingua, 49, 1979, p. 11-
49.
27 Charles-Luce J. & Luce P.A., « Similarity neighbourhoods of words in young children's
lexicons », Child Language, 1990, 17, p. 205-215.
28 Hallé P. & Boysson-Bardies, B. de, « The format of representation of Recognized words in
infant's early receptive lexicon » Infant Behavior and Development, 19, 463-481.
29 Stager C.L., « Phonetic similarity influences learning word-object associations in 14-
month-old infants », Thèse, Faculty of Graduate Studies, Department of Psychology, University
of British Columbia, Octobre 1995.
30 Barton D., The role of perception in the acquisition of phonology, Bloomington, IN,
Indiana University Linguistics Club, 1978.
31 Blake J. & Boysson-Bardies B. de, « Patterns in babbling : A cross-linguistic study »,
Journal of Child Language, 19 (1), 1992, p. 51-74.
32 Benedict H., « Early lexical development : Comprehension and production », Journal of
Child Language, 6, 1979, p. 183-200.
33 Oviatt S.L., « The emerging ability to comprehend language : An experimental
approach », Child Development, 51, 1980, p. 97-106.
34 Golinkoff R.M., Hirsh-Pasek K., Cauley K.M. & Gordon L., « The eyes have it : Lexical
and syntactic comprehension in a new paradigm », Journal of Child Language, 14, 1987, p. 23-
45.
35 Golinkoff R.M. & Hirsh-Pasek K., « Reinterpreting children's sentence comprehension :
Toward a new framework », dans P. Fletcher et B. MacWhinney (Eds.), The Handbook of Child
Language, Oxford (UK) et Cambridge (USA), Basil Balckwell, 1995.
36 Bates E., Dale P.S. & Thal D., « Individual differences and their implications for theories
of language development », dans P. Fletcher et B. MacWhinney (Eds.), The Handbook of Child
Language, Oxford, Basil Blackwell, 1995, p. 96-151.
37 Saint Augustin, Les Confessions, Paris, Garnier Flammarion, dernière édition, 1993.
CHAPITRE V

Les premiers pas lexicaux


(onze-dix-huit mois)

« Il y a des mots que je vois et d'autres que je ne vois pas. »


UN ENFANT

Les mots pour le dire

Qu'est-ce donc qu'un mot ? Du point de vue de la morphologie, c'est


une structure répondant à des règles. Comme unité de sens, c'est, selon
la jolie définition de Steven Pinker1, « un pur symbole, entre plusieurs
milliers, rapidement acquis grâce à l'harmonie entre l'esprit de l'enfant,
l'esprit de l'adulte, et la texture de la réalité ». En fait, aussi bien les
philosophes que les linguistes ont du mal à définir ce qu'est le « mot »,
une fois dit qu'il n'est pas la chose ! Nous nous en tiendrons donc à
cette définition.
L'acquisition du lexique touche un domaine spécial : celui d'un
système de connaissance du monde. Le système phonologique et le
système syntaxique sont des systèmes conventionnels ; le lexique que
l'enfant doit apprendre met, lui, en jeu la « texture de la réalité ». Les
mots que nous employons correspondent à des formes phonologiques
et à des découpages du monde réel en catégories d'objets et d'actions.
Ces découpages ne sont pas gra-tuits, ils obéissent fondamentalement à
des partitions du monde qui ne sont pas arbitraires.
Ainsi, nous appelons « main » l'extrémité du bras composée de la
paume et de cinq doigts et s'arrêtant au poignet ; au-delà, chacun le sait,
on trouve l'avant-bras, qui va du poignet au coude. Les mots
correspondent ici à des zones bien délimitées par des articulations.
Nous n'avons pas de mot pour dire « main ± partie de l'avant-bras qui
va jusqu'au milieu de celui-ci ». Cette catégorie n'existe pas. La
physique du corps a présidé aux dénominations de celui-ci, c'est en la
respectant que des noms ont été donnés aux parties qui la constitue.
Comment l'enfant peut-il savoir que le mot « main » s'applique à la
seule extrémité pourvue de cinq doigts et non à un ensemble que la
mère agite devant lui pour lui montrer sa main ? L'idée souvent
proposée selon laquelle l'enfant lie simplement la forme sonore qu'il
entend avec l'objet qui lui est présenté ou qui apparaît en même temps
que cette forme sonore ne peut être soutenue que dans des cas bien
précis d'apprentissage de noms. Ce n'est pas le mode général, en
particulier ce n'est pas le cas pour les verbes. Certes, le bébé reste très
dépendant de sa perception. Cependant, dans les situations habituelles,
il est confronté non pas à des objets isolés hors de tout contexte, mais à
des ensembles ou à des événements. Il entend les formes sonores dans
des contextes où plusieurs actions et plusieurs objets se trouvent
simultanément reliés. Ainsi, à l'heure du déjeuner, il est transporté dans
la cuisine, on l'assied dans sa chaise haute, on lui noue sa serviette
autour du cou, on pose une assiette devant lui, sa mère s'assied à côté
de lui, prend un instrument dans la main et le lui met dans la bouche où
s'écoule alors quelque chose de chaud et de délicieux. Cette scène
incorpore des objets et des actions qui se retrouvent chaque fois que
l'événement se reproduit mais qui en sont des parties, des entités
indépendantes. Comment va être extrait le sens des mots « manger »,
« chaise », « cuillère », « chaud », « serviette », dits par la mère à cette
occasion ? L'enfant doit apprendre à distinguer des référents bien
déterminés, désignant non pas l'ensemble d'un événement mais des
parties de celui-ci telles que la chaise, la cuillère ou la serviette. Le
bébé sait que la cuillère et l'assiette de bouillie ne sont pas un même
objet : leurs contours ne sont pas liés et leurs déplacements sont
indépendants. Par ailleurs les formes acous-tiques qu'il entend sont des
blocs (mots, phrases) qui s'arrêtent à certains moments.
Les enfants peuvent donc découvrir le sens correct d'un mot en ayant
une intuition sur le lien entre le découpage du monde extérieur et les
formes sonores qu'ils entendent. Quelle est leur connaissance du monde
et comment le lien se fait-il avec les mots : telle est la première
question.

Le monde et le bébé

Chez l'être humain, les partitions sur le monde, la catégorisation des


objets matériels et l'appréhension des personnes comme « autres » sont
en grande partie prédéterminées. Nous vivons dans un espace
euclidien, dans un monde régi par des principes physiques. Ces
principes physiques nous permettent, dans la plupart des cas, de séparer
les actions et les objets, d'attribuer à chacun des caractères stables qui
préservent leur identité et permettent de les représenter et de les
catégoriser.
La question de savoir si le système de représentation et de
catégorisation des objets et des actions du monde se construit avec les
mots ou préexiste à ceux-ci a fait depuis longtemps l'objet de débats
passionnés. On sait maintenant que les enfants ont des connaissances
naturelles et apprises sur le découpage du monde et ont formé des
catégories à partir du réel, bien avant d'apprendre les signaux
linguistiques qui vont y correspondre. Comme le dit S. Pinker2, le bébé
a un cerveau qui sculpte le monde « en objets cohérents, bornés,
discrets et en actions qui peuvent être faites dans ce monde ». Cette
aptitude dynamique à catégoriser les phénomènes du monde fait partie
elle aussi des cadeaux que l'enfant a reçus dans sa corbeille de
naissance.
Les humains sont donc capables, et sont même contraints de façon
innée, de faire des prédictions sur le monde et de le « découper » en
catégories d'objets et en catégories d'actions. Ils s'attendent aussi à ce
que le langage comporte des mots pour les catégories d'objets et des
mots pour les catégories d'action. Encore une fois, l'interaction avec
l'environnement est nécessaire pour que l'enfant mette des noms sur les
catégories naturelles ou apprises.
Quand et comment s'organise la relation entre les connaissances que
l'enfant possède et va continuer d'acquérir sur le monde d'une part, et la
prise de conscience que les formes sonores ont un sens, d'autre part ?
Dans une première étape, le langage est traité plus acoustiquement
que linguistiquement ; dans une seconde étape, la reconnaissance et la
production des premiers mots indiquent qu'existe une conscience que
les formes sonores ont un sens. L'enfant a mis en relation les formes
sonores et des événements ou des objets. Il a compris l'intention des
personnes de son entourage quand elles utilisent des mots : intention de
se référer à des objets ou des situations, de transmettre du sens, des
informations. Dans une troisième étape, quelques mois plus tard,
l'accroissement rapide du vocabulaire correspond à la découverte du
fait que les mots non seulement dénotent des concepts mais qu'ils
peuvent être appris à partir de tous les concepts dont l'enfant dispose. Il
y a un mot pour chaque « chose » que l'enfant peut perceptivement
extraire en tant qu'objet ou action. Les formes sonores émergent alors
comme un nouveau système qui canalise le traitement de la réalité.
Ainsi, donner un nom à un ensemble de parties physiques garantit une
unité de ces parties.

Le bébé est-il physicien ?

Grâce à l'approche expérimentale de la cognition chez le bébé, on a


pu montrer que la physique des objets matériels, les principes qui
rendent compte du concept de mouvement, ceux qui sous-tendent la
géométrie de l'espace peuvent, dès les premiers mois de vie, aider
l'enfant à structurer le monde.
Selon Elizabeth Spelke3-4, les enfants naissent avec une quintessence
de savoirs sur les objets. Pour Renée Baillargeon5, ce sont plutôt des
mécanismes très contraints qui guident leur raisonnement sur les
objets. Les expériences montrent en effet que, dès trois mois et demi, le
nourrisson se représente un objet comme soumis à des contraintes de
continuité et de solidité dans l'espace. Pour « interroger » le nourrisson,
les auteurs ont comparé ses réactions lors de la présentation de
situations physiques normales et anormales. Si les enfants ont certaines
certitudes sur la physique des objets, un événement qui viole ces
certitudes doit provoquer leur surprise et des temps de regard plus
longs que lors de la présentation d'un événement normal.

FIGURE 1 - Dispositif pour tester les notions de continuité et de solidité


chez des bébés de deux mois et demi. Le schéma du haut (a) montre la
condition expérimentale et le schéma du bas la condition contrôle (b).
Les pointillés indiquent le cache. L'enfant est familiarisé avec la
position 1. La balle roule et disparaît derrière le cache ; levé, celui-ci
laisse apparaître la balle arrêtée par l'obstacle. L'enfant est ensuite
confronté aux conditions 2 et 3. On s'attend à ce que l'enfant regarde
plus longtemps la situation 3 « incohérente » car violant les notions de
continuité et solidité. Le dispositif (b) montre la situation contrôle par
rapport à laquelle les temps de regard des enfants au cours de
l'expérience sont interprétés (d'après E. Spelke, 1990).

Un bébé bien installé dans sa chaise suit un objet qui se déplace


lentement et horizontalement. À un moment de sa course, cet objet
passe derrière un cache. Si, par un tour de passe-passe, on modifie cet
objet de façon à ce que celui qui réapparaît à la sortie du cache n'ait pas
la même taille ou pas la même apparence que celui qui avait pénétré
derrière le cache, le bébé manifeste une vive réaction de surprise. Le
nourrisson s'attend à ce que ressorte le « même » objet. Pour satisfaire
l'attente de l'enfant, l'objet qui a été occulté un moment doit garder sa
taille et sa forme. Il doit conserver son identité. Dans d'autres
expériences, E. Spelke montre que les notions de solidité et de
continuité existent chez les bébés dès deux mois et demi. Les figures 1
et 2 montrent les types de situations étudiées. Dans la première
situation, les bébés sont familiarisés avec une balle introduite sur le
côté gauche, qui roule et disparaît derrière un écran. L'écran levé laisse
voir la balle sur le côté droit à côté de l'obstacle. Dans les situations
expérimentales, l'obstacle est au centre du dispositif et l'écran levé
laisse voir la balle soit devant l'obstacle (situation normale), soit à
l'extrémité droite (situation anormale). Les bébés regardent
systématiquement plus longtemps la situation qui viole la notion de
continuité et de solidité. Dans l'expérience présentée sur la figure 2,
E. Spelke teste de la même façon la notion de gravité. C'est un peu plus
tard, entre quatre et six mois, que les enfants montrent qu'ils s'attendent
à ce que l'objet caché continue à tomber jusqu'à ce qu'il rencontre une
surface solide. Dès cinq-six mois, les principes de gravité et d'inertie
permettent aux bébés de prévoir les mouvements des objets : un objet
qui tombe doit le faire selon les principes de la gravitation.

FIGURE 2 - Dispositif pour tester la notion de gravité chez les bébés de


six mois. Le schéma du haut (a) montre la situation expérimentale.
L'enfant est familiarisé avec la position 1. Les temps de regard pour les
situations 2 et 3 sont comparés. L'enfant regarde plus la situation 3
violant la notion de gravité. b) montre la situation contrôle (d'après E.
Spelke, 1990).

Dans une passionnante série d'expériences, dont nous n'avons


présenté que quelques exemples, Elizabeth Spelke et Renée
Baillargeon prouvent ainsi que, comme les adultes, les bébés assignent
des propriétés aux objets dans un espace tridimensionnel : un objet
solide ne peut traverser un autre objet solide, deux surfaces
appartiennent à un même objet si elles se touchent et bougent
ensemble, l'occultation partielle d'un objet ne signifie pas la perte de la
partie cachée, un objet ne peut rester stable sans support, etc. La
perception des objets est donc guidée par une certaine conception de
propriétés physiques qui impliquent des constantes pour les objets dans
l'espace.
La distinction entre chose vivante et chose non vivante est également
une donnée très précoce. Les bébés ont une intuition leur permettant de
séparer le mouvement d'un objet inanimé qui obéit à des lois physiques
et celui d'un être animé qui n'obéit qu'à lui-même. Ils s'attendent à ce
que les objets animés et les objets inanimés bougent selon des lois
différentes.
Les nourrissons se représentent les objets physiques inanimés et
animés et « raisonnent » sur leurs déplacements en respectant les
contraintes qui régissent le monde physique. Ainsi la physique des
objets matériels, la géométrie de l'espace, la psychologie des personnes
organisent-elles leurs catégorisations naturelles et leur permettent-elles
de faire des déductions sur le monde bien avant que n'apparaissent les
premiers mots.
Certes, plus tard, l'enfant devra faire appel à d'autres connaissances.
Il mettra longtemps avant de savoir que les objets virtuels n'existent pas
comme objets solides et, comme nous, il sera souvent trompé par la
« réalité » d'une image de synthèse. Mais c'est là une autre histoire !
L'équipement cognitif de l'homme lui permet d'avoir une conception
initiale sur la structure du monde physique qui l'entoure. Celle-ci lui
permet d'organiser le réel et de le découper en entités délimitées et
stables dans le temps.
Cependant ni ce qui est donné en commun à l'homme à sa naissance
pour faciliter ses apprentissages, ni ce qui est commun dans la structure
de toutes les langues du monde ne dispensent de l'expérience avec une
langue particulière. Chaque enfant va devoir faire correspondre les
formes acoustiques de sa langue, telles qu'elles sont « découpées » dans
cette langue, avec des actions, des événements ou des objets.

Les choses et les mots

Animé du désir de communiquer, muni de connaissances sur le


monde et de connaissances sur la structure des sons du langage, l'enfant
doit encore lier des schémas sonores à des représentations d'objets,
d'actions et d'événements.
Est-ce aussi simple que cela ?
L'enfant doit s'approprier, à travers ses représentations personnelles,
ce qui lui est donné par le monde physique, linguistique et culturel. Ce
que W. Quine6 a appelé « le scandale de l'induction » joue ici.
Comment, devant une série d'événements, peut-on extraire le sens d'un
mot et faire une généralisation correcte en écartant des interprétations,
actuellement cohérentes avec les observations, mais qui vont s'avérer
incorrectes pour prédire les événements futurs ?
L'exemple classique de W. Quine dans Word and Object est celui du
mot « gavagai ». Un linguiste qui entend ce mot dans un pays étranger
pendant que court un lapin pourra-t-il conclure que le mot signifie
« lapin » ? Il peut signifier « il court » « le voilà » ou « attrapons-le »,
etc. Pour les petits enfants, prenons l'exemple du mot « chien ».
L'enfant a pu entendre ce mot en voyant un basset en train de manger
un os, en regardant un berger allemand courir derrière une balle, en
étant effrayé par un aboiement. Il connaît le caniche blanc de sa tante et
le chien de son papa qui est noir et pour lequel on dit « Médor » et non
pas chien !
Comment l'enfant extrait-il de la diversité des formes et des
événements liés à la production du mot « chien » par les adultes le sens
de ce mot ? Celui-ci définit une espèce particulière d'animal. Comment
pourra-t-il éviter de généraliser le mot à l'ensemble des animaux à
quatre pattes ? Pourquoi l'enfant ne pense-t-il pas que le mot « chien »
désigne la queue de ce « quelque chose », ou tout animal qui a quatre
pattes, pourquoi désigne-t-il un « objet » et non pas une action,
l'aboiement par exemple ? D'autre part, d'autres « fausses voies »
pourraient être ouvertes par des emplois métaphoriques du mot ! Ainsi
son père a pu s'apitoyer sur un petit bobo en disant avec un peu d'ironie
« Pauvre chou, tu t'es fait un mal de chien ! » Dans ce cas, pas d'animal
en vue !
L'enfant va-t-il privilégier des similarités de forme ou de fonctions ?
La plupart du temps, le mot se présente avec assez d'indétermination
pour que l'enfant ait à « choisir » un sens. Cependant il ne faut pas
exagérer : grâce aux contraintes ontologiques, aux « savoirs » précoces
qu'il possède sur le monde, les hypothèses que l'enfant peut faire ne
sont pas si nombreuses. Et en effet, la plupart du temps, les prédictions
des enfants vont s'avérer correctes ou raisonnables. Le mot « chien »
s'appliquera à quelque chose qui bouge, qui a une forme ayant des
caractéristiques telles que quatre pattes, une queue, une tête et dont le
mode d'expression sonore est l'aboiement. Seul un objet ayant tout ou
partie de ces caractéristiques se retrouve dans les différentes scènes.
Certes, les généralisations ou, au contraire, certaines réductions dans
l'emploi du mot restent possibles et relativement fréquentes. Dans le
langage usuel, le mot « chien » dénote une espèce particulière d'animal
à quatre pattes, mais l'enfant peut généraliser ce concept et commencer
à penser que le mot « chien » s'applique à tout animal avec quatre
pattes et des poils. Ce type de généralisation repose cependant sur un
fondement conceptuel. Les déductions de l'enfant ne sont pas fausses
mais la mise à l'écart d'un ou de plusieurs attributs de l'objet le conduit
à sélectionner une supercatégorie, les mammifères, plutôt qu'une sous-
espèce de cette supercatégorie : les chiens. Guy, à dix-sept mois, utilise
le mot « chien » pour tous les mammifères et pour… les dinosaures ! Il
utilise le mot « poule » pour tous les oiseaux et le mot « poissons »
pour les poissons. Dans cette partition, les « supercatégories »
reçoivent le nom d'un élément de la catégorie, si l'on excepte l'erreur
des dinosaures ! Mais combien d'adultes ne se laisseraient-ils pas
prendre à l'aspect physique d'un diplodocus ou d'un brontosaure ? En
fait, ce que Steven Pinker appelle les « devinettes » des enfants sont en
général correctes. Le plus souvent ils appellent les personnes et les
choses par leur nom.
Les premiers mots sont le plus souvent attribués à des
représentations préexistantes d'objets, d'actions ou d'événements.
Cependant une même approche, fondée à la fois sur des contraintes
ontologiques et pragmatiques, est utilisée pour les mots nouveaux
correspondant à des concepts nouveaux ainsi que pour la généralisation
des mots connus à des objets nouveaux de même catégorie.
Suivons encore Guy en train d'apprendre ses premiers mots. Il
connaît le mot « oreille » et sait montrer son oreille et celle d'une autre
personne. Il n'a pas de chien et n'a jamais joué avec un chien. Il a
aperçu de loin des chiens et en a vu sur son livre d'images. Un jour, il
se trouve en présence d'un vrai chien, se montre ravi et sans crainte. Le
chien est un épagneul à oreilles tombantes. Comme Guy a fait son petit
numéro et montré son oreille et celle de son père, on lui demande de
montrer les oreilles du chien. Sans hésitation Guy va soulever l'oreille
du chien. Est-ce si trivial ? Les oreilles de l'épagneul perdues dans de
longs poils soyeux ressemblent-elles donc à celles des hommes ? La
généralisation ne peut s'effectuer qu'à partir d'une « connaissance »
implicite des parties du corps et de leurs fonctions, non seulement chez
l'homme mais aussi chez les mammifères.
Les enfants déduisent que des mots nouveaux se réfèrent à de
nouveaux objets ; ils en étendent la signification à d'autres objets avec
prudence. Un peu plus tard, ils apprennent vite qu'une chose peut avoir
plusieurs noms : le chien est un animal et peut s'appeler Médor ou
Toutou. Cela ne semble pas poser de problème aux enfants. Ils
s'attendent à ce qu'un papa soit aussi un monsieur et qu'il s'appelle
aussi Pierre ou Paul ou « mon chéri ». On a parfois pensé à des erreurs
de généralisation quand un bébé appelle « papa » tous les messieurs. Il
faut se méfier de ce genre d'interprétations : il n'y a pas forcément
généralisation du nom destiné à un papa particulier, qui reste seul
habilité à le porter, mais généralisation de la fonction. Dès que l'enfant
sait utiliser les articles, il dit : « c'est un papa ». Le rôle des hommes est
d'être des pères protecteurs et nourriciers dans l'imaginaire des tout-
petits. Au Moyen Âge, en France, comme maintenant encore en Italie
et en Espagne, la bouillie s'appelait « papa », marquant ainsi le rôle
symbolique de l'homme-père qui est de « nourrir » l'enfant.
Certes la tâche des enfants peut être facilitée par les adultes, par
exemple lorsque ceux-ci désignent les objets ou les emploient
particulièrement fréquemment. Cependant ce type d'apprentissage n'est
pas la règle et n'existe pratiquement pas pour certains enfants ou dans
certaines cultures. Jusqu'à ce que l'enfant puisse demander la définition
d'un mot, il doit en deviner le sens grâce à sa connaissance du monde et
à ses relations avec les autres. D'une part, l'enfant est aidé dans ses
« devinettes » par les contraintes physiques ou abstraites qui
restreignent les sens possibles d'un mot et en canalisent le domaine et
la structure. D'autre part, il est aidé par les relations interpersonnelles et
le langage. La concordance d'indices extérieurs avec des indices
linguistiques (phonétiques, prosodiques, sémantiques et syntaxiques) et
des réactions des adultes lui permet de lier les mots aux choses, aux
actions et aux sentiments. Très vite, l'enfant comprend qu'une suite de
mots correspond à un événement complexe. Vers treize-quinze mois,
bien avant et sans qu'il lui soit nécessaire de rentrer dans une phase
beaucoup plus avancée de la production du langage, il comprend des
phrases relativement complexes. Peu à peu il pourra se libérer des
indices externes et se reposer sur l'analyse syntaxique de la phrase.

Les premiers mots

La date d'entrée dans le domaine des mots est très variable. L'âge
auquel les premiers mots sont prononcés, la forme de ceux-ci et le
rythme avec lequel se développe le vocabulaire varient selon les
enfants. La culture, l'environnement social, le tempérament de l'enfant,
son rang dans la fratrie jouent tous un rôle pour influencer l'âge
d'apparition des premiers mots.
Il convient cependant de dégager quelques tendances générales. Le
plus souvent, les premiers mots des enfants sont « entendus » par les
adultes entre le onzième et le quatorzième mois. L'accroissement du
premier vocabulaire va être très lent. Les enfants mettent en moyenne
cinq-six mois pour arriver à un répertoire de cinquante mots7. Cette
période entre la production du premier mot et un vocabulaire d'une
cinquantaine de mots est particulière, non seulement par la lenteur du
développement mais aussi par sa fluctuation. L'enfant peut ne plus
employer certains mots précédemment utilisés, et sa prononciation d'un
même mot peut varier. En outre les mots sont utilisés dans des
contextes réduits et ne se généralisent pas à d'autres situations.
Elizabeth Bates et son équipe8-9ont mené une enquête auprès de
1 803 parents en leur demandant de marquer, sur des listes préparées
d'avance, les mots que leur enfant disait. Cette étude a permis de suivre
l'évolution du vocabulaire d'enfants anglophones depuis l'âge de huit
mois jusqu'à l'âge de trente mois.
Les résultats de son étude montrent une variabilité énorme et des
lexiques étonnamment riches chez certains enfants. À onze mois, les
mots dits par les enfants, selon les parents, vont de zéro à cinquante-
deux avec une moyenne de six mots, à un an les vocabulaires s'étendent
de trois mots à trois cent cinquante-sept mots avec une moyenne de
quarante-quatre mots et à vingt mois de cinquante-sept mots à cinq cent
trente-quatre mots avec une moyenne de trois cent onze. Le nombre de
mots dits par les enfants dans les données de E. Bates et ses collègues
est bien plus élevé que dans les autres études. Katherine Nelson10
donnait une moyenne de cinquante mots à vingt mois (âges variant de
quatorze à vingt-quatre mois) et cent quatre-vingt-six mots à vingt-
quatre mois avec des variations allant de vingt-huit à quatre cent trente-
six mots. En prenant des critères plus stricts, E. Bates et L. Fenson11
proposent des moyennes de dix mots à treize mois, cinquante mots à
dix-sept mois et trois cent dix mots à vingt-quatre mois. Cela rejoint les
performances des enfants que nous avons étudiés. Ils ont produit entre
trente et quarante mots durant une séance entre quinze et dix-sept mois.
Leurs mères ne pensaient pas le vocabulaire de l'enfant beaucoup plus
important. On retrouve chez les enfants suédois et japonais des
moyennes proches. Cependant, dans toutes ces études, la variabilité des
performances entre les enfants est très importante.
L'étude de E. Bates12 et de ses collègues sur des enfants américains
pourrait donner à penser que la méthode de recueil auprès des parents,
avec des listes préparées d'avance, favorise l'imagination de certains
parents. Il reste que l'on doit constater une variabilité très importante, et
la réalité d'une certaine précocité existe bien. Mais, ainsi que
l'indiquent les moyennes, les enfants ayant plus de cinquante mots à
douze mois et plus de trois cents mots à seize mois sont rares !

FIGURE 3 - Production : évolution du répertoire de mots produits par les


enfants entre huit et seize mois a) par les enfants les plus avancés, b)
pour la moyenne des enfants et c) par les enfants les moins avancés
(d'après E. Bates et al 1995).

Dans les figures 3 et 4, E. Bates a présenté l'évolution du répertoire


pour les 10 % d'enfants les plus avancés, pour la moyenne (c'est-à-dire
80 % des enfants), et pour les 10 % des enfants les moins avancés.
L'augmentation du vocabulaire est particulièrement sensible entre
seize et vingt mois, c'est-à-dire après l'acquisition des cinquante
premiers mots qui s'étend sur quatre à cinq mois. Après cette première
et relativement laborieuse étape, le vocabulaire s'accroît régulièrement
et rapidement. Dans les quatre mois qui suivent l'acquisition des
cinquante premiers mots, les enfants acquièrent en moyenne cent vingt
mots, puis cent quarante dans les quatre mois suivants et deux cent
soixante au tout début de la troisième année.

FIGURE 4 - Production : évolution du répertoire de mots produits par les


enfants entre seize et vingt-quatre mois a) par les enfants les plus
avancés, b) pour la moyenne des enfants et c) par les enfants les moins
avancés (d'après E. Bates et al 1995).

Le nombre de mots produits dépend en fait peu de l'âge chez les


enfants de moins de dix-huit mois. Il ne rend compte que de 22 % de la
variation. Chez les enfants plus âgés, l'âge devient une variable plus
pertinente (46 % de la variation). Jusqu'à la troisième année, les
variations dans le nombre de mots du vocabulaire sont donc plus
personnelles que dépendantes de l'âge.
Des variations aussi considérables peuvent paraître surprenantes. Les
retards importants sont-ils tous pathologiques ? Les précocités
prédisent-elles de futurs « forts en thème » ? Certes non. Les difficultés
de compréhension des mots ont une valeur de prédiction beaucoup plus
forte que le nombre de mots produits. Dans son étude, Elizabeth Bates
a comparé les enfants qui étaient très en dessous de la moyenne en
production mais qui, en compréhension, se situaient dans la normale, et
ceux dont la compréhension était aussi inférieure à la normale. Un an
plus tard, les premiers bébés avaient rejoint la moyenne des enfants
quant au nombre de mots produits. Pour les autres, la plupart ne
rejoignaient cette moyenne qu'à six ans. Parmi les enfants très précoces
pour la production, on trouve des enfants dont la compréhension n'est
pas supérieure à la moyenne. Ce constat renforce l'idée d'une
dissociation entre la compréhension et la production chez les tout
jeunes enfants. Il peut exister aussi des dissociations entre le niveau du
vocabulaire et ceux de la syntaxe et de la mémoire verbale, si bien
qu'un vocabulaire important à dix-huit mois ne prédit pas un
développement plus précoce des phrases. Sans doute, beaucoup
d'enfants qui ont un vocabulaire important à un âge où les autres ne
disent que « papa » et « maman » ont de bonnes chances de se
retrouver beaux parleurs quelques années plus tard. Ce sont des enfants
qui aiment parler. Mais un retard dans la production de mots, pas plus
qu'une précocité dans le vocabulaire, ne sont des indices permettant de
prédire l'intelligence ou les réussites scolaires. Einstein, un des plus
grands cerveaux du siècle, n'aurait parlé qu'à cinq ans ! S'il faut rester
vigilant pour déceler des troubles de langage chez les enfants, on doit
savoir qu'un « délai » dans la production des premiers mots n'est pas
forcément l'indication d'un déficit. Les troubles de compréhension, eux,
doivent en revanche attirer particulièrement l'attention des parents.
Il faut se rappeler que les analyses d'Elizabeth Bates portent sur les
rapports de parents auxquels ont été présentées des listes de mots à
cocher selon qu'ils pensent que l'enfant produit ou non le mot. Les
imitations sont acceptées : les enfants imitateurs, et plus
particulièrement les enfants imitateurs de sons d'animaux, vont être
assez abusivement gratifiés de connaissances qu'ils ne possèdent pas
encore ! La forme des mots n'est pas considérée et la « correction »
avec laquelle les enfants prononcent leurs mots varie aussi beaucoup.
La tolérance des parents pour accepter comme mot une forme plus ou
moins déformée du mot cible dépend beaucoup des cultures. Il y a,
dans ce genre d'approche, une certaine sous-estimation ou
surestimation par les parents selon que l'on attache de l'importance aux
performances précoces des enfants. La surestimation se révèle en
général particulièrement fréquente aux États-Unis où la compétition
existe très tôt, même dans ce domaine. La précocité que trouve
E. Bates est sans doute liée en partie à ce problème d'estimation.
L'« illusion du vocabulaire » reste très forte dans certains milieux
culturels qui privilégient une approche référentielle et tendent à
apprendre le plus de mots possibles aux enfants. Nos travaux
comparatifs nous ont montré, et nous en parlerons plus tard, combien
les mères françaises ou japonaises sont bien moins impatientes
d'entendre parler leurs enfants que ne le sont les mères américaines.
Mais les études d'E. Bates et de ses collègues permettent en tout cas de
voir l'extraordinaire variabilité individuelle qui se marque dans le
vocabulaire de production des enfants, entre huit et trente mois, et
d'avoir sur celui-ci des idées plus claires.

Les essais et les erreurs

Pour produire un mot, plusieurs étapes sont nécessaires : il faut


d'abord sélectionner le mot approprié dans le répertoire, puis retrouver
le programme phonétique qui permettra de le réaliser, enfin donner une
séquence d'ordres aux divers articulateurs pour aboutir à la
prononciation du mot.
Comment, chez l'enfant, s'actualisent ces processus ? L'adulte
programme d'abord les mots sous une forme métrique donnant les
indications de rythme syllabique et éventuellement, selon les langues,
de stress et d'accent. Quand ce cadre est construit, il est « rempli » par
le matériel segmental (consonnes et voyelles ou syllabes) et
éventuellement tonal. Chez l'enfant, nous avons vu que le cadre
métrique n'est dans la plupart des cas que partiellement rempli par le
matériel segmental. C'est donc à partir d'un cadre reposant sur les
éléments métriques spécifiques de la langue, syllabes ou pieds, dont le
contenu sera peu spécifié, que vont être programmés les gestes
articulatoires. Chez certains enfants, seuls les traits saillants seront
indiqués avec le contour d'intonation. Nous connaissons ce phénomène
d'avoir un « mot sur le bout de la langue » lorsque nous essayons de
retrouver un mot rare, un mot étranger ou un nom propre : nous savons
qu'il contient trois syllabes (cadre), qu'il commence par un /g/ et finit
par quelque chose comme /ol/ ou /or/. Nous avons codé la métrique,
une terminaison : voyelle plus une consonne latérale, mais le
remplissage segmental des syllabes intermédiaires manque, nous
empêchant de produire correctement le mot « glycérol ». L'enfant se
heurte à des problèmes de ce type. Les schémas phonétiques spécifient
de façon floue les gestes nécessaires pour produire la succession de
syllabes et de segments.

FIGURE 5 - Modèle pour la production des mots chez les jeunes enfants.
Les enfants s'appuient sur la métrique syllabique et l'intonation des
mots et ne programment pas nécessairement la totalité de la structure
segmentale.

À ces difficultés s'ajoute, à la fin de la première année, un contrôle


incertain du système articulatoire. Celui-ci, chargé d'exécuter le
programme phonétique sous la forme d'une série d'instructions
neuromusculaires complexes, n'est pas mûr pour produire tous les sons
éventuellement programmés. La maîtrise des articulateurs supérieurs
n'est pas encore acquise. Ainsi un début de type /fl/ peut-il être
correctement codé sans que l'enfant puisse le reproduire. La plupart des
enfants de moins de deux ans sont incapables de prononcer des groupes
consonantiques tels que /gr/, ou /pr/, ou /fl/, etc. Tous ces facteurs
expliquent pourquoi la forme des mots des enfants diffère de manière
typique de celle des mots des adultes. Les principales études sur ce
point sont dues au groupe de Stanford sous la houlette de Charles
Ferguson13-14-15. Les auteurs retrouvent dans les premiers mots
beaucoup des caractéristiques formelles des productions du babillage :
les syllabes sont le plus souvent de type CV (Consonne ± Voyelle).
Elles sont introduites par des occlusives labiales ou dentales. Les mots
se terminant par une consonne sont rares et les consonnes terminales
sont plus souvent des fricatives que des occlusives. Le plus
généralement, il n'y a pas de discontinuité entre les formes du babillage
et celles des premiers mots : certains enfants donnent ainsi l'impression
de choisir leurs premiers mots parmi les sons de babillage qu'ils ont
aimé produire16.
Prenons l'exemple d'Émilie qui a favorisé, dans son babillage, les
syllabes introduites par des consonnes vélaires telles que /g/ ou /k/. Elle
« choisit » la majorité de ses quinze premiers mots parmi les mots
introduits par une occlusive vélaire. Parfois, ces mots sont inattendus
dans un vocabulaire aussi restreint, ainsi des mots tels que /kje/ et
/kuja/ pour cuillère, /ke/ pour une clef ou pour le nom de Mickey, /ka/
pour sac, à côté de /kaka/ pour canard et /gogo/ pour son chien en
peluche. Ce comportement fréquent n'est cependant pas de règle, et
certains enfants montrent une belle indépendance vis-à-vis de leurs
formes babillées quand ils abordent le domaine des mots.
Parce qu'ils impliquent une programmation en fonction d'une cible et
donc un investissement supplémentaire de la part de l'enfant, les mots
ont souvent des formes plus simples que les dernières productions de
babillage. Dans son effort pour produire une séquence de syllabes non
aléatoire, l'enfant tend à réduire la demande articulatoire, ce qui
l'amène à simplifier les formes de ces syllabes. Il tend à choisir des
mots bisyllabiques avec des syllabes répétées, ou à réitérer une des
syllabes d'un mot dissyllabique. Il augmente encore sa propension à
produire des labiales17. Ces dernières sont les phonèmes favoris des
petits enfants, des petits Français tout particulièrement !
Ces tendances sont des constantes du premier langage. Au
XIIIe siècle, Aldebrandin de Sienne18 signalait la facilité de production
des mots avec des occlusives labiales et des syllabes répétées ou
proches. Il remarquait aussi que les mots qui font partie de l'univers des
tout-petits sont bâtis de cette façon, ainsi : « papa », « maman »,
« bébé », « poupée ». Mots auxquels il faut ajouter des formes dites
enfantines, peut-être issues du fameux « bégaiement » des nourrices,
préconisé par Barthélemy l'Anglais19 : « bonbon », « mémé », « lolo »,
« dodo », « bobo », « popo », « wouah-wouah » !
Chez les bébés de moins de vingt mois, on trouve des suppressions
de syllabes ou de segments, des substitutions de phonèmes « faciles » à
certains phonèmes qui demandent une coordination complexe de
mouvements, comme les fricatives : /s/, /z/, /ch/ ou les latérales /r/, /l/.
Les syllabes semblent cependant, particulièrement en français, une
unité de parole fondamentale. En considérant les tout premiers mots
d'enfants français, il est rare de trouver des omissions de syllabes dans
les mots dissyllabiques (8 % environ dans nos études). Elles sont un
peu plus fréquentes dans les premiers mots trisyllabiques : [efa] pour
« éléphant ». Mais le plus souvent, l'enfant utilise une technique de
remplissage ou de duplication de syllabes qui permet de conserver le
nombre de syllabes : [tetefan] pour « éléphant », [papapo] pour
« paletot ». La suppression de la première consonne se retrouve dans
environ 7 % des productions d'enfants français : [apo] « chapeau » ;
[apin] « lapin ».
Chez les bébés anglophones, les omissions de syllabes dans les mots
dissyllabiques sont bien plus fréquentes (environ 23 %). L'enfant ne
garde que la première syllabe du mot, celle sur laquelle porte l'accent
(le stress). La structure des langues module très tôt la forme des
premiers mots, de telle sorte que les types « d'erreurs » trouvées dans la
prononciation des premiers mots n'apparaissent pas avec la même
fréquence en anglais, en français et en japonais, par exemple. Si tous
les enfants ont une forte tendance à omettre les consonnes finales
([zosy] pour « chaussures », [kala] pour « canard »), la structure de
l'anglais amène les bébés anglophones à en produire plus, et plus tôt.
La réduction systématique des groupes consonantiques est assez
générale : [bawo] « bravo » ; [ke] « clef ». Les erreurs dues à des
substitutions phonémiques portent essentiellement sur la substitution
d'occlusives à des fricatives, dont la production est plus difficile : [to]
« chaud » ; [tal] « sale ». La distinction entre des fricatives telles que
/v/, /s/, /ch/, /z/ restera difficile pour beaucoup d'enfants jusqu'à cinq-
six ans.
La plupart des enfants produisent des mots révélant des schémas :
M. Vihman20 et M. Macken21 ont étudié ces « patrons harmoniques » et
« patrons mélodiques ». Les « patrons harmoniques » consistent à
assimiler la première consonne à la seconde consonne du mot
(assimilation antérétrograde), particulièrement lorsque celle-ci est une
occlusive labiale : [papo] « chapeau », [papin] « sapin », [tato]
« gâteau », [kako] « Jacquot ». Dans les premiers mots, les
harmonisations consonantiques sont fréquentes. Plus habituelles que
l'harmonie vocalique, elles persistent aussi beaucoup plus longtemps.
Les « patrons mélodiques » indiquent des contraintes d'un autre type
qui impliquent des schémas spécifiques de consonnes. Marilyn
Vihman22 présente l'exemple d'Alice chez qui l'on trouve, à quatorze
mois, un schéma canonique [C V C V], bien établi : [baji] « bottle » ;
[taeji] « daddy » ; [baeji] « bunny » ; [ma :ni] « mammy ».
L'organisation mélodique du schéma d'Alice affecte aussi bien le début
du mot que la rime de la seconde syllabe.
Léo, un de nos petits sujets, organise un certain nombre de
productions autour de /l/, son généralement rare chez les enfants de cet
âge. Durant un moment, il cristallise ses productions autour d'une
forme [C V C V] : [pala] « pas là » ; [bala] « ballon » ; [kola], nom
d'un pingouin ; [kola] « cuillère » ; [delo] » de l'eau » ; [walla]
« voilà », mais aussi : [pala] « brosse » ; [kala] « canard », qui sont des
mots normalement sans /l/ en position centrale.
Les erreurs de prononciation dans la première moitié de la deuxième
année restent cependant le plus souvent aléatoires et les réalisations
d'un même mot varient chez un même enfant. Au cours d'une seule
séance, le mot « gâteau » est dit sept fois par Noël sous des formes
différentes dans lesquelles seule la deuxième syllabe est constante :
/tato/ /eto/ /geto/ /kato/ /Həto/.
Dans la seconde moitié de la seconde année, les erreurs des enfants
sont moins erratiques. On trouve des régularisations de formes pas
toujours correctes mais qui montrent que l'enfant est en train, après
avoir acquis le système phonétique, d'acquérir le système phonologique
de sa langue.

Deux lexiques ?

Nous avons vu que l'enfant comprend plus de mots qu'il n'en produit.
Cela voudrait-il dire qu'il existe un lexique de compréhension différent
du lexique de production ? L'enfant a-t-il des représentations séparées
pour les mots, dont l'une sert à reconnaître ces mots et l'autre à
programmer leur production ? Le lexique d'entrée est supposé par
définition contenir le savoir de l'enfant sur le mot. Chez les jeunes
enfants, ce savoir est faible. En particulier les traits grammaticaux sont
absents ainsi que beaucoup d'indications sur les segments et leurs
combinaisons. Ces représentations phonétiques et métriques
schématiques permettraient de retrouver les mots mais ne donneraient
pas assez d'indications pour reconstruire la forme du mot. Les enfants
auraient alors besoin d'un lexique de production. Celui-ci consisterait
en une collection de formes que l'enfant connaît, sait reproduire et qu'il
applique à des mots selon certaines similitudes. Cette position peut
expliquer l'avance de la compréhension sur la production, la plus
grande facilité à imiter qu'à produire des mots et enfin l'accroissement
lent du vocabulaire durant les premiers mois de production. Elle
pourrait expliquer les late-talkers qui demandent une spécification
phonétique plus précise du lexique pour prononcer des mots.
Mais il n'est peut-être pas nécessaire de supposer deux lexiques pour
justifier ces faits. On peut aussi penser qu'il n'y a qu'un seul lexique et
des voies d'accès différentes pour la perception et la production. Ces
voies d'accès se développeraient à un rythme différent et rendraient
compte du « retard » de la production sur la compréhension. L'intérêt
de cette dernière position serait de faire prendre en charge les
productions des jeunes enfants par le lexique de perception. En effet
l'enfant doit reconnaître les mots qu'il produit. De nombreux exemples
montrent que des relations existent entre le choix des premiers mots et
les routines de productions favorites des enfants. L'enfant est plus
attentif aux mots qui incluent les formes qu'il a pratiquées durant le
babillage et qui, souvent, lui servent de repères et de modèles23.

Composition du premier vocabulaire

Dans le premier vocabulaire des enfants, les noms dominent et les


formes prédicatives (verbes ou adjectifs) sont relativement rares. Les
études, en particulier celles faites aux États-Unis, ont insisté sur cette
prédominance des noms. Même si, parmi les tout premiers mots, des
mots « sociaux » comme « allô », « au revoir », ou des mots de
fonction comme « là », « encore », sont fréquents, la majorité des
cinquante premiers mots sont des noms d'objets ou d'animaux.
Katherine Nelson24, Helen Bene-dict25, Elizabeth Bates26 trouvent plus
de 70 % de noms dans le premier vocabulaire des enfants américains.
Dans leur étude, elles trouvent 45 % de noms quand les enfants ont un
vocabulaire de dix à cinquante mots, mais ce chiffre ne comprend ni les
noms de personnes, ni les sons d'animaux qui servent à désigner.
E. Bates dit avoir ainsi largement sous-estimé la proportion des noms
dans le vocabulaire des enfants. Dans le même groupe d'enfants, on
trouve peu de verbes : 3 %. C'est le pourcentage que nous avons
retrouvé dans nos propres études sur des enfants de milieu anglophone
aux États-Unis. Nous verrons combien il convient de ne pas généraliser
ces données aux enfants d'autres milieux linguistiques. Les enfants
français de même âge et de même niveau linguistique produisent 13 %
de verbes parmi leurs premiers cinquante mots27.
En effet, selon la structure de la langue maternelle ou les « styles »
d'acquisition du langage des enfants, la composition du vocabulaire
présente des variations importantes dans les proportions de verbes, de
mots sociaux ou de noms.
Cependant, assez généralement, il y a peu de verbes dans le premier
vocabulaire des enfants : leur sens est moins facile à saisir que celui
des noms et ceux-ci sont plus aisément identifiés dans le monde
concret. L'apprentissage des verbes dépend, en partie au moins, de la
possibilité de comprendre des phrases : la structure syntaxique
contraint alors leur sens comme l'a montré Leila Gleitman28. Une
phrase comme « le bébé sourit » oriente l'interprétation vers une action
sans objet, contrairement aux phrases : « le bébé prend un jouet » ou
« le bébé donne une balle à sa maman ». Les enfants français, suédois
ou japonais qui, dans nos études, acquièrent un peu plus tardivement un
vocabulaire de cinquante mots, produisent nettement plus de verbes
que les enfants anglophones, sans doute parce que, plus âgés, ils ont
une meilleure compréhension des phrases.
Les formes non nominales augmentent régulièrement quand le
vocabulaire passe de cent à six cents mots. Le langage passe alors
graduellement de la référence simple à la prédication et à la grammaire.
Cependant le pourcentage de noms peut varier considérablement
dans le vocabulaire de l'enfant en fonction de son « style ». Chez
certains enfants, la quasi-totalité du vocabulaire, avant vingt mois, est
composée de noms. Leur style est dit « référentiel ». Pour d'autres, qui
utilisent un style « expressif », on trouve un équilibre entre noms et
prédicats ou mots de la classe fermée (adverbes de type : « encore »,
« là », ou parfois pronoms, articles, copules). Ces enfants utilisent en
effet souvent des expressions que les auteurs américains qualifient de
« figées ». Il s'agit d'énoncés perçus et codés globalement qui, bien que
composés de plusieurs mots, ne peuvent être assimilés à une phrase
(« y a pas là », « on le met », « donne-le »), etc. Ces formules sont
particulièrement nombreuses dans le style d'acquisition qui favorise un
découpage prosodique. Chez d'autres enfants, qui favorisent un
découpage syllabique, on les rencontre moins.
« Vivre, c'est être différent » disait Blaise Cendrars29. Les
expressions de la diversité enfantine dans l'acquisition du langage
jaillissent des tempéraments. On verra les choix de petits enfants
français pour entrer dans le langage. Mais la diversité se nourrit aussi
de la variété des langues, des milieux et des cultures. Nous verrons les
différences qui éclosent sous des cieux différents.

1 Pinker S., The Language Instinct, New York, William Morrow and Company, 1994,
p. 265.
2 Pinker S., op. cit.
3 Spelke E.S., « Perceptual knowledge of objects in infancy », dans J. Mehler, E. Walker &
M. Garrett (Eds.), Perspectives on Mental Representation, Hillsdale, New Jersey, Lawrence
Erlbaum Associates, 1982.
4 Spelke, E.S., « Physical knowledge in infancy : reflections on Piaget's theory », dans
S. Carey et R. Gelman (Eds.), The Epigenesis of Mind, Hillsdale, New Jersey, Lawrence Erlbaum
Associates, 1991, p. 133-169.
5 Baillargeon R., « Object permanence in 3.5 and 4.5 month-old infants », Developmental
Psychology, 23, 1991, p. 655-664.
6 Quine, W.V.O., Word and Object, Cambridge, Mass., MIT Press, 1960.
7 Vihman M.M. & Miller R., « Words and babble at the threshold of lexical acquisition »,
dans M.D. Smith & J.L. Locke (Eds.), The Emergent Lexicon : The Child's Development of a
Linguistic Vocabulary, New York, Academic Press, 1988.
8 Bates E., Marchman V., Thal D., Fenson L., Dale P., Reznick J.S., Reilly J. & Hartung J.,
« Developmental and stylistic variation in the composition of early vocabulary », Journal of Child
Language, 21, 1994, p. 85-123.
9 Bates E., Dale P. S. & Thal D., « Individual differences and their implications for theories of
language development », dans P. Fletcher et B. MacWhinney (Eds.), The Handbook of Child
Language, Oxford, Basil Blackwell, 1995, p. 96-151.
10 Nelson K., « Structure and strategy in learning to talk », Monographs of the Society for
Research in Child Development 38(149), 1973.
11 Fenson L., Dale P.S., Reznick J.S., Bates E., Thal D.J. & Pethik S.J., « Variability in early
communicative development », Monographs of the Society for Research in Child Development,
1994, 59(5).
12 Bates E., Dale P.S. & Thal D., 1995, op. cit.
13 Ferguson C. A. & Farwell C. B., « Words and sounds in early language acquisition »,
Language, 1975, 51, p. 419-439.
14 Vihman M. M., Ferguson C. A. & Elbert M., « Phonological development from babbling
to speech : Common tendencies and individual differences », Applied Psycholinguistics, 7, 1986,
p. 3-40.
15 Stoel-Gammon C. & Cooper J., « Patterns of early lexical and phonological
development », Journal of Child Language, 1984, 11, p. 247-271.
16 Vihman M. M., Ferguson C. A. & Elbert M., op. cit.
17 Boysson-Bardies B. de & Vihman M. M., « Adaptation to language : Evidence from
babbling and first words in four languages », Language, 67(2), 1991, p. 297-319.
18 Aldebrandin de Sienne (médecin italien du XIII e siècle s'exprimant en anglais), Le Régime
du corps, édité par L. Landouzy et R. Pépin, Paris, 1911.
19 Barthélemy l'Anglais, Livre des Propriétés des hoses, rédigé au XIIIe siècle, dont les propos
sont repris par de nombreux auteurs au Moyen Âge ; tiré de L'Enfance au Moyen Âge, de Pierre
Riché et Danièle Alexandre-Bidou, Paris, Seuil et Bibliothèque de France, 1994.
20 Vihman M.M., « Consonant harmony : Its scope and function in child language », dans
J.H. Greenberg (ed.), Universals of Human Language, Stanford, Stanford University Press,
1978.
21 Macken M.A., « Developmental changes in the acquisition of phonology », dans B. de
Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage & J. Morton (Eds.), Developmental
neurocognition : Speech and face processing in the first year of life, Dordrecht, Kluwer Academic
Publishers, 1993.
22 Vihman M.M., Early syllables and the construction of phonology, dans C.A. Ferguson,
L. Menn & C. Stoel-Gammon (Eds.), Phonological Development : Models, Research,
Implications, Timonium, Maryland, York Press, 1992, p. 393-422.
23 Ferguson C.A. & Farwell C.B., 1975, op. cit.
24 Nelson K., Hamson J. & Kessler Shaw L., « Nouns in early lexicons : Evidence,
explanations and implications », Journal of Child Language, 20, 1993, p. 61-84.
25 Benedict H., « Early lexical development : comprehension and production », Journal of
Child Language, 6, 1979, p. 183-200.
26 Bates E., Bretherton I., Shore C. & McNew S., « Names, gestures and objects », dans
K.E. Nelson (Ed.), Children's language (Vol. 4), Hillsdale, New Jersey, Lawrence Erlbaum
Associates, 1983.
27 Boysson-Bardies B. de, Vihman M.M. & Durand C., « The first lexicon : A comparative
study of four languages » (soumis à publication).
28 Gleitman L.R., « The structural sources of verb meaning », Language Acquisition, 1,
1990, p. 3-55.
29 Cendrars B., Moravagine, Paris, Grasset, 1983.
CHAPITRE VI

À chaque bébé son style

« Des mammifères primitifs à l'homme, l'enveloppe génétique


s'ouvre à la variabilité individuelle. »
JEAN-PIERRE CHANGEUX

Tous semblables et tous différents

Les êtres humains possèdent tous, inscrites dans leur patrimoine


génétique, les déterminations qui fondent les caractéristiques de
l'espèce humaine. Les nouveau-nés sont tous destinés à voir se
développer en eux les marques distinctives de l'espèce : station
verticale, faculté d'abstraction et de généralisation, langage articulé. Ils
sont tous génétiquement programmés pour apprendre à parler. On a
voulu, pour des raisons théoriques fondamentales, séparer l'étude de
l'inscription dans le système biologique des capacités pour le langage
de l'étude de leur mise en œuvre au cours du développement. Ces
dernières années, il était dans le vent de tenir pour négligeables, sinon
inintéressants, tous les effets que pouvaient engendrer les différences
de langues ou de personnalités sur les modes d'acquisition. Cependant,
l'étude du système « inné » pour le langage et celle du jeu et des limites
de variation de ce système en fonction de l'expérience sont
complémentaires et ne devraient pas être séparées. Le « jeu des
possibles » chez l'être humain est souvent bien plus puissant que ne le
pensent les chercheurs. Laissons les esprits chagrins igno-rer – ou
nier – l'utilité heuristique et le charme des différences. Laissons-les
oublier la réflexion pas si provocante d'Ilia Prigogine1 : « Les
constantes universelles expriment toujours une limitation de notre
manière de faire les expériences et de voir la nature ! »
Darwin2, en constatant que le langage n'est pas un véritable instinct,
mais n'est pas non plus l'apprentissage d'un art ordinaire, permet de
poser celui-ci comme une tendance instinctive à acquérir un art très
particulier. Le terme « art » corrige ainsi ce que le terme « instinct »
peut avoir d'étriqué lorsqu'il s'agit du langage humain.
Muni d'un dispositif puissant et adaptable, le bébé va pouvoir
acquérir un langage articulé quelles que soient les caractéristiques de
son environnement linguistique. Mais des variations « artistiques »
vont voir le jour. Les langues sont diverses, très diverses. Si des super-
règles rendent sans doute compte des traits fondamentaux communs
qui les sous-tendent, leurs réalisations n'en restent pas moins très
différentes. L'enfant apprend la langue parlée dans son environnement.
Il le fera dans les formes et les limites que lui offre la détermination
génétique de l'espèce humaine ; mais cette approche portera aussi la
marque de ses propres déterminations et de son expérience des indices
spécifiques que lui fournissent sa langue et sa culture pour actualiser sa
tendance instinctive à acquérir l'art de parler.
Les diversités qui se marquent dans la façon dont l'enfant commence
à parler sont donc du plus grand intérêt, qu'elles soient issues des
tempéraments particuliers des enfants, de leur expérience avec la
langue parlée dans leur environnement, ou des modèles culturels.
Tous pareils en humanité, les bébés sont tous différents : il y a des
blonds, des bruns, des noirs, des enfants aux yeux bleus et des enfants
aux yeux bridés, des têtes frisées, des têtes hirsutes et des têtes lisses,
des grands, des drôles, des romantiques, des dodus, des tout doux et
des fortes têtes, des affectueux et des obsessionnels. Tous aptes à
parler, ils parviendront tous au langage de façon différente.
L'imagination, la créativité et l'astuce avec lesquelles ils vont utiliser
ces « outils communs » sont passionnantes. Il existe des styles
d'approche particulièrement visibles chez les tout-petits. La structure de
la langue maternelle, l'emprise de la culture, les formes de
communication avec la mère, et tout particulièrement le tempérament
de l'enfant nous introduisent dans le domaine du choix. Tout se passe
comme si le bébé, à l'écoute du langage, se trouvait au cours de la
première année devant des bifurcations avec des choix entre plusieurs
hypothèses. Qu'extraire des paroles entendues ? Sur quoi fixer mon
attention ? Quelles sont les marques les plus importantes dans les
discours adultes ? Que puis-je reproduire ? Que dois-je reproduire ?
Telles pourraient être les questions que se pose le bébé, confronté à la
fois à ses limitations propres et à l'énorme corps de données
linguistiques qu'il reçoit.
Les choix que peut faire l'enfant sont heureusement limités. Ils
doivent progressivement l'amener à maîtriser avant six ans la
prononciation et la grammaire de base de sa langue. Mais, à la fin de la
première année et dans la deuxième année, les choix sont encore assez
ouverts pour influer tout particulièrement sur le style et les
performances de l'enfant.
L'âge où sont dits les premiers mots, le nombre de mots produits à
deux ans, la diversité des premiers vocabulaires varient de façon très
substantielle selon les enfants, nous l'avons vu. Mais une différence
plus essentielle encore se voit dans les stratégies de productions.
Celles-ci suggèrent que les nourrissons, au cours de la première année,
n'ont pas relevé les mêmes aspects du langage.
L'attention de certains bébés s'est consacrée tout particulièrement
aux éléments phonétiques et à la structure des syllabes. Ces bébés
tendent à découper la chaîne parlée en mots, et sélectionnent les
structures syllabiques qu'ils savent produire. C'est sur la base de ces
unités qu'ils constitueront leur vocabulaire. Leurs productions
consistent en mots isolés souvent monosyllabiques. Leur vocabulaire
est composé presque exclusivement de noms de personnes, d'animaux
ou d'objets. Le style de ces enfants est dit « référentiel » ou
« analytique » par des auteurs anglo-saxons tels que K. Nelson3,
L. Bloom4, A. Peters5 et E. Bates6 qui, parmi d'autres, se sont penchés
sur les différences individuelles dans l'acquisition du langage. À
l'opposé, on trouve les enfants dont le style est dit « holistique » ou
« expressif ». Ils ont concentré leur attention sur les contours
d'intonation et sur le rythme syllabique des mots ou des phrases, plus
que sur leur structure phonétique. Ils produisent de longues séquences
qui ressemblent à des phrases avec des schémas d'intonation cohérents
et des syllabes de remplissage. Ils ont moins de noms dans leur premier
vocabulaire, de plus nombreux prédicats (verbes, adjectifs) et des
expressions toutes faites (ou formules). D'autres enfants utilisent des
stratégies mixtes. Enfin, certains enfants n'entrent dans le langage
qu'après en avoir déjà relevé l'aspect systématique et avoir organisé
leurs entrées lexicales sur le mode phonologique. Les différences entre
les enfants référentiels et les enfants expressifs sont particulièrement
nettes au tout début du langage. Elles s'atténuent progressivement, et
l'écart entre le nombre de noms et de prédicats a quasiment disparu
quand les enfants atteignent un vocabulaire de six cents mots7. Une
approche comparative, prenant en compte la structure des langues,
modifie un peu les définitions de « styles » proposées par les auteurs
anglais. En effet leur « rentabilité » n'est pas la même selon la langue
maternelle à apprendre. Mais la présence des deux tendances indiquées
se retrouve partout.
Nous allons illustrer ces différents styles avec quelques exemples8. Il
en existe de multiples variantes, des modes d'accès plus extrêmes ou
plus marginaux, mais ceux que nous allons pré-senter répondent à des
stratégies assez usuelles chez les enfants entre l'âge d'un et deux ans.

Émilie, Sean et Timmy ou la stratégie a minima

Émilie est une petite fille vive, toujours en mouvement, aimant


danser, bouger, mais aussi regarder des livres d'images. Sensible à son
comportement déjà un peu espiègle, sa mère l'appelle « mon petit
clown ». Cette dernière s'occupe entièrement de sa fille et s'attache
beaucoup à ses progrès langagiers. Elle lui enseigne le nom des objets
en essayant de les lui faire nommer « en situation » ; cependant elle ne
corrige pas la prononciation de l'enfant. Émilie se prête bien à ces jeux,
et à ceux que nous lui proposons pour recueillir son vocabulaire. Nous
l'avons suivie depuis l'âge de dix mois jusqu'à quatorze mois et quinze
jours. Elle disait alors vingt-cinq mots au cours de la demi-heure que
nous passions à l'enregistrer. Parmi les enfants français que nous avons
étudiés, c'est elle qui a acquis le plus tôt un vocabulaire de vingt-cinq
mots. Elle a adopté, pour entrer dans le monde des mots, un style
simple et payant.
Dans son babillage, Émilie a évité les longues productions intonées.
Les monosyllabes représentent 61 % de ses productions de babillage
relevées entre dix et treize mois, contre une moyenne de 40 % pour les
autres enfants français. Elle a privilégié fortement les occlusives.
Celles-ci représentent 60 % des consonnes dans ses productions
babillées alors qu'elles ne représentent que 49 % des consonnes dans le
babillage des autres enfants français.
Ces tendances se retrouvent dans les premiers mots. Émilie s'est
consacrée à l'information articulatoire dans les mots, privilégiant les
syllabes et les consonnes qu'elle produisait déjà dans le babillage. Elle
a ainsi systématiquement sélectionné des mots adultes qui contenaient
l'un des deux schémas articulatoires les plus fréquents dans son
babillage. Sa technique est simple et systématique :
1) Choisir des mots incluant une syllabe introduite par une occlusive
soit vélaire : /k/, soit labiale : /b/ ou /p/.
2) Réduire les mots bisyllabiques en monosyllabes, en ne gardant
que la syllabe qui commence par l'occlusive. La place de la syllabe
dans le mot sélectionné est indifférente et seule cette syllabe est
reproduite, qu'elle soit en début ou en fin de mot.
3) Conserver les voyelles pertinentes, ce qui permet d'éviter les
homophones.
Un peu plus tard elle a ajouté la règle :
4) Au besoin, redoubler la syllabe quand cette syllabe est redoublée
dans le mot ou que le mot est dissyllabique.
Jusqu'à l'acquisition d'un vocabulaire d'une vingtaine de mots, le
répertoire d'Émilie se compose donc en majorité de mots
monosyllabiques composés d'une consonne (C) (soit /k/, soit /b/ ou /p/)
et, en général, de la voyelle qui suit cette consonne dans le mot de la
langue.
Il inclut les formes :
Mickey [kχ]
canard [ka]
clef [ke]
cuillère [kkɪ]
sac [ka] ou [qa]
balle [ba]
bouton [bø]
bébé [bebe]
chapeau [po]
pomme [pɔ]
pépé [pɛ]
papa [papa]
petit pot [popo]

Un peu plus tard, au stade de vingt-cinq-trente mots, elle va


augmenter ses productions bisyllabiques, soit en introduisant quelques
mots par une voyelle d'appoint /a/ :

à boire [Abɥa]
poire [abɥa]
brosse [abɔ]
tortue [æɧy]

soit, plus généralement, en redoublant la syllabe :

babar [baba]
pompon [pupu]
cuillère [kokoa]
canard [kaka]
lapin [papa]
voiture [ɧity]
Gogo, nom d'un animal en peluche [ɡoɡo]

À vingt-cinq-trente mots, 40 % des occurrences de mots sont


bisyllabiques et 8 % ont plus de deux syllabes. D'autre part, des
occlusives dentales /t/ ou /d/ commencent à apparaître mais l'on ne
trouve toujours pas de fricatives ni de latérales.
Le vocabulaire d'Émilie reste très concret, exclusivement formé de
noms. Les trente mots qu'elle dit renvoient tous à des noms d'objets,
d'animaux ou de personnes.
Avec Émilie on voit des routines, préparées dans les productions de
babillage, servir pour les premiers mots. Elle accentue même, dans les
mots, les tendances phonétiques du babillage. Les occlusives
représentent maintenant 88 % de ses consonnes contre une moyenne de
55 % pour les autres enfants français. Quand, vers quatorze mois, des
dissyllabes vont s'adjoindre aux monosyllabes, ce seront en majorité
des mots composés de syllabes répétées. Ce type de mots va
représenter 64 % des dissyllabes d'Émilie contre une moyenne de
35,6 % chez les autres enfants français. À côté de fréquents
redoublements, on trouve de nombreuses omissions de syllabes :
14,7 % contre une moyenne de 6,6 % pour les autres enfants français.
La technique de production d'Émilie révèle d'autres caractéristiques,
montrant combien elle cherche à faire simple et efficace, à nommer au
moindre prix articulatoire. Cette stratégie rentable lui permet de
développer très rapidement un vocabulaire qui, malgré la pauvreté du
répertoire consonantique, contient relativement peu d'homophones
complets. En effet les mots se distinguent par leurs voyelles. Ces mots
sont d'ailleurs bien repérés par les adultes car Émilie en maîtrise bien la
production et ne les prononce que dans des contextes qui permettent de
lever les ambiguïtés.
Au cours de la recherche interlangue que nous avons menée sur
l'acquisition de la phonologie chez les jeunes enfants, Marilyn Vihman9
a analysé les premières productions d'enfants anglophones aux États-
Unis. Pour beaucoup d'entre eux on retrouve une stratégie « a minima »
du type de celle d'Émilie. Chez certains sujets, cette stratégie est
parfois poussée à son paroxysme !
Sean produit 77 % de ses mots sous forme de monosyllabes CV
(consonne occlusive ± voyelle). Il est vrai qu'il a sélectionné ses
cibles : 71 % d'entre elles sont des monosyllabes. Quand il se risque à
des cibles bisyllabiques, il les réduit à des monosyllabes dans 65 % des
cas. Il évite même le système simple de réduplication de syllabes. On
ne trouve que 12 % de ce type de productions pour des mots,
pourcentage le plus bas trouvé dans les productions des vingt enfants
des différents groupes linguistiques que nous avons étudiés.
Le répertoire de quinze mots de Sean comprend les formes
suivantes :

ball [bᴧ]
bear [be]
book [bu]
bowl [bo]
baby [pe:p]
bike [pæ] ou [bæ]
cat [tæ]
duck [da]
dog [dɔ]

Comme on le voit, les premières productions sont des homophones


ou des quasi-homophones monosyllabiques. Les schémas phonétiques
de Sean sont comparables à ceux d'Émilie. Les mots sont construits
autour de deux schémas. Le premier consiste en une syllabe simple
consonne-voyelle avec une occlusive labiale /b/ ou /p/ et une voyelle ;
le second consiste en une syllabe consonne-voyelle introduite par une
occlusive dentale /t/ ou /d/. L'inventaire vocalique de Sean est, comme
celui d'Émilie, assez varié : /a/, /ae/, ou /o/, /e/, /i/.
Le développement du répertoire de Sean ne se fait pas avec
l'introduction de bisyllabes, mais avec des essais de mots se terminant
par une consonne. Sean ajoute une consonne, qui est toujours la
consonne vélaire /k/, en position finale :
block [ba:k]
clown [kəæ:k]
bug [bᴧ:k]

Le répertoire de Sean, même à vingt-cinq mots, reste composé


majoritairement de formes très simples, ne demandant qu'un geste
articulatoire minimum et qui restent proches des consonnes-voyelles
initiales. Comme chez Émilie, les premiers mots de Sean sont
principalement des noms très concrets renvoyant à des objets, des
animaux ou des personnes. Sean est un bon exemple du style
référentiel ou analytique.
Pour trouver la loi du moindre effort poussée à l'extrême, voyons
Timmy. Les productions de Timmy, autre enfant américain du groupe
analysé par Marylin Vihman, sont caractérisées par un « schéma idéal »
rigide qui sert pour tous les mots adultes sans discrimination. Deux
types de syllabes consonne-voyelle forment la base de son vocabulaire.
La voyelle est toujours la voyelle /a/. Les deux consonnes sont
l'occlusive labiale /b/ et l'occlusive vélaire /g/. Les mots de Timmy
commençant par /b/ correspondent à des mots adultes commençant par
/b/, mais les mots introduits par /g/ sont des mots qui contiennent une
vélaire, que celle-ci soit en initiale ou à la fin du mot.
La rigidité de son schéma vocalique oppose Timmy aux deux
premiers enfants. Émilie et Sean varient les voyelles alors que Timmy
s'en tient à une voyelle unique /a/. À seize mois, il produit quinze mots,
tous dits soit /ba/ soit /ga/ ; ce sont donc de parfaits homophones.
Timmy utilise /ba/ (ou /pa/) pour bell, ball, block, box, bird, boy,
good-bye ; /ga/ (ou /ka/) pour car, kitty, quack, cup, cow, girl.
Ce n'est qu'à dix-sept mois que l'on trouve quelques timides
variations de voyelles, ainsi que des dissyllabes, généralement issus de
redoublements du schéma consonantique primitif. Le schéma vocalique
des dissyllabes est à son tour rigide : la première voyelle est /a/ et la
seconde /i/.

please [pai:]
cookie [kaki]
bottle [babi]
coffee [ɡaɡi]
daddy [daddi]
goob-bye [ɡ bi]

Les mots adultes dont la structure phonétique est très loin du


« schéma idéal » sont réorganisés complètement en fonction de ce
schéma :

light [iɡa]
lizard [ȷaɪȷa]

Pour Timmy, la stratégie « a minima » n'est pas payante, à dix-sept


mois son répertoire reste très pauvre.
Quelle est l'influence des langues et des pratiques maternelles sur le
style des enfants ? Grâce aux approches comparatives, on peut
rattacher la fréquence des types de stratégie dans une langue à
l'organisation prosodique et au système phonologique de cette langue.
Puisque les indices de segmentation dans la langue de l'environnement
ont une influence sur la forme des représentations, il est normal d'en
rechercher les effets sur les productions des enfants. La fréquence des
mots monosyllabiques et l'alternance des syllabes fortes et faibles
favorisent la production de monosyllabes chez les enfants anglophones.
Le très rapide développement du vocabulaire chez beaucoup d'enfants
américains est aussi lié au choix de cibles monosyllabiques ainsi qu'à
l'attention particulière des mères et à l'énergie qu'elles consacrent à
l'apprentissage des noms par leurs enfants. En revanche, elles sont très
indulgentes et acceptent comme mots un schéma qui donne de
nombreux homophones. Il serait intéressant de voir la part de cette
indulgence dans la persistance de prononciations très « incorrectes »,
comme chez Timmy. La plupart des mères françaises que nous avons
rencontrées se montrent plus exigeantes sur la prononciation et
n'estimeraient pas comme « mots » des formes aussi rigides et d'une
utilisation si générale. Cela explique peut-être pourquoi Émilie, qui
cependant ne produisait que des quasi-homophones, renonce plus
rapidement que ses pairs américains à décliner son seul « schéma
idéal ».

Simon, Léo et Marie ou les charmes


de la conversation

À dix-huit mois, Simon n'est crédité par les adultes que de quelques
mots. Et pourtant il parle, il parle ! Et sa conversation est aussi
charmante qu'intéressante. Il fait la joie de tous par sa façon de se
mêler aux discussions des convives au cours des repas. Il intervient
avec de longues « phrases » pour acquiescer à quelque idée générale ou
« poser des questions » aux uns ou aux autres. L'intonation, le rythme
syllabique et la phonétique de ses « phrases » sont si françaises qu'un
étranger pourrait s'étonner de la maturité linguistique de ce bout de
chou. Au téléphone, il peut de la même façon tenir des conversations
sur un mode mondain tout à fait pertinent. Simon est un petit garçon
très drôle, très mignon, très sociable et qui n'a pas froid aux yeux. En
fait, il est assez diabolique !
Nous l'avons suivi avec plaisir, car il nous a fait beaucoup rire
pendant dix mois. Au cours de dix séances d'enregistrement, entre dix-
huit et vingt mois, nous avons recueilli 2 554 vocalisations ! Simon,
très à l'aise, parle presque sans cesse durant les séances
d'enregistrement. Il commente tout ce qu'il fait, il monologue en
rangeant et en classant les jeux qui lui sont régulièrement présentés, ce
qui donne beaucoup de soliloques. Mais il converse aussi avec
l'expérimentateur, répond aux questions, fait des demandes. La plupart
du temps, il est impossible de trouver une correspondance entre les
productions de l'enfant et des mots ou des phrases de la langue adulte.
Il est difficile de qualifier ces productions. S'agit-il de jargon ?
Certaines des séquences syllabiques, très stables au point de vue
phonétique, sont reliées avec des situations bien définies du monde
extérieur, mais la plupart du temps, les séquences sont trop irrégulières
pour que l'on puisse repérer des correspondances avec des événements
extérieurs. Simon produit spontanément quelques mots (peu), mais il
en imite volontiers d'autres quand on le lui demande. En tout cas, il
comprend parfaitement ce qu'on lui dit, ce qui ne nous étonne guère.
Ses « phrases » consistent le plus fréquemment en des séquences de
trois, quatre, cinq syllabes ; on trouve parfois des séquences plus
longues (7 % de l'ensemble). Les bisyllabes sont prépondérantes et
représentent le tiers des productions de Simon.
Simon semble avoir porté toute son attention sur la forme
prosodique des discours adultes mais il a aussi un large répertoire
syllabique. La particularité de son entrée dans la parole repose
cependant sur l'intonation et le rythme. Il choisit un contour
d'intonation correspondant à un contour de groupe de mots ou de
phrases et le remplit par des syllabes variées et bien articulées. Ses
choix de contour d'intonation sont très divers et bien appropriés au
français. Dans les monologues comme dans les dialogues avec des
adultes, il varie de façon pertinente les contours légèrement montants,
très montants (interrogatifs ?) et les contours descendants. Les contours
montants sont majoritaires, comme y invite l'intonation du français et
comme c'est le cas chez la plupart des enfants français. Mais dans les
dialogues, quand les questions de l'adulte induisent une réponse de type
déclaratif, les réponses de Simon se caractérisent par un contour plat ou
descendant. Ainsi, en réponse à la question : « Qu'est-ce que tu fais ? »,
on trouve 80 % de contours plats ou descendants alors que ceux-ci ne
représentent que 45 % de l'ensemble de ses productions. Au cours de
soliloques, on trouve en revanche une majorité de contours montants,
mais il arrive aussi que Simon oppose deux intonations successives,
donnant l'impression qu'il s'interroge lui-même.

FIGURE1 - Exemple de schéma d'intonation avec des contours en


opposition produit au cours d'un monologue par Simon à dix-neuf
mois.
Lorsque Simon montre du doigt ou ajoute un /ça/ (un de ses seuls
mots compréhensibles) en fin de « phrases », celles-ci sont presque
toujours (92 % des cas) caractérisées par une variation importante de la
voix : soit une montée importante de l'intona-tion qui marquerait une
interrogation, soit une descente importante que l'on peut interpréter
comme un commentaire.
FIGURE 2 - Exemples de contours d'intonation de productions de type «
commentaires » a) se terminant par le démonstratif « ça » b) incluant le
démonstratif « ça ». (Simon, dix-neuf mois.)

En fait, Simon doit connaître et employer plus de mots que les


adultes ne le lui en reconnaissent, mais sa stratégie de « remplissage »
de contours d'intonation fonctionnels par des syllabes masque les mots
qu'il pourrait utiliser. De temps à autre, l'adulte devine un mot, ou
même une phrase de plusieurs mots, mais au cours des deux premiers
mois d'enregistrement (entre dix-huit et vingt mois), la plupart des
discours de Simon sont incompréhensibles, sinon ininterprétables.
Les syllabes qu'il utilise pour remplir les contours d'intonation sont
des syllabes bien formées selon les règles du français. La distribution
de ses consonnes et de ses voyelles reflète d'ailleurs la distribution
phonétique du français. Simon « jargonne » en français.
Ses propos sont-ils d'ailleurs vraiment incompréhensibles ? Pour
nous sans doute, mais pas pour lui ! Nous lui avons fait écouter, huit
mois plus tard, les « propos » qu'il avait tenus à vingt mois.
Merveilleuse réaction ! Ravi, il écoutait en hochant la tête pour
approuver ou nier, il commentait, riait ou se fâchait, bref le Simon de
deux ans et demi « reconnaissait » les discours mélodieux du Simon de
vingt mois et y réagissait avec plaisir et même enthousiasme.
Nous avons suivi Simon pendant dix mois. Il a gardé cette stratégie
« intonative », tout en s'orientant vers des réalisations plus conformes
aux modèles adultes. En augmentant sa production de mots isolés, il n'a
toutefois pas renoncé à produire des phrases qui sont devenues, au fil
des jours, de plus en plus compréhensibles. Il est entré dans le langage
avec des phrases.
Sa stratégie n'est pas « rentable », si l'on prend le nombre de mots
compris par l'adulte comme indice du développement linguistique.
Mais elle est certes éminemment rentable du point de vue social. Elle
n'a en tout cas pas empêché Simon d'avoir à trois ans un langage bien
articulé, bien adapté et très riche.
Simon a poussé à l'extrême l'option du style « expressif » ; il a
privilégié les composants prosodiques et rythmiques en y subordonnant
le composant phonétique. Dans ce style, il a montré une maestria sans
égale.
Ce type de style, toutefois moins poussé à l'extrême, semble assez
fréquent chez les enfants français. En effet, l'organisation prosodique
du français ne facilite pas le découpage en mots mais bien plutôt en
groupements plus larges (en groupes clitiques), ou en propositions. Les
contours d'intonation du français se marquent, nous l'avons vu, par
l'allongement des syllabes terminales et, fréquemment, par un contour
montant indiquant la poursuite du discours. Ces indices sont plus nets
aux frontières de groupes de mots ou de phrases. Les contrastes
d'accentuation qui structurent la segmentation en mots dans les langues
à accents n'existent pas en français. D'autre part les mots français,
contrairement aux mots anglais, sont le plus souvent bisyllabiques.
L'enfant français est donc incité par la prosodie et les autres propriétés
de sa langue à découper les discours adultes en unités plus larges que le
mot. Nous l'avons observé chez Simon mais aussi chez deux autres
enfants que nous avons suivis. Marie et Léo, comme Simon, ont un
style expressif dans lequel le composant prosodique joue un grand rôle,
sans évacuer cependant une phonétique bien adaptée au français.
Marie est la cinquième enfant de la famille ; ses frères et sœurs
s'échelonnent de quatre à dix-sept ans. Ainsi entourée, elle alterne entre
des jeux solitaires dans lesquels elle s'absorbe profondément et des
jeux d'échanges auxquels elle participe avec plaisir. Comme Simon,
Marie a l'habitude de monologuer. À onze mois, comme Simon, elle
imite volontiers, et cela donne lieu à des jeux au cours desquels Marie
répète les sons ou les syllabes prononcés par sa mère. Cela l'amuse
beaucoup et la fait rire. Ces jeux peuvent se prolonger, ce qui fait dire à
sa mère : « C'est comme si on avait avec elle une vraie conversation. »
En effet, à un an, on a l'impression que Marie répond aux questions.
La mère : « Tu veux aller faire dodo ? Qu'est-ce que tu veux faire ? »
Marie : « baegm : gmba:yae weo jajaja: m:: bam », avec une
intonation résolue et descendante.
Cependant les productions de type « phrases » correspondent plus
fréquemment à des soliloques. Marie produit beaucoup de polysyllabes
(75 % de ses productions de mots sont des dissyllabes ou polysyllabes).
À treize mois, Marie dit cinq mots dans une séance :
ça [ta]
bravo [babө:]
poupée [bøβə]
nono [nɛno]
maman [mam :]

Déjà une majorité de bisyllabes, mais pas de schéma phonétique


spécial. C'est seulement à dix-sept mois que nous « enten-dons »
quinze mots dans une séance. Comme chez Simon, les mots sont
« noyés » dans des phrases de quatre à sept syllabes (34 % de ses
productions) qui gênent leur reconnaissance. Voyons le répertoire de
Marie à quinze-vingt mots.

attends [ættæ]
bateau [hatø]
bébé [bebe]
dodo [dodo]
c'est beau [təbɔ]
c'est beau ça [ebotsa]
Jacquot [ȷæko]
poupée [popi]
tintin [tat ]
tartine [ta:tinn]
Ludovic [ado]
papa [papa]
non [n ]
nom de l'ours en peluche [nonɔ]
maman [mem ]
Mimichat [hemȷetsA]
papillon [papɨdʐA]
voiture [voaɧy]
Bien que les formes CVCV prédominent, ce répertoire reflète une
indubitable variété phonétique et sémantique. Les mots cibles sont
mono, bi ou trisyllabiques. Marie a « découpé » des expressions ou des
groupes de mots comme « c'est beau », « c'est ça », ou « Mimi chat ».
La variété des formes est surprenante. Seuls cinq types de mots ont un
schéma de syllabes redoublées ; dans les autres, voyelle et/ou
consonnes varient. Si l'on compte toutes les occurrences des mots (au
lieu de compter chaque mot du répertoire une seule fois), on retrouve
un important pourcentage de dissyllabes (48 %) et de productions
contenant trois syllabes ou plus (30 %). Marie utilise les principales
voyelles du français : a, é, e, ou, o, i, u. Elle privilégie les occlusives à
l'exception des vélaires mais produit aussi des mots commençant par
des nasales : /m/ et /n/ et des fricatives : /v/. Seules manquent encore
les latérales mais quinze jours après, à dix-sept mois et demi, Marie dit
vingt-cinq mots dans la séance, et l'on trouve plusieurs mots ou
expressions contenant /l/ :

houlà [ʊlla]
là [halla]
c'est là [əlla]
l'eau [ɛ:llo]
(elle la) met [haləme:]

Marie n'a manifestement pas choisi une stratégie a minima ! La


différence est grande avec un Timmy crédité de quinze mots avec deux
formes phonétiques et des cibles sélectionnées pour ces formes. En fait,
comme Simon, il est probable que Marie produit depuis un certain
temps plus de mots que nous ne nous autorisions à en identifier. La
prononciation de Marie étant plus nette, nous remarquons maintenant
des mots enchâssés comme « poupée » dans /panichipapénedla/, mot
immédiatement confirmé par Marie qui tend sa poupée en redisant
/pepé/. Il en est de même pour l'expression « c'est beau ça » dans la
suite /a:énébocha/, ou le mot chapeau dans /denedaapo/.
À partir de dix-sept mois, Marie, tout en continuant à produire
beaucoup de « phrases » de cinq à six syllabes ininterprétables par les
adultes, dit assez de mots isolés pour que l'on puisse voir que son
vocabulaire augmente rapidement. Elle prononce des « vraies » phrases
de deux ou trois mots : /e poupé la amoua/.

Le répertoire des significations est aussi bien plus varié que chez
Émilie, Sean ou Timmy. Marie, en plus de noms d'objets, utilise des
verbes, des adjectifs, des pronoms, des expressions comme « c'est
beau », « houlala », qui indiquent des émotions, et fait des
commentaires : « elle la met ». Elle utilise le pronom « moi ».
Le style expressif de Marie l'a amenée à rentrer dans le langage avec
des petites phrases-expressions aux intonations très pertinentes. Ce
choix a sans doute retardé l'apparition ou la reconnaissance des
premiers mots, mais ils étaient là, préparés avant d'être entendus, et ont
conduit Marie vers un vocabulaire varié, un riche espace de
représentations linguistiques et une palette phonétique chatoyante.
Cette stratégie d'entrée dans le langage, Léo l'a aussi adoptée, avec
quelques variantes personnelles.

Léo.

Léo est un très joli petit garçon. C'est un premier-né. Il est sociable,
sérieux et sensible, il aime la musique et chantonne volontiers. Sa mère
lui parle de façon très adulte avec des phrases relativement longues.
Quand elle regarde un livre avec lui, elle ne nomme pas seulement les
images mais les commente longuement. Léo est gardé à la maison par
une nounou qui parle français.
Il n'a que dix mois et dix-huit jours quand on relève sept mots dans
ses productions. C'est très précoce. Ses mots se réfèrent à des
demandes, ou sont des termes d'interaction sociale.

allô [ɔ:ȷlo]
donne [do]
tiens [ta]
eau [ʎɔʎɔ]
encore [hӕlo]
papa [papa]
maman [mam ]

Deux particularités vont caractériser le choix des mots de Léo. Il


privilégie les mots dissyllabiques et en particulier ceux contenant un /l/.
Ses productions sont longues. Dès cet âge, ainsi que dans les mois qui
vont suivre, 73 % des productions du babillage de Léo comportent plus
de deux syllabes et certaines séquences incluent jusqu'à huit ou neuf
syllabes.
À quatorze mois, Léo est crédité de quinze mots. Les mots se
présentent soit isolés, soit inclus dans des « suites ». Ainsi « allô », déjà
trouvé au cours des séances précédentes, est dit /ele/ et inclus dans la
séquence « elodija » que Léo dit en prenant le téléphone.
Ce n'est qu'à dix-sept mois que l'on « entend » vingt-cinq mots en
séance. Mais ces mots sont variés et la plupart du temps enchâssés dans
des expressions.

donne et donne-le [d ]
là [la]
allô [Ɂɜlɜ]
bébé-poupée [baba]
coucou [kukku:]
maman [mam ]
papa [papa]
nom d'un pingouin [kokɔ]
bouton [tʉtʉ]
manger [məmɒ:]
ballon [ba:la]
Didier [ɧyty]
pas là, parti [pəla ǂpɜdli]
petits trous thɨthɔ]
non non non [n n n n ]

Les mots et les expressions – nombreuses dans le vocabulaire de


vingt-cinq mots – illustrent le schéma privilégié dans le babillage et
dans les premiers mots. Celui-ci consiste à mettre la consonne /l/ en
position médiane dans des mots CVCV ou VCV.

allô [alo]
de l'eau [dəlo]
voilà [wallah]
cuillère [kola]
brosse [pᴧla]
canard [kwala]
pingouin [kol ]
chapeau [bølo]
là la dame là [lələdala]
canard dans l'eau [baladdalo]

Léo ajoute souvent là à la fin d'un mot. Pourquoi ce choix d'un


phonème difficile pour la plupart des enfants ? On peut avancer
plusieurs idées telles que l'influence de son nom commençant par /l/,
mais ce n'est là que pure spéculation. Seul Léo aurait pu nous répondre.
Comme chez Marie, la sémantique des premiers mots de Léo est
multiple et ne se limite pas à des mots concrets. On trouve des
expressions, des verbes, des adjectifs. Léo commence à produire
quelques phrases où subsistent cependant des syllabes non identifiées.
Ainsi la phrase : /tato ya pae reXka pélla/ répond à la question « est-ce
que tu veux un gâteau ? » alors que les gâteaux ne sont pas dans la
pièce.
Conversation d'abord ! La « stratégie » qui nous semble liée « aux
charmes de la conversation » accorde un poids particulier à l'intonation
et au rythme des énoncés. Elle privilégie l'expressivité et le choix de
mots sémantiquement plus variés que ceux habituels dans le
vocabulaire des enfants de cet âge. Les expressions et petites phrases
apparaissent avant même que l'enfant n'ait un vocabulaire de plus de
cinquante mots.
L'acquisition se fait parfois aux dépens de la fidélité segmentale,
comme chez Simon. Mais les séquences parodiant des phrases de la
langue sont dites de façon aisée. Les contours d'intonation et le
remplissage phonétique sont pertinents et pourraient rendre compte de
phrases « possibles » dans la langue maternelle. Les syllabes de
remplissage sont-elles vraiment mises au hasard ? Des productions qui
semblaient inintelligibles ont parfois révélé des surprises lors
d'analyses plus attentives les mettant en relation avec le contexte. Il
apparaissait qu'en fait les enfants produisent des formes stables, des
mots ou des expressions interprétables, mais dont le rôle paraît si
secondaire par rapport à l'expressivité globale qu'ils ne sont pas
reconnus comme tels. Ce type de productions peut aussi cacher la
production précoce de vraies phrases telles que, chez Léo, « gâteau pa
pala ». Le style expressif retarde peut-être le développement du
lexique, celui des noms en particulier, mais il favorise l'insertion
sociale et entraîne le développement d'un lexique plus varié que la
stratégie a minima.
Le style de Minh, petit garçon anglophone étudié par Ann Peters10
présente les mêmes caractéristiques que celui de Marie et Léo. La
structure des langues oriente les choix des enfants, elle ne les
détermine pas et les préférences individuelles subsistent, non
réductibles aux contraintes externes.
Les stratégies plus globales, plus expressives, sont assez fréquentes
chez les enfants français. Les auteurs anglo-saxons jettent sur elles un
regard sévère. Ils considèrent que les expressions sont des formules
figées, que le style expressif implique moins de variété dans des
catégories lexicales et un développement moins rapide du vocabulaire.
Sans doute parce que la prosodie du français induit ces segmentations
globales, le style « expressif » ou « global » des enfants français paraît
souvent plus riche et bien plus productif que les images qu'en donne la
littérature anglo-saxonne. D'une part, il semble favoriser les futures
acquisitions grammaticales et la production de phrases, et l'on
s'aperçoit d'autre part, que les formules figées ne le sont pas vraiment !
Marc avait appris l'expression « y a quelqu'un ? » que son frère
utilisait lorsqu'il n'arrivait pas à ouvrir la porte de la salle de bains.
Marc, à sa suite, essayait d'ouvrir en disant « yakéqun ? » Expression
figée ? Cela y ressemblait fortement. Un jour, en passant près de Marc,
et en se dirigeant vers ladite porte, un adulte veut taquiner Marc et lui
dit « yaquéqun ? » « Non, répond Marc, ya pas quéqun ! » L'expression
n'était pas si figée que cela ! Une négation pouvait y être correctement
introduite !
Certains aspects communs se retrouvent chez les enfants qui ont
choisi ce style, ou dans leur entourage. Les mères parlent avec des
phrases élaborées, souvent longues, plus adultes. Ces enfants sont
fréquemment très attirés par la musique et montrent des dons précoces
pour celle-ci. Ainsi Marie, qui a maintenant huit ans, est une excellente
violoncelliste. Ann Peters avance, à la fin de son analyse des
productions de Minh, que : « son amour pour la musique et sa stratégie
globale de production du langage sont peut-être reliés au
développement de l'hémisphère droit, tandis que les stratégies
analytiques seraient, elles, plus liées au développement de l'hémisphère
gauche ». Ainsi formulée cette proposition semble encore hautement
spéculative, mais sous une forme plus nuancée, elle pourrait
correspondre à une certaine réalité.

Charles, Noël et les autres : la voie médiane

Même la voie médiane est large ! Les enfants qui l'empruntent


musardent, flânent ou marchent vite et droit. Beaucoup d'enfants
mélangent le style analytique et le style expressif avec cependant une
sagesse qui les rapproche beaucoup du premier. Leur stratégie n'est pas
aussi réductrice que celle de Sean ou Timmy, ni aussi systématique que
celle d'Émilie, mais on n'y trouve pas les flamboyances de Simon ou
Marie. L'unité de base est le mot, dont les enfants cherchent à
reproduire les syllabes. Certes on retrouve des omissions, des
redoublements syllabiques et des schémas préférentiels, mais aucune
de ces « techniques » ne peut à elle seule rendre compte de leurs
premières productions.
Charles, tout blond, est un enfant sage. C'est un premier-né et il va à
la crèche la journée. Il s'affaire beaucoup avec ses cubes et ses jouets
mais, sociable, il collabore gentiment à notre quête des premiers mots.
Ces premiers mots sont trouvés à douze mois.

au revoir [awa]
boum [ba]
non [n :]
donne [da]
manger [Ɂӕm]
beau [bø:]
maman [mɒm ]
papa [pəpA]

Mots en général monosyllabiques mais variés. Dans les dix premiers


mots, pas de mots pour les objets ou les choses mais les termes qui sont
nécessaires pour des besoins vitaux fondamentaux ! À quatorze-quinze
mois, Charles dispose d'un vocabulaire de quinze à vingt mots mono et
dissyllabiques, assez varié sur le plan phonétique. Les occlusives
labiales ou dentales habituelles voisinent avec des nasales, des
fricatives et des latérales.

bravo [bAbo]
poupée [bɛpA]
boire [bA]
gâteau [toto]
canard [kA:nɒ]
maman [mɒm ]
non non [nɛno]
au revoir [awA]
assis [a∫]
chaussures [t∫et∫u]
ours [ʒo]
ça [tah]
chaud [ø∫ø]
allô [alo]
caméra [mɜmãʀa]

Des noms, des adjectifs, des mots relationnels, mais pas


d'expressions ou de formules. Charles cherche à rendre les principaux
traits de chaque mot et n'hésite pas devant des fricatives dentales (s-s)
qui sont généralement très rares dans les premiers mots des enfants. Il
produit des /l/ et des /r/. Il conserve soigneusement le nombre de
syllabes dans les mots : pas de réductions, même lorsque le modèle est
trisyllabique. En revanche, la consonne initiale est parfois omise :

chapeau [apo]
lapin [apA]

Cependant, le plus souvent, il respecte le mieux possible la structure


syllabique et phonétique du mot cible.
Sagement, Charles continuera à accroître un vocabulaire bien
équilibré et simple. À quinze mois et demi, il dira plus de vingt-cinq
mots en séance, tous bien compréhensibles. Il suit son petit bonhomme
de chemin qui lui permet d'avoir un vocabulaire déjà important à seize
mois sans avoir sacrifié aux tentations du réductionnisme ou aux
grandes envolées incompréhensibles.
Noël est le troisième enfant. Avec deux sœurs très vives
intellectuellement, il faut se débrouiller ! Ses premiers cinq mots sont
trouvés à treize mois.

manger [mam]
papa [pӕpӕ]
poum [p m]
wouah wouah [əwɜ]
coucou [tətə]

Il produit quinze mots en séance à seize mois et demi, et vingt-cinq


mots à dix-sept mois et vingt-trois jours.

pas là [pɜla]
poupée [pəpe]
paletot [papapo]
lapin [pa] ou [pɐp ]
pomme [pam]
pain [p ]
l'eau [ʎo]
biberon [baʐɒbɜn ]
banane [baɖa]
gâteau [tato]
main et pas main [mɐ: ] et [pӕmã]

Sa production est importante car Noël répète plusieurs fois les mots.
Son vocabulaire comporte, comme celui de Charles, des monosyllabes
(38 %) et des dissyllabes (59 %) mais peu de polysyllabes (3 %). Noël
fait quelques réductions de syllabes ou de consonnes. Pas de
« système » apparent, pas d'expressions, peu de réduplication de
syllabes, un répertoire essentiellement à base d'occlusives. Il semble
que Noël recherche « l'efficacité » mais sans adopter pour cela une
stratégie « a minima ». Son vocabulaire comporte beaucoup de noms
d'objets (particulièrement pour la nourriture !) mais aussi des verbes,
des adjectifs et des termes sociaux.
On peut comparer les approches de Charles et Noël d'un côté, et
celle d'Émilie de l'autre. Elles partagent certaines caractéristiques mais
l'approche d'Émilie était nettement plus systématique. Simon, Marie et
Léo ont entre eux une approche très différente. Les styles de ces
enfants s'opposent sur la longueur des productions, leur intonation, le
pourcentage de mots avec des syllabes répétées, celui des réductions
syllabiques, la fréquence de production des expressions, le pourcentage
de noms d'objets et en général le choix des cibles.

Henri ou comment reculer pour mieux parler

Pour rassurer les parents d'enfants qui, quoique éveillés et


comprenant bien ce qu'on leur dit, se refusent à parler alors que leur
petit cousin du même âge parle déjà « beaucoup », on invoque le cas
d'Einstein qui n'aurait parlé qu'à cinq ans ! Ne généralisons pas, tous
les enfants qui parlent tard ne sont pas des génies et pour certains c'est
hélas l'indication de troubles plus ou moins profonds. Mais il ne faut
pas non plus trop s'inquiéter lorsque des enfants ne parlent pas avant
deux ans et demi. Il faut s'assurer que l'enfant entend correctement,
comprend bien ce qu'un enfant de cet âge doit comprendre et n'a pas
d'autres troubles de comportement. Après, il reste à attendre que
l'enfant ait décidé qu'il « pouvait » parler. Certains enfants ne s'y
décident que lorsqu'ils ont déjà élaboré un système très structuré et
dans ce cas on assiste le plus souvent à une entrée triomphale qui
conduira l'enfant à un vocabulaire de plus de deux cents mots et des
phrases de deux mots et plus en quelques semaines.
Henri en est l'exemple. Il n'a pas babillé, ou si peu ! On a alors
vérifié son audition qui s'est avérée tout à fait normale. Enfant
silencieux, mais vif et attentif, il a marché tôt et a fait preuve d'un
esprit taquin révélant des capacités d'observation fines. Très intéressé
par tout ce qui l'entoure, son plaisir principal est de « lire ». Depuis
l'âge de dix mois, il demande à « lire » en apportant aux adultes des
livres et il peut rester de très longs moments à se faire nommer les
images qu'il désigne ou écouter raconter des histoires. « Plusieurs
heures », dit sa mère à douze mois. Il indique en faisant « ein » avec
une intonation montante ce qu'il veut qu'on lui nomme. Il répète les
sons d'animaux mais jamais un mot et là-dessus ne se laisse pas piéger.
Au petit jeu suivant, les adultes ont toujours été perdants.
Adulte : « le chien fait wouah wouah ». Henri : wouah wouah.
Adulte : « le chat fait miaou ». Henri : miaou.
Adulte : « la tourterelle fait rourou ». Henri : rourou.
Adulte : « l'enfant dit “auto”. Henri : (pas de réponse mais un petit
sourire en coin).
À treize mois, Henri reconnaît la forme des mots car il montre les
images dont on lui dit le nom. Il en connaît le « sens » et fait « vroom »
pour les motos, renifle et fait semblant de pleurer quand c'est l'image
d'une petite fille qui pleure. Il comprend fort bien ce qu'on lui
demande, mais en restant très silencieux. Il ne dit pas un mot, pas plus
qu'il ne « jargonne ». À seize, dix-sept mois, on commence à relever
deux ou trois mots dits rarement et avec prudence.
« Papa », « maman » et « non » sont les seuls mots habituels jusqu'à
dix-huit mois. À vingt mois, tout à coup, Henri ressort tout le
vocabulaire accumulé : plus de trente mots d'animaux ou d'objets et
plus de quinze mots de relation tels que « dedans », « là-haut »,
« attends », « encore », « a pas », « çà y est », « donne », « tiens »,
« regarde », « allô », « au revoir », etc. À vingt-deux mois : explosion
de mots. Henri, dans une seule séance d'une demi-heure, fait montre
d'un vocabulaire de plus de cent cinquante mots et prononce de vraies
phrases de deux et trois mots.
Pas de schémas, mais dès le départ un système de règles complexes
gouverne la structure des mots. Henri peut dire tous les phonèmes mais
à condition qu'ils soient à certaines places dans le mot. Sinon, il a
élaboré un système de substitutions régulières.
Ainsi, le /m/ est parfaitement dit en position médiane et en position
initiale devant /a/. Mais en position initiale devant une autre voyelle,
/m/ est remplacé par /b/ si la deuxième consonne du mot est voisée et
par /p/ si la deuxième consonne du mot est non voisée. Henri garde la
labialisation de la consonne initiale mais la dénasalise.

musique (myzik) est dit [bizik]


maison [bɛzɣ]
messieurs [pøsȷø]
méchant [pe∫ǎ]
De même /s/ en position initiale est remplacé par la consonne de la
syllabe suivante (assimilation antérograde) :

serpent [papǎ]
sapin [pap ]

mais il est correctement reproduit en position médiane ou finale :

messieurs [pøsȷø]

Le développement du langage d'Henri s'est ensuite poursuivi très


rapidement : à trente mois il avait un vocabulaire comprenant des mots
rares et sophistiqués et ses phrases étaient syntaxiquement très
élaborées.
Il est rentré presque immédiatement dans le stade « phonologique ».
Il avait manifestement emmagasiné les mots mais ne les a utilisés que
lorsque leur codage a été spécifié à l'intérieur d'un système. Il s'est
refusé aux productions approximatives des stratégies a minima ou aux
envolées de la stratégie de « conversa-tion ». Il a en quelque sorte
« sauté » cette période des cinquante premiers mots qui témoigne d'un
codage plus global, pour commencer à produire des mots à partir de
représentations déjà bien spécifiées.
Quoique Henri ne se soit pas exercé à produire des sons durant le
babillage, ses productions ont été dès le départ bien articulées et très
compréhensibles. L'idée du babillage comme nécessaire exercice
articulatoire trouve ici une réfutation.
Ceux que l'on a appelé les late-speakers ont été très peu étudiés.
Mais dans la plupart des cas non pathologiques signalés dans la
littérature, on remarque, quand l'enfant commence à parler, la présence
d'un système déjà bien élaboré et cohérent qui fonde la structure des
premiers mots.
Enfants perfectionnistes ? Enfants timides ? Enfants scientifiques ?
Pourquoi ce choix radical de refuser d'utiliser des mots tant que ceux-ci
ne sont pas structurés par un système ? Attente d'une maturation de
l'hémisphère gauche avec un refus de se servir des informations trop
globales données par l'hémisphère droit ? Le champ expérimental
s'ouvre à ces spéculations.

Ce sont eux qui choisissent

Les styles, les modes d'accès au langage des enfants se révèlent


incroyablement différents. Comment peut-on expliquer cela à partir de
mécanismes communs ?
Les « outils » que possèdent les enfants leur permettent de segmenter
et de reconnaître les mots et les phrases quels que soient les indices
structurels de la langue et leur complexité, variété et subtilité.
Cependant les capacités d'attention, le coût de traitement du « calcul »
perceptif et cognitif, et les limites de la mémoire imposent des
contraintes. L'enfant choisit de privilégier certaines hypothèses. Ce
faisant, il adopte une approche personnelle du langage. Son choix
déterminera un style. Celui-ci se marquera d'autant plus que le
vocabulaire est restreint et les modes d'expression limités.
Plusieurs raisons peuvent être invoquées pour expliquer les
différences d'approches des enfants. D'abord le tempérament. Les
enfants intéressés par les objets extérieurs, orientés vers la réflexion
concrète, vers l'analyse, tendront à adopter un style référentiel. Certains
d'entre eux, nous l'avons vu, seront particulièrement organisés et
systématiques dans leurs productions. Totalement consacré à
l'information donnée par l'environnement matériel, leur vocabulaire
sera constitué de noms concrets.
Les enfants plus extériorisés, aimant s'exprimer et s'intégrer dans un
espace de communication sociale, adopteront le style expressif. Leur
approche sera plus globale, ils seront plus sensibles à la musique de la
langue qu'à la précision phonétique. Sans doute, bon nombre d'enfants
doués pour la musique, ou du moins y portant un intérêt spécial,
choisiront un style très influencé par les contours d'intonation.
L'implication respective des hémisphères droit ou gauche avec leurs
affinités respectives pour la prosodie et la musique d'une part et pour
l'analyse de l'autre, sous-tend sans doute les préférences des enfants
pour le traitement des composants prosodiques ou phonétiques de la
parole. Les fonctions langagières reposent sur un jeu d'ensemble de
composantes de traitement qui peuvent être latéralisées dans l'un ou
l'autre des hémisphères. Les études dans ce domaine ne font que
commencer.
Le niveau intellectuel n'est pas en jeu. Peut-être la forme future de
l'intelligence et de l'imagination se devine-t-elle ? Mais rien n'est connu
sur ces points et les jeunes enfants ont bien trop de potentiels encore
non dévoilés et bien trop de créativité pour qu'on puisse se risquer à les
enfermer dans des prédictions précoces !
Le style des mères joue aussi un certain rôle. Les mères qui
cherchent à apprendre des mots, qui nomment des objets et attendent
de l'enfant qu'il le fasse aussi, canalisent le choix de l'enfant vers un
style référentiel, alors que les modes plus personnels, plus affectifs
orientent vers un style expressif. Si le langage de la mère est pauvre,
l'enfant peut adopter un mode restreint, ou jargonner. Mais le
tempérament de l'enfant et le style de la mère ne sont pas
interdépendants : ils s'influencent mutuellement parfois sans que l'on
puisse parler de détermination.
Un autre facteur joue un rôle primordial pour le choix des styles
d'approche du langage articulé, c'est la langue parlée dans
l'environnement. Les langues dans lesquelles l'ordre des mots est
essentiel pour indiquer le sens de la phrase et qui ont peu de variations
flexionnelles, les langues à accent qui favorisent une segmentation sur
les mots pourraient orienter vers le style réfé-rentiel. En revanche, les
langues dont la prosodie découpe des syntagmes ou des phrases
pourraient susciter plus spontanément des stratégies de style holistique.
Aucune étude de grande envergure n'a cependant été entreprise qui
permettrait de comprendre la part respective de ces facteurs dans les
modes d'acquisition du langage parlé durant les premières années.
Osons une comparaison. Si le « moteur » qui guide le
développement du langage est bien le même pour tous les enfants, si
les langues et les cultures, comme des châssis, des pneus ou une
suspension ont une influence sur le mode de conduite, les stratégies des
bébés représentent le style du conducteur, son brio ou sa prudence, son
goût du risque ou sa réflexion. Le moteur est robuste et tous les
conducteurs doivent, sauf accident, arriver au but. Tous les enfants
arriveront au but : acquérir leur langue maternelle, quelles que soient
les stratégies qu'ils ont adoptées au départ.

1 Prigogine I. « La redécouverte du temps » Conférence donnée dans le cadre des


Conférences Marc Bloch le 10 juin 1987 à la Sorbonne.
2 Darwin C., La Descendance de l'homme et la sélection sexuelle, Reinwald et Cie, Paris,
1873, p. 53.
3 Nelson K., « Structure and strategy in learning to talk », Monographs of the Society for
Research in Child Development, 38(149), 1973.
4 Bloom L., Lightbown L. & Hood L., « Structure and variation in child language »,
Monographs for the Society for Research in Child Development, 40, 1975, n° 2.
5 Peters A.M., « Language learning strategies : Does the whole equal the sum of the parts ? »,
Language, vol. 53, 3, 1977, p. 561-573.
6 Bates E., Dale P.S. & Thal D., « Individual differences and their implications for theories of
language development », dans P. Fletcher et B. MacWhinney (Eds.), The Handbook of Child
Language, Basil Blackwell, Oxford, 1995, p. 96-151.
7 Bates E., Dale P.S. & Thal D., Ibid.
8 Tous les exemples que nous prenons sont tirés d'études portant sur l'accès au langage
d'enfants français et américains menées, pour les cinq enfants français par B. de Boysson-Bardies,
P. Hallé, C. Durand, et pour les cinq enfants américains par M.M. Vihman. L'exemple de Simon
est tiré d'une étude faite par B. de Boysson-Bardies, N. Bacri, M. Poizat et L. Sagart.
9 Vihman M.M. & Miller R., « Words and babble at the threshold of lexical acquisition »,
dans M.D. Smith & J.L. Locke (Eds.), The Emergent Lexicon : The Child's Development of a
Linguistic Vocabulary, New York, Academic Press, 1988.
10 Peters A.M., « Language learning strategies : Does the whole equal the sum of the
parts ? », Language, vol. 53, 3, 1977, p. 561-573.
CHAPITRE VII

Des langues, des cultures et des enfants

« La diversité est une façon de parer au possible. »


Le Jeu des possibles, FRANÇOIS
JACOB

Langage et socialisation

Le langage est la plus grande force de socialisation qui soit. Tous les
enfants ont des besoins fondamentaux communs qui se marqueront
dans certaines formes communes des premiers vocabulaires. Mais tous
doivent, pour communiquer avec l'entourage, être reconnus comme
locuteurs, et pour cela parler la langue de leur environnement et se
conformer à certaines habitudes formelles et sociales imposées à la fois
par la langue et par la culture. Leur vocabulaire se constitue au contact
de la langue adulte qui, dès le départ, dictera non seulement les choses
du monde qu'il faut voir et apprendre mais aussi la façon de les dire, et
les modalités d'expression qui permettront d'être reconnu en même
temps que compris.
Le langage ne s'enseigne pas. Cependant, les mères attendent avec
impatience les premiers mots des enfants et la plupart ont envie d'aider,
ou plutôt d'accélérer les débuts de la parole chez leurs enfants.
Selon les cultures, ce que l'on appelle « apprendre à parler » n'a pas
le même sens. L'attente des parents diffère, ainsi que les « objets » de
la parole. Ainsi les Kaluli (Papous de Nouvelle-Guinée) estiment que
l'enfant sait parler quand il sait dire « no » (mère) et « bo » (sein)1 ; les
mots qu'il aurait pu dire auparavant ne sont guère entendus, et les
mères Kaluli parlent peu à leurs nourrissons car elles pensent que ceux-
ci « n'ont pas de compréhension ». Cette attitude est extrême mais,
même dans des cultures plus proches, selon les pays et selon les
milieux sociaux, les modes d'interaction, le contenu et les formes des
discours des mères sont encore très dépendants de l'image de l'enfant
dans la culture, et des attentes des parents.
Les mères américaines incitent leur enfant à parler et surtout à
nommer. Elles aiment qu'il soit « précoce » en tout, alors que les mères
françaises pensent qu'il « a bien le temps d'apprendre ». Elles ne
recherchent pas de performances linguistiques mais estiment plutôt que
l'enfant doit être heureux, gentil et qu'il doit beaucoup jouer. De même
les mères allemandes s'attendent à ce que l'enfant parle plus tard que ne
l'attendent les mères du Costa-Rica. On pourrait multiplier les
exemples de décalage entre les attentes des mères dans les différentes
cultures, et par conséquent de décalages dans « l'écoute » par les
parents des premiers mots des enfants. Mais ces premiers mots
dépendent aussi de la structure de chaque langue.
L'organisation linguistique et conceptuelle du monde se traduit dans
les langues par des formes et des images qui leur deviennent propres.
Les cultures occidentales, pragmatiques et « efficaces » sont plus ou
moins orientées vers la production de noms : « il faut appeler chaque
chose par son nom ». L'anglais est, dans ce domaine, tout à fait
remarquable et se caractérise par la richesse exceptionnelle de son
vocabulaire. À l'inverse, dans certaines langues orientales comme le
coréen ou le japonais, la référence se fait avec le verbe ou l'adjectif. Il
n'est pas nécessaire, pour un locuteur japonais, de mentionner un objet
quand celui-ci est présent ou lorsque le sujet de la conversation est
agréé par son interlocuteur. Ainsi pourra-t-il dire « est fêlé sur le bord »
sans préciser de quoi il parle, si le sujet de conversation général porte
sur des vases Heyan dont un exemplaire est dans la pièce. De même
quelqu'un qui vient de recevoir un bouquet de roses pourra dire
« sentent délicieusement bon » sans qu'il soit nécessaire de mentionner
les fleurs du bouquet. Le japonais et le coréen sont des langues qui
prennent particulièrement en compte les relations interpersonnelles
dans le mode d'expression. On peut donc s'attendre à ce que les
schémas lexicaux des enfants japonais ou coréens soient différents de
ceux des enfants dont la langue exige une référence nominale explicite.
Parmi les langues occidentales, il est aussi possible de prédire des
schémas de vocabulaire différents ; ainsi la forme des mots (longueur
et structure syllabique), fortement monosyllabique en anglais, s'oppose-
t-elle à celle du français ou de l'italien, langues dans lesquelles les mots
sont majoritairement bi ou trisyllabiques. Des oppositions se marquent
aussi entre les langues dans lesquelles l'ordre des mots fonde le sens
(l'anglais tout particulièrement) et les langues dans lesquelles l'ordre est
plus libre et les relations indiquées par des flexions morphologiques
comme le russe ou le turc. Le pourcentage et la forme des noms dans la
langue, celui des mots grammaticaux, l'absence ou la présence de
flexions, la fonction des auxiliaires sont autant de sources de variations
dans une liste qui est loin d'être close.

Univers culturel et premiers mots

Demandez à une mère américaine si sa petite fille ou son petit


garçon de treize mois parle ; la plupart du temps elle s'exclamera :
« Mais naturellement, elle/il dit au moins cinquante mots ! » Ce que
l'on pourrait appeler « l'illusion du vocabulaire » est très forte chez les
mères américaines. Posez la même question à la mère d'une petite fille
ou d'un petit garçon français, la plupart du temps elle vous répondra :
« Non, à part « papa », « maman », et encore ce n'est pas sûr, il/elle ne
dit pas de mots ; il/elle a tout le temps ! »
Faut-il penser que les petits Américains sont tous des génies
linguistiques ? Loin de là ! Mais alors pourquoi cette différence ?
Les stratégies des parents pour éveiller l'attention du nourrisson à
l'environnement physique et pour solliciter sa participation au monde
social se différencient précocement. Dès trois mois, le style
d'interaction caractéristique d'une culture apparaît dans les relations de
l'entourage avec les nourrissons2-3-4.
Ces styles se reflètent dans la façon dont les mères réagissent aux
premières paroles de leurs enfants. Voyons, en leur demandant de
regarder avec eux un livre d'images, comment elles leur « présentent »
les mots. Nous sommes à San Francisco5 : Mary, mère de Sue, est
assise à côté de sa petite fille de quatorze mois. Elle regarde avec elle
un livre et tombe sur l'image d'un chat : (nous traduisons en français les
dialogues)
Mary : « Look at the cat, it's a cat, look at the cat, cat. »
(Regarde le chat, c'est un chat, regarde le chat, chat.)
Sue : « a. »
Mary : « Good girl, you say cat, a cat, good girl. »
(Gentille petite fille, tu as dis chat, un chat, bravo !)
Les encouragements se poursuivent haut et fort. L'image suivante est
celle d'un chien :
Mary : « Look at the dog, a dog, say dog, dog. »
Sue : « e. »
Mary : « Good girl, you say dog, say dog… », etc.
Sue est créditée par la mère, ravie, de deux mots : « cat » et « dog ».
Plusieurs études ont montré la tendance fortement didactique des
mères américaines de la middle class. Celles-ci s'attachent à attirer
l'attention de l'enfant sur les objets de l'entourage et à les faire nommer
par le bébé. L'apprentissage des noms d'objets et également de
personnes (on fait désigner les personnages connus de séries télévisées)
occupe une grande place dans l'échange mère-enfant qui repose sur les
questions typiques du naming game : « what is this ? », « who is
she ? », « can you say “juice” ? » suivies des indications : « that's your
toe, that's your bottle », « it's a butterfly », etc. Au cours de tous leurs
essais, le petit Américain ou la petite Américaine sont très fortement
encouragés, félicités, quel que soit le résultat de leurs tentatives.
Rendons-nous maintenant à Paris, chez Marie. Elle montre les
images d'un livre à son fils, Léo.
Marie : « Regarde le chat, Léo, il est noir avec une petite langue
rose, c'est un gentil chat, tu vois le chat ? »
Paul : « a. »
Marie : « Oui, c'est un chat, il boit du lait et fait miaou. »
Léo n'est pas spécialement encouragé dans ses productions. Sa mère
rit à l'idée que le « a » dit par Léo puisse être considéré comme un mot.
Mais Léo a sans doute appris quelque chose sur les chats !
Pas de forcing, peu d'encouragements à répéter. Les mères françaises
ne recherchent pas la performance mais s'attachent plus à développer
des histoires en commentant les images et ceci même avec de très
jeunes enfants. Elles utilisent avec l'enfant un langage plus adulte et
cherchent moins à s'adapter à lui qu'à le préparer à « parler joliment ».
La plupart des mères françaises n'acceptent un mot que s'il est
relativement bien prononcé. /Ta/ pour chat n'est pas toujours accepté
(ni même entendu), surtout si l'enfant utilise cette forme pour d'autres
référents. Des prononciations « minimales » sont beaucoup plus
admises par les mères américaines habituées à la sous-articulation des
mots. Timmy a par exemple un vocabulaire « reconnu » de quinze mots
tournant autour de deux formes /ba/ et /ga/ !
Allons voir maintenant Fusako avec Taku.
Fusako montre l'image et demande : « Celui-là ? »
Taku ne dit rien.
Après un temps, sa mère reprend : « Oh là là, le bébé ne parle pas.
Taku, où est la voiture ? »
Taku : « Bubu (voiture). »
Mère : « Bubu, ah bon, c'est bien la voiture. N'est-ce pas un cochon,
là ? Oh, c'est difficile ce livre ! Il y a beaucoup de gens ! »
La mère se met à la place de l'enfant et formule les commentaires
qu'il pourrait faire ! Elle l'interroge aussi sur l'image, mais sans insister
et souvent sans donner la réponse lorsque l'enfant ne répond pas.
Pour les Japonais, l'approche du bébé est donc très différente. La
mère japonaise intervient beaucoup moins dans l'apprentissage des
dénominations par le bébé, reste plus discrète dans l'exploration qu'il
fait de ce qui l'entoure, mais insiste plus sur la qualité de la
communication entre elle et l'enfant, sur l'intégration de l'individu au
groupe social. Les règles de politesse, l'attention aux sentiments des
autres, les modalités de communication à autrui de ses propres
impressions sont beaucoup plus mises en valeur dans la langue.
L'attitude des parents changera drastiquement avec les enfants d'âge
scolaire, mais avec les jeunes enfants elle est délicate et
noninterventionniste.
Dans la plupart des études interculturelles anglais-japonais, les
enfants japonais sont crédités d'une acquisition de mots plus tardive6.
Mais une étude approfondie montre que leurs premiers mots sont
systématiquement plus longs et correspondent à des formes
sémantiques plus variées7.
Tout cela passe avant la capacité à nommer le plus d'objets possibles,
considérée comme secondaire par rapport à la qualité de l'expression.
Certes, on ne peut généraliser ces comportements à toutes les
mères ! Mais de nombreux travaux8-9-10 montrent que la recherche de
performances précoces, qu'elles soient verbales ou motrices, est bien
plus forte chez les parents aux États-Unis qu'en France ou au Japon.
Dans ces pays, l'approche est plus personnelle ou plus poétique.
L'emploi des mots dans les propos que les mères adressent aux
enfants montre bien le style du discours de l'adulte et les centres
d'intérêt vers lesquels il essaie d'attirer l'attention de l'enfant. Les
analyses des propos de mères françaises, américaines ou japonaises
illustrent particulièrement ce point. Ainsi, les propos de mères
américaines contiennent 35 % de noms, contre 25 % dans ceux des
mères françaises11. Dans une autre étude12, on trouve 40 % de noms
dans les propos que les mères américaines tiennent à leurs enfants,
contre 20 % dans les propos des mères japonaises.

Les sujets de conversation des petits Français,


Américains, Suédois et Japonais

Comment des attitudes aussi différentes vont-elles se marquer dans


le premier vocabulaire produit par l'enfant ?
Chez les bébés des grandes villes modernes – Paris, Stockholm, San
Francisco – que nous avons enregistrés, on trouve des constantes dans
les catégories du vocabulaire employé : les noms des personnes qui
entourent l'enfant et auxquelles il peut faire appel : maman, papa et
souvent la grand-mère ; les objets nécessaires à la « survie » : les
aliments, la boisson et les ustensiles pour se nourrir (biberon, tasse), les
vêtements qui se mettent et se retirent pour la promenade, telles les
chaussures. On trouve également le nom de certains objets de la
maison, particulièrement ceux qui font du bruit et attirent l'attention, tel
le téléphone, et enfin ce qui se déplace et roule (auto, train). Dans tous
les vocabulaires une grande importance est accordée aux animaux, « à
ce que dit l'animal » : le son qu'il produit sert souvent à le désigner. Le
chien est un « wouah wouah », le canard, un « coin-coin ».
Un des grands besoins de l'espèce humaine, le jeu, se mani-feste
aussi dès les premiers mots. Le jeu de cache-cache, mimant de façon
ludique l'apparition et la disparition, est rendu par un terme dans
probablement toutes les langues du monde. Nous l'avons retrouvé
parmi les premiers mots de tous les enfants des différents groupes
linguistiques que nous avons étudiés. Enfin, un autre aspect indiquant
des préoccupations fondamentales identiques chez les bébés des
différentes cultures est celui de la communication sociale : les termes
pour dire bonjour ou au revoir se retrouvent dans la plupart des
premiers vocabulaires.
Cependant les variations individuelles, l'influence de la culture et la
structure de la langue modulent déjà le choix et la distribution des
premiers mots de l'enfant.
Nous allons suivre nos petits Français, Américains, Suédois et
Japonais dans leurs rapports avec la langue et la culture de leur
environnement maternel et social, tels qu'ils se traduisent dans leurs
premiers mots et nous verrons combien les variations culturelles
demeurent, combien « le temps du monde fini » est encore loin !
Regardons la distribution des types de mots dans le premier
vocabulaire des enfants français, américains, suédois et japonais que
nous avons enregistrés depuis leur premier mot jusqu'à ce qu'ils
prononcent vingt-cinq mots dans une séance, ce qui correspond à un
vocabulaire de trente à cinquante mots selon les enfants13.
FIGURE 1 – Distribution des types de mots dans le vocabulaire d'enfants
français, américains, suédois et japonais ayant un vocabulaire de moins
de cinquante mots.

Malgré une certaine communauté de mots reflétant des besoins


généraux et des catégories universelles dans le langage, et par-delà les
variations individuelles, des caractéristiques spécifiques à chaque
groupe se dégagent chez les bébés.
Tout d'abord, le « biais » vers la production de noms.

FIGURE 2 – Production relative de noms et de verbes ou autres


catégories grammaticales dans le vocabulaire des enfants français,
américains, suédois et japonais.

Mais, outre leur propension à produire des noms, dont les référents
sont stables et concrets, plutôt que des verbes, les enfants abordent
d'autres catégories grammaticales. Celles-ci sont particulièrement
sensibles à la structure de la langue.
L'hédonisme des bébés français

Entre dix et dix-huit mois, les bébés français produisent en moyenne


64 % de noms et 24 % de verbes. Si, comme les Suédois, ils sont
nettement moins sociables que les Japonais ou les Américains, ils
semblent être les plus hédonistes ! Bien que le nombre de types de
mots se rapportant à la nourriture soit du même ordre que chez les
Américains et les Suédois, les bébés français les utilisent nettement
plus souvent (15 % de leurs productions s'y rapportent contre 4 à 6 %
pour les autres groupes). Ils ont aussi plus de termes pour désigner les
vêtements, mais moins pour désigner les autres objets de
l'environnement. La variété des verbes est moins grande chez eux qu'en
suédois, bien que leur fréquence de production soit la même. Ces
verbes font référence à des activités ou des états agréables : « lire »,
« boire », « manger », « donner », plutôt qu'à des actions physiques
énergiques comme en suédois. Ils utilisent beaucoup d'expressions
telles que : « c'est beau ». Les termes relationnels tels que « encore »
sont nombreux. De façon surprenante d'ailleurs, ce terme, utilisé par
tous les enfants français étudiés, ne se retrouve ni chez les Suédois, ni
chez les Américains, et n'est utilisé que par deux enfants japonais sur
cinq.

Le pragmatisme et la sociabilité
des petits Américains

Les petits Américains sont pragmatiques : ils nomment les personnes


qui les entourent ainsi que les personnages de la mythologie américaine
moderne : Great Gable, Humpty-Dumpty. On trouve chez eux trois fois
plus de noms propres que chez les enfants japonais. Ils nomment aussi
des animaux, et sur ce point ne diffèrent pas des autres groupes, ainsi
que des objets de la vie courante (36 % de leurs productions).
« Money » (memi), répond un bébé américain de seize mois à la
question de sa mère lui montrant des pièces de monnaie. Certes il n'en
connaît pas encore l'usage, mais le mot appartient déjà à son
vocabulaire !
On trouve étonnamment peu de verbes et d'adjectifs dans le premier
lexique des enfants américains : 9 % des verbes contre plus de 21 %
dans les trois autres groupes. Ces données concordent avec celles de la
plupart des auteurs qui ont étudié la distribution des premiers mots
chez les enfants aux États-Unis.
Les enfants américains sont aussi sociables que les Japonais et bien
plus que les Français et les Suédois. 15 % de leurs productions sont des
termes de bienvenue (greetings).
Un certain nombre de raisons peuvent être avancées pour expliquer
le pourcentage élevé de noms dans le vocabulaire des petits
Américains : l'importance de l'ordre des mots en anglais, la fréquence
des monosyllabes, les schémas de l'accent tonique et la tendance des
parents américains à encourager les enfants à nommer.

Le goût de l'action des petits Suédois

Comme les Français, les petits Suédois sont peu sociables en parole.
Ce sont les plus actifs, si l'on en juge par le nombre de verbes d'action
dans leur vocabulaire : « ga » marcher, « hoppa » sauter, « dansa »
danser, « gunga » se balancer, « sitta » s'asseoir, « tanda » allumer,
« rita » dessiner, « tanka » mettre de l'essence, « backa » renverser,
« klappa » applaudir. Ils sont plus intéressés que les Français, les
Japonais ou même les Américains par les objets de la maison : des
mots tels que « klocka » l'horloge, « lampa » la lampe, « pall » le
tabouret », « dörr » la porte, « stuga » le cottage se retrouvent chez
plusieurs enfants. Actifs et intéressés par leur maison, voilà nos petits
Suédois dès dix-huit mois.

Le sens esthétique des enfants japonais

Le groupe de petits enfants japonais se distingue par la


prépondérance qu'on y trouve des mots d'une autre catégorie
grammaticale que les noms.
Il est très intéressant de voir comment la civilisation qui est la leur et
qui s'exprime dans un usage du langage bien différent de celui de
l'Occident, marque le premier vocabulaire des jeunes Japonais, en dépit
des similitudes fondamentales dues aux capacités et aux besoins
communs à tous les jeunes enfants.
La langue japonaise, nous l'avons vu, se structure souvent autour de
verbes qu'elle place en fin de phrase : position qui est particulièrement
saillante pour tous les enfants.
Les cinq bébés japonais que nous avons suivis ont un vocabulaire
plus restreint que les bébés des autres groupes pour les noms de
personne (7 % contre 15 % pour les Américains) et pour les noms
d'objets désignant des jouets, des aliments, etc. Ils ont une petite
tendance « écolo » ou poétique qui les porte à mentionner plutôt des
éléments de la nature que des objets de la maison : la pluie, le nuage, la
feuille, le soleil et la lune. Ils ont un vocabulaire plus étendu dans
d'autres catégories grammaticales qui traduisent déjà le souci, propre à
leur culture, de la relation avec autrui : ce sont eux qui utilisent le plus
de termes sociaux tels que « hai » bonjour, « haro » hello, « dozo » je
vous en prie, « arigato » merci, « akushu » serrons-nous les mains. Les
mères japonaises veillent avec soin à ce que les petits enfants utilisent
des termes de politesse.
Beaucoup de formes sont révélatrices de l'importance d'entrer en
relation avec l'autre et de mentionner des « états » et des impressions :
« atta » je l'ai trouvé, le voilà, « totte » peux-tu me le donner, « are »
qu'est-ce qu'il y a, « jatta » je l'ai fait, « owatta » c'est fini, « aishi »
délicieux, « kire-kire » très joli, « kawai » mignon.
À ce vocabulaire s'ajoute le vocabulaire adverbial propre au
japonais, et tout spécialement les onomatopées. Celles-ci ne sont pas
réservées au langage enfantin comme dans nos langues. Elles
imprègnent la vie japonaise et se retrouvent en particulier dans toute la
poésie et dans les travaux littéraires14. Elles sont présentes dans la vie
de tous les jours. Elles reflètent des sensations physiques, visuelles ou
auditives aussi bien que des sentiments plus subtils et des concepts
complexes. Les bébés japonais en sont friands pour exprimer le bruit
d'un jet d'eau « jaja », le floc de l'eau frappée « picha-picha », le bang
d'un marteau « kon-kon », le cognement « goto-goto » et le petit
tapotement « liko-liko ». Même le bruit du dormeur « gu-gu » et la
brillance étincelante « kira-kira » trouvent leur place dans le premier
vocabulaire des enfants japonais. Ces expressions vont donc
représenter plus de 50 % des productions du vocabulaire de trente mots
des enfants japonais et lui donner une coloration très différente de celui
des enfants anglophones.

Mais tous les enfants du monde

Seuls 12 % des mots (dix-neuf mots) ayant une signification


commune se retrouvent dans le lexique des différents groupes
d'enfants ; ils sont dits par au moins un enfant dans chacun des
groupes. Pour calculer cela, on a regroupé les mots ayant une fonction
équivalente, même s'ils ne correspondaient pas à une transcription
exacte (par exemple « eau », « juice », « saft » (limonade), « jusu » qui
semblent être les boissons de base pour les différents groupes). 12 % de
termes ayant des fonctions ou des références communes pour les quatre
groupes, cela semble peu si l'on considère les « besoins communs
fondamentaux » des enfants.
Les mots que l'on retrouve dans tous les groupes sont des noms de
personnes, d'animaux, et des termes « sociaux ». À cela s'ajoute un
déictique, servant à indiquer, et une négation. Ces mots sont : « papa »,
« maman », « bébé », « yeux », « chien », « canard », « oiseau »,
« ours », « eau », « gâteau », « balle », « chaussures », « voiture »,
« là » ou « çà », « pas là », « coucou », « non » et des mots de type « au
revoir » ou « hello ».
Les pratiques culturelles orientent donc fortement le choix
sémantique des premiers mots des enfants. Si l'on considère les groupes
de façon indépendante, on relève que 30 à 40 % des mots sont
communs à au moins deux enfants du même groupe. Les préférences
individuelles sont donc un moins grand facteur de variabilité que
l'appartenance à un groupe linguistique et culturel.
Doué d'équipements spécifiques, il suffit à l'enfant de disposer de
conditions favorables minimales pour commencer généralement à dire
des mots entre un et deux ans. Cependant l'appropriation effective de sa
langue exige de lui toutes ses forces. À partir de la structure
phonétique, prosodique et syntaxique de sa langue, ainsi que des
modalités de transmission de celle-ci, l'enfant choisira un mode d'accès
à la parole qui répond à son tempérament. Le regard et les attentes que
l'adulte projette sur l'enfant jouent aussi dans ce choix.

1 Schieffelin B.B., « Teasing and shaming in Kaluli children's interactions », dans


B.B. Schieffelin & E. Ochs (Eds.), Language socialization across cultures, New York, Cambridge
University Press, 1986.
2 Fernald A. & Morikawa H., « Common themes and cultural variations in Japanese and
American mother's speech to infants », Child Development, 64, 1993, p. 637-656.
3 Toda S., Fogel A. & Kawai M., « Maternal speech to three-month-old infants in the United
States and Japan », Journal of Child Language, 17, 1990, p. 279-294.
4 Bornstein M.H., Tamis-LeMonda C.S., Pêcheux M.-G., Rahn C.W., « Mother and infant
activity and interaction in France and the United States : A comparative study », International
Journal of Behavioral Development, 14(1), 1991, p. 21-43.
5 Les exemples de conversations mère-enfant sont extraits des recueils de corpus effectués
dans le cadre d'une recherche comparative longitudinale portant sur l'accès au langage d'enfants
américains, suédois, français et japonais. Cette recherche a donné lieu à une collaboration
internationale entre C. Ferguson, M. Vihman et F. Arao pour les enfants américains et japonais,
B. Lindblom, L. Roug-Hellichius, I. Landberg pour les enfants suédois et B. de Boysson-Bardies,
P. Hallé, C. Durand pour les enfants français.
6 Fernald A. & Morikawa H., op. cit.
7 Boysson-Bardies B. de, Vihman M.M. & Durand C., « The first lexicon : A comparative
study of four languages », (soumis à publication).
8 Tamis-LeMonda C.S., Bornstein M., Cyphers L., Toda S. & Ogino M., « Language and
plays at one-year : A comparison of toddlers and mothers in the United States and Japan »,
International Journal of Behavioral Development, 15(1), 1992, p. 19-42.
9 Bornstein M., Tal J., Rahn C., Galperin C.Z., Lamour M., Ogino M., Pêcheux M.-G.,
Toda S., Azuma H. & Tamis-LeMonda C.S., « Functional analysis of the contents of maternal
speech to infants of 5 and 13 months in four cultures : Argentina, France, Japan, and the United
States », Developmental Psychology, vol. 28, no 4, 1992, p. 1-10.
10 Morikawa H., Shand N. & Kosawa Y., « Maternal speech to prelingual infants in Japan
and the United States : Relationships among functions, forms and referents », Journal of Child
Language, 15, 1988, p. 237-256.
11 Vihman M.M., Kay E., Boysson-Bardies B. de, Durand C. & Sundberg U., « External
sources of individual differences ? A cross-linguistic analysis of the phonetic of mothers' speech
to One-year-old children », Developmental Psychology, 30(5), 1994, p. 651-662.
12 Fernald A. & Morikawa H., op. cit.
13 Boysson-Bardies B. de, Vihman M.M. & Durand C., op. cit.
14 Shibatani M., The languages of Japan, Cambridge, Cambridge University Press, 1990.
CHAPITRE VIII

La parole devient langage


(dix-huit-vingt-quatre mois)

« Un savant germanique a dit que tout enfant acquiert dès ses trois
premières années le tiers des idées et des connaissances que,
vieillard, il emportera dans la tombe. »
DOSTOÏEVSKI

Une nouvelle étape

Quelques mois après qu'ils ont commencé à dire leurs premiers mots,
entre dix-huit mois et deux ans pour la plupart d'entre eux, les enfants
franchissent une nouvelle étape. Des modifications importantes se
produisent dans leur comportement langagier. Subitement leur
vocabulaire s'accroît, la prononciation des mots devient moins
erratique, et des énoncés composés de plusieurs mots apparaissent. Les
parents ont l'impression que l'enfant se met réellement à parler. Ce n'est
pas sans raison : le système grammatical de la langue adulte commence
à organiser les connaissances linguistiques de l'enfant.
Parler de grammaire fait le plus souvent passer un frisson d'horreur
et l'on peut se demander ce qu'ont à voir les pénibles leçons de nos neuf
ans avec les combinaisons de deux ou trois mots que l'enfant produit
alors ! Mais nous ne sommes pas Monsieur Jourdain et savons que la
compétence grammaticale qui nous permet de produire des phrases ne
dépend pas des leçons de grammaire. L'essentiel de la grammaire est
connu avant d'être enseigné puisqu'elle est une part essentielle de notre
capacité à nous exprimer. Mais comment peut-on en suivre la
structuration à la fin de la deuxième année ?
Lorsqu'on parle de système grammatical, on entend une entité très
vaste qui comprend le vocabulaire, la morphologie, la syntaxe et les
fonctions de communication assurées par ces aspects. Entre dix-huit et
vingt-quatre mois, chacun de ces aspects évolue tandis que l'enfant fixe
les principes grammaticaux qui gouvernent sa langue. Sans doute, ce
n'est qu'après ses deux ans que l'on trouvera des constructions de
phrases assez complexes, nous permettant de suivre les acquis
successifs de « règles » ou principes syntaxiques et morphologiques de
la grammaire de la langue. Mais, à la fin de la deuxième année, l'enfant
a déjà entamé cette dernière étape qui, après celles du babillage et des
premiers mots, verra s'épanouir son talent grammatical.

L'explosion du lexique

L'enfant que nous avons suivi jusqu'ici ne dit qu'une cinquantaine de


mots isolés. Comment se traduit le début de cette nouvelle étape dans
le lexique, dans la prononciation et dans les combinaisons de mots ?
Lorsque l'enfant atteint un vocabulaire de production de soixante à
soixante-dix mots environ – ce qui correspond à des vocabulaires en
reconnaissance de plus de deux cents mots – se produit une véritable
explosion : brusquement il dit de quatre à dix mots nouveaux par jour !
Cet accroissement subit du vocabulaire implique une réorganisation des
systèmes de codage et de reproduction des mots. On dit que le
vocabulaire de l'enfant s'organise en lexique phonologique.
Au début de la première année, les premiers mots prononcés sont
représentés dans le répertoire des enfants comme des unités dont la
construction est relativement peu analysée1-2. Sans doute sont-ils
uniquement enregistrés avec leur prosodie, leur struc-ture syllabique et
quelques traits articulatoires. Lorsque s'accroît le nombre des mots
mémorisés, ce mode de représentation devient insuffisant. Des
représentations aussi peu définies ne permettent pas de discriminer ou
de reproduire les items d'un vaste vocabulaire. L'enfant doit donc d'une
certaine façon « mettre de l'ordre dans ses armoires » et ranger les mots
d'une façon systématique qui lui garantisse un accès rapide et fiable
aux différents mots du vocabulaire. Ce rangement implique une analyse
plus précise des segments phonétiques des mots et de leur
combinatoire, et des renseignements grammaticaux. Il s'agit d'intégrer,
dans le lexique, les règles phonologiques qui contrôlent la
prononciation des mots, et les règles morphologiques qui gouvernent
leur construction.

La découverte de la phonologie

La définition savante enseigne que la phonologie est la partie de la


grammaire qui rend compte de la connaissance, par les locuteurs, des
sons propres à leur langue et de leur organisation particulière dans
celle-ci. Plus simplement, nous dirons que les règles phonologiques
gouvernent la prononciation des mots. Jusqu'ici nous avons vu l'enfant
découvrir le système phonétique de sa langue, c'est-à-dire relever et
apprendre à produire les sons nécessaires pour produire des mots de la
langue. Mais il reste à connaître les règles qui organisent les relations
de prononciation des sons entre eux, leur ajustement avec les sons
avoisinants, ainsi que les schémas de tons, de stress ou d'intonation
sous lesquels ils se réalisent. Chaque langue possède son système
phonologique particulier dont les règles sont complexes.
L'organisation des mots en lexique va nécessairement de pair avec
celle des sons en système phonologique. Dans la langue, le mot n'est
pas une forme toute faite qui pourrait être reconnue ou produite comme
un tout. C'est une forme qu'il faut reconstruire et dont on doit connaître
les règles de construction. Quelques exemples montrent la complexité
des informations nécessaires pour reconstituer et produire un mot : les
lapsus tels que « j'ai l'aiglon » au lieu de « j'ai l'onglée », ou « couche-
tard » pour « coûte cher » montrent que le locuteur assigne les
phonèmes dans des cadres stricts selon un ordre défini et que, ce fai-
sant, il peut y avoir des erreurs d'attribution. D'autre part, les formes de
prononciation des mots et des suites de mots obéissent à des règles
relatives, non générales, et sont donc complexes. Ainsi, en français, le
[t] de « but » se prononce, mais pas celui de « petit » si l'on dit « le
petit chat » ; on le prononce en disant « le petit enfant », « un grand
éléphant » est prononcé comme « un gran(t) éléphant », etc.
Pour comprendre et prononcer des mots, les adultes se réfèrent donc
à un lexique qui comprend une série d'entrées lexicales. Celles-ci
donnent le sens du mot, sa signification mais aussi les informations sur
sa forme sonore et les informations sur ses propriétés grammaticales.
Les informations sur la forme sonore fournissent l'ordre de succession
des phonèmes et les règles de leur combinaison. Le composant
grammatical détermine les propriétés syntaxiques et morphologiques
du mot. Il en indique la catégorie (nom, verbe, etc), les affixes et les
inflexions (pluriel/singulier, désinences verbales telles que verbe au
futur, etc.), le genre (masculin, féminin), etc. Pour faire une phrase
correcte, il faut savoir si tel mot est du genre masculin, si le verbe est
intransitif, etc. Ces marques constituent l'interface entre l'information
syntaxique et l'information sémantique. Elles précisent l'acception du
mot et son intégration lors de la construction des phrases, bref elles
indiquent son mode d'emploi à côté de son sens et du concept qu'il
recouvre.
C'est ce codage que l'on voit apparaître à la fin de la seconde année.
L'enfant sait alors articuler des sons sous forme de syllabes. Il a
sélectionné les schémas phonétiques les plus fréquents de sa langue. Il
fixe maintenant le système formel qui organise la combinaison des sons
de sa langue, et il y adjoint les traits grammaticaux lui permettant de
produire des phrases.

La réorganisation du système de production des mots se caractérise


donc d'abord, nous l'avons vu, par un accroissement soudain du
vocabulaire. Alors que les enfants ont mis cinq à six mois pour passer
de un à cinquante mots, il leur devient possible d'apprendre
régulièrement de quatre à dix mots par jour.
Cet accroissement du vocabulaire s'accompagne d'un changement
dans les formes de production des mots. Celles-ci deviennent plus
régulières, sinon plus correctes. Ce sont principalement les formes
nouvelles qui bénéficient des changements apportés par les nouvelles
règles de prononciation. Les anciens mots résistent eux à la
réorganisation de la prononciation et restent dits sous la forme
archaïque qui a été consolidée par les fréquentes répétitions. L'enfant
peut ainsi prononcer des mots nouveaux avec des phonèmes qu'il
continue à éviter ou à déformer dans les mots de son premier
vocabulaire.
L'étude des erreurs illustre cette construction du système phonétique
au cours de laquelle les segments acquièrent leur valeur tant
individuelle que relationnelle. L'enfant recherche d'abord les régularités
de prononciation et il a tendance à les systématiser. Ce faisant, il
généralise certaines régularités, ce qui le conduit à des erreurs. Un
exemple classique est celui étudié par L. Menn3 : Daniel produit
d'abord les mots down et stone [doewn] et [don]. Plus tard, il
commence à avoir une « règle » d'harmonie nasale et produit les mots
beans comme [minz] et dance comme [nans]. Il commence alors à
généraliser cette règle et prononce sous la forme [noewn] et [non] les
mots auparavant correctement introduits par une occlusive.
Henri est aussi un bon exemple montrant la recherche de
systématisation et « d'harmonie » en français. Il utilise, à vingt-deux
mois, des règles complexes qui changent la première consonne du mot
introduit par « m » (suivi d'une voyelle haute ou mi-haute) en
occlusive, voisée ou non selon le voisement de la deuxième consonne
du mot. Dans monsieur [mesje] qu'il prononce [pøsȷø] méchant
[méSan] qu'il prononce [pe∫ã], [m] est remplacé par [p], occlusive non
voisée, puisque le [S] est une fricative non voisée, alors que dans
musique [mizik] qu'il prononce [bizik] maison [mezon] quil prononce
[bɛ∫ô] [m] est remplacé par [b], occlusive voisée, car la fricative [z] est
voisée.
Cette recherche d'« harmonie » entre les consonnes d'un mot montre
que l'enfant ne se refère plus à une forme globale mais à des structures
relationnelles : les traits articulatoires d'un segment sont reliés à ceux
des autres segments du mot. Ces formes de transition ne durent
cependant que peu de temps. Les productions vont devenir de plus en
plus adaptées.
Certes, les aspects phonétiques de la prononciation, ceux liés à la
physiologie de l'appareil vocal de l'enfant, ne disparaissent pas dans
cette réorganisation : certaines difficultés de prononcia-tion que nous
avions vues dans les cinquante premiers mots subsistent, qui parfois se
maintiendront jusqu'à quatre ou cinq ans. Les groupes consonantiques
ou la production de liquides [l] ou [r] posent pendant longtemps encore
des problèmes à certains enfants. Le dévoisement final subsiste parfois
dans les productions des enfants : il est plus facile de dire /pat/ que
/pab/. La distinction, dans « chaussette », entre les fricatives [∫] de
« chaud » et [s] de « saucisse » est une chausse-trappe articulatoire que
connaissent encore les adultes lorsqu'il s'agit de dire un peu vite : « Les
chaussettes de l'archiduchesse sont sèches, archisèches » ! Dans
l'histoire des Gaulois revue par les célèbres Uderzo et Goscinny4,
Obélix porte des menhirs et non des obélisques et pourtant son nom
prononcé par les enfants conviendrait mieux à ces derniers objets. La
prononciation de /ix/ reste une difficulté majeure pour les enfants
jusqu'à cinq ans et plus ! En outre perdurent des erreurs individuelles.
Ce n'est guère avant six-sept ans que l'organisation temporelle des traits
articulatoires rejoint celle des adultes.
Le comportement des enfants suggère une profonde réorganisation
dans le traitement du langage. Peut-on en déceler des corrélats
physiologiques ?

Le remaniement des réponses cérébrales

Grâce à nos connaissances, on peut penser qu'au cours des deux


premières années de la vie la parole est traitée selon un double
système : un traitement phonétique analytique réservé aux phonèmes et
un traitement plus global pour les mots. Selon cette hypothèse, le cours
de la maturation ainsi que le développement fonctionnel des systèmes
neuronaux impliqués ne se feraient pas au même rythme selon qu'il
s'agirait des segments et des syllabes d'une part, et du codage global de
formes sonores telles que les contours d'intonation d'autre part.
L'accroissement du vocabulaire et l'émergence de régularités dans la
production des mots, qui se manifestent entre dix-huit mois et deux
ans, résultent de l'intégration de ces deux systèmes. Le codage
« phonologique » des mots exige en effet un traitement plus spécifique
que celui des segments de parole et plus analytique que celui des
formes holistiques. L'émergence de ce mode de traitement et de codage
des mots implique-t-elle d'autres systèmes cérébraux que le codage des
formes holistiques ? L'approche neuropsychologique permet-elle de
conforter les hypothèses faites à partir de l'analyse des
comportements ?
Dans des travaux récents, D. Mills, S. Coffey et H. Neville5 ont
recherché les réponses de potentiels évoqués (ERP) à des présentations
de mots connus ou inconnus des enfants ainsi qu'à des mots dont
l'enregistrement est présenté à l'envers et qui ne correspondent donc
pas à des sons de parole. Les ERP sont recueillis sur huit sites du
cerveau : les lobes frontaux, temporaux, pariétaux et occipitaux de
l'hémisphère droit et de l'hémisphère gauche. Après avoir
rigoureusement contrôlé les connaissances lexicales des enfants
(nombre de mots compris et nombre de mots produits), les auteurs ont
séparé les enfants en groupes. Dans une première analyse, ils sont
regroupés selon l'âge. Le premier groupe comprend vingt enfants de
treize à dix-sept mois, et l'autre vingt enfants de vingt à vingt-quatre
mois. Dans une seconde analyse, le groupement se fait non plus par âge
mais en fonction du nombre de mots dont les enfants disposent.
Les réponses cérébrales aux trois types de stimuli (mots connus,
mots inconnus et mots à l'envers) se caractérisent par des séries de
déflexions positives et négatives : un pic positif (P 100), et deux pics
négatifs (N 200) et (N 350). Le pic P 100 est suscité par tous les stimuli
et correspond à la réponse acoustique aux paramètres physiques du
signal. Les pics N 200 et N 350 ne s'observent qu'avec les mots, qu'ils
soient connus ou inconnus. Ils diffèrent dans la localisation et
l'amplitude selon les groupes d'enfants. Pour les plus jeunes enfants ou
pour ceux qui produisent peu de mots, les pics négatifs N 200 et N 350
sont plus importants pour les mots connus que pour les mots inconnus,
mais cette différence d'amplitude est la même sur les deux hémisphères
et sur tous les sites. Chez ces enfants possédant un vocabulaire faible,
les réponses cérébrales sont donc semblables sur les deux hémisphères.
Il n'y a pas de latéralisation hémisphérique préférentielle pour traiter
les mots connus.
FIGURE 1 – Réponses EEG des hémisphères droit et gauche chez les
enfants de a) treize-dix-sept mois et b) vingt mois à la présentation de
mots connus ou inconnus. On voit que ce n'est qu'à vingt mois que se
marque une différence dans les deux hémisphères sur les sites pariétaux
et temporaux lors du traitement des mots connus (d'après D. Mills, S.
Coffey et H. Neville, 1993).

Les données obtenues avec les enfants qui possèdent un vocabulaire


plus étendu sont radicalement différentes. Les variations de N 200 et de
N 350 sont plus importantes dans les sites temporaux et pariétaux de
l'hémisphère gauche pour les mots connus. Ceux-ci sont donc traités
préférentiellement par l'hémisphère gauche.
Ces résultats indiquent que chez les enfants de vingt mois, les mots
compris sont traités par des systèmes spécialisés du cerveau, au niveau
du lobe temporal et du lobe pariétal de l'hémisphère gauche. Un degré
de spécialisation hémisphérique spécifique au traitement des mots
émerge donc dès vingt mois, ou après l'acquisition d'une centaine de
mots. Avant ce stade, le traitement des mots se distribue sur les deux
hémisphères.
Peut-on aller plus loin dans l'interprétation de ces données ? Nous
avons dit la prudence qui doit présider à l'extension à l'enfant des
données adultes, mais cela n'interdit pas de rechercher dans les apports
de la neuropsychologie adulte des supports aux hypothèses sur
lesquelles travaillent les psychologues et les neuropsychologues qui se
consacrent aux enfants. Les études de psychopathologie de l'adulte
montrent que l'hémisphère droit peut acquérir des mots avec leur sens,
mais ne peut utiliser activement cette connaissance. Le lexique
« statique » de l'hémisphère droit ne peut fournir la signification
complète du stimulus exigée par un lexique phonologique6. C'est le
cortex temporo-pariétal gauche qui est impliqué à la fois dans
l'encodage phonologique des mots et dans l'accès à une organisation
lexicale incluant la classe grammaticale des mots7. Les premiers
indices de focalisation, sur les sites temporaux et pariétaux gauches, du
traitement des mots connus par les enfants rendraient bien compte
d'une émergence de l'organisation d'un lexique avec composants
phonologiques et grammaticaux. Ainsi les données comportementales
qui montrent un accroissement brusque du vocabulaire, un
réaménagement de la prononciation des mots et les premières
combinaisons de mots traduisent-elles la prise en charge du traitement
de la parole par l'hémisphère gauche. En amont, la non-spécialisation
hémisphérique des tout jeunes enfants reflète un système de
représentations peu analysées, un traitement partiel des mots et un
manque de flexibilité dans leur emploi. Caractéristiques que nous
avions relevées dans le premier vocabulaire du jeune enfant.
Il y a beaucoup à attendre de la collaboration entre psycholinguistes
et neuropsychologues. Il serait intéressant de voir à quelle « mise en
service » du cerveau correspondent le début du babillage et la
production ou la compréhension des premiers mots. Mais ces études
délicates et difficiles n'ont pas encore été entreprises sur les très jeunes
enfants.
D'autres étapes comportementales, plus tardives, du développement
linguistique des enfants ont été corroborées par les études
neuropsychologiques. Ainsi, on a pu montrer que quand, vers dix ans,
les processus syntaxiques deviennent plus automatiques,
l'investissement des aires antérieures de l'hémisphère gauche pour le
traitement de phrases se fait plus important. Ces aires qui incluent l'aire
de Broca sont en effet « spécialisées » pour les traitements
automatiques des processus syntaxiques alors que le cortex (pariéto-
temporale gauche) est capable de jugements syntaxiques, mais sans les
contraintes temporelles d'un traitement rapide et automatique8.

Les premières phrases

La transition vers des combinaisons de mots se fait aux alentours de


vingt mois. On n'insistera cependant jamais assez sur la variabilité
entre enfants, particulièrement quand il s'agit de zones frontières où
l'on ne sait pas encore si l'on peut appeler « phrases » certaines
juxtapositions de mots.
FIGURE 2 – Combinaison de mots selon l'âge a) pourcentage d'enfants
combinant occasionnellement des mots b) pourcentage d'enfants
combinant fréquemment des mots (d'après Bates et al 1995).

Comme pour les premiers mots, les décalages relatifs à l'âge des
premières productions de phrases peuvent être importants. Certains
enfants forcent sur le vocabulaire avant de combiner des mots, alors
que d'autres très tôt cherchent à lier les termes. Souvent, les enfants
lents à dire leurs premiers mots se rattrapent avec des premières
phrases précoces. Cependant, à la fin de la deuxième année, la plupart
des enfants ont commencé à combiner des mots. Peut-on parler pour
autant de phrases ?
Avant dix-huit mois, on trouve, particulièrement chez les enfants
ayant un style expressif, des formules, des expressions toutes faites :
« est là », « a pas là », « c'est beau » ou « veux pas », que l'on pourrait
comptabiliser comme plusieurs mots, s'il n'apparaissait pas que ces
expressions sont apprises comme un tout. Les psycholinguistes ont
tendance à être prudents dans leurs analyses et à parler dans ce cas de
« formules » ou « d'expressions figées », et non pas de combinaisons
de mots. Cependant dès seize mois, on retrouve ces expressions
combinées avec des mots.
D'autre part, et très tôt, les enfants adjoignent souvent aux premiers
mots des particules, des éléments « neutres », tels que les /a/ et /e/ dont
les référents ne sont pas clairs. Ainsi
/a/ main (Émilie 12;17)
/a/ poire (Émilie 12;17)
/é/ chat (Marie 17;01)
/e/ poupée (Marie 19;26)
Les exemples de cette sorte sont nombreux dans les productions des
enfants entre un an et vingt mois. On pourrait être tenté de les
interpréter comme des articles ou des démonstratifs. On est, en effet,
frappé par la cohérence et la stabilité de leur emploi. Mais il se peut
tout simplement que les enfants aient codé des formes toutes faites
« article-mot » telles que [lavjo] « l'avion » ou des formes
« démonstratif-mot » [∫a] « c'est le chat ». Le fait que des mots, parfois
combinés avec des éléments que l'on a appelés neutres, se retrouvent
aussi dans le vocabulaire de l'enfant sans ceux-ci, ne prouve pas que les
marques ajoutées soient des marques indépendantes. Il s'agit peut-être
là de deux types de mots que l'enfant considère comme indépendants.
Mais même si l'on ne veut pas retenir l'idée que l'adaptation
grammaticale de l'article est déjà en cours dans la première partie de la
seconde année, on doit cependant raisonnablement considérer que ces
marques sont en passe de devenir des articles, ou des démonstratifs.

Les « phrases de deux mots » ont donné lieu dans les années
soixante-dix à une abondante littérature. Les psycholinguistes se sont
alors beaucoup intéressés aux premières combinaisons de mots. Celles-
ci se limitent la plupart du temps aux énoncés de deux termes
juxtaposés, sans articles ou prépositions. On parle de « style
télégraphique » à propos de ces productions, par analogie avec le style
des télégrammes de l'époque. Dans ceux-ci en effet, seuls étaient
conservés les mots les plus informatifs, le coût étant calculé d'après le
nombre de mots. C'était il y a vingt-cinq ans à peine, et de telles
économies relèvent d'un monde qui paraît aussi désuet que certaines
propositions sur le développement du langage à la même époque !
En s'appuyant sur la distribution des mots dans ces phrases,
d'éminents psycholinguistes tels que M. Braine9, R. Brown10,
L. Bloom11 ont mis en évidence des séquences composées de deux
classes de mots. D'une part, des mots « opérateurs » ou « pivots »,
fréquemment utilisés et rentrant régulièrement en combinaison avec un
grand nombre de termes, d'autre part, des mots faisant partie d'une
classe dite ouverte, incluant noms, verbes, etc. Cette dernière classe
s'accroît plus rapidement. Les deux principaux types de séquences qui
caractérisent le langage enfantin consistent en constructions : mot
pivot + mot de la classe ouverte, ou mot de la classe ouverte + mot de
la classe ouverte.
Les constructions mot pivot + mot de la classe ouverte telles que :
« encore gâteau »
« a pas wouah wouah »
« là nounours »
permettent à l'enfant de construire de nombreuses phrases en variant
les mots associés aux mots pivots que sont « encore », « là », « a pas »,
etc. Ce type de phrases exprime le plus souvent la présence ou
l'absence d'objets, des récurrences, des demandes ou des rejets.
Les constructions : mot de la classe ouverte + mot de la classe
ouverte telles que
« moto papa »
« mange yaourt »
« poum bébé »
expriment le plus souvent des actions, des appartenances.
La régularité et la fréquence de ces formes dans les productions des
enfants américains ont donné à penser aux psychologues des années
soixante-dix qu'il existerait une grammaire propre à l'enfant de cet âge,
indépendante de la grammaire adulte. Les principes de cette grammaire
spécifique et universelle régleraient la distribution des mots à ce stade.
Cette analyse a assez vite soulevé des réticences. Elle ne s'est révélée ni
assez précise, ni assez universelle.
La fréquence élevée et la régularité des productions de deux mots ne
se retrouvent ni chez tous les enfants, ni dans tous les groupes
linguistiques. L'ordre des mots n'est pas tant guidé par une grammaire
spécifique que par la structure syntaxique de la langue parlée dans
l'environnement. Ainsi, le bébé français dit « chaussures papa » pour
indiquer les chaussures de son père, alors que l'enfant anglais dira
« daddy shoe ». D'autre part, le rôle du composant sémantique dans
l'analyse de ces premières phrases a été sous-estimé.
L'idée d'une grammaire propre aux enfants de deux ans étant écartée,
peut-on penser à une « grammaire sémantique » ? Il est difficile d'en
poser les principes sans que la référence aux structures grammaticales
ne s'impose. En effet, si toutes les langues doivent exprimer des
structures conceptuelles de même type (tels les rapports entre l'agent et
l'objet d'une action, l'appartenance, les relations temporelles), elles
découpent ces structures en des catégories différentes et organisent les
relations entre les différents termes selon des ordres particuliers. Le
bébé, nous l'avons vu, forme des concepts avant de parler.
L'appréhension des événements extérieurs lui permet de dégager les
notions telles que celles d'agent et d'objet d'une action. Cependant, pour
pouvoir parler grammaticalement sa langue, l'enfant doit classer les
concepts qu'il a formés et les mots qui les traduisent dans des
catégories propres à sa langue, et exprimer leurs relations selon les
règles d'ordre de cette langue et donc selon la syntaxe de sa langue.
Doit-il passer par une grammaire inadéquate pour y parvenir ?
Pourquoi ne pas poser plus simplement que les enfants ont une
grammaire incomplète, mais déjà adaptée à leur langue, sur laquelle se
fonde le développement grammatical postérieur ? C'est ce que semblent
montrer les expériences sur la compréhension, et les travaux
comparatifs sur les énoncés des enfants de différents milieux
linguistiques et les récentes études des enfants bilingues.
Les expériences sur la compréhension confirment la thèse d'une
appréhension précoce des catégories grammaticales et de l'ordre des
mots. Vers seize mois, les enfants américains y sont déjà sensibles.
Testés avec les méthodes de préférence dont nous avons parlé, on les
voit aptes à associer des verbes transitifs ou intransitifs aux situations
correspondantes. Ils sont également aptes à interpréter des variations
dans l'ordre des mots, à condition toutefois que la prosodie, la syntaxe
et la sémantique des phrases concordent12-13. D'autres expériences de
L.A. Gerken14 montrent que les foncteurs (article, préposition, etc.) –
que les enfants de cet âge n'utilisent pas spontanément dans leurs
productions – leur servent cependant pour segmenter et analyser les
phrases qu'ils entendent. Ces expériences suggèrent que certaines
compétences grammaticales seraient masquées par les limitations
qu'imposent la programmation et la réalisation de la parole dans la
deuxième année.
Des études utilisant des méthodes comparatives interlangues
permettent aussi de renforcer cette thèse et montrent une précoce
adaptation des enfants aux principes structuraux de leur langue
maternelle. Virginia Valian15 s'est posé la question de savoir si, tout
jeunes, les enfants étaient sensibles à la structure des phrases et
particulièrement à la mention du sujet syntaxique. L'anglais requiert
que l'on mentionne le sujet devant les verbes, alors que l'italien ne
l'exige pas. Les phrases : Io sono bravo tato et Sono bravo tato sont
toutes deux correctes en italien alors que seule la phrase : I am a good
kid est correcte en anglais. La suppression de I rend la phrase * am a
good kid incorrecte. Les enfants américains comprennent-ils que la
mention d'un sujet est nécessaire dans leur langue ? La comparaison
des productions d'enfants américains et italiens de vingt à vingt-quatre
mois met en évidence un écart dans la proportion de sujets nominaux et
pronominaux mentionnés par les enfants. Il y a deux fois plus de sujets
nominaux ou pronominaux dans les énoncés des petits Américains que
dans ceux des petits Italiens. Virginia Valian en conclut que les enfants
américains ont commencé à apprendre, dès avant deux ans, que dans
leur langue il est nécessaire de mentionner le sujet d'un verbe.
Les plus récents travaux sur l'acquisition du langage chez les enfants
bilingues suggèrent que ceux-ci séparent les systèmes grammaticaux
des deux langues auxquelles ils sont exposés. Dès qu'ils commencent à
combiner des mots dans l'une ou l'autre langue, ils se conforment à
l'ordre propre à chaque langue16. Cette séparation précoce des systèmes
grammaticaux se confirme quand l'ordre des phrases devient plus
complexe.
Les premières phrases des petits Français

Avant vingt mois, on trouve déjà chez les enfants que nous avons
suivis de nombreuses combinaisons de mots. Les énoncés de deux mots
sont fréquents. Mais ils sont loin de rendre compte des productions de
tous les enfants de moins de deux ans.
Les combinaisons de deux mots groupent le plus souvent des mots
de types « opérateurs » avec des mots de contenu. Entre seize et vingt
mois, la plupart des exemples que nous trouvons dans nos corpus sont
ainsi composés mais le style n'en est pas pour cela nécessairement
télégraphique : les articles sont souvent présents. L'ordre n'est pas fixe,
mais varie selon les situations, tout en respectant le plus souvent l'ordre
canonique du français.
Léo, entre la fin du quinzième mois et dix-sept mois et demi, produit
des phrases telles que :
« la dame là »
« encore de l'eau »
« plus l'eau » (il n'y a plus d'eau)
« donne de l'eau »
« canard dans l'eau »
« de l'eau » (« de l'eau » ne peut être considéré comme une
expression figée car la présence d'une négation ou d'une localisation
fait disparaître l'article partitif.) On trouve aussi :
« moi là » (sur une photo)
« c'est moi »
« chapeau moi » (pour demander qu'on lui donne son chapeau)
« papa parti »
« pas là parti »
Marie, entre dix-sept et vingt mois, favorise également les formes :
opérateur avec nom de contenu. Elles sont très variées :
« nounours là »
« voilà papillon »
« y a poupée »
« c'est Grégoire »
« pots dedans »
Et l'on trouve déjà des combinaisons plus complexes :
« poupée là moi »
« où est poupée ? »
« où est chapeau ? »
« dedans on le met »
« attend elle le met »
Chez ces deux enfants, les mots isolés sont souvent précédés d'un
article ou d'une « marque » /è/ ou /a/.
On trouve peu d'exemples de combinaison de deux mots de contenu :
« bébé beau » (Charles, dix-sept mois onze jours)
« mange poupée » (la poupée mange) (Marie, dix-neuf mois
douze jours)
« moto papa » (Henri, vingt et un mois cinq jours).
À partir de vingt mois, les phrases deviennent plus structurées. Les
petits enfants français peuvent-ils apporter leur contribution pour
mettre en évidence l'adaptation à la grammaire de la langue ? Nous
allons voir que certaines structures d'énoncés sont très spécifiques aux
enfants français et sont liées à des caractéristiques grammaticales du
français parlé.
La structure d'une phrase simple en français « L'enfant mange la
pomme. » s'analyse comme le montre la figure 3 :
Au sujet syntaxique : « l'enfant », peut être substitué un sujet
pronominal : « il ».
FIGURE 3 – Structure de la phrase « L'enfant mange la pomme ».

Dans le langage parlé, et tout particulièrement dans les formes


utilisées par les adultes qui s'adressent aux enfants, la très grande
majorité des phrases est construite avec redoublement du nom par un
pronom (on parle de sujet clitique). Les sujets clitiques ne s'analysent
pas comme des sujets nominaux, mais comme des affixes de personne
et de nombre remplaçant les suffixes inflectionnels des verbes qui ont
disparu presque complètement en français actuel. Ils peuvent doubler le
sujet lexical. Ainsi des énoncés tels que : « Maman, elle t'a acheté un
joli seau pour jouer sur la plage. » « Elle a de l'allure, cette voiture. »
Les hommes politiques utilisent souvent cette forme. Laurent Fabius en
abusait dans ses discours « Les Français, ils n'accepteront plus que… »,
« Elles veulent enfin voir leurs droits reconnus, les femmes. » Ces
formes sont, quoique peu esthétiques, très habituelles dans la langue
parlée : elles permettent de positionner plus nettement le thème du
discours avant de faire le commentaire qui s'y rapporte.
Chez les enfants français, la structure du syntagme verbal (SV :
verbe plus objet) est, dès le début, la même que chez les adultes :
« mange yaourt », « donne de l'eau ». Le nom ou le syntagme nominal
indiquant le sujet est le plus souvent laissé en position post-verbale.
Dans ce cas, le verbe est parfois précédé d'un clitique ou d'une marque
indiquant le pronom :
« mange poupée » (la poupée mange) (Marie, dix-neuf mois
douze jours)
« e(il ou elle) pleure bébé » (le bébé pleure) (Henri, vingt-
deux mois)
« e(lle) pique a jambe Cécile » (Cécile pique ma jambe) (Manon,
vingt et un mois).
Un nombre important de sujets postverbaux, sujets clitiques omis ou
non, est très caractéristique dans les premières phrases des enfants
français.
Pour mieux illustrer l'évolution des phrases à la fin de la deuxième
année, nous vous présentons Manon17 : elle est âgée de vingt et un
mois et vingt jours au début des enregistrements et de vingt-deux mois
et vingt jours à la fin de ceux-ci. Lors des séances d'enregistrement,
nous avons recueilli plus de quatre-vingts énoncés de plusieurs mots.
Manon a compris qu'elle était enregistrée et s'est montrée très loquace.
Le magnétophone utilisé est un appareil dont on voit tourner la bande.
Un jour, Manon s'arrête net de parler en prenant un air pincé ; j'insiste
pour continuer la conversation. Elle me montre le magnétophone en
disant : « a tourne plus ! » Vedette avant l'heure, Manon, petite fille de
vingt-deux mois, parlait pour être enregistrée ! Ce désir de vedettariat
en fait un excellent sujet. Ses nombreuses productions représentent un
bon échantillon des énoncés qu'un enfant français de moins de deux ans
peut produire. Naturellement, Manon, assez précoce pour parler, ne
constitue qu'un exemple parmi d'autres, mais les analyses menées sur
les productions d'autres enfants du même âge permettent de voir que
ses formes « préférées » sont très courantes chez ses petits
compatriotes.
Pour indiquer une action ou un état et son agent, Manon, comme
beaucoup d'enfants français, tend à mettre en premier le verbe, précédé
ou non par un pronom ; le nom d'agent est en position finale.
Lorsqu'il s'agit d'une phrase commençant par le verbe être, le clitique
est généralement omis :
« est gentille jaquie »
« est gentille la tortue »
« est là le loulours »
« est bon le yaourt »
On trouve quelques rares exceptions où le clitique est mentionné
avec le verbe être :
« là i(l) est loulours ».
Le pronom (clitique) est présent – avec un sujet nominal postposé –
dans le cas de verbes d'action :
« elle pique Cécile » (Cécile est l'agent et non l'objet)
« i(l) a tombé le camion »
Avec les verbes intransitifs, seul le clitique est mentionné :
« entend, elle parle »
« mais e(lle) tourne, e(lle) tourne regarde ! ».
À la fin du vingt-deuxième mois, le sujet syntaxique est antéposé, et
accompagné d'un clitique dans quelques phrases construites avec des
verbes intransitifs :
« le chat i(l) joue la balle »
« ça tourne là ».
Le pronom « je » est toujours antéposé :
« je vois le chat »
« je veux pas ».
Le syntagme verbal est fixe, avec le complément d'objet qui suit
toujours le verbe :
« elle pique à jambe »
« mange ma beurre le cuillère » (je mange mon beurre avec une
cuillère)
« veux un bonbon mamie ».
Dans les phrases négatives incluant un verbe, « pas » suit toujours le
verbe, comme avec les modaux « vouloir » et « pouvoir » :
« non, veux pas »
« peux pas (at)traper »,
ou dans les injonctions :
« (re)garde pas Cécile » (Cécile ! ne regarde pas).
Nous avons vu que les éléments /a/ et /e/ devant des noms
s'observent dès quatorze-quinze mois. Mais, entre vingt mois et deux
ans, la plupart des enfants commencent à marquer le genre et le
nombre. Les noms sont précédés d'articles définis, indéfinis ou
possessifs, comme on le voit dans les phrases de Manon. Cependant,
chez celle-ci, les articles définis et indéfinis sont toujours au singulier.
« veux un bonbon »
« y a pas là la balle »
« encore là plus là le beurre »
« est bon le yaourt ».
On voit des erreurs ou des fluctuations de genre :
« a pas là le balle »
« mange ma beurre le cuillère ».
Alors que, dans certaines phrases précédentes, Manon avait bien dit
« la balle » ou « le beurre », elle utilise cette fois le possessif « ma »
devant beurre, et met « le » devant cuillère et balle.
Chez les enfants français, le nombre est le plus souvent spécifié très
tôt, au moyen de la forme : /ade/ (a deux). Cette forme se retrouve,
avant deux ans, chez de très nombreux enfants.
Marie (dix-neuf mois), en rajoutant des petits pots, dit :
« a de(ux) e(lle) le met ».
On est loin, avec Manon, de pouvoir généraliser une approche en
style dit télégraphique. Ces fameuses phrases de deux mots qui font
dire à D. Bickerton18 – dans son désir d'assimiler phylogénèse et
ontogénèse – que les premières combinaisons de mots sont une forme
de protolangage du type de celui que peuvent acquérir les chimpanzés !
Les phrases des enfants de vingt à vingt-quatre mois se distinguent de
celles de Washoe, le chimpanzé auquel avait été enseignée la langue
des signes, ou de celles de ses congénères auxquels on avait tenté
d'apprendre à s'exprimer de façon « humaine ». Les phrases des enfants
entre vingt et vingt-quatre mois ont un ordre cohérent, non aléatoire,
les articles et les marques de genre sont nombreux, on y trouve des
régularités révélant des constructions spécifiques en fonction de
catégories linguistiques. Chez Manon, la position du complément
d'objet ou celle de la négation de verbe avec « pas » sont conformes au
français et bien respectées par l'enfant. En bref, les premières phrases
manifestent une adaptation grammaticale à la langue de
l'environnement.
L'enfant de moins de deux ans peut aussi exprimer des différences
sémantiques subtiles. Ainsi, Manon, à vingt mois, dit : « a pas
nounours » ou « a pas balle », quand ces objets ont disparu, mais : « a
plus musique » ou « a plus toc-toc », quand cessent la musique ou un
bruit, manifestant déjà une distinction entre la cessation de « présence
» et celle de « processus ». « A pas » et « a plus » ne sont pas pour elle
des formes identiques sémantiquement mais correspondent à des
différences dans l'ordre de la « non-existence ». Elles sont
judicieusement utilisées en fonction de la situation.

Comme on le voit, les productions des enfants de deux ans révèlent


des connaissances grammaticales importantes. Certes les règles
manifestées sont incomplètes, partielles, parfois personnelles, mais en
accord avec les formes adultes. On ne trouve pas à cet âge des phrases
complexes du type : « maman a mis le chapeau de papa pour aller à la
plage », mais quand il voudra exprimer cela, l'enfant respectera un
ordre cohérent des mots, même s'il omet certains d'entre eux. Les
limitations dues aux difficultés de réalisation masquent les
compétences réelles de l'enfant, mais laissent transparaître des
principes adaptés aux grammaires adultes. Ainsi les études
comparatives des premières phrases d'enfants de milieux linguistiques
différents confirment-elles bien l'idée que l'enfant a commencé à
relever certains principes grammaticaux de la langue adulte.
Quelques psycholinguistes ont même avancé que l'enfant – tel la
déesse Athena sortant tout armée de la cuisse de Jupiter – naîtrait « tout
armé » de connaissances linguistiques. Il découvrirait l'ordre canonique
des mots dans les phrases de sa langue maternelle à partir de la
reconnaissance des relations grammaticales. Cette connaissance
immédiate lui permettrait de définir sa langue maternelle comme une
langue à ordre : sujet, verbe, objet, ou comme une langue à ordre :
sujet, objet, verbe. D'autres psycholinguistes se montrent moins
généreux et postulent des connaissances linguistiques moins fortes.
Dans ce cas, l'aide des catégories sémantiques serait nécessaire pour
construire les catégories syntaxiques. Pour tous, il semble cependant
acquis que la grammaire des enfants est de même nature que la
grammaire des adultes bien qu'ils ne réalisent pas dans leurs
productions tous les principes qui régissent cette dernière. À partir de
cette grammaire très incomplète, mais non incorrecte, de la deuxième
année, se fonde le développement grammatical rapide qui caractérise
les acquis linguistiques de la troisième année. Au cours de celle-ci, la
longueur, la complexité et la variété des phrases de l'enfant augmentent
très rapidement, justifiant l'expression de Steven Pinker19 qui qualifie
l'enfant de trois ans de « génie grammatical ».
Ainsi, depuis que, nouveau-né, il vagissait dans son berceau, notre
enfant a-t-il fait bien des progrès. En deux ans, grâce aux dons qu'il a
reçus en tant qu'être humain et à l'impulsion donnée par
l'environnement linguistique, il a appris à traiter les sons qui
constituent la parole, à les produire, à en relever l'organisation et à en
découvrir le sens. Nous ne suivrons pas la progression rapide du « petit
génie grammatical » de trois ans, et laisserons au seuil de sa troisième
année un enfant auquel la parole est venue.

1 Ferguson C.A. & Farwell C.B., « Words and sounds in early language acquisition »,
Language, 51, 1975, p. 419-439.
2 Macken M., « Developmental reorganization of phonology », Lingua, 49, 1979, p. 11-49.
3 Menn L., « Phonotactic rules in beginning speech », Lingua, 26, 1971, p. 225-241.
4 Uderzo et Goscinny, Série des Astérix.
5 Mills D.C., Coffey S.A. & Neville H.J., « Changes in cerebral organization in infancy
during primary language acquisition », in G. Dawson & K. Fischer (Eds.), Human Behavior and
the Developing Brain, New York, Guilford Publications, 1993.
6 Hannequin D., Goulet P. & Joanette Y., Hémisphère droit et langage, Paris, Masson,
1987.
7 Caramazza A. & Hillis A.E., « Lexical organization of nouns and verbs in the brain »,
Nature, 349, 1991, p. 788-790.
8 Friederici D., « Development of language relevant processing systems : The emergence of a
cognitive module », dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage &
J. Morton (Eds.), Developmental neurocognition : Speech and face processing in the first year of
life, Dordrecht, Kluwer Academic Publishers, 1993.
9 Braine M. D.S., « The ontogeny of English phrase structure : The first phase », Language,
39, 1963, p. 1-14.
10 Brown R., A First Language, Cambridge (Mass.), Harvard University Press, 1973.
11 Bloom L., Language Development : Form and Function in Ermerging Grammars,
Cambridge, Mass., M.I.T. Press, 1970.
12 Golinkoff R.M. & Hirsh-Pasek K., « Reinterpreting children's sentence comprehension :
Toward a new framework », dans P. Fletcher et B. MacWhinney (Eds.), The Handbook of Child
Language, Oxford (UK) et Cambridge (USA), Basil Blackwell, 1995.
13 Hirsh-Pasek K. & Golinkoff R.M., « Language comprehension : A new look at some old
themes », dans N. Krasnegor, D. Rumbaugh, M. Studdert-Kennedy & R. Schiefelbusch (Eds.),
Biological and Behavioral Aspects of Language Acquisition, Hillsdale, NJ, Lawrence Erlbaum
Associates, 1991, p. 301-320.
14 Gerken L.A., Landau B. & Remez R.E., « Function morphemes in young children's speech
perception and production », Developmental Psychology, 27, 1990, p. 204-216.
15 Valian V.V., « Syntactic subjects in the early speech of American and Italian children »,
Cognition, 40, 1991, p. 21-81.
16 Meisel J.M., « Parameters in Acquisition », dans P. Fletcher & B. MacWhinney (Eds.),
The Handbook of Child Language, Oxford, Basil Blackwell, 1995, p. 10-35.
17 Une analyse des phrases négatives produites par Manon a été présentée dans B. de
Boysson-Bardies, Négation et performance linguistique, Paris-La Haye, Mouton, 1976.
18 Bickerton D., Language and Species, Chicago, The University of Chicago Press, 1990.
19 Pinker S., The Language Instinct, New York, William Morrow and Company, 1994,
p. 265.
CONCLUSION

« Si dans la suite de l'âge ils paraissent sans conduite et presque


sans raison, il faut considérer que c'est la connaissance des
affaires et tous les sujets sur lesquels ils doivent raisonner qui leur
manque plutôt que la raison. Joint à cela que les coutumes du
monde, qui en font toute la sagesse, sont souvent si contraires à ce
que la nature bien ordonnée exigerait des hommes que ceux qui
naissent ont besoin de vivre plusieurs années pour apprendre des
choses si éloignées de ce que la nature enseigne. »
GÉRAUD DE CORDEMOY

Devant son nouveau-né, la mère pense plus à rechercher un contact


physique et affectif qu'à imaginer les programmes biologiques et
cognitifs qui vont conduire son développement. La parole vient, plus
tard, si naturellement, qu'on ne s'étonne pas d'entendre les premiers
babillages puis les premiers mots des enfants ; on s'en réjouit, on s'en
amuse, on les sollicite, mais tout cela semble si naturel. Si naturel en
effet, puisque l'homme est doué du pouvoir de parler.
La petite merveille dont la mère admire la délicatesse et le corps
parfait en la recevant dans ses bras est aussi dotée d'un esprit destiné à
lui permettre de décoder le monde dans lequel elle vit. Si son conduit
vocal n'est pas encore prêt à produire des sons de parole, depuis deux
mois déjà son écoute y est sensible et son cerveau préparé.
Au cours de la phylogenèse s'est construit un système géné-tique qui
contient une grande part de connaissance. Notre conscience et notre
intelligence sont conçues comme un prolongement de l'adaptation
biologique en ce sens qu'elles s'incarnent dans un noyau de
prédispositions génétiquement transmises. Sans cette sorte de
préadaptation, sans des connaissances implicites sur les formes de base
qui sous-tendent toutes les langues humaines, l'apprentissage du
langage et de la parole serait impossible.
Peut-on montrer que cette préadaptation existe et si oui sous quelle
forme ? Telles ont été les deux questions qui ont conduit les recherches
des psycholinguistes cognitifs depuis les années soixante-dix. Pour
répondre à ces questions, on a recherché s'il existait des mécanismes
très précoces et très spécifiques pour traiter les sons de parole. Puis
l'étude s'est portée sur la recherche des processus de catégorisation et
de sélection qui organisent le traitement du langage. On a enfin dégagé
la cohérence entre les comportements langagiers des enfants et les
principes généraux qui commandent la forme des langues tels que les
linguistes ont pu les définir.
Pour toutes ces études une approche expérimentale s'est imposée.
Les méthodes fondées sur l'observation des bébés révèlent certes
beaucoup sur leurs comportements et leur évolution ainsi que sur
certains fonctionnements de leur pensée mais elles ne permettent pas
de dégager les processus sous-jacents au traitement du langage. Nous,
adultes, ne sommes pas conscients des processus qui permettent à une
onde acoustique de se transformer dans notre esprit en une phrase
porteuse de sens. Les processus inconscients qui permettent cette
transformation doivent être étudiés par des moyens indirects. Pour
essayer de comprendre le pourquoi et le comment de processus
inconscients qui fondent le traitement de la parole lors de son
acquisition et qui, plus tard, seront intégrés dans le traitement
« automatique » de la parole chez les adultes, la psychologie cognitive
a recours à des vérifications expérimentales ou analytiques
d'hypothèses issues de modèles théoriques. Cette approche se refuse à
toute explication n'entraînant pas des énoncés susceptibles d'être
vérifiés. Cela la conduit à écarter les interprétations fondées sur des
observations générales, sur l'attribution de désirs souvent mal définis
ou sur des refoulés d'histoires personnelles. Non que certaines
inférences à partir de ce type de représentations n'aient parfois une
certaine réalité, non qu'elles ne puissent servir à amorcer des
réflexions, mais elles ne sont ni vérifiables ni généralisables
directement et ne peuvent de ce fait asseoir une démarche valable pour
vérifier les bases des mécanismes et des processus qui déterminent
cette faculté qu'est le langage.
Il faut cependant nuancer ces propos. Cette quête de l'universel qui
fonde les travaux sur les capacités de l'homme pour le langage se
heurte très vite au fait que l'acquisition du langage est un processus
interactif. Aussi, à partir de fondements communs, le cours du
développement sera très tôt soumis à la variabilité des langues, des
modes de transmission et à celle, plus subtile, des tempéraments.
Dégager les principes, aussi bien que les régularités de comportements,
ayant une portée universelle ne peut se faire en généralisant des
données expérimentales trop restreintes, qu'il s'agisse des sujets ou des
environnements linguistiques. Des études comparatives s'avèrent alors
indispensables, aussi bien pour vérifier ce qui, sous les variations
individuelles, linguistiques et culturelles, relève de l'universel, que pour
comprendre le système d'acquisition dans sa flexibilité et dans ses
variations possibles. Les psycholinguistes se proposent de découvrir les
régularités imposées par les structures innées. Mais ils souhaitent aussi
montrer les marges de liberté et de créativité accordées à l'espèce
humaine dans ses possibilités de choix, d'invention et d'imagination. Il
y a bien du nouveau dans la connaissance que nous avons acquise sur
les premières années de l'enfant mais il reste encore beaucoup à
découvrir. Et même si l'on parvient un jour à cerner ce qui fonde
l'aptitude au langage chez les humains, il restera, toujours mystérieuse,
la part qui jaillit, magique, charmante, poétique, triste ou drôle des
babils, des mots et des propos de nos petits enfants. Mais cela sera le
travail des poètes !

À la naissance, le cerveau est préparé pour le langage parlé, mais les


expériences subjectives et les états de conscience du bébé sont encore
bien rudimentaires. La conscience s'érige à travers les expériences
issues de la perception, de la mémoire, de la formation des concepts,
des interactions avec les autres ainsi que des relations entre ces
expériences. Au cours de la première année, la fonction symbolique,
les capacités de représentation et la conscience de soi conduisent à
dépasser, à structurer les connaissances premières. L'enfant va
imaginer, redécouvrir, réinventer. Le concours du langage, dans sa
double fonction de maniement de la pensée et de vecteur de
communication, deviendra de plus en plus essentiel, marqué par le
désir d'apprendre et de connaître les faits de culture. Pris dans un
processus de socialisation, l'enfant aura aussi à se conformer à des
attentes parentales, à s'initier aux modes de parler de son milieu
culturel. Ces contraintes culturelles, comme le remarquait déjà Géraud
de Cordemoy, l'entraînent loin des seules « choses enseignées par la
nature ».
Il faut – et il y a – des différences pour faire un enfant humain. Pour
chaque individu, les sensations, les perceptions, les expériences vécues
suivent un cours différent, relevant à la fois du hasard et de recherches
conscientes. À travers les interactions culturelles et linguistiques,
l'esprit crée certains aspects de la réalité. Très vite l'imagination et la
diversité sous-tendent les comportements des différents enfants et des
enfants de diverses cultures. Au cours de la troisième année, la
diversité formelle des énoncés s'atténuera cependant tandis qu'ils
deviendront plus « grammaticaux » et plus semblables au fur et à
mesure que les enfants parleront plus correctement leur langue. Mais
resteront et s'accentueront la diversité des modes d'expression et celle
des contenus. L'une des caractéristiques les plus frappantes du langage
est la créativité qu'il autorise. Lorsque s'accroît le degré de conscience
et une individualité plus évoluée, cette créativité devient quasiment
illimitée. Certes tous les enfants ne seront pas des Mozart, des Léonard
de Vinci ou des Newton, mais chacun épanouira la personnalité qu'il
nous a été loisible d'entrevoir dès ses premiers mots. L'expérimentation
nous a permis de découvrir un bébé bien programmé pour la parole,
mais quoique cette méthode reste l'approche privilégiée pour l'étude du
développement du langage, elle trébuche parfois lorsque le caractère,
l'imagination et l'humour rendent plus complexe la personnalité de
l'enfant tout au long de son développement.
Les premiers mots naissent de ce qu'ils ont été entendus. Les
mystères de l'écoute et les projections de l'adulte transforment la parole
des enfants. Les recherches nous apprennent combien ceux-ci sont
doués pour apprendre à parler, et combien sont robustes, quand ils sont
biologiquement intacts, les mécanismes d'apprentissage. Elles nous
apprennent aussi combien sont normales des variations importantes
dans le rythme et les formes de développement du langage. Si les
parents et les éducateurs doivent être attentifs aux écarts, ils doivent
veiller à ne pas être trop normatifs. Des analyses fines de l'évolution
des processus de traitement de parole, ainsi que celles des principes
impliqués dans l'acquisition de la syntaxe et de la morphologie au cours
des années qui vont suivre, sont essentielles si l'on veut mieux
comprendre les troubles de l'acquisition de la parole et du langage.

Nous avons laissé au seuil de la troisième année un enfant auquel la


parole est venue mais qui a encore beaucoup à apprendre. Équipé de la
grammaire universelle, il « s'engage » plus avant dans le décodage de
la grammaire de sa langue, qui, quelle qu'elle soit, présente de
nombreuses subtilités, expressions de genre et de nombre, d'aspects et
de temps des verbes, de flexions, de relations. L'enfant de trois ans
saura y faire face et déjouer l'écheveau des régularités particulières de
son langage, avec certes des essais et des erreurs, mais au total une
étonnante maestria. Cette aventure est une autre et passionnante
histoire que je laisserai d'autres vous raconter.
Tableau récapitulatif des principales étapes
du développement de la parole entre zéro et
deux ans
GLOSSAIRE

Accent (accent tonique, stress en anglais)


Marque d'énergie acoustique plus grande sur un élément ou sur une
syllabe d'un mot avec effet de saillance perceptive. Dans les langues à
stress, l'accent a une valeur linguistique, son emplacement détermine le
sens du mot : « canto » en espagnol, avec accent sur la première syllabe
signifie « chant », sur la deuxième syllabe « il chanta ». L'anglais est
une langue à stress ou accent.
Accès au lexique
Processus selon lequel un son ou une suite de sons conduisent à la
représentation d'un mot stocké dans un lexique mental.
Adverbe
Mot invariable qui précise le mode ou le temps d'une action ; exemple :
« rapidement », « tard », etc.
Affixe
Élément pouvant être rattaché avant (préfixe) ou après (suffixe) le
radical d'un mot pour en préciser le sens ou la fonction. Ainsi dans
« prédire », construit avec pré (avant) et dire, et « prévisible » où le
suffixe « ible » indique qu'il s'agit d'une possibilité.
Alphabet phonétique international
(IPA en anglais : International Phonetic Alphabet) Système de
classement et de transcription international des voyelles et des
consonnes en fonction de leur type d'articulation ; il permet en principe
de transcrire de façon homogène toutes les langues du monde.
Amplitude
Mesure du déplacement maximum des molécules de l'air dans l'onde
sonore en fonction de l'énergie de vibration des cordes vocales.
Analyse acoustico-phonétique
Étude des paramètres acoustiques (énergie et fréquence de l'onde
sonore) et phonétiques (identification des phonèmes : consonnes,
voyelles) dans une production sonore.
Aphasie
Trouble ou perte de la parole (en compréhension ou en production) à la
suite d'une lésion des zones du cerveau impliquées dans le langage
(après hémorragie, accident, traumatisme…).
Article
Mot placé devant un nom, qui sert à le déterminer et le marquer en
genre et en nombre : « un » « la » « des », etc.
Articulateurs
Ensemble des structures et des muscles qui, par leur déplacement ou
leur mouvement, modifient le trajet de l'air dans le conduit vocal (v.
conduit vocal) et permettent ainsi de former des sons différents : ce
sont la langue, les lèvres, les mâchoires, le voile du palais, la paroi
postérieure du pharynx.
Attaque
Qualité du premier son d'une syllabe (ou d'un mot) donnée par la
consonne ou le groupe consonantique précédant la voyelle.
Axone
Prolongement de la cellule nerveuse ; il transmet l'information du
neurone.
Behaviorisme
École de psychologie qui étudie le comportement et l'explique avec des
lois de conditionnement stimulus-réponse. Dans sa version radicale, le
behaviorisme nie l'existence d'états mentaux, dans la version
méthodologique, il les considère comme trop difficiles à étudier et se
concentre sur l'étude des comportements. Influente dans les années
vingt à trente, cette école l'est moins actuellement.
Bilabiale (consonne)
Consonne pour la prononciation de laquelle les deux lèvres se
réunissent : b, m, p…
Catégorisation
Opération de classement des sons dans une catégorie illustrée par un
prototype. La catégorisation perceptive permet ainsi de reconnaître une
même voyelle ou même une consonne par-delà les différences de
réalisation.
Co-articulation
Recouvrement de gestes articulatoires lors de la production de
segments successifs – parfois même non successifs – dans un énoncé.
Ces recouvrements ont des effets d'anticipation ou de persévération.
Cognition
Domaine des représentations et des processus qui permettent la
connaissance, comme la perception, le langage, la mémoire, le
raisonnement.
Conduit vocal (ou tractus vocal)
L'ensemble des cavités par où passe l'air des poumons émis au niveau
de la glotte et du larynx. Tout d'abord le pharynx puis les cavités orale
et nasale séparées par le palais dur et le voile du palais dans l'arrière-
gorge qui se termine par la luette dans le haut du pharynx. Le conduit
vocal comprend d'autres « articulateurs » qui modifient la forme des
espaces où arrivent les vibrations de l'air : la mâchoire, les lèvres, la
langue.
Consonne
Phonème produit avec blocage partiel ou total du tractus vocal. On
classe les consonnes selon leur point d'articulation (labiales, dentales,
vélaires…) et leur mode d'articulation (fricatives, occlusives…). Elles
peuvent être voisées, ex. : [b], [m] ou non voisées, ex. : [p], [t], [k] (v.
labiale, dentale, vélaire, latérale, fricative, occlusive, nasale, liquide,
voisement).
Contenu (mot de)
Classe syntaxique des mots tels que : noms, verbes, adjectifs, adverbes
et quelques prépositions qui expriment des concepts particuliers dans
une phrase, par opposition aux mots foncteurs (articles, conjonctions,
auxiliaires, pronoms) qui ne font que préciser l'information donnée par
les mots de contenu.
Contour Fo
Contour d'intonation donné par les variations de la fréquence
fondamentale (notée Fo), degré de hauteur de la voix dans une
production sonore.
Cortex
Tissu externe des hémisphères cérébraux constitué des corps des
cellules nerveuses les plus évoluées dans l'échelle des espèces les
neurones.
Décibel
Mesure de l'intensité d'un son, c'est-à-dire de l'amplitude des variations
de la pression de l'air qui le forment. C'est une mesure relative, rendant
compte du rapport d'intensité entre deux sons.
Délai de voisement
Délai qui s'écoule entre la constriction du tractus vocal pour la
production d'une consonne et la reprise du voisement après le
relâchement de cette fermeture. Cette reprise plus ou moins rapide du
voisement constitue un indice acoustique qui permet de distinguer les
consonnes voisées, ex. : [b], [d], [g] des consonnes non voisées, ex. :
[p], [t], [k].
Démonstratif (pronom)
Pronom qui sert à désigner ou représenter un nom, un objet, une idée :
ce, cette, ceci, ça.
Dentale (consonne)
Consonne pour la production de laquelle la pointe de la langue est
amenée au contact de la face postérieure des dents de la mâchoire du
haut : [t] ou [d].
Dichotique (écoute)
Technique expérimentale qui consiste à présenter deux sons différents,
un dans chacune des oreilles ; cette méthode permet d'observer
l'asymétrie fonctionnelle dans le traitement par le cerveau des sons du
langage (ou de la musique, etc.), chaque oreille étant mieux connectée
avec l'hémisphère cérébral opposé.
Discrimination
Capacité de distinguer entre deux stimuli.
Diphtongue
Son vocalique qui change entre son début et sa fin, comme dans
« cow », ou « buy », en anglais ; il n'existe pas de diphtongues en
français.
Distinctif (trait)
Le système des traits distinctifs est constitué de l'ensemble des traits
acoustiques qui permettent de distinguer un son d'un autre selon un
critère qui les oppose ; ainsi un son peut être voisé ou non voisé (b/p),
nasal ou non nasal (m/p).
Embryogenèse
Formation et développement de l'embryon.
Empirisme
Approche pour étudier la pensée et le comportement qui met l'accent
sur l'apprentissage et l'influence de l'environnement aux dépens des
structures innées.
Endogènes (signaux)
Qui viennent de l'intérieur, de l'organisme lui-même ou du système.
Engramme
Trace laissée dans le cerveau par un événement du passé.
Entrée lexicale
Ensemble des informations sur un mot particulier (forme sonore, sens,
marques syntaxiques) codées dans le lexique mental.
Exogènes (signaux)
Qui prennent naissance hors de l'organisme ou hors du système.
ERP
« Event related potential », en français « potentiel évoqué », mesure de
l'activité électrique des neurones d'une région du cerveau en réponse
immédiate à une stimulation auditive (ou visuelle) grâce à des
électrodes posées sur le crâne.
Espace vocalique
Espace donné sur un diagramme par la mise en relation des fré-quences
des deux premiers formants (régions de haut degré d'énergie
acoustique) des voyelles d'une langue.
Flexion
Élément d'un mot qui s'ajoute à la racine pour remplir une fonction
syntaxique : flexion nominale dans les langues où le nom se décline (le
latin), flexion verbale pour la conjugaison des verbes.
Formants
Zones de fréquence où se concentrent les principaux degrés d'énergie.
On considère que les trois premiers formants sont importants pour la
perception et l'identification d'une voyelle.
Fréquence fondamentale ou Fo
Fréquence de vibration des cordes vocales, qui donne la hauteur de la
voix. Plus les cordes vocales vibrent vite, plus la hauteur (ou pitch) est
élevée. Les variations d'intonation correspondent à des variations de la
fréquence fondamentale.
Fricative
Consonne dans laquelle l'obstruction de l'air par la langue est partielle,
ce qui produit un bruit de friction ; exemple : v, f, s, ch…
Glide (semi-voyelle)
Son du langage qui se situe entre la consonne et la voyelle.
Glotte (coup de)
Son produit par le resserrement étroit des cordes vocales l'une contre
l'autre produisant un blocage complet du flux de l'air au niveau de la
glotte (espace entre les cordes vocales).
Grammaire universelle
Principes grammaticaux sous-jacents à toutes les langues du monde.
Depuis N. Chomsky on considère que ce schéma, appliqué aux
données spécifiques que reçoit l'enfant, détermine la forme de la
grammaire susceptible d'émerger c'est-à-dire la grammaire de la langue
maternelle de l'enfant.
Harmonie
– consonantique :
on parle d'harmonie consonantique dans un mot de la langue adulte ou
du langage enfantin lorsque dans un mot de deux syllabes (ou plus) il y
a répétition de la consonne de la syllabe précédente ou suivante :
exemple dans les mots d'enfants « papin » pour « lapin ».
– vocalique :
assimilation de la voyelle d'une syllabe d'un mot à la voyelle de la
syllabe qui précède ou qui suit. On observe de telles déformations dans
l'évolution de la langue adulte ou dans la production par un enfant d'un
mot de sa langue (« assa » pour assis).
Hauteur (pitch)
La hauteur d'un son de la parole est déterminée par la fréquence de
vibration des cordes vocales : la fréquence fondamentale Fo (pitch) qui
se mesure en hertz.
Intensité
L'intensité ou la puissance sonore est liée à l'amplitude de la vibration
de l'air, c'est-à-dire à l'énergie transmise le long de l'onde sonore. Elle
est mesurée en décibel.
Intonation
Mélodie ou contour de la hauteur de la voix qui accompagne la
production de la parole. Elle peut avoir, selon les langues, un rôle de
discrimination syntaxique (distinguer une affirmation d'une
interrogation, etc.) ou lexicale (langues à tons).
I.P.A. International Phonetic Alphabet (v. Alphabet Phonétique
International).
IRM
Imagerie cérébrale par résonance magnétique : mesure fondée sur
l'étude du débit sanguin cérébral (soit par injection intraveineuse d'un
traceur intravasculaire de contraste, permettant de mesurer le volume
sanguin cérébral, soit en utilisant des séquences d'acquisition ultra-
rapide, sensibles à la concentration cérébrale de désoxyhémoglobine,
permettant de détecter les variations tissulaires après « activations »
cérébrales).
Langue à tons
Langue dans laquelle les différences entre tons (haut ou bas, montant
ou descendant) des syllabes ont une fonction linguistique. En chinois
par exemple, « ma », selon la direction du ton qu'il porte, peut signifier
« la mère », « le cheval », « le chanvre » ou « insulter ».
Larynx
Organe essentiel de la phonation, situé en haut de la trachée artère ; il
contient les cordes vocales (attachées à deux petits car-tilages) qui
ouvrent et ferment la glotte et provoquent ainsi une vibration régulière
de l'air venu des poumons.
Lexique
Dictionnaire ou plus particulièrement lexique mental, consistant en
l'ensemble des représentations phonologiques, syntaxiques et
sémantiques des mots qui constituent la connaissance intuitive de ces
mots chez le locuteur.
Liquide
Consonne voisée produite avec obstruction seulement partielle de l'air
dans la bouche ; le groupe des liquides comprend les latérales [l] et les
[r] où l'air passe des deux côtés de la bouche.
More
Unité phonétique de temps dans la langue japonaise qui forme la base
du rythme pour la prononciation de cette langue : elle peut
correspondre à une voyelle courte, à une consonne nasale, à un
allongement vocalique, au redoublement d'une consonne. Ainsi
« Nippon » (Japon), en japonais, se divise en quatre mores [ni p po n]
et donc prend autant de temps à prononcer que « kakemono ».
Morphème
Plus petite unité de signification dans laquelle les mots d'une langue
peuvent être découpés (ceci incluant l'élément grammatical signifiant
d'un mot, la terminaison d'un verbe, ou la marque du pluriel des noms,
la désinence d'un adverbe ; exemple : le -ment de « gentiment », etc.).
Morphologie
Étude des règles de formation des mots : elle permet de décrire la
structure interne des mots et les relations de parenté entre les mots, ex :
fuir fuyant fugace, fugue.
Nasale
Consonne prononcée avec abaissement du voile du palais, ce qui
permet à l'air de passer par le conduit nasal ; exemple : [m] ou [n].
Noyau vocalique
Partie de la syllabe constituée d'une voyelle (ou d'une diphtongue) et
dans laquelle est concentrée une grande partie de l'énergie.
Neurones
Cellules du système nerveux c'est-à-dire du cerveau, de la moelle et des
nerfs. Ils traitent l'information.
Occlusive (consonnes)
Consonne prononcée avec obstruction complète de l'air dans la cavité
buccale. Selon le point de fermeture, il peut s'agir d'une occlusive
labiale [b], dentale [t], vélaire [k].
Ontogenèse
Développement de l'individu, depuis la fécondation de l'œuf jusqu'à
l'état adulte.
Perception catégorielle
Forme de perception qui consiste à identifier des objets ou des
événements en termes de catégories perceptives auxquelles ils
appartiennent et à ignorer les variations acoustiques intra-catégorielles
(v. catégorisation).
Périodique
Se dit d'un son basé sur des vibrations périodiques de l'air ; les sons du
langage peuvent être périodiques lorsqu'il y a vibration des cordes
vocales au niveau de la glotte (voyelles, consonnes voisées), ou
apériodiques : expirations, turbulences de l'air aux points de
resserrement du conduit vocal (consonnes occlusives : p, t, k,
fricatives…).
Phonation
Émission des sons du langage par un ensemble de mécanismes incluant
le mouvement respiratoire adapté à la parole ainsi que la vibration des
cordes vocales et la modulation de la voix dans les résonateurs du
conduit vocal.
Phonème
1. Unité de son qui forme les mots. 2. Unité de son contrastive dans
une langue ; deux sons sont des phonèmes distincts quand leur
différence phonétique véhicule des sens différents, ainsi fou/sou,
bon/pont.
Phonétique
Étude et classification de la manière dont les sons du langage sont
articulés et perçus.
Phonologie
Composant de la grammaire qui inclut l'inventaire des sons d'une
langue et les règles gouvernant leur combinaison.
Phonotactique
Ensembles des règles d'agencement des séquences phonologiques
commandant la structure des mots dans une langue ; par exemple une
terminaison en /sd/, ou un mot commençant par /vlt/ ne sont pas
possibles en français.
Phylogenèse
Mode de formation des espèces, développement de l'espèce.
Pitch (v. hauteur)
Plasticité
Désigne la capacité d'adaptation du cerveau. Celui-ci met l'organisme
en communication avec l'environnement et peut organiser ou
réorganiser les voies de transmission d'un signal nerveux pour adapter
le comportement en fonction de cet environnement.
Potentiel évoqué (v. ERP)
Prédicat
Est prédicat ce que l'on affirme à propos du sujet logique d'une
proposition ; il peut être simple : verbe seul, ou complexe : verbe plus
complément.
Proposition
Phrase exprimant ce que l'on peut dire d'un état de chose, et qui peut
avoir ou pas une valeur de vérité.
Prosodie
Enveloppe « musicale » de la parole avec des aspects de rythme,
tempo, mélodie, accent et intonation, pouvant avoir une valeur
linguistique (marquer des frontières de phrases ou de mots) ou non
linguistique (marquer une émotion…).
Psycholinguiste
Personne qui étudie comment le langage est perçu, acquis, produit,
compris, mémorisé.
Quantité
En phonologie, se réfère à la durée d'un son.
Sciences cognitives
Ensemble des sciences qui étudient le fonctionnement de l'intelligence
et d'une manière générale comment la pensée tente de prendre
connaissance du réel (raisonnement, perception, langage, mémoire,
contrôle du mouvement) ; on y trouve la psychologie expérimentale, la
linguistique, la philosophie, les neurosciences.
Segment
Unité minimale de la chaîne sonore du langage qui permet de la
découper en signes phonétiques distincts : les voyelles et les consonnes
sont des segments.
Segmentation
Processus d'analyse de la représentation d'une stimulation afin d'en
faire apparaître les propriétés ou les constituants.
Sémantique
Etude du sens d'une production verbale (mot, phrase).
Sonagramme
Dispositif de mesure et d'analyse des sons de la parole qui enregistre
les fréquences accentuées dans un son et leur évolution.
Spectrogramme
Représentation graphique des paramètres physiques de la parole. La
répartition de l'intensité sonore y est représentée en fonction du temps
et de la fréquence (en abscisse le temps, en ordonnée la fréquence).
Stratégie
Procédure optionnelle consciente ou non.
Stress (v. accent)
Sujet
Un des arguments du verbe. Agent ou acteur quand le verbe est un
verbe d'action.
Syllabe
Unité de la structure phonologique, dépendant donc du système des
sons d'une langue, constituée généralement d'un noyau voca-lique,
précédé et/ou suivi d'une ou plusieurs consonnes (voir aussi
dissyllabe).
Synapse
Espace très fin qui sert de zone de contact entre les neurones. C'est une
structure polarisée. Un neurone peut comporter jusqu'à dix mille
synapses.
Synaptogenèse
Étape essentielle de la formation du système nerveux responsable de la
spécificité des circuits nerveux.
Syntagme
Groupe de mots ayant une unité à l'intérieur de la phrase du point de
vue de l'analyse grammaticale qu'on peut en faire : ainsi on distingue le
syntagme nominal « la petite fille » du syntagme verbal « courait dans
le jardin ».
Syntaxe
Ensemble des règles d'organisation des mots dans une phrase et de
bonne formation des énoncés selon la grammaire de la langue.
Tractus vocal (v. conduit vocal)
Traitement de l'information
Ensemble des transformations de l'information dans le système mental.
Transition de formant
Durée et niveau de la transition entre le bruit du relâchement de l'air
après une constriction pour prononcer une consonne et le voisement
particulier d'une voyelle.
Trille
Vibration d'un articulateur contre l'autre.
Unité perceptive
Propriété ou constituant d'un objet ou d'un événement représenté dans
le système perceptif ou cognitif (Morais).
Vélaire (consonne)
Consonne prononcée avec appui de l'arrière de la langue sur le voile du
palais, tels [k] ou [g].
Voisé (non voisé)
Un son voisé est produit avec une vibration des cordes vocales au
passage de l'air, un son est dit non voisé quand il y a eu interruption des
vibrations des cordes vocales pendant la production de la consonne.
Voyelle
Phonème prononcé sans constriction de l'air (exemple : a, i, o etc.).
BIBLIOGRAPHIE

Aldebrandin de Sienne (médecin italien du XIII e siècle s'exprimant


en français), Le Régime du corps, édité par L. Landouzy et R. Pépin,
Paris, 1911.
Aslin R. N., « Segmentation of fluent speech into words : Learning
models and the role of maternal input », dans B. de Boysson-Bardies,
S. de Schonen, P. Jusczyk, P. MacNeilage & J. Morton (Eds.),
Developmental neurocognition : Speech and face processing in the first
year of life, Dordrecht, Kluwer Academic Publishers, 1993.
Bacri N., « Pitch and timing cues in speech intelligibility : The case
of child language », dans M.P.R. van den Broecke et A. Cohen (Eds.),
Proceedings of the tenth International Congress of Phonetic Sciences,
Dordrecht, Floris Publications, 1984, p. 589-594.
Baillargeon R., « Object permanence in 3.5 and 4.5 month-old
infants », Developmental Psychology, 23, 1991, p. 655-664.
Baillargeon R., Spelke E.S. & Wasserman S., « Object permanence
in five-month-old infants », Cognition, 20, 1985, p. 191-208.
Barthélémy l'Anglais, Livre des Propriétés des Choses, rédigé au XIII
e siècle, dont les propos sont repris par de nombreux auteurs au Moyen

Âge ; tiré de L'Enfance au Moyen Âge, de Pierre Riché et Danièle


Alexandre-Bidou, Paris, Seuil et Bibliothèque de France, 1994.
Barthes R., Essais critiques IV : Le bruissement de la langue, Paris,
Seuil, 1984, p. 23.
Barton D., The role of perception in the acquisition of phonology,
Bloomington, IN, Indiana University Linguistics Club, 1978.
Bates E., Bretherton I., Shore C. & McNew S., « Names, gestures
and objects », dans K. E. Nelson (Eds.), Children's language (Vol. 4),
Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1983.
Bates E., Marchman V., Thal D., Fenson L., Dale P., Reznick J.S.,
Reilly J. & Hartung J., « Developmental and stylistic variation in the
composition of early vocabulary », Journal of Child Language, 21,
1994, p. 85-123.
Bates E., Dale P.S. & Thal D., « Individual differences and their
implications for theories of language development », dans P. Fletcher
& B. MacWhinney (Eds.), The Handbook of Child Language, Oxford,
Basil Blackwell, 1995, p. 96-151.
Benedict H., « Early lexical development : Comprehension and
production », Journal of Child Language, 6, 1979, p. 183-200.
Bertoncini J. & Mehler J., « Syllables as units in infants speech
behavior », Infant Behavior and Development, 4, 1981, p. 247-260.
Bertoncini J., Bijeljac-Babic R., Jusczyk P., Kennedy L. & Mehler J.,
« An investigation of young infants' perceptual representations of
speech sounds », Journal of Experimental Psychology : General, 117,
1988, p. 21-33.
Bertoncini J., Morais J., Bijeljac-Babic R., MacAdams S., Peretz I.
& Mehler J., « Dichotic perception and laterality in neonates », Brain
and Language, 1989, 37, p. 591-605.
Best C., « Emergence of language-specific constraints in perception
of non-native speech : A window on early phonological development »,
dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage
& J. Morton (Eds.), Developmental neurocognition : Speech and face
processing in the first year of life, Dordrecht, Kluwer Academic
Publishers, 1993, p. 289-304.
Best C., Hoffman H., Glanville B.B., « Development of infant ear
asymmetries for speech and music », Perception and Psychophysics,
31(1), 1982, p. 75-85.
Bickerton D., Language and Species, Chicago, The University of
Chicago Press, 1990.
Bijeljac-Babic R., Bertoncini J. & Mehler J., « How do four days old
infants categorise multisyllabic utterances », Developmental
Psychology, 29, 1993, p. 711-721.
Blake J. & Fink R., « Sound-meaning correspondences in
babbling », Journal of Child Language, 14, 1987, p. 229-253.
Blake J. & Boysson-Bardies B. de, « Patterns in babbling : A cross-
linguistic study », Journal of Child Language, 19(1), 1992, p. 51-74.
Bloom L., Language development : Form and function in emerging
grammars, Cambridge, Mass., M.I.T. Press, 1970.
Bloom L., Lightbown L. & Hood L., « Structure and variation in
child language », Monographs for the Society for Research in Child
Development, 40, 1975, no 2.
Blount B., « The pre-linguistic system of Luo children »,
Anthropological linguistics, 12, 1970, p. 326-342.
Blount B. G., Padgug E., « Mother and father speech : Distribution
of parental speech features in English and Spanish », Papers and
Reports on Child Language Acquisition, 12, 1976, p. 47-59.
Bornstein M.H., Azuma H., Tamis-LeMonda C.S. & Ogino M.,
« Mother and infant activity and interaction in Japan and in the United
States. I. A comparative microanalysis of naturalistic exchanges »,
International Journal of Behavioral Development, 13, 1990, p. 267-
287.
Bornstein M.H., Tamis-LeMonda C.S., Pêcheux M.-G., Rahn C.W.,
« Mother and infant activity and interaction in France and the United
States : A comparative study », International Journal of Behavioral
Development, 14(1), 1991, p. 21-43.
Bornstein M., Tal J., Rahn C., Galperin C.Z., Lamour M., Ogino M.,
Pêcheux M.-G., Toda S., Azuma H. & Tamis-LeMonda C.S.,
« Functional analysis of the contents of maternal speech to infants of 5
and 13 months in four cultures : Argentina, France, Japan, and the
United States », Developmental Psychology, vol. 28, no 4, 1992, p. 1-
10.
Boysson-Bardies B. de, Négation et performance linguistique, Paris-
La Haye, Mouton, 1976.
Boysson-Bardies B. de, « Ontogeny of language-specific phonetic
and lexical productions, dans B. de Boysson-Bardies, S. de Schonen,
P. Jusczyk, P. MacNeilage & J. Morton (Eds). Developmental
neurocognition : Speech and face processing in the first year of life,
Dordrecht, Kluwer Academic Publishers, 1993.
Boysson-Bardies B. de, Sagart L. & Durand C., « Discernible
differences in the babbling of infants according to target language »,
Journal of Child Language, 11, 1984, p. 1-15.
Boysson-Bardies B. de, Hallé P., Sagart L. & Durand C., « A cross-
linguistic investigation of vowel formants in babbling », Journal of
Child Language, 16, 1989, p. 1-17.
Boysson-Bardies B. de & Vihman M.M., « Adaptation to language :
Evidence from babbling and first words in four languages », Language,
67(2), 1991, p. 297-319.
Boysson-Bardies B. de, Vihman M.M., Roug-Hellichius L.,
Durand C., Landberg I. & Arao F., « Material evidence of infant
selection from the target language : A cross-linguistic phonetic study »,
dans C. Ferguson, L. Menn et C. Stoel-Gammon (Eds.) Phonological
development : Models, research, implications, Timonium (Maryland),
York Press, 1992, p. 369-391.
Boysson-Bardies B. de, Vihman M.M. & Durand C., « The first
lexicon : A comparative study of four languages », (soumis à
publication).
Braine M.D.S., « The ontogeny of English phrase structure : The
first phase », Language, 39, 1963, p. 1-14.
Bretherton I., « How to do things with one word : The ontogenesis of
intentional message making in infancy », dans M.D. Smith &
J.L. Locke (Eds.), The emergent lexicon. The child's development of a
linguistic vocabulary, New York, Academic Press, 1988, p. 225-260.
Bril B. & Lehalle H., Le Développement psychologique est-il
universel ?, Paris, P.U.F. 1988.
Broca P., « Remarques sur le siège de la faculté du langage articulé,
suivies d'une observation d'aphémie (perte de la parole) », Bulletin de
la Société d'Anthropologie, 6, 1861, p. 330-357. Reproduit dans
H. Hécaen et J. Dubois, (Eds.), La Naissance de la neuropsychologie
du langage, 1825-1865, Paris, Flammarion, 1969, p. 61-91.
Broca P., « Sur le siège de la faculté du langage articulé », Bulletin
de la Société d'Anthropologie, 6, 1865, p. 337-393. Reproduit dans
H. Hécaen et J. Dubois, (Eds.), La Naissance de la neuropsychologie
du langage, 1825-1865, Paris, Flammarion, 1969, p. 108-121.
Brown R., A First Language, Cambridge (Mass.), Harvard
University Press, 1973.
Bühler C., « Die ersten sozialen Verhaltensweisen des Kindes »,
Quellen und Studien zur Jugendkunde, 5, 1927, p. 1-102.
Butterworth G. & Cochran E., « Towards a mechanism of joint
visual attention in human infancy », International Journal of
Behavioral Development, 3, 1980, p. 253-270.
Butterworth G.E. & Grover L., « The origins of referential
communication in human infancy », dans L.E. Weiskrantz (Ed.),
Thought without language, Oxford, Clarendon Press, 1988, p. 5-24.
Caramazza A. & Hills A.E., « Lexical organization of nouns and
verbs in the brain », Nature, 349, 1991, p. 788-790.
Changeux J.-P., « Un modèle neuronal capable de raisonnement »,
La Recherche, Vol. 3, 244, 1992, p. 711-713.
Changeux J.-P., L'Homme neuronal, Paris, Fayard, 1983.
Changeux J.-P. & Danchin A., « Selective stabilization of developing
synapses as a mechanism for the specification of neuronal networks »,
Nature, 1976, 264, p. 705-721.
Changeux J.-P. & Dehaene S. « Neuronal models of cognitive
fonctions », Cognition, 1989, 33, p. 63-110.
Charles-Luce J. & Luce P.A., « Similarity neighbourhoods of words
in young children's lexicons », Child Language, 1990, 17, p. 205-215.
Chomsky N., Syntactic Structures, La Haye, Mouton, 1957, (trad.
fr. : Structures syntaxiques, Paris, Éd. du Seuil, 1969).
Chomsky N., « A review of Skinner's Verbal Behavior », Language,
35, 1959, p. 26-58 (traduit dans Langages, 4, 1969, no 16, p. 16-49).
Chomsky N., Aspects of the theory of syntax, Cambridge, Mass.,
MIT Press, 1965 (trad. fr. : Aspects de la théorie syntaxique, Paris, Éd.
du Seuil, 1971).
Chomsky N., Language and Mind, New York, Harcourt Brace
Jovanovich, 1968.
Chomsky N., & Halle M., The sound pattern of English, New York,
Harper and Row, 1968.
Christophe A., Dupoux E., Bertoncini J. & Mehler J. « Do infants
perceive word boundaries ? An empirical study of the bootstrapping of
lexical acquisition », Journal of the Acoustical Society of America, 3,
1995, p. 1570-1580.
Cohen N.J. & Beckwith L., « Maternal language in infancy »,
Developmental Psychology, 12, 1976, p. 371-372.
Cordemoy G. de, Discours physique de la Parole, Paris, Copedith,
Bibliothèque du Graphe, 1970 (reproduit d'après l'édition de 1704).
Cukovskij K., Ot dvux do pjati, Moscou, 1966.
Curtiss S., Genie : A psycholinguistic study of a modern-day « wild
child », London, Academic Press, 1977.
Cutler A., « Segmentation problems, rythmic solutions », Lingua,
1994, 92/1.
Cutler A., « Prosody and the word boundary problem », dans
J. Morgans & K. Denneth (Eds.), Signal to syntax, (sous presse).
Cutler A. & Butterfield S., « Rythmic cues to speech segmentation :
Evidence from juncture misperception », Journal of Memory and
Language, 31, 1992, p. 218-236.
Cutler A. & Carter D.M., « The predominance of strong initial
syllables in the English vocabulary », Computer Speech and Language,
2, 1987, p. 133-142.
Cutler A., Mehler J., Norris D. & Segui J., « A language specific
comprehension strategy », Nature, 304, 1983, p. 159-160.
Cutler A. & Norris D.G., « The role of strong syllables in
segmentation for lexical access », Journal of Experimental
Psychology : Human Perception & Performance, 14, 1988, p. 113-121.
Cyrulnik B., Les Nourritures affectives, Éd. Odile Jacob, Paris,
1993.
Darwin C., The expression of Emotions in Man and Animals,
London, Murray, 1872 (traduction française : L'Expression des
émotions, Paris, Reinwald et Cie, 1877).
Darwin C., La Descendance de l'homme et la sélection sexuelle,
Paris, Reinwald et Cie, 1873.
Darwin C., L'Origine des espèces, Paris, La Découverte, 1985,
première édition 1859.
DeCasper A.J. & Fifer W.P., « Of human bonding : Newborns prefer
their mothers' voices », Science, 208, 1980, p. 1174-1176.
DeCasper A.J. & Spence M.J., « Prenatal maternal speech influences
newborn's perception of speech sounds », Infant Behavior and
Development, 9, 1986, p. 133-150.
DeCasper A.J., Lecanuet J.P., Busnel M.C., Granier-Deferre C. &
Maugeais R., « Fetal reactions to recurrent maternal speech », Infant
Behavior and Development, 17(2), 1994, p. 159-164.
Dehaene-Lambertz G., « Bases cérébrales de la discrimination
syllabique chez le nourrisson », Annales de la fondation Fyssen, no 9,
1994, p. 43-49.
Dehaene-Lambertz G. & Dehaene S., « Speed and cerebral
correlates of syllables discrimination in infants », Nature, 370, 1994,
p. 292-295.
Demany L., McKenzie B. & Vurpillot E., « Rythm perception in
early infancy », Nature, 266, 1977, p. 718-719.
Deville G., « Notes sur le développement du langage », Revue de
Linguistique et de Philologie Comparée, 23 (p. 330-343) et 24 (p. 10-
42, 128-143, 242-257, 300-320), 1890.
Di Cristo A., Contribution à l'étude de la structure prosodique de la
phrase en français moderne, Thèse de Doctorat, Université de
Provence, 1976.
D'Odorico L. & Franco F., « The determinants of baby talk :
Relationship to context », Journal of Child Language, 12, 1985,
p. 567-586.
Dupoux E., Mehler J., Naître humain, Paris, Éd. Odile Jacob, 1990.
Edelman G.M., Neural Darwinism, New York, Basic Books, 1987.
Eibl-Eibesfeldt I., Ethology. The Biology of Behavior, New-York,
Holt, Rinehart and Winston, 1970.
Eimas P.D., Siqueland E.R., Jusczyk P. & Vigorito J., « Speech
perception in infants », Science, 171, 1971, p. 303-306.
Entus A. K., « Hemispheric asymmetry in processing of dichotically
presented speech and nonspeech stimuli by infants », dans
S.J. Segalowitz et F.A. Gruber (Eds.), Language development and
neurological theory, New York, Academic Press, 1977.
Fenson L., Dale P.S., Reznick J.S., Bates E., Thal D.J. &
Pethick S.J., « Variability in early communicative development »,
Monographs of the Society for Research in Child Development, 1994,
59(5).
Ferguson C.A., « Baby talk as a simplified register », dans
C.E. Snow et C. A. Ferguson (Eds.), Talking to children. Language
input and acquisition, Cambridge, Cambridge University Press, 1977.
Ferguson C.A., « Baby talk in six languages », American
Anthropologist, 1964, 66, (6 part 2), p. 103-114.
Ferguson C.A. & Farwell C.B., « Words and sounds in early
language acquisition », Language, 51, 1975, p. 419-439.
Fernald A., « Four-month-old infants prefer to listen to motherese »,
Infant Behavior and Development, 8, 1985, p. 181-195.
Fernald A. & Kuhl P., « Acoustic determinants of infant reference or
motherese speech », Infant Behavior and Development, 10, 1987,
p. 279-283.
Fernald A., Taeschner T., Dunn J., Papousek M., Boysson-Bardies B.
de & Fukui I., « A cross-language study of prosodic modifications in
mother's and father's speech to preverbal infants », Journal of Child
Language, 16(3) 1989, p. 477-501.
Fernald A. & Morikawa H., « Common themes and cultural
variations in Japanese and American mother's speech to infants »,
Child Development, 64, 1993, p. 637-656.
Fernald A. & Simon T., « Expanded intonation contours in mother's
speech to newborns », Developmental Psychology, 20, 1984, p. 104-
113.
Fodor J., The modularity of mind, Cambridge, Mass., MIT Press,
1983.
Friederici D., « Development of language relevant processing
systems : « The emergence of a cognitive module », dans B. de
Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage &
J. Morton (Eds.), Developmental neurocognition : Speech and face
processing in the first year of life, Dordrecht, Kluwer Academic
Publishers, 1993.
Furrow D., Nelson K. & Benedict H., « Mother's speech to children
and syntactic development : some simple relationships », Journal of
Child Language, 6, 1979, p. 423-442.
Garnica O., « Some prosodic and paralinguistic features of speech to
young children », dans C.E. Snow et C.A. Ferguson (Eds.), Talking to
children : Language input and acquisition, Cambridge, Cambridge
University Press, 1977, p. 63-68.
Gerken L.A., Landau B. & Remez R.E., « Function morphemes in
young children's speech perception and production », Developmental
Psychology, 27, 1990, p. 204-216.
Geschwind N. & Galaburda A.M., « Cerebral lateralization :
Biological mechanisms, associations and pathology, I-III : A
hypothesis and a program for research », Archives of Neurology, 42,
1987, p. 428-459, 521-552 et 634-654.
Glanville B.B., Best C.T. & Levenson R., « A cardiac measure of
cerebral asymmetries in infant auditory perception », Developmental
Psychology, 13, 1977, p. 54-59.
Gleitman L.R., « The structural sources of verb meaning »,
Language Acquisition, 1, 1990, p. 3-55.
Golinkoff R.M., Hirsh-Pasek K., Cauley K.M. & Gordon L., « The
eyes have it : Lexical and syntactic comprehension in a new
paradigm », Journal of Child Language, 14, 1987, p. 23-45.
Golinkoff R.M. & Hirsh-Pasek K., « Reinterpreting children's
sentence comprehension : Toward a new framework », dans P. Fletcher
et B. MacWhinney (Eds.), The Handbook of Child Language, Oxford
(UK) et Cambridge (USA), Basil Blackwell, 1995.
Grégoire A., L'Apprentissage du langage. Les deux premières
années, Paris, Felix Alcan, 1937.
Grieser D.L. & Kuhl P.K., « Maternal speech to infants in a tonal
language : Support for universal prosodic features in motherese »,
Developmental Psychology, 24, 1988, p. 14-20.
Hagège C., L'Homme de parole : Contribution linguistique aux
sciences humaines, Paris, Fayard, 1985.
Hallé P.A. & Boysson-Bardies B. de, « Emergence of an early
receptive lexicon : Infant's recognition of words », Infant Behavior and
Development, 17, 1994, p. 119-129.
Hallé P., Boysson-Bardies B. de & Vihman M., « Beginnings of
prosodic organization : Intonation and duration patterns of disyllables
produced by Japanese and French infants », Language and Speech,
34(4), 1991, p. 299-318.
Hallé P. & Boysson-Bardies B. de, « The format of representation of
Recognized words in infant's early receptive lexicon », Infant Behavior
and Development, 19, 463-481.
Hannequin D., Goulet P. & Joanette Y., Hémisphère droit et langage,
Paris, Masson, 1987.
Hillis A.E. & Caramazza A., « Category-specific naming and
comprehension impairment : A double dissociation », Brain, 144,
1991, p. 2081-94.
Hirsh-Pasek K. & Golinkoff R.M., « Language comprehension : a
new look at some old themes », dans N. Krasnegor, D. Rumbaugh,
M. Studdert-Kennedy & R. Schiefelbusch (Eds.), Biological and
Behavioral Aspects of Language Acquisition, Hillsdale, New Jersey,
Lawrence Erlbaum Associates, 1991, p. 301-320.
Hirsh-Pasek K., Kemler-Nelson D.G., Jusczyk P.W., Wright
Cassidy K., Druss B. & Kennedy L., « Clauses are perceptual units for
young infants », Cognition, 26, 1987, p. 269-286.
Hirst D.J. & Di Cristo A., « French intonation : A parametric
approach », Die Neueren Sprachen, 83, 5, 1984, p. 554-569.
Hohne E.A., Jusczyk A.M. & Redanz N.J., « Do infants remember
words from stories ? » (Poster presented at the 127th meeting of the
Acoustical Society of America at Buffalo).
Hugo Victor, « Jeanne endormie/La sieste », dans L'Art d'être grand-
père, Paris, Flammarion, 1985 (première édition Paris, A. Lemerre,
1881).
Itard Jean, « Mémoire et rapport sur Victor de l'Aveyron » (rapport
de 1801), publié dans l'ouvrage de Lucien Malson : Les Enfants
sauvages : mythe et réalité, Paris, Éditions France Loisirs, 1981.
Izard C.E., Huebner R., Risser D., McGinnes G. & Dougherty L.,
« The young infant's ability to produce discrete emotion expressions »,
Developmental Psychology, 16, 1980, p. 132-140.
Jakobson R., Langage enfantin et aphasie, Paris, Éditions de Minuit,
1969 (traduction de : Kindersprache, Aphasie und allgemeine
Lautgesetze, Uppsala, 1941).
Jakobson R. & Waugh L., La Charpente phonique du langage, Paris,
Éditions de Minuit, 1980.
Johnson M.H. & Morton J., Biology and Cognitive Development.
The case of face recognition, Oxford (UK) et Cambridge (USA), Basil
Blackwell, 1991.
Jusczyk P.W., « On characterizing the development of speech
perception », dans J. Mehler & R. Fox (Eds), Neonate Cognition :
Beyond the blooming buzzing confusion, Hillsdale, N.J., Lawrence
Erlbaum, 1985.
Jusczyk P.W., « How word recognition may evolve from infant
speech perception capacities », dans G.T.M. Altmann et R. Shillcock
(Eds.), Cognitive Models of Speech Processing : The Second Sperlonga
Meeting, Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1991.
Jusczyk P.W. & Aslin R.N., « Infant's detection of the sound patterns
of words in fluent speech », Cognitive Psychology, 29, 1995, p. 1-23.
Jusczyk P.W. & Bertoncini J., « Si “d'instinct” nous apprenions à
percevoir la parole ? » dans V. Pouthas et F. Jouen (Eds.), Les
Comportements du bébé : expression de son savoir ?, Liège, Mardaga,
1993, p. 257-270.
Jusczyk P.W., Cutler A. & Redanz N.J., « Infant's preference for the
predominant stress patterns of English words », Child Development,
1993, 64, p. 675-687.
Jusczyk P.W. & Derrah C., « Representation of speech sounds by
young infants », Developmental Psychology, 23, 1987, p. 648-654.
Jusczyk P.W., Friederici A., Wessels J., Svenkerud V. &
Jusczyk A.M., « Infant's sensitivity to the sound patterns of native
language words », Journal of Memory and Language, 32, 1993, p. 402-
420.
Jusczyk P.W., Hirsh-Pasek K., Kemler-Nelson D.G., Kennedy L.,
Woodward A. & Piwoz J., « Perception of acoustic correlates of major
phrasal units by young infants », Cognitive Psychology, 24, 1992,
p. 252-293.
Kelkar A., « Marathi baby talk », Word, 20, 1964, p. 40-54.
Kemler-Nelson D.G., Jusczyk P.W., Mandel D.R., Myers J., Turk A.
& Gerken L.A., « The headturn preference procedure for testing
auditory perception », Infant behavior & Development, 18, 1995,
p. 111-116.
Kent R.D., « Anatomical and neuromuscular maturation of the
speech mechanism : Evidence from acoustic studies », Journal of
Speech and Hearing Research, 19, 1976, p. 421-445.
Kent R.D., « The biology of phonological development », dans
C.A. Ferguson, L. Menn & C. Stoel-Gammon (Eds.) Phonological
Development : Models, research, implications, Timonium, Maryland,
York Press, 1992, p. 65-90.
Kent R.D. & Bauer H.R., « Vocalizations of one year olds », Journal
of Child Language, 12, 1985, p. 491-526.
Kent R.D. & Murray A.D., « Acoustic features of infant vocalic
utterances at 3, 6 and 9 months », Journal of Acoustic Society of
America, 72, 1982, p. 353-365.
Klatt D.H., « Speech perception : A model of acoustic-phonetic
analysis and lexical access », Journal of Phonetics, 7, 1979, p. 279-
312.
Koopmans-van-Beinum F. & Van-der-Stelt J., « Early stages in
infant speech development », Proceedings of the Institute of Phonetic
Sciences, University of Amsterdam, 5, 1979, p. 30-43.
Kuhl P.K., « Perception of auditory equivalence classes for speech in
early infancy », Infant Behavior and Development, 6, 1983, p. 263-285.
Kuhl P.K., « Innate predispositions and the effects of experience in
speech perception : The native language magnet theory », dans B. de
Boysson-Bardies, S. de Schonen, P. Jusczyk, P. MacNeilage &
J. Morton (Eds.), Developmental neurocognition : Speech and face
processing in the first year of life, Dordrecht, Kluwer Academic
Publishers, 1993.
Kuhl P.K. & Meltzoff A.N., « The bimodal perception of speech in
infancy », Science, 218, 1982, p. 1138-1141.
Kuhl P.K. & Meltzoff A.N., « The intermodal representation of
speech in infants », Infant Behavior and Development, 7, 1984, p. 361-
381.
Kuhl P.K., Williams K.A., Lacerda F., Stevens K.N. & Lindblom, B.,
« Linguitic experience alters phonetic perception in infants by
6 months of age », Science, 255, 1992, p. 606-608.
Lecanuet J.P., Granier-Deferre C., DeCasper A.J., Maugeais R.,
Andrieu A.J. & Busnel M.-C., « Perception et discrimination fœtale de
stimuli langagiers, mise en évidence à partir de la réactivité cardiaque.
Résultats préliminaires », Comptes rendus de l'Académie des Sciences
de Paris, t. 305, Série III, 1987, p. 161-164.
Lecanuet J.-P., Granier-Deferre C. & Schaal B., « Continuité
sensorielle transnatale », dans V. Pouthas et F. Jouen (Eds.), Les
Comportements du bébé : expression de son savoir ?, Liège, Mardaga,
1993.
Lecanuet J.P. & Granier-Deferre C., « Speech stimuli in the fetal
environment », dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk,
P. MacNeilage & J. Morton (Eds.), Developmental neurocognition :
Speech and face processing in the first year of life, Dordrecht, Kluwer
Academic Publishers, 1993.
Lenneberg E., « The capacity for language acquisition », dans
J.A. Fodor et J.J. Katz (Eds.), The structure of language : Readings in
the philosophy of language, Prentice-Hall Inc., Englewood-Cliffs, NJ,
1964. Traduction française : « Aptitude à l'acquisition du langage »,
dans J. Mehler et G. Noizet (Eds.), Textes pour une psycholinguistique,
Paris, Mouton, 1974.
Lenneberg E., Biological foundations of language, New York, Wiley,
1967.
Levelt W.J.M., Speaking, Cambridge, Mass., MIT Press, 1989.
Levitt A. & Wang Q., « Evidence for language-specific rythmic
influences in the reduplicative babbling of French-and English-learning
infants », Language and Speech, 34, 1991, p. 235-249.
Lewis M.M., Infant speech : a study of the beginnings of language,
London, Routledge and Kegan Paul, 1936.
Liberman A.M., « Some results of research on speech perception »,
Journal of Acoustic Society of America, 29, 1957, p. 117-123.
Liberman A.M., Harris K.S., Kinney J.A. & Lane H., « The
discrimination of relative-onset time of the components of certain
speech and nonspeech patterns », Journal of Experimental Psychology,
61, 1961, p. 379-388.
Lieberman P., « On the development of vowel production in young
children », dans G. Yeni-Komshian, J. Kavanagh et C. Ferguson (Eds.),
Child Phonology : Vol. 1 Production, New York, Academic Press,
1980, p. 113-142.
Lindblom B., « Phonological units as adaptative emergents of lexical
development », dans C.A. Ferguson, L. Menn et C. Stoel-Gammon
(Eds.), Phonological development : models, research, implications,
Timonium, Maryland, York Press, 1992.
Lindblom B., MacNeilage P. & Studdert-Kennedy M., « Self-
organizing processes and the explanation of phonological universals »,
dans B. Butterworth, B. Comrie et Ö. Dahl (Eds.), Explanations of
linguistic universals, The Hague, Mouton, 1983.
Macfarlane J.A., « Olfaction and the development of social
preferences in the human neonate », dans R. Porter & M. O'Connor
(Eds.), Parent-Infant Interaction, CIBA Foundation Symposium 33,
Amsterdam, Elsevier-North Holland, 1975, p. 103-117.
MacKain K., Studdert-Kennedy M., Spieker S. & Stern D., « Infant
intermodal speech perception is a left-hemisphere function », Science,
219, 1983, p. 1347-1349.
Macken M., « Developmental reorganization of phonology »,
Lingua, 49, 1979, p. 11-49.
Macken M.A., « Aspects of the acquisition of stop systems : A cross-
linguistic perspective », dans G. Yeni-Komshian, J.F. Kavanagh &
C.A. Ferguson (Eds.) Child phonology 1 : Production, New York,
Academic Press, 1980, p. 143-168.
Macken M.A., « Developmental changes in the acquisition of
phonology », dans B. de Boysson-Bardies, S. de Schonen, P. Jusczyk,
P. MacNeilage & J. Morton (Eds.), Developmental neurocognition :
Speech and face processing in the first year of life, Dordrecht, Kluwer
Academic Publishers, 1993.
MacNeilage P.F., « The control of speech production », dans G. Yeni-
Komshian, C. Kavanagh et C. Ferguson (Eds.), Child phonology 1 :
Production, New York, Academic Press, 1980, p. 9-21.
MacNeilage P.F. & Davis B.L., « Acquisition of speech production :
Frames, then content », dans M. Jeannerod (Ed.), Attention and
performance, XIII. Motor representation and control, Hillsdale, New
Jersey, Lawrence Erlbaum Associates, 1991.
MacNeilage P.F. & Davis B.L., « Motor explanations of babbling
and early speech patterns » dans B. de Boysson-Bardies, S. de Schonen,
P. Jusczyk, P. MacNeilage & J. Morton (Eds.), Developmental
neurocognition : Speech and face processing in the first year of life,
Dordrecht, Kluwer Academic Publishers, 1993.
Mandel D.R., Jusczyk P.W. & Kemler-Nelson D.G., « Does
sentential prosody help infants organize and remember speech
informations ? », Cognition, 53, 1994, p. 155-180.
Mandel D.R., Jusczyk P.W. & Pisoni D.B., « Infants' recognition of
the sound patterns of their own names », Psychological Science, 1995,
6, p. 315-318.
Markman E.M. & Hutchinson J.E., « Children's sensitivity to
constraints on word meaning : Taxonomic versus thematic relations »,
Cognitive Psychology, 16, 1984, p. 1-27.
Marler P., « Song learning : Innate species differences in the learning
process », dans P. Marler & H.S. Terrace (Eds.), The biology of
learning, Berlin, Springer Verlag, 1984.
Masataka N., « Pitch characteristics of Japanese maternal speech to
infants », Journal of Child Language, 19, 1992, p. 213-223.
Mehler J., Bertoncini J., Barrière M. & Jassik-Gershenfeld D.,
« Infant recognition of mother's voice », Perception, 7, 1978, p. 491-
497.
Mehler J., Dupoux E. & Segui J., « Constraining models of lexical
acess : The onset of word recognition », dans G. Altman (Ed.),
Cognitive Models of Speech Processing, Cambridge, Mass., MIT Press,
1990, p. 236-262.
Mehler J., Jusczyk P.W., Lambertz G., Halsted N., Bertoncini J. &
Amiel-Tison C., « A precursor of language acquisition in young
infants », Cognition, 29, 1988, p. 143-178.
Mehler J., Segui. J., Frauenfelder U., « The role of the syllable in
language acquisition and perception », dans T. Myers, J. Laver &
J. Anderson (Eds.), The Cognitive Representation of Speech,
Amsterdam, North Holland, 1981.
Meisel J.M., « Grammatical development in the simultaneous
acquisition of two first languages », in J. Meisel (Ed.), Two First
Languages : early grammatical development in bilingual children,
Dordrecht, Paris, 1990, p. 5-22.
Meltzoff A.N. & Moore M.K., « Imitation of facial and manual
gestures by human neonates », Science, 198, 1977, p. 75-78.
Menn L., « Phonotactic rules in beginning speech », Lingua, 26,
1971, p. 225-241.
Menn L., « Phonological units in beginning speech », dans A. Bell &
J. Hooper (Eds.), Syllabes and Segments, Amsterdam, North Holland,
1978.
Menn L. « Development of articulatory, phonetic, and phonological
capacities », dans B. Butterworth (Ed.), Language production, Vol. 2.,
London, Academic Press, 1983.
Menyuk P. & Menn L., « Early strategies for the perception and
production of words and sounds ? », dans P. Fletcher et M. German
(Eds.), Language Acquisition : Studies in First Language Development,
Cambridge, Cambridge University Press, 1979.
Mills D.C., Coffey S.A. & Neville H.J., « Language acquisition and
cerebral specialization in 20-month-old infants », Journal of Cognitive
Neuroscience, 1993, 5, p. 317-334.
Mills D.C., Coffey S.A. & Neville H.J., « Changes in cerebral
organization in infancy during primary language acquisition », dans
G. Dawson et K. Fischer (Eds.), Human Behavior and the Developing
Brain, New York, Guilford Publications, 1993.
Mogford K. & Bishop D., « Five questions about language
acquisition considered in the light of exceptional circumstances », dans
D. Bishop & K. Mogford (Eds.), Language development in exceptional
circumstances, Hillsdale, New Jersey, Lawrence Erlbaum Associates,
1993.
Molfese D.L., « Auditory evoked responses recorded from 16-
month-old human infants to words they did and did not know », Brain
and Language, 38, 1990, p. 343-363.
Molfese D.L., Freeman R.B. & Palermo D.S., « The ontogeny of
brain lateralization for speech and non-speech stimuli », Brain and
Language, 2, 1975, p. 356-368.
Molfese D.L. & Molfese V.J., « Hemisphere and stimulus dif-
ferences as effected in the cortical responses of newborn infants to
speech stimuli », Developmental Psychology, 15, 1979, p. 505-511.
Morikawa H., Shand N. & Kosawa Y., « Maternal speech to
prelingual infants in Japan and the United States : Relationships among
functions, forms and referents », Journal of Child Language, 15, 1988,
p. 237-256.
Myers J., Jusczyk P.W., Kemler-Nelson D.G., Charles-Luce J.,
Woodward A. & Hirsh-Pasek K., « Infants' sensitivity to word
boundaries in fluent speech », Journal of Child Language (sous
presse).
Nelson K. « Structure and strategy in learning to talk », Monographs
of the Society for Research in Child Development, 38 (149), 1973.
Nelson K., Hamson J. & Kessler Shaw L., « Nouns in early
lexicons : Evidence, explanations and implications », Journal of Child
Language, 20, 1993, p. 61-84.
Newport E.L., « Motherese : The speech of mothers to young
children », dans N.J. Castellan, D.B. Pisoni & G.R. Potts (Eds.),
Cognitive theory : Vol. II, Hillsdale, New Jersey, Lawrence Erlbaum
Associates, 1976.
Oller D.K., « The emergence of the sounds of speech in infancy »
dans G. Yeni-Komshian, C. Kavanagh et C. Ferguson (Eds.), Child
phonology 1 : Production, New York : Academic Press, 1980, p. 93-
112.
Oller D.K., « Metaphonology and infant vocalizations », dans
B. Lindblom et R. Zetterstrom (Eds.), Precursors of early speech, New
York, Stockton Press, 1986.
Oller D.K. & Eilers R.E., « The role of audition in infant babbling »,
Child Development, 59, 1988, p. 441-449.
Oller D.K., Eilers R.E. & Steffens M., « Speech-like vocalizations in
infancy : An evaluation of potential risk factors », Journal of Child
Language (sous presse).
Oller D.K. & Lynch M.P., « Infant vocalizations and innovations in
infraphonology : Toward a broader theory of development and
disorders », dans C.A. Ferguson, L. Menn et C. Stoel-Gammon (Eds.),
Phonological development : Models, research, implications,
Timonium, Maryland, York Press, 1992.
Oviatt S.L., « The emerging ability to comprehend language : An
experimental approach », Child Development, 51, 1980, p. 97-106.
Papousek M., Papousek H. & Haekel M., « Didactic adjustments in
fathers' and mothers' speech to their three-month-old infants », Journal
of Psycholinguistic Research, 16, 1987, p. 491-516.
Papousek M. & Papousek H., « Forms and functions of vocal
matching interactions between mothers and their precanonical
infants », First Language, 9, 1989, p. 137-158.
Papousek H. & Papousek M., « Apprentissage chez le nourrisson :
un point de vue synthétique », dans V. Pouthas et F. Jouen (Eds.), Les
Comportements du bébé : expression de son savoir ?, Liège, Mardaga,
1993, p. 120.
Pegg J.E., Werker J.F. & McLeod P.J., « Preference for infant-
directed over adult-directed speech : Evidence from 7-week-old
infants », Infant Behavior and Development, 15, 1992, p. 325-345.
Peters A.M., « Language learning strategies : Does the whole equal
the sum of the parts ? », Language, vol 53, 3, 1977, p. 561-573.
Petitto L. et Marentette P., « Babbling in the manual mode :
Evidence for the ontogeny of language », Science, 251, 1991, p. 1493-
1496.
Pinker S., The language instinct, New York, William Morrow and
Company, 1994, p. 265.
Premack D., Intelligence in ape and man, Hillsdale, New Jersey,
Lawrence Erlbaum Associates, 1977.
Pye C., « Mayan telegraphese : Intonational determinants of
inflectional development in Quiché Mayan », Language, 59, 1983,
p. 583-604.
Querleu D., Renard W. & Versyp F., « Les perceptions auditives du
fœtus humain », Médecine et Hygiène, 39, 1981, p. 2101-2110.
Quine W.V.O., Word and object, Cambridge, Mass., MIT Press,
1960.
Quine W.V.O., « Natural kinds », dans Ontological relativity and
other essays, New York, Columbia University Press, 1969.
Rakic P., Bourgeois J.-P., Eckenoff M.F., Zecevic N. & Goldman-
Rakic P.S., « Concurrent overproduction of synapses in diverse regions
of the primate cerebral cortex », Science, 232, 1986, p. 232-235.
Ratner N.B. & Pye C., « Higher pitch is not universal : Acous-tic
evidence from Quiche Mayan », Journal of Child Language, 11, 1984,
p. 515-522.
Rousseau J.-J., Essai sur l'origine des langues : Où il est parlé de la
mélodie et de l'imitation musicale, Berlin, 1817, réédition Paris,
Bibliothèque du Graphe, s.d.
Saint Augustin, Les Confessions (vers 410), dernière réédition Paris,
Garnier Flammarion, 1993.
Saussure F. de, Cours de linguistique générale, Paris, Payot, 1972.
Scaife M. & Bruner J., « The capacity for joint visual attention in the
infant », Nature, 253, 1975, p. 265-266.
Schaal B., Montagner H., Hertling E., Bolzoni D., Moyse E.,
Quichon R., « Les stimulations olfactives dans les relations entre
l'enfant et la mère », Reproduction, Nutrition, Développement, 20,
1980, p. 843-858.
Schieffelin B.B., « Teasing and shaming in Kaluli children's
interactions », dans B.B. Schieffelin & E. Ochs (Eds.), Language
socialization across cultures, New York, Cambridge University Press,
1986.
Schieffelin B.B. & Ochs E., « A cultural perspective on the transition
from prelinguistic to linguistic communication », dans R.M. Golinkoff
(Ed.), The transition from prelinguistic to linguistic communication,
Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1983.
Schonen S. de, Van Hout A., Mancini J. & Livet M.O.,
« Neuropsychologie et développement cognitif », dans X. Seron et
M. Jeannerod (Eds.), Neuropsychologie humaine, Liège, Mardaga,
1994, p. 487-527.
Schonen S. de, Gil De Diaz M., Mathivet E., « Hemispheric
asymmetry in face processing in infancy », dans H. D. Ellis, M.
A. Jeeves, F. Newcombe & A. Young (Eds.), Aspects of face processing,
Dordrecht, Martinus Nijhoff Publishers, 1986, p. 199-208.
Seron X., « Le programme de la neuropsychologie », dans X. Seron
et M. Jeannerod (Eds.), Neuropsychologie humaine, Liège, Mardaga,
1994, p. 53.
Shibatani M., The languages of Japan, Cambridge, Cambridge
University Press, 1990.
Shute B., « Vocal Pitch in motherese », Educational Psychology,
1989, p. 187-205.
Siqueland E.R. & DeLucia C., « Visual reinforcement of non-
nutritive sucking in human infants », Science, 165, 1969, p. 1144-1146.
Skuse D.H., « Extreme deprivation in early childhood », dans
D. Bishop & K. Mogford (Eds.), Language Development in exceptional
circumstances, Hillsdale New Jersey, Lawrence Erlbaum Associates,
1993.
Spelke E.S., « Perceptual knowledge of objects in infancy », dans
J. Mehler, E. Walker & M. Garrett (Eds.), Perspectives on Mental
Representation, Hillsdale, N.J., Lawrence Erlbaum Associates, 1982.
Spelke E.S., « Perception of Unity, Persistence and Identity », dans
J. Mehler & R. Fox (Eds.), Neonate cognition : beyond the blooming,
buzzing confusion, Hillsdale, New Jersey, Lawrence Erlbaum
Associates, 1985, p. 87.
Spelke E.S., « Physical knowledge in infancy : Reflections on
Piaget's theory », dans S. Carey et R. Gelman (Eds.), The epigenesis of
mind, Hillsdale, New Jersey, Lawrence Erlbaum Associates, 1991,
p. 133-169.
Stager C.L., « Phonetic similarity influences learning word-object
associations in 14-month-old infants », Thèse, Faculty of Graduate
Studies, Department of Psychology, University of British Columbia,
Octobre 1995.
Stern D.N., Spieker S., Barnett R.K. & MacKain K., « The prosody
of maternal speech : Infant age and context related changes », Journal
of Child Language, 10, 1983, p. 1-15.
Stoel-Gammon C. & Cooper J., « Patterns of early lexical and
phonological development », Journal of Child Language, 11, 1984,
p. 247-271.
Streri A., « Tactile discrimination of shape and intermodal transfer in
2- to 3-month old infants », British Journal of Developmental
Psychology, 5, 1987, p. 213-220.
Studdert-Kennedy M.G., « Language development from an
evolutionary perspective », dans N. Krasnegor, D. Rumbaugh,
R. Schiefelbusch & M. Studdert-Kennedy (Eds.), Biobehavioral
Foundations of Language Development, Hillsdale, New Jersey,
Lawrence Erlbaum Associates, 1991.
Tamis-LeMonda C.S., Bornstein M., Cyphers L., Toda S. &
Ogino M., « Language and plays at one-year : A comparison of
toddlers and mothers in the United States and Japan », International
Journal of Behavioral Development, 15(1), 1992, p. 19-42.
Termine N.T. & Izard C.E., « Infants' responses to their mothers'
expressions of joy and sadness », Developmental Psychology, 24, 1988,
p. 223-229.
Thelen E., « Motor aspects of emergent speech : A dynamic
approach », dans N.A. Krasnegor, D.M. Rumbaugh, R.L. Schiefelbusch
& M. Studdert-Kennedy (Eds.), Biological and behavioral
determinants of language development, Hillsdale, New Jersey,
Lawrence Erlbaum Associates, 1991, p. 339-362.
Toda S., Fogel A. & Kawai M., « Maternal speech to three-month-
old infants in the United States and Japan », Journal of Child
Language, 17, 1990, p. 279-294.
Trehub S.E., « Infants' sensitivity to vowel and tonal contrasts »,
Developmental Psychology, 9, 1973, p. 91-96.
Trehub S.E., Bull D. & Thorpe L., « Infants' perception of melodies :
The role of melodic contour », Child Development, 55, 1984, p. 821-
830.
Trevarthen C., « Descriptive analyses of infant communicative
behavior », dans H.R. Schaffer (Ed.), Studies in Mother-infant
Interaction, New York, Academic Press, 1977, p. 227-270.
Tuaycharoen P., « An account of speech development of a Thai
child : From babbling to speech » dans T.L. Thongkum, V. Panupong,
P. Kullavanijaya & M.R. Tingsabadh (Eds.), Studies in Thai and Mon-
Kmer phonetics and phonology : in honour of Eugenie
J. A. Henderson, Bangkok, Chulalongkorn University Press, 1979.
Uzgiris I.C., « L'imitation dans les interactions précoces », dans
V. Pouthas et F. Jouen (Eds.), Les Comportements du bébé : expression
de son savoir ?, Liège, Mardaga, 1993.
Valian V.V., « Syntactic subjects in the early speech of American and
Italian children », Cognition, 40, 1991, p. 21-81.
Valian V.V., Parental replies : Linguistic status and didactic role,
MIT Press, Bradford, Cambridge, MA (sous presse).
Vihman M.M., « Consonant harmony : Its scope and function in
child language », dans J.H. Greenberg (ed.), Universals of Human
Language, Stanford, CA, Stanford University Press, 1978.
Vihman M.M., Early syllables and the construction of phonology,
dans C.A. Ferguson, L. Menn & C. Stoel-Gammon (Eds.),
Phonological Development : Models, Research, Implications,
Timonium, Maryland, York Press, 1992, p. 393-422.
Vihman M.M. & Boysson-Bardies B. de, « The nature and origins of
ambient language influence on infant vocal production and early
words », Phonetica, 51, 1994, p. 159-169.
Vihman M.M., Ferguson C.A. & Elbert M., « Phonological
development from babbling to speech : Common tendencies and
individual differences », Applied Psycholinguistics, 7, 1986, 3-40.
Vihman M.M., Kay E., Boysson-Bardies B. de, Durand C. &
Sundberg U., « External sources of individual differences ? A cross-
linguistic analysis of the phonetic of mothers' speech to one-year-old
children », Developmental Psychology, 30(5), 1994, p. 651-662.
Vihman M.M. & Miller R., « Words and babble at the threshold of
lexical acquisition », dans M.D. Smith & J.L. Locke (Eds.), The
Emergent Lexicon : The Child's Development of a Linguistic
Vocabulary, New York, Academic Press, 1988.
Vygotsky L.S., Thought and Language, Cambridge, Mass., 1962,
(version traduite et revue par E. Hanffmann & G. Vakar à partir de
l'édition russe : Mysl' i jazyk, Moscou & Leningrad, 1934).
Wallon H., De l'acte à la pensée, Paris, Flammarion, 1942, rééd.
1970.
Waterson N., « Child phonology : A prosodic view », Journal of
Language, 6, 1971, p. 179-211.
Watson-Gegeo K.A. & Gegeo D.W., « Calling-out and repeating
routines in Kwara'ae children's language socialization », dans
B.B. Schieffelin et E. Ochs (Eds.), Language socialization across
cultures, New York, Cambridge University Press, 1986, p. 17-50.
Werker J.F., Gilbert J.H., Humphrey K. & Tees R.C.,
« Developmental aspects of cross-language speech perception », Child
Development, 52, 1981, p. 349-353.
Werker J.F. & Tees R.C., « Cross-language speech perception :
Evidence for perceptual reorganization during the first year of life »,
Infant Behaviour and Development, 7, 1984, p. 49-63.
Werker J.F., Pegg J.E., McLeod P.J., « A cross-language
investigation of infant preference for infant-directed communication »,
Infant Behavior and Development, 17(3), 1994, p. 323-333.
Wernicke C., Der aphasische symptomencomplex Cohn, Breslau,
Weigert, 1874.
Zack M., Étude du comportement de refus de poursuivre la tétée,
Thèse de Doctorat de 3e Cycle, Paris, École des Hautes Études en
Sciences Sociales, 1987.
Zanzotto A., « Élégie du pétel. », Arcanes 17, 1986.
Table

INTRODUCTION 11

CHAPITRE I. Le nourrisson ne parle pas, mais... 23


Le nouveau-né cet inconnu, 23
La parole ne peut être son langage, 25
Un nouveau-né compétent, 29
Il s’est préparé avant la naissance, 34
Les talents des nourrissons, 38
Le prénom : un premier signal, 40
Organisation du cerveau pour le langage, 42

CHAPITRE II. L’émergence de la parole 51


Les expressions vocales des premiers mois, 51
De rapides spécialistes de leur langue maternelle, 54
Le babillage, 59
Que disent les enfants entre sept et dix mois ? 61
Que disent les enfants entre dix et douze mois ? 64
Quand des esprits sérieux se penchent sur le babillage, 66
Les bébés français babillent-ils en français et les bébés yoruba en
yoruba ? 72
Ils commencent à parler leur langue sans accent, 81
Un babillage en langue des signes, 85
CHAPITRE III. L’univers communicatif du bébé 87
Communication et expressions, 87
Le regard, 90
Les conduites de réciprocité, 91
Le turn-taking, 93
Expression des émotions, 94
L’attention partagée vers le monde extérieur, 96
La parole des mères, 98
Voix maternelle, 100
Le parler bébé, 102
Cultures et modes de parler aux bébés, 104
Périodes sensibles, 110

CHAPITRE IV. À la découverte du sens des mots (neuf-dix-sept mois)


115
Découper et assembler, 115
Le nourrisson à l’œuvre, 120
L’assemblage des pièces du puzzle, 122
Le problème des petites pièces, 128
Reconnaître et comprendre, 130
Retrouver le même objet, 132
Reconnaître les mots familiers, 135
La représentation mentale des mots, 137
Comprendre les mots, 142

CHAPITRE V. Les premiers pas lexicaux (onze-dix-huit mois) 149


Les mots pour le dire, 149
Le monde et le bébé, 151
Le bébé est-il physicien ?, 152
Les choses et les mots, 156
Les premiers mots, 159
Les essais et les erreurs, 164
Deux lexiques ? 169
Composition du premier vocabulaire, 170
CHAPITRE VI. À chaque bébé son style 173
Tous semblables et tous différents, 173
Émilie, Sean et Timmy ou la stratégie a minima, 177
Simon, Léo et Marie ou les charmes de la conversation, 183
Charles, Noël et les autres : la voix médiane, 193
Henri ou comment reculer pour mieux parler, 196
Ce sont eux qui choisissent, 199

CHAPITRE VII. Des langues, des cultures et des enfants 203


Langage et socialisation, 203
Univers culturel et premiers mots, 205
Les sujets de conversation des petits Français, Américains, Suédois
et Japonais, 209
L’hédonisme des bébés français, 211
Le pragmatisme et la sociabilité des petits Américains, 212
Le goût de l’action des petits Suédois, 212
Le sens esthétique des bébés japonais, 213
Mais tous les enfants du monde, 214

CHAPITRE VIII. La parole devient langage (dix-huit-vingt-quatre mois)


217
Une nouvelle étape, 217
L’explosion du lexique, 218
La découverte de la phonologie, 219
Le remaniement des réponses cérébrales, 222
Les premières phrases, 226
Les premières phrases des petits Français, 232

CONCLUSION 241
Tableau récapitulatif des principales étapes du développement de la
parole de zéro à deux ans 247

GLOSSAIRE 251
BIBLIOGRAPHIE 265

Vous aimerez peut-être aussi