Vous êtes sur la page 1sur 6

pls_420_p000000_langues_GJ3008 4/09/12 12:34 Page 66

Discipline (sous-thme)

Linguistique

Les langues du monde :


un mme dbit dinformation
Le dbit de parole varie selon les langues,
mais plus il est rapide, moins chaque syllabe vhicule
dinformation. Ainsi, quelle que soit la langue, la vitesse
de transmission de linformation est quasi constante.

Franois Pellegrino, Christophe Coup et Egidio Marsico

la terrasse dun caf, dans le brou-


haha ambiant, votre attention est sou-
dain attire par un voisin parlant une
langue trangre. Sa voix vous semble tra-
nante ou, linverse, empresse. Cette
diffrentes langues changent des infor-
mations un dbit comparable. Pour le mon-
trer, nous prsenterons dabord les ensembles
de syllabes (les inventaires syllabiques)
disposition des langues et nous prcise-
impression, quon pourrait croire subjec- rons la notion dinformation dans ce contexte.
L E S S E N T I E L tive, correspond une ralit mesurable:

I Grce la mesure du dbit


le dbit syllabique (le nombre de syllabes
prononces par seconde) varie dune langue
Des contraintes
syllabique (le nombre lautre. Nous lavons rcemment mon- faonnant les langues
de syllabes prononces par tr en comparant les dbits syllabiques Au cours du XXe sicle, les linguistes ont
seconde) et de la densit dune soixantaine de locuteurs sexprimant tudi plusieurs centaines de langues, en
syllabique dinformation dans sept langues dEurope et dAsie. insistant tantt sur leurs diffrences et tan-
(la quantit dinformation Limpression que les Espagnols par- tt sur leurs ressemblances. En 1957, le lin-
porte par chaque syllabe), lent vite, par exemple, est fonde : en guiste amricain Martin Joos a affirm que
on value le dbit moyenne, ils prononcent 26 pour cent de les langues peuvent diffrer les unes des
dinformation de diffrentes syllabes en plus par seconde que les locu- autres sans aucune limite et de faon
langues. teurs de langlais et 50 pour cent de plus imprvisible. linverse, Noam Chom-
que ceux du chinois mandarin. Pour sky a suppos quelles sont toutes sous-
I Ce dbit est presque
autant, une mme histoire durera-t-elle tendues par une mme grammaire inne
constant dune langue
une fois et demie plus longtemps en man- et universelle, dont elles seraient des reflets
lautre. Il correspondrait
darin quen espagnol ? dforms. Plus rcemment, la linguistique
une vitesse de transmission
Non, car nous verrons que la diff- dite fonctionnelle a adopt un point de
adapte aux besoins
rence de dbit syllabique est compense par vue diffrent : elle dcrit la fois la diver-
de la communication.
la quantit dinformation porte par cha- sit des langues et les tendances quelles
I Pour linstant, seules sept cune des syllabes (on parle de densit syl- partagent comme rsultant de la comp-
langues ont t tudies. labique dinformation) : une langue rapide tition entre des contraintes varies. Celles-
Ce nombre doit tre recourt un plus grand nombre de syl- ci peuvent tre physiologiques (imposes
augment pour confirmer labes quune langue lente pour raconter la par le systme vocal), cognitives (issues
et tendre les rsultats. mme histoire, chaque syllabe portant moins notamment de la capacit du cerveau
dinformation. Finalement, les locuteurs des traiter linformation), communicatives (on

66] Linguistique Pour la Science - n 420 - Octobre 2012


pls_420_p000000_langues_GJ3008 4/09/12 12:34 Page 67

1. QUELQUE 6 000 LANGUES sont parles


dans le monde, parfois par des centaines
de millions de personnes, tel le mandarin
en Chine, ou par quelques centaines de locu-
teurs, comme le cavinea en Bolivie. Elles
semblent aussi efficaces les unes que les

djem/Shutterstock
autres pour transmettre linformation, bien
que le dbit de la parole varie notablement.

Salim October/Shutterstock
Jianhao Guan/Shutterstock

Dima Sobko/Shutterstock
REDAV/Shutterstock

Pour la Science - n 420 - Octobre 2012 Linguistique [67


pls_420_p000000_langues_GJ3008 4/09/12 12:34 Page 68

I LES AUTEURS doit par exemple parler lun aprs lautre) enfants, dautres partir du nombre dop-
ou sociales (la parole exprime qui lon est rations mentales (dductions, rfrences
Franois PELLEGRINO, vis--vis des autres, auxquels on sadresse au contexte, etc.) ncessaires au dcodage
Christophe COUP
et Egidio MARSICO travaillent avec des formes plus ou moins polies, dun message... De faon schmatique, la
au laboratoire Dynamique tels les pronoms personnels tu et vous en complexit dune langue correspond la
du langage (DDL), franais). Elles faonnent en permanence taille du mode demploi quun locuteur
lInstitut des sciences les langues, qui sont, ds lors, des systmes doit matriser pour sexprimer correcte-
de l'homme (ISH), Lyon.
dynamiques complexes. ment dans cette langue.
Depuis le dbut du XXIe sicle, le dve- Nos recherches sinscrivent dans ces
loppement de mthodes danalyse de ces tentatives de quantifier les langues, mais
systmes, conjugu la multiplication des ont un but diffrent : plutt que de com-
I SUR LE WEB donnes linguistiques disponibles, per- parer la complexit des langues, nous cher-
met de mener des tudes quantitatives chons montrer quelles offrent la mme
M. Dryer et M. Haspelmath
(ds), The World Atlas of denvergure. En particulier, on cherche capacit communiquer, via la mesure du
Language Structures Online, dterminer sans rponse claire pour lins- dbit dinformation.
Munich, Max Planck Digital tant si les langues prsentent une com- Cette mesure requiert la comprhen-
Library 2011: plexit gale. Cette question est difficile, sion des fondements de notre systme de
http://wals.info/.
car aucune dfinition de la complexit ne communication : la production, la trans-
fait consensus en linguistique : certains mission et la perception de messages lin-
tentent de la quantifier partir de la dure guistiques sonores. Ces messages sont
dapprentissage dune langue par les constitus de phrases, dcomposables en

LES SONS DES L ANGUES DU MONDE


a parole est forme denchanements de sons toire et cest (presque) toujours le mme les consonnes occlusives (telles p, t, k, b, d,
L continus (les voyelles) et de sons bloqus
(les consonnes). Ce sont les deux lments de base
ensemble de paramtres acoustiques qui per-
met de les dcrire dans les diffrentes langues.
g ), cres avec une interruption totale du
flux dair, et les consonnes fricatives (telles f,
du langage. Aucune langue nest constitue uni- Ces paramtres, nomms formants, correspon- v, s, z), ralises avec un rtrcissement lais-
quement de voyelles ou de consonnes ce der- dent des accumulations dnergie dans cer- sant chapper un peu dair. Deux autres para-
nier terme signifiant dailleurs qui sonne avec, taines bandes de frquences sonores, produites mtres diffrencient les consonnes : le lieu
sous-entendu avec une voyelle. Les sons sont orches- par des gestes articulatoires entranant des ph- darticulation, qui prcise o a lieu lentrave
trs par le systme vocal. Pour prononcer les voyelles, nomnes de rsonance. Ainsi, le [u] est obtenu dans le systme vocal, et le voisement, qui
le systme vocal module lair de diffrentes faons en concentrant quasiment toute lnergie sonore indique lactivit des cordes vocales. Ainsi, le
(langue plus ou moins proche du palais, lvres dans des frquences relativement basses (en son [k] est produit en interrompant le flux dair
arrondies ou non). Divers gestes articulatoires dessous de 1 000 hertz), alors que pour le [i], avec le dos de la langue et sans vibration des
peuvent augmenter le nombre de nuances. Par lnergie est rpartie entre des basses frquences cordes vocales, tandis que le son [b] est ra-
exemple, en franais, la nasalisation (lenvoi dair (autour de 300 hertz) et des frquences plus le- lis par une fermeture complte au niveau des
dans les fosses nasales) transforme le son de a en ves, vers 2 000 et 2 800 hertz. lvres tout en maintenant une vibration des
an, tandis quen allemand, la dure de la voyelle linverse, les consonnes sont bien plus cordes vocales. Comme pour les voyelles, un
permet de distinguer entre les mots Rate (avec diversifies, tant du point de vue articula- certain nombre de gestes articulatoires accrois-
un a long) et Ratte (avec un a bref), qui signifient toire quacoustique. Cependant, toutes sont sent linventaire des consonnes, par exemple
respectivement une mensualit et un rat. produites en entravant le passage de lair, et en allongeant la dure dun son. Dans les dif-
Malgr ces diffrences, la classe des voyelles le degr dentrave est le premier paramtre de frentes langues du monde, on a compt
est assez homogne du point de vue articula- leur classification. On distingue par exemple prs dun millier de voyelles et de consonnes

Fosses
nasales
Cavit buccale

u
Langue
i a

Pharynx
Larynx (gorge)
(sige des cordes
vocales qui
produisent le son)

68] Linguistique Pour la Science - n 420 - Octobre 2012


pls_420_p000000_langues_GJ3008 4/09/12 12:34 Page 69

mots, eux-mmes forms de squences de les langues, une mme suite de phonmes Les structures syllabiques varient dans
sons lmentaires nomms phonmes, qui peut tre intgre dans une ou plusieurs des proportions importantes entre les
sont propres chaque langue. Les pho- syllabes : le franais autorise ainsi la suc- langues. Ainsi, la plupart des syllabes
nmes comprennent des consonnes, des cession des sons [s] et [t] dans une mme utilises en espagnol ont une structure
voyelles et parfois des diphtongues (des syllabe, comme dans le mot stop, mais CV ou CVC, alors que langlais a une grande
voyelles complexes dont le timbre se modi- pas le tha ; en consquence, les Thalan- diversit syllabique, incluant des syllabes
fie en cours de prononciation, tel [ei] dans dais prononcent souvent le mot stop en trs longues. Par exemple, le mot strengths
le mot anglais day). Prcisons quon parle insrant une voyelle entre [s] et [t]. (signifiant forces) est transcrit par les pho-
ici des voyelles et des consonnes phon- Les syllabes les plus simples sont nticiens [str(k)s] ( traduit le son de th)
tiques et non alphabtiques (voir lenca- constitues dune unique voyelle. En fran- et prsente une structure CCCVC(C)CC (la
dr ci-dessous) : en franais, la voyelle [o] ais, certaines correspondent des mots parenthse indique une consonne qui nest
peut ainsi scrire o, au, eau frquents : la prposition , la conjonc- pas toujours prononce).
Linventaire des phonmes dune tion de coordination et, le nom commun Enfin, des syllabes composes de
langue ne suffit pas pour rendre compte eau Les syllabes peuvent aussi comporter consonnes et de voyelles identiques se
de la faon dont elle sonne , qui dpend des consonnes, comme par exemple dans distinguent dans certaines langues par
aussi de leur agencement en syllabes. Pour strict, une syllabe et un mot compose des diffrences de mlodie . Cest sou-
ce faire, on doit donc sintresser aux syl- de trois consonnes, suivies dune voyelle, vent le cas en Afrique et en Asie, et par-
labes, les lments dorganisation ryth- puis de deux consonnes. On note une telle fois en Amrique. L encore, la richesse
mique de la parole (les morceaux en structure syllabique sous la forme CCCVCC, de ces systmes est variable : dans cer-
lesquels un locuteur dcoupe intuitive- o la lettre C symbolise une consonne et tains idiomes mexicains, une mme
ment les mots dans sa langue natale). Selon la lettre V une voyelle. squence de phonmes peut comporter
jusqu huit mlodies distinctes, nom-
mes tons, qui crent huit mots aux signi-
fications totalement diffrentes ! En
Europe, la mlodie est parfois aussi uti-
lise, par exemple en norvgien, mais de
obtenues entre autres grce lajout dun trait culatoires plus compliqus sont ncessaires
secondaire (dure, nasalisation). pour assurer une distance perceptuelle suffisante.
faon plus limite (on parle daccents
Les tudes ont vite rvl que de nombreux Du fait de ces contraintes structurelles assez tonals et non de tons).
phonmes (reprsents essentiellement par les fortes et identiques pour tous , les langues
consonnes et les voyelles phontiques) se retrou- ont de nombreux points communs. Toutes ont
vent dans les diffrentes langues. Les scientifiques des consonnes occlusives et prs de 90 pour cent
20 fois plus
saccordent aujourdhui sur le fait que les sys- possdent le k. Plus de 80 pour cent utilisent de syllabes en anglais
tmes sonores des langues sont le fruit de deux
contraintes antagonistes. La premire concerne
les voyelles phontiques i, a, ou, et une majo-
rit sont organises autour de cinq voyelles de
quen japonais
la production de la parole: les sons doivent tre base : i, , a, o, ou. Malgr cela, les langues Chaque langue a son propre nombre de
choisis afin de limiter leffort articulatoire du locu- sont trs varies. Les systmes sonores dcrits briques lmentaires et des rgles das-
teur. La seconde contrainte porte sur la percep- aujourdhui comportent de 11 141 consonnes semblage spcifiques pour construire ses
tion et impose de faciliter la tche de lauditeur et voyelles, pour une moyenne de 31 lments syllabes. Une langue comme langlais,
en crant un contraste suffisant entre les sons (en moyenne un tiers de voyelles et deux tiers ayant un inventaire de phonmes tendu
diffrencier. Il rsulte de cette double contrainte de consonnes). Si la majorit des langues ont et autorisant des syllabes complexes, offre
que les systmes comportant peu de sons utili- moins de huit voyelles, certaines en ont jus- des combinaisons bien plus nombreuses
sent prfrentiellement des gestes articulatoires qu 24, tandis que le nombre de consonnes que le japonais, dont les phonmes sont
simples (telle la modulation de louverture de la varie de 6 95! titre de comparaison, la langue assez peu nombreux, et qui utilise prf-
bouche ou de la position de la langue), et que franaise comporte moins de 20 consonnes et rentiellement des syllabes simples.
lorsquil y a plus de phonmes, des gestes arti- une quinzaine de voyelles.
En analysant ces diffrents paramtres
sur des centaines de milliers, voire de mil-
lions, de mots, nous avons compar les
inventaires syllabiques de sept langues
(allemand, anglais, espagnol, franais,
italien, japonais et mandarin). Mme
Notre appareil vocal produit des sons varis, sur un chantillon de langues aussi limit,
an grce des gestes articulatoires parfois com- nous observons des variations impor-
plexes, pouvant impliquer tous ses compo- tantes des tailles des inventaires sylla-
sants (bouche, gorge, larynx...). De gauche biques, qui vont de 416 syllabes distinctes
droite, les configurations reprsentes cor-
en japonais prs de 8 000 en anglais (soit
respondent u, i, aet an. Cette dernire voyelle
presque 20 fois plus).
Sophie Jacopin

est obtenue en ajoutant au a un trait secon-


daire dit de nasalisation (on ouvre les fosses Nous nous sommes ensuite intresss
nasales). aux consquences de ces diffrences sur
le dbit dinformation du discours. Pour

Pour la Science - n 420 - Octobre 2012 Linguistique [69


pls_420_p000000_langues_GJ3008 4/09/12 12:34 Page 70

cela, nous avons mesur le dbit syllabique mation au sens de Shannon quune syl- duits dans chacune des langues de ltude
(le nombre de syllabes prononces par labe anglaise (issue dun inventaire de prs (voir la figure 3). Ainsi, les versions japo-
seconde) et estim la densit syllabique de 8 000 syllabes). naises comptaient en moyenne 85 pour
dinformation (la quantit dinformation cent de syllabes supplmentaires par rap-
porte par chaque syllabe). La notion de
quantit dinformation utilise ici est celle
Quantifier port leurs quivalents anglais.
Faut-il en dduire quune mme conver-
dfinie par le mathmaticien amricain linformation sation durera prs de deux fois plus long-
Claude Shannon au milieu du XXe sicle. En ralit, dautres facteurs interviennent, temps en japonais quen anglais? Cela parat
Au cours de ses travaux sur les tl- un nonc ntant pas constitu de syl- peu probable: toutes les langues du monde
communications durant la Seconde Guerre labes tires au hasard. Les syllabes for- tant adaptes leur fonction doutil de
mondiale, Shannon a montr que lon peut ment des mots : si quelquun prononce communication, on imagine difficilement
estimer mathmatiquement la quantit an-ti-con-sti-tu-tio-, la syllabe suivante sera quun change verbal prenne un temps trs
moyenne dinformation transmise entre coup sr -nel- et le fait de lentendre diffrent dune langue lautre. Une langue
un metteur et un rcepteur, indpen- apporte peu dinformation. En outre, les o crier Au secours ! prendrait une
damment de la signification du message. mots obissent des rgles grammaticales. minute plutt que quelques fractions de
Dans le cas dun discours constitu dune Enfin, les syllabes sont plus ou moins seconde remplirait assez mal sa fonction!
suite de syllabes, on considre en premire frquentes dans une langue donne. En Pour le confirmer, nous avons analys
approche que lauditeur ignore chaque franais, par exemple, on utilise bien des enregistrements des 20 textes lus par
instant la syllabe qui sera prononce plus souvent la syllabe qui constitue le mot diffrents locuteurs. Nous avons montr
ensuite. La quantit moyenne dinforma- et que celle qui correspond strict. On que les variations de dbit syllabique com-
tion transmise par syllabe est alors dfi- traduit alors la densit syllabique din- pensent les diffrences de quantit din-
nie comme la quantit dincertitude que formation par une valeur numrique en formation porte par chaque syllabe: une
lnonc de cette syllabe vient combler. recourant au formalisme mathmatique langue telle que le japonais, qui ncessite
Plus il y a de syllabes dans une langue, de la thorie de linformation. plus de syllabes que langlais pour vhicu-
plus la probabilit de prdire la syllabe Une syllabe japonaise tant moins ler la mme information, a un dbit sylla-
correcte en rpondant au hasard est faible, informative quune syllabe anglaise, on bique plus rapide; la densit dinformation
et donc plus lincertitude est grande et plus sattend ce quune mme histoire nces- moindre est contrebalance par une vitesse
chaque syllabe porte dinformation. Une site bien plus de syllabes en japonais quen de transmission suprieure. Ainsi, entre les
syllabe prononce en japonais (parmi les anglais. L encore, nous lavons vrifi, sept langues tudies, la densit sylla-
416 possibles) porte donc moins dinfor- avec une vingtaine de courts textes tra- bique dinformation et le dbit syllabique

2. LE DBIT DINFORMATION (triangles rouges sur le graphique en bas


droite) est assez constant pour les langues tudies. Il est fonction de
la densit syllabique dinformation (barres jaunes) et du dbit syllabique
(barres vertes), qui tendent voluer en sens contraire. Sur le graphique,
les langues sont ordonnes de gauche droite par densit syllabique din-
formation croissante.
Densit syllabique dinformation
Dbit syllabique

Dbit dinformation
Franois Pellegrino, Christophe Coup et Egidio Marsico

Japonais Espagnol Italien Franais Allemand Anglais Mandarin

70] Linguistique Pour la Science - n 420 - Octobre 2012


pls_420_p000000_langues_GJ3008 4/09/12 12:34 Page 71

varient en sens contraire, avec pour cons- 3. CE TEXTE est lun de ceux qui ont t tra-
quence un dbit dinformation trs voi- duits dans plusieurs langues pour tester les
Hier soir, jai ouvert la porte dentre
sin pour la plupart des langues mme pour laisser sortir le chat. La nuit tait si belle diffrences de densit syllabique dinfor-
que je suis descendu dans la rue prendre le frais. mation, de dbit syllabique et de dbit din-
si langlais et le japonais se dmar- formation. En japonais, langue o chaque
Javais peine fait quelques pas
quent (leurs dbits dinformation sont que jai entendu la porte claquer derrire moi. syllabe porte peu dinformation (la den-
respectivement suprieur et infrieur Jai ralis, tout d'un coup, que jtais enferm dehors. sit syllabique est faible), il comporte prs
la moyenne). Le comble cest que je me suis fait arrter alors que de deux fois plus de syllabes quen anglais.
jessayais de forcer ma propre porte !
Prcisons quon parle ici des
valeurs moyennes. Des diffrences de
dbit dinformation demeurent toutes
les chelles : chez un locuteur confront la complexit structurelle des sys-
diverses situations, entre individus, entre x tmes linguistiques. Les questions sont
populations Un individu peut ainsi multiples: quelles diffrences observe-
sadapter au contexte, non seulement  t-on entre les langues o les mots sont

en parlant plus ou moins vite, mais  souvent polysyllabiques et celles o
galement en choisissant les mots ils sont plutt monosyllabiques ?
employs, les tournures de phrases, Comment la densit syllabique din-

etc. Les locuteurs dune mme langue formation varie-t-elle entre les
prsentent galement des diffrences langues aux schmas syllabiques trs
de dbit normal dlocution, certaines simples (CV ou CVC par exemple) et celles
personnes parlant naturellement plus vite o ces schmas sont plus complexes (CCVCC
que dautres. Dans notre tude, par par exemple) ? Etc.
exemple, les locuteurs franais les Pour comparer les langues, il est
plus rapides avaient un dbit com- Last night I opened the front door to let the cat out. galement intressant daller au-del
parable celui des locuteurs japonais It was such a beautiful evening that I wandered down de la notion mathmatique dinfor-
les plus lents. the garden for a breath of fresh air. mation que nous avons considre,
Then I heard a click as the door closed behind me.
I realised I'd locked myself out. pour se pencher sur la notion plus
Ni trop vite To cap it all, I was arrested while I was trying
to force the door open !
gnrale de signification. Si les infor-
mations sont transmises des dbits
ni trop lentement... comparables dune langue lautre,
Pourquoi le dbit moyen dinformation des diffrences notables existent quant
ne varie-t-il pas dans des proportions plus ce qui est considr comme une infor-
importantes ? Un dbit trop faible serait mation pertinente transmettre
socialement pnalisant, car des interac- explicitement. Le mandarin et le japonais,
tions efficaces ncessitent lchange din- par exemple, recourent des lments
formations. linverse, un dbit moyen grammaticaux nomms classificateurs.
trop rapide aurait des cots physiolo- Ceux-ci spcifient la forme, la taille ou
gique et cognitif trop levs. En effet, si dautres caractristiques physiques ou
chacun peut acclrer momentanment fonctionnelles des lments dnombrs.
son dbit de parole (et donc son dbit Ainsi, la phrase Trois chats boivent du
dinformation), cela requiert la fois un lait dite en japonais se traduit littrale-
supplment dnergie biomcanique de ment en franais par Trois animaux-chats
la part du locuteur et un supplment de du lait boivent. Sur un autre plan, en japo-
ressources neurocognitives de la part de nais, les formules de politesse ont un rle
lauditeur. Plusieurs travaux rcents sug- social trs codifi et font partie de linfor-
grent dailleurs que le cerveau traite plus mation juge essentielle transmettre lors
efficacement les informations prsentes I BIBLIOGRAPHIE de la communication.
un rythme compris dans une plage Nos rsultats soulignent quil existe plu-
F. Pellegrino et al.,
troite, voisine de celle que nous avons A cross-language perspective sieurs profils de langues. Ainsi, le manda-
observe ; ils se fondent pour cela sur on speech information rate, rin se fonde sur des syllabes denses en
lanalyse des rseaux neuronaux mobi- Language, vol. 87, pp. 539-558, information (notamment grce aux tons)
2011.
liss par laudition et la comprhension transmises un dbit assez lent, tandis
du langage. J. Vaissire, La phontique, que lespagnol utilise des syllabes moins
Nous poursuivons actuellement nos Collection Que sais-je?, Presses denses en information, mais mises plus
recherches en augmentant le nombre de Universitaires de France, 2006. vite. Cependant, le fait quune langue soit
langues tudies (nous avons ajout le Bernard Comrie et al., Atlas plus rapide ou plus dense en information
turc et le coren, ainsi que plusieurs langues des langues : Lorigine ne la rend pas plus efficace pour commu-
dAfrique subsaharienne et de Chine), avec et le dveloppement des langues niquer, puisque le dbit dinformation reste
dans le monde, Acropole, 2004.
lintention de relier la densit dinformation quasi constant. I

Pour la Science - n 420 - Octobre 2012 Linguistique [71