Vous êtes sur la page 1sur 10

1

I - Neurophysiologie - 13 - Phontique acoustique


Phontique acoustique
13
C. Meunier - Charge de Recherche
Laboratoire Parole et Langage, CNRS UMR 6057
Universit de Provence
29 avenue Robert Schuman
13621 Aix-en-Provence Cedex 1, France.
Courriel : christine.meunier@lpl.univ-aix.fr
I. Les sons du langage
Lensemble des congurations articulatoires
possibles pour la production du langage parl nest
pas extensible. Elles sont dpendantes du matriel
anatomique dont dispose ltre humain. Et comme
tous les tres humains disposent du mme appareil
anatomique, les sons utiliss dans chacune des langues
du monde relvent de congurations articulatoires
communes. Il est donc possible de procder des
regroupements de classes de sons dans lesquels
chaque langue puise son propre inventaire. Ces
classes de sons se font selon des critres articulatoires
ou acoustiques.
On observe sur la gure 1 les critres articulatoires
retenus selon lAlphabet Phontique International
(International Phonetic Alphabet, IPA) pour le
classement des consonnes. Ainsi, dans la classe des
fricatives, le franais utilise seulement une partie des
possibilits oertes par lappareil anatomique. On
remarquera sur cette gure 1 que le franais utilise
peu la partie trs postrieure du tractus vocal, la
consonne la plus arrire tant le /n/ uvulaire.
De mme, dans linventaire des voyelles franaises
il ny a aucune voyelle centrale, except le /c/ (Fig.
2). En fait, la structure de linventaire des sons dans
une langue nest pas alatoire mais suit une logique
universelle relative aux contraintes articulatoires et
la distinctivit ncessaire au sein de chaque systme
(Schwartz et al., 1997). De mme, la description
acoustique des sons du langage tente de prsenter
un panorama de valeurs permettant de distinguer
lensemble des sons. Nous tenterons, dans ce chapitre,
de dresser un inventaire des descriptions acoustiques
des sons du franais en les reliant avec une explication
articulatoire.
I
Neurophysiologie
de la parole
Fig. 1. Liste des principales consonnes des langues du monde dans lAlphabet Phontique International classes selon leur mode
darticulation (en colonne) et leur lieu darticulation (en ligne). Lorsquil y a deux consonnes par case, celle de gauche est la
consonne sourde, celle de droite est son quivalente sonore. Daprs International Phonetic Alphabet (International Phonetic
Association, 1999). Les consonnes du franais sont entoures en gris.
2
I - Neurophysiologie - 13 - Phontique acoustique
II. Lacoustique des sons
Il est classique de distinguer les voyelles des
consonnes selon des critres articulatoires : la
production des voyelles suppose une libre circulation
de lair dans le tractus vocal, tandis que lors de la
production des consonnes, un rtrcissement du
tractus en un point entrane une interruption ou
une perturbation dans la circulation de lair. Cette
distinction de bas niveau rete mal ce qui direncie
fondamentalement voyelles et consonnes. En eet, en
sappuyant uniquement sur des critres articulatoires
ou acoustiques, la dirence entre une occlusive et
une approximante est sans doute plus importante
que la dirence entre cette mme approximante et
une voyelle. Il apparat en fait que la distinction la
plus probante entre les voyelles et les consonnes est
de nature linguistique : les voyelles et les consonnes
se distinguent selon leur place dans la syllabe, les
voyelles peuvent tre le noyau (centre de la syllabe et
seul lment indispensable pour une syllabe), ce que
les consonnes, de rares exceptions prs, ne peuvent
pas (cf. chapitre 14).
Si les voyelles reprsentent un ensemble de
productions plutt homogne, il nen va pas de mme
pour la catgorie des consonnes constitues de classes
de sons assez dirents aussi bien dun point de vue
articulatoire quacoustique. On parle alors souvent
de macroclasses de sons (Rossi, 1990) pour essayer
de rendre compte de groupes de sons homognes du
point de vue acoustique. Si la classe des voyelles est
homogne, il est classique de distinguer les voyelles
fermes des voyelles ouvertes et les voyelles antrieures
des postrieures. Au sein des consonnes, deux macro-
classes sont elles-mmes assez homognes, il sagit des
occlusives et des fricatives. Reste ensuite un ensemble
de sons, ayant peu de points communs, faisant oce
dintermdiaire entre consonnes et voyelles que lon
peut regrouper dans la macro classe des consonnes
vocaliques. Dans cette macro classe, on trouve les
approximantes, les glissantes, les vibrantes, etc.
Nous allons voir ci-dessous plus en dtails les
caractristiques de lensemble de ces sons. Pour
une description gnrale de lacoustique des sons,
cf. chapitres 6 et 8.
1. Les voyelles
Toutes les voyelles sont voises, cest--dire quil
sagit de sons priodiques. Cette priodicit est issue
de la vibration des cordes vocales. Les voyelles sont
caractrises par la prsence de zones dharmoniques
renforces appeles formants . La conguration
des cavits bucco-pharyngales tant dirente pour
chaque voyelle, chacune delle va tre caractrise
par des valeurs de formants direntes. En dautres
termes, la modulation de la forme du tractus et donc
de la taille des cavits, va occasionner des valeurs
spciques de formants correspondant la forme que
prend le tractus vocal pour chaque voyelle. Il existe
un lien entre la taille dun rsonateur (cavits du
tractus dans la parole) et sa frquence : plus la taille
du rsonateur et importante, plus sa frquence est
basse. Les valeurs de formants vont donc, en partie,
dpendre de la taille des cavits de rsonance durant
la production des voyelles.
Pour les voyelles, trois cavits sont pertinentes:
les cavits pharyngale, buccale et nasale. Quatre
dimensions permettent de modier la forme ou laccs
ces cavits : 1/ le degr daperture de la mandibule ;
2/ la position de la langue ; 3/ la position des lvres ;
4/ la position du velum (autorisant ou non le passage
de lair dans les fosses nasales). Les variations au sein
de ces quatre dimensions entranent des variations de
timbre (valeurs de formants). Dans dautres langues, la
dure ou encore la valeur tonale (variations de F0) vont
constituer des dimensions supplmentaires permettant
la distinctivit au sein du systme.
Le premier formant (F1) est dtermin par le degr
daperture de la mandibule (et de la hauteur de la
langue). Le deuxime formant (F2) varie en fonction
Fig. 2. Trapze vocalique reprsentant un classement des
voyelles orales des langues du monde selon des critres
articulatoires. Lorsque deux voyelles apparaissent de part
et dautre dun point, la premire est une ralisation tire,
la deuxime une ralisation arrondie (voir plus loin dans ce
chapitre II.1 Les voyelles). Daprs International Phonetic
Alphabet (International Phonetic Association, 1999). Les
voyelles du franais sont entoures en gris.
3
I - Neurophysiologie - 13 - Phontique acoustique
de la position avant ou arrire de la langue, mais aussi
en fonction de la position tire ou arrondie des lvres.
Enn, les valeurs du troisime formant (F3) sont
dtermines par la position tire ou arrondie des lvres.
Notons que la voyelle /c/, prsente en franais mais
avec un statut phonologique trs particulier, prsente
des caractristiques articulatoires totalement neutres et
ne sera donc pas mentionne dans nos descriptions.
a. Laperture
Laperture de la mandibule ne fonctionne pas de
faon isole. Elle entrane, de fait, un abaissement
de la langue ainsi quun rtrcissement de la taille du
pharynx. On oppose ainsi les voyelles ouvertes (ou
basses), caractrises par une aperture maximale de la
mandibule et un abaissement de la langue (entranant
une trs petite cavit pharyngale), aux voyelles fermes
(ou hautes), caractrises par une aperture trs rduite
de la mandibule et la langue en position haute (laissant
place une grande cavit pharyngale). Ainsi, les voyelles
ouvertes sont caractrises par un F1 lev (/a/ = 700
Hz), tandis que les voyelles fermes ont un F1 bas (/i/
= 300 Hz) (Tableau 1 et Fig. 3). Les voyelles ouvertes
sont /a/ ct /o/, /o /. Les voyelles mi-ouvertes sont /c/,
/o/, /5/, /c /, /o /, /5 /. Les voyelles mi-fermes sont /c/,
/o/, /o/. Les voyelles fermes sont /i/, /y/, /u/.
b. La position de la langue
Le mouvement de la langue en position avant ou
arrire entrane une modication globale du tractus
vocal et plus prcisment de la taille de la cavit buccale.
Ce mouvement a une incidence sur la valeur du F2
(Fig. 3). Les voyelles antrieures sont caractrises par
un F2 lev (/i/ = 2000 Hz), tandis que les voyelles
postrieures laissent place une cavit buccale plus
ample et ont un F2 bas (/u/ = 750 Hz). Les voyelles
davant sont /i/, /y/, /c/, /o/, /c/, /o/, /a/, /c /, /o /. Les
voyelles darrire sont /u/, /o/, /5/, /o/, /5 /, /o /.
c. La position des lvres
Certaines voyelles sont ralises avec une projection
des lvres en avant. On parle alors darrondissement
des lvres, de projection des lvres ou encore
de protrusion . Ce geste articulatoire a pour
consquence lallongement de la cavit buccale par
la cration dune petite cavit, la cavit labiale. Cet
allongement occasionnel du conduit vocal entrane
un abaissement des F2 et F3. Ainsi, la seule dirence
articulatoire entre /i/ et /y/, qui sont toutes les deux
des voyelles fermes antrieures, est larrondissement
des lvres pour la production de /y/. Le F3 de /y/
(2100 Hz) est alors plus bas que celui de /i/ (3000
Hz). Il en va de mme pour le F2 (/y/ = 1750 Hz ;
/i/ = 2000 Hz). Les voyelles arrondies sont /y/, /u/,
/o/, /o/, /o/, /5/, /5/, /o/. Les voyelles non-arrondies
(tires) sont /i/, /c/, /c/, /a/, /o/, /o/, /c/.
d. La nasalit
Les voyelles nasales prsentent des caractristiques plus
complexes concernant leur description acoustique. Lors
de la production des voyelles nasales, le voile du palais
sabaisse laissant le ux dair accder aux fosses nasales.
Les fosses nasales entrent donc en communication avec
le conduit oral. Le couplage acoustique de ces cavits
donne lieu un formant supplmentaire, nomm
formant nasal (vers 500 Hz 700 Hz) ainsi qu des
anti-formants , autrement dit des zones o lon
observe une forte chute de lintensit des harmoniques.
Par ailleurs une modication des valeurs formantiques
des voyelles orales correspondantes est observe. Les
voyelles nasales sont /o /, /5 /, /c /, /o /. Les voyelles
nonarrondies (tires) sont /i/, /y/, /u/, /c/, /o/, /o/,
/c/, /o/, /5/, /a/, /o/.
Tableau 1. Valeurs formantiques moyennes des voyelles orales
du franais (daprs Tubach, 1989).
F1 F2 F3
voy. fermes
i
308 2064 2976
y
300 1750 2120
u
315 764 2027
voy. mi-fermes
c
365 1961 2644
o
381 1417 2235
o
383 793 2283
voy. mi-ouvertes
c
530 1718 2558
o
517 1391 2379
5
531 998 2399
voy.ouverte
a
684 1256 2503
Fig. 3. Valeurs formantiques des voyelles a, i, u (en haut) et
coupe sagittale du tractus vocal (en bas) avec les direntes
positions de la langue pour la production de ces trois voyelles,
les plus distinctes du point de vue articulatoire.
4
I - Neurophysiologie - 13 - Phontique acoustique
2. Les consonnes
Les consonnes peuvent tre priodiques ou
apriodiques. Par rapport aux voyelles, elles sont
produites avec un resserrement du conduit vocal.
Les consonnes constituent un ensemble de sons trs
htrogne aussi bien du point de vue articulatoire
quacoustique. Le type de resserrement ralis
va permettre de distinguer les macroclasses de
consonnes. Dune certaine faon les deux macro-
classes occlusives et fricatives sont des sous-ensembles
homognes et organiss. Nous regroupons les autres
types de consonnes dans la catgorie des consonnes
vocaliques en raison de la prsence dune structure de
formant dans leur ralisation acoustique. Toutefois,
cette catgorie est constitue de sons trs dirents
dun point de vue articulatoire.
En acoustique, trois grandes classes sont donc
distingues : 1/ pour les occlusives (ou plosives), le
conduit phonatoire est ferme durant une partie de
lmission de la consonnes ; 2/ pour les fricatives (ou
constrictives), le resserrement est important et donne
lieu un bruit turbulent ; 3/ les consonnes vocaliques
prsentent un rtrcissement ponctuel et/ou peu
important du conduit vocal. Ce faible rtrcissement
permet la prsence dune structure formantique
visible pour ces consonnes.
a. Les occlusives
On distingue gnralement les occlusives orales
des occlusives nasales. Eectivement, dun point de
vue articulatoire les occlusives se caractrisent par la
fermeture complte du conduit oral. Toutefois pour
les nasales le voile du palais est abaiss. Locclusion
devient alors relative puisque lair passe par les cavits
nasales qui entrent en rsonance donnant lieu une
structure de formant. Sur le simple critre de lanalyse
acoustique, les occlusives nasales devraient tre classes
parmi les consonnes vocaliques (Meunier, 1994). Pour
cette raison, nous dcrirons les nasales plus bas (3. Les
consonnes vocaliques).
Les occlusives orales sont constitues de deux
vnements temporels. Dabord une tenue, dure
pendant laquelle locclusion est maintenue, puis un
relchement de locclusion. Ces deux vnements
donnent lieu une trace acoustique dirente selon
que locclusive est priodique ou apriodique. Pour ces
dernires, le conduit vocal tant totalement ferm, ces
consonnes sont caractrises par un silence durant toute
la dure de locclusion. A la n de locclusion, le contact
de locclusion (lvres, palais ou autre) est brutalement
relch donnant lieu un bruit dexplosion dont la
frquence est caractristique de la consonne. Il en va
de mme pour les occlusives priodiques la dirence
prs que la vibration des cordes vocales donne lieu
une onde sonore (remplaant le silence des occlusives
apriodiques et visible sur un spectrogramme sous la
forme dune barre de voisement ) dont la frquence
est celle de la frquence fondamentale (F0) (Fig.
4). Les caractristiques de la barre de voisement
ont une grande importance dun point de vue
perceptif. Le Voice Onset Time (V.O.T.) est le temps
dtablissement du voisement, mesur partir de la
barre dexplosion (Serniclaes, 1987). En franais, les
occlusives sourdes ont un V.O.T. positif (le voisement
sinstalle aprs lexplosion), alors que les sonores ont un
V.O.T. ngatif (ltablissement du voisement prcde
lexplosion). Ce nest pas le cas dans toutes les langues
(Lisker et Abramson, 1964). Les occlusives priodiques
La priodicit ou lapriodicit des sons du langage
fait rfrence, respectivement, la vibration ou
labsence de vibration des cordes vocales. On trouve
galement les termes vois/non vois ou sonore/sourd.
On lit parfois dans des ouvrages que les consonnes sont
des sons apriodiques. Toutefois, partir du moment
o une source sonore est prsente, on observe, sur le
signal de parole, une onde priodique laquelle peut
tre ajoute une source bruite. Nous considrons que
ces signaux sont priodiques.
Fig. 4. Signaux temporel (en haut) et spectrographique (en bas) des squences /apa/ ( gauche) et /aba/ ( droite). On observe la
barre de voisement permettant de distinguer le /b/ du /p/.
5
I - Neurophysiologie - 13 - Phontique acoustique
sont gnralement plus courtes que les occlusives
apriodiques. Leur bruit dexplosion est galement de
moindre intensit que celui de leur quivalente sourde.
Les occlusives orales apriodiques sont /p/, /t/, /k/. Les
occlusives orales priodiques sont /b/, /d/, /g/.
Les occlusives se distinguent galement en
fonction de leur lieu darticulation, autrement dit
du lieu o est eectu la fermeture du conduit vocal
(Fig. 5). Il existe trois lieux darticulation pour les
occlusives en franais : les bilabiales (les deux lvres
viennent en contact), les alvolaires (lapex de la
langue vient obturer le conduit oral en se plaant
sur les alvoles, cest--dire, juste derrire les incisives
centrales suprieures), les vlaires (le dos de la langue
vient en contact du velum, cest--dire la partie
molle et postrieure du palais). Les caractristiques
acoustiques qui permettent de direncier ces trois
types docclusives portent a priori sur une dure trs
brve (5 30 ms), le bruit dexplosion. En eet, la
tenue est constitue soit dun silence, soit dune
onde non caractristique du lieu darticulation de la
consonne produite. La frquence, la dure et lnergie
du bruit dexplosion sont typiques de la consonne
produite. Les bilabiales ont un bruit dexplosion de
trs faible nergie (parfois mme non identiable),
court et de basse frquence. Les alvolaires produisent
un bruit intense, court et plutt de haute frquence.
Enn, les vlaires ont un bruit intense, long et
dont la frquence dpend troitement de la voyelle
suivante. En eet, la frquence du bruit dpend de
la taille de la cavit antrieure au lieu docclusion et
pour les vlaires, le lieu docclusion va lgrement se
dplacer selon que la voyelle suivante est une voyelle
antrieure (/i/) ou postrieure (/u/), ceci en raison
de la coarticulation (cf. plus loin dans ce chapitre).
Toutefois, on considre gnralement que les traces
acoustiques les plus saillantes pour lidentication du
lieu darticulation des occlusives ne sont pas internes
au segment consonantique, mais dans les pentes de
transition des voyelles (cf. chapitre 8, Fig. 8). Les
transitions sont les variations frquentielles (sous forme
de pente) des formants de la voyelle au contact de la
consonne. Le type de pente (montant, descendant ou
plat) va dpendre du lieu darticulation de locclusive
ainsi que du type de voyelle produit. Les occlusives
bilabiales sont /p/ et /b/. Les occlusives alvolaires
sont /t/ et /d/. Les occlusives vlaires sont /k/ et /g/.
b. Les fricatives
Les consonnes fricatives sont caractrises par la
prsence dun bruit turbulent durant toute leur tenue.
Ce bruit est issu dun resserrement important, mais
incomplet du tractus vocal. Les fricatives peuvent
tre apriodiques ou priodiques. Dans ce deuxime
cas, le bruit se superpose une onde sinusodale
caractristique de la frquence fondamentale (Fig.
6). Tout comme les occlusives, les fricatives sonores
sont plus brves que les fricatives sourdes. De mme,
on note une intensit globale du bruit plus faible
pour les sonores en raison de la vibration des cordes
vocales qui diminue la pression supraglottique. Les
fricatives apriodiques sont /I/, /s/, /j/. Les fricatives
priodiques sont /v/, /z/, //.
La frquence et lintensit du bruit de friction
dpendent du lieu darticulation de la consonne,
Fig. 5. Coupe sagittale du tractus vocal et localisation des lieux
darticulation et articulateurs utiliss pour la description des
sons des langues du monde.
Fig. 6. Signaux temporel (en haut) et spectrographique (en bas) des squences /aja/ ( gauche) et /aa/ ( droite). On constate le
voisement bruit de la fricative //. A noter galement la dure plus courte et lintensit plus faible de la fricative sonore.
6
I - Neurophysiologie - 13 - Phontique acoustique
cest--dire de lendroit du conduit o le passage de
lair est le plus troit. Il existe trois lieux darticulation
en franais pour les fricatives : lespace entre la lvre
infrieure et les incisives suprieures (labio-dentales),
lespace entre la langue et les alvoles (les alvolaires) et
lespace entre la langue et le palais dur (les palatales).
Notons que pour les alvolaires et les palatales, la
langue entre en contact avec le lieu darticulation,
mais uniquement sur les parties latrales, laissant
passer lair au milieu. Le lieu de resserrement donne
la cavit buccale une conguration particulire qui
dtermine la frquence du bruit. Le bruit des labio-
dentales est de faible intensit (cest dailleurs leur
principale caractristique), il prsente des pics dius
vers 3, 5 et 8 kHz. Celui des alvolaires, plus intense, se
situe entre 4 et 8 kHz avec des pics autour de 5 kHz et
8 kHz. Enn pour les palatales, le bruit de turbulence
se situe entre 2 et 7 kHz avec un pic dius dont la
moyenne se trouve autour de 4 kHz. Les fricatives
labio-dentales sont /I/, /v/. Les fricatives alvolaires
sont /s/, /z/. Les fricatives palatales sont /j/, //.
c. Les consonnes vocaliques
Lappellation consonnes vocaliques est peu
rpandue. Certains auteurs utilisent les termes
Consonnes sonantes ou dautres ne regroupent pas
ces consonnes dans une seule classe mais dtaillent
chaque type. Nous avons choisi dutiliser ces termes
car ils retent la fois laspect consonantique
(rtrcissement du tractus) et vocalique (structure de
formant) de ces consonnes. Dune certaines faon, il
sagit de sons intermdiaires plutt considrs comme
des consonnes en raison de la place quils occupent
dans la syllabe (attaque ou coda, cf. chapitre 14).
Cette catgorie est bien plus complexe dcrire
que les autres catgories de consonnes. Elle est en
fait constitue dlments trs divers. On distingue
les approximantes latrales, les vibrantes, les nasales
et les glissantes. Ces types de consonnes ont peu de
caractristiques communes, si ce nest le rtrcissement
partiel ou transitoire du tractus vocal qui permet
lapparition de structures de formants moins stables
et moins intenses que celles des voyelles. Mme si
chacune de ces consonnes possde des structures
formantiques spciques, les frquences des formants
sont relatives aux consonnes et voyelles adjacentes.
Il existe une approximante en franais, la latrale
/l/. Les approximantes prsentent un rtrcissement
du tractus vocal, mais moins important que celui des
fricatives. Ce faible rtrcissement, intermdiaire entre
larticulation vocalique et consonantique, ne gnre
pas de bruit. Le lieu darticulation de /l/ est situ sur
lavant du palais : lapex de la langue va se positionner
sur les alvoles, laissant passer lair sur lun ou les deux
cts de la langue, do son nom de latrale. Le F1 est
autour de 300 Hz tandis que le F2 est fonction des
voyelles adjacentes (Fig. 7).
Fig. 7. Signaux spectrographiques des squences /ama/, /ala/ et /aja/. On note la faible intensit des formants des consonnes
vocaliques compars ceux des voyelles. On observe galement laspect totalement continu des variations formantiques de la
7
I - Neurophysiologie - 13 - Phontique acoustique
Tout comme pour lapproximante, il nexiste
quune vibrante (ou trill en anglais) en franais,
il sagit du /r/. La consonne /r/ a un statut tout
fait particulier car cest le son du franais le plus
multiforme. Il prend en eet des aspects extrmement
varis en fonction du contexte phontique dans lequel
il se trouve. Traditionnellement considr comme une
vibrante en franais, il est, en fait, rarement ralis
ainsi. Une vibrante est une consonne pour laquelle
la langue va entrer en battements le plus souvent
multiples au niveau du lieu darticulation (alvolaire
ou uvulaire). La vibrante alvolaire /r/ ( r roul )
nest prsente que dans certains accents rgionaux
et tend disparatre. Le lieu darticulation du r
le plus frquent en franais est uvulaire (donc le son
le plus postrieur du franais). Il est ralis vibrant
(/n/ dans le tableau de lIPA) uniquement en groupe
consonantique lorsquil est prcd dune occlusive ou
dune fricative sonore (Fig. 8). Ce /n/ est alors constitu
de trois parties : une partie voyelle suivie dune partie
battue suivie elle-mme dune autre partie voyelle
(pour une description complte, cf. Meunier, 1994).
En revanche, on observe une ralisation fricative /n/
dans les groupes consonantiques o les occlusives ou
fricatives sont sourdes. Dans ce dernier cas, le /n/
est totalement dvois (assimilation de voisement
avec la consonne qui prcde) et prend le statut
dune consonne fricative (Fig. 8). Enn, en contexte
intervocalique, le r est en gnral ralis comme
une approximante : il ny a pas de pas de battement et
ce nest pas une fricative. Le lieu darticulation reste
uvulaire dans tous les cas.
Nous avions mentionn les consonnes nasales
dans la partie relative aux occlusives en raison de
lobstruction complte du conduit oral. De ce fait,
ces consonnes sont souvent considres comme
des occlusives. Il existe deux consonnes nasales en
franais : /m/ et /n/. Dun point de vue articulatoire,
elles sont totalement comparables aux occlusives
orales si ce nest que labaissement du velum autorise
la sortie de lair par les fosses nasales. Ainsi, /m/ est
une bilabiale. Son articulation est identique celle
de /p/ et /b/ except labaissement du voile du palais.
De mme, /n/ est une alvolaire comme /t/ et /d/.
Les formants de /m/ sont plus graves que ceux de
/n/. Comme pour les voyelles nasales, on note pour
ces consonnes la prsence danti-formants dus au
couplage des cavits orale et nasale (Fig. 7).
Les glissantes (ou glides an anglais) sont par
excellence des lments phontiques intermdiaires
entre consonnes et voyelles. Certains auteurs les font
appartenir la classe des approximantes. Elles sont,
de ce fait, galement appeles semi-voyelles ou semi-
consonnes. Elles sont au nombre de trois en franais:
/j/, /q/ ct /w/. Leur articulation se fait en rfrence
larticulation des trois voyelles fermes : /i/ pour
Fig. 8. Signaux temporel (en haut) et spectrographique (en bas) des squences /dna/ ( gauche) et /tna/ ( droite). On observe la
partie vocalique puis battue (chute dintensit) du /n/ dans la squence voise /dna/. En revanche, dans la squence dvoise /tna/,
le /n/ est totalement dvois et fricatif.
Deux autres nasales sont souvent mentionnes
comme tant des phonmes du franais. Il sagit de
// et de /p/. Elles sont constitues chacune de deux
lments consonantiques, /n/ + /j/ (pour //) et /n/
+ /g/ (pour /p/). Leur apparition dans le discours est
relativement rare et fortement conditionn par le
lexique. // est cens apparatre dans des mots comme
pagne (/pa/) ou peigne (/pc/). Toutefois, aucun
argument convaincant ne peut expliquer pourquoi il
sagit dun phonme spcique et non une ralisation
allophonique de /nj/. Le phonme /p/, quant lui,
napparat que dans des mots emprunts langlais.
De plus, ces phonmes consonantiques ont un statut
syllabique peu cohrent avec les autres consonnes :
toutes les autres consonnes du franais peuvent se
combiner pour constituer un groupe de consonnes
soit en attaque, soit en coda de syllabe. Les deux
consonnes // et de /p/ ne peuvent, elles, se combiner
avec dautres consonnes. Ces arguments nous amnent
considrer quil sagit, en franais, de groupes de
consonnes plutt que de consonnes simples.
8
I - Neurophysiologie - 13 - Phontique acoustique
/j/ (palatale), /y/ pour /q/ (labio-palatale) et /u/ pour
/w/ (labio-vlaire). Les glissantes sont caractrises
par une structure formantique faible, en variation
constante et donc sans partie stable, la dirence
des voyelles. Cette instabilit sexplique par un
resserrement des articulateurs plus important pour
les glissantes ainsi que par une articulation en
mouvement. Leur caractre transitoire et vocalique
fait quil est impossible de distinguer avec assurance
la n dune glissante du dbut de la voyelle qui suit
(Fig. 7).
III. Prototypes acoustiques et
ralits de la parole
Lensemble des descriptions que nous avons propos
ci-dessus reprsentent des prototypes des sons du
franais. En dautres termes, il sagit de descriptions
obtenues partir de productions trs contrles
(appeles parole de laboratoire ) auprs de groupes
de populations homognes. Pourquoi est-il ncessaire
de contrler les productions de parole pour obtenir
des prototypes acoustiques stables ? Dans la parole
conversationnelle classique, les sources de variation
de la parole sont nombreuses et leur impact sur les
ralisations phontiques peut tre de nature changer
considrablement les valeurs prototypiques des sons
dcrits. En quelque sorte, lobjectif de la description
des sons tant la distinctivit, il est ncessaire pour
augmenter cette distinctivit de rduire les sources de
variation. Toutefois, pour viter de donner dans ce
chapitre limpression que tout cart par rapport ces
prototypes est dviant, ce qui serait erron, nous nous
proposons dvoquer rapidement quelques sources de
variations normales de la parole.
1. Enchanements articulatoires et
coarticulation
Parmi les dirents facteurs qui occasionnent
la variabilit des sons de la parole, celui qui a
probablement donn lieu au plus grand nombre
dtudes est la coarticulation. Elle peut tre dcrite
comme le chevauchement et linteraction des dirents
articulateurs au cours de la production de segments
phontiques successifs (Farnetani, 1997). La vitesse
de production des sons de la parole (12 sons par
seconde, donc environ 700 sons par minute) a pour
consquence que les gestes articulatoires ne peuvent
tre produits indpendamment les uns des autres. Ils
sont donc souvent soient anticips, soit persistants.
Par exemple, lors de la ralisation du mot sous
(/su/), la conguration du conduit vocal prsente, ds
le dbut de la fricative, les caractristiques du trait
darrondissement de la voyelle /u/ dont larticulation
est anticipe, alors que dans la production de /si/, les
lvres sont en position tires au dbut de larticulation
du /s/. Ces deux congurations donnent des rsultats
acoustiques trs dirents : larrondissement des
lvres durant la ralisation du /s/ dans /su/ augmente
la taille de la cavit buccale ; la frquence du bruit
de /s/ dans /su/ est donc plus grave que celui de /si/.
Dans ce cas, on observe donc un dcalage par rapport
aux valeurs prototypiques. Cet exemple nest pas
isol. La production de la parole implique la prsence
systmatique de ce type de conguration. Le cas de la
coarticulation est inhrent la production de la parole.
Cest pourquoi la prise en compte des variations dues
la coarticulation est dsormais incontournable dans
les descriptions de la parole. Ces chevauchements
systmatiques des gestes articulatoires trouvent un
cadre privilgi au sein de la syllabe (cf. chapitre 14).
Toutefois, des travaux rcents ont pu montr des
phnomnes danticipation ou de persistance dans
des units dpassant largement le cadre de la syllabe.

2. Caractristiques du locuteur
Lanatomie du conduit vocal, qui change selon
le sexe et lge, est lorigine dune autre forme de
variation totalement inhrente la production de la
parole. La hauteur de la voix est le paramtre le plus
apparemment aect par lge ou le sexe des locuteurs.
Si la F0 des enfants de deux ans est autour de 400 Hz,
elle baisse continuellement pour se stabiliser aprs la
pubert entre 200 Hz et 250 Hz pour les femmes
tandis que celle des hommes se situe entre 100 Hz et
150 Hz. Si chaque auditeur est capable didentier le
On remarquera parfois une nomenclature
articulatoire peu cohrente pour les glissantes. Elle
sexplique par une appartenance conjointe de ces
phonmes la classe des voyelles comme celle des
consonnes. Ainsi, en tant que consonnes, elles trouvent
leur description articulatoire dote des termes propres
aux lieux darticulation consonantiques : palatale, labio-
palatale et labio-vlaire. Ces termes, peu explicites pour
des consonnes du franais (le terme labio rfre en
gnral, pour les consonnes, au lieu de constriction du
tractus et non larrondissement des lvres), trouvent
leurs quivalents dans la nomenclature propre la
description des voyelles de cette faon : palatale =
antrieur ; vlaire = postrieur ; labio = arrondi. Il est
ncessaire dclairer cette quivalence dans la mesure
o le lieu darticulation des glissantes se rfre celui
des trois voyelles fermes.
9
I - Neurophysiologie - 13 - Phontique acoustique
sexe du locuteur daprs la hauteur de la voix, il lui sera
beaucoup plus dicile de prendre conscience que les
hommes et les femmes produisent des voyelles dont
les valeurs acoustiques sont direntes. Pourtant ces
variations, dues aux tailles des rsonateurs (plus larges
pour les hommes), sont bien relles et engendrent
des valeurs de formant plus leves pour les femmes
(Tubach, 1989). Ainsi, alors que les trois formants
de /e/ pour un homme sont en moyenne de 365 Hz,
1961 Hz et 2644 Hz (cf. Tableau 1), ils augmentent
pour une femme 417 Hz, 2351 Hz et 3128 Hz en
raison de la taille rduite des direntes cavits.
Indpendamment des caractristiques anatomiques
des locuteurs, il existe galement des variations
dues la spcicit de chaque locuteur, son origine
gographique, ses caractristiques sociales, etc. Par
exemple, les locuteurs du nord-est de la France
produisent des /a/ (/o/) plus postrieurs que ceux de
la moyenne des Franais.
3. Type de parole
On oppose depuis quelques annes la parole de
laboratoire la parole naturelle ou spontane .
Lanalyse de la parole produite dans des conditions
relles est relativement rcente. Une des raisons
majeures de cette marginalit est la trs forte variabilit
des sons produits en parole spontane, non contrle,
mais aussi lidentication dlicate des sources de
variations qui aectent le signal. Les ralisations
des units phontiques sont ainsi trs loignes de
leurs valeurs prototypiques. Dans une tude portant
sur la ralisation et la perception des occlusives du
franais, Duez (1995) montre quen parole spontane
seulement la moiti des consonnes sont identies
correctement. Parler est une adaptation constante
aux situations de communication (Lindblom, 1990).
Larticulation peut tre soutenue si la situation le
demande (contexte peu informatif, milieu bruit, etc.)
ou relche si la situation est peu ambigu. Plusieurs
travaux (Lindblom, 1963 ; Gendrot et Adda-Decker,
2006) ont ainsi pu montrer que plus le dbit de
parole augmente, moins les cibles articulatoires sont
atteintes. De mme, larticulation des voyelles tend
se rduire en mme temps que la production de
la parole est contextualise (Meunier et al., 2006).
Le triangle caractristique de la reprsentation
acoustique des voyelles montre que les voyelles sont
produites en priphrie lorsquelles sont prononces
isolment, tandis quelles se centralisent lorsquelles
sont produites dans un texte lu (Fig. 9). Cela signie
que larticulation des voyelles en lecture de texte tend
vers une voyelle centrale /c/, pour laquelle les gestes
articulatoires sont les plus neutres. En consquence,
la parole trs contrle (celle qui permet de fournir
des mesures prototypiques) est caractrise par une
hyperarticulation, alors que la parole contextualise
est sous-articule.
IV. Conclusion
Nous avons cherch, dans ce chapitre, dresser
un portrait des ralisations acoustiques des sons du
franais. Ce portrait nest pas toujours simple tant
donn la complexit de lorganisation des sons dans
une langue. Si certaines classes de sons semblent
former un systme articulatoire et acoustique
organis en franais (les voyelles, les occlusives,
les fricatives), dautres sons semblent plus isols et
nentrent pas dans lorganisation dun systme de
traits aussi rgulier. Dune certaine faon, il existe des
sons trs ouverts (les voyelles) et dautres trs ferms
(les occlusives et les fricatives). Entre les deux, les
ralisations articulatoires semblent plus mouvantes et
moins simples expliciter.
Fig. 9. Ralisations acoustiques des voyelles /i/, /e/, /a/, /o/, /u/ prononces isolment ( gauche) et dans un texte. On observe la
rduction considrable de la taille globale du systme vocalique ; les valeurs moyennes de formants observes en lecture de texte
sont trs loignes des valeurs prototypiques (daprs Meunier et al., 2006).
10
I - Neurophysiologie - 13 - Phontique acoustique
Nous insistons sur le fait que les ralisations
acoustiques des sons dune langue sont des phnomnes
bien plus mouvants quune simple description
pourrait le laisser penser. La production des sons est
une composante de lorganisation plus gnrale de la
production du langage. Cette organisation suppose
des interactions complexes entre les dirents niveaux
linguistiques ainsi que des contraintes cognitives
mettant en relation un locuteur avec un (ou des)
auditeurs. Aussi, la prsentation de valeurs acoustiques
prototypiques ne reprsente que la partie mergente
de liceberg des productions sonores du langage en
condition normale. Cette partie mergente est celle
qui apparat lorsque lon isole la production des sons
du contexte linguistique.
Rfrences
1. Duez D. On spontaneous French speech : Aspects of
the reduction and contextual assimilation of voiced
stops . J Phonetics 1995, 23: 407-427.
2. Farnetani E. Coarticulation and connected speech.
In Hardcastle WJ, Laver J (eds). Handbook of
Phonetic Sciences. Blackwell. Oxford. 1997, pp
371-404.
3. Gendrot C, Adda-Decker M. Analyses formantiques
automatiques en franais: priphralit des voyelles
orales en fonction de la position prosodique. Actes des
26mes Journes dtudes sur la Parole, Dinard, juin
2006 : 407-410
4. International Phonetic Association. (1999).
Handbook of the International Phonetic Association.
A Guide to the Use of the International Phonetic
Alphabet. Cambridge University Press. Cambridge.
5. Lindblom B. Spectrographic study of vowel reduction.
J Acoust Soc Am 1963, 35: 1773-1781.
6. Lindblom B. Explaining phonetic variation : a
sketch of the hyper- and hypospeech theory. In
Hardcastle WJ, Marchal A (eds). Speech Production
and Speech Modelling. Kluwer Academic Publishers.
1990, pp 403-439.
7. Lisker L, Abramson AS. A cross-language study of
voicing in initial stops: acoustical measurements.
Word 1964, 20: 384-422.
8. Meunier C. (1994). Les groupes de consonnes :
problmatique de la segmentation et variabilit
acoustique. Tse de lUniversit de Provence. Aix-
en-provence. France.
9. Meunier C, Espesser R, Frenck-Mestre C. Aspects
phonologique et dynamique de la distinctivit au
sein des systmes vocaliques : une tude inter-langues.
Actes des 26mes Journes dtudes sur la Parole,
Dinard, juin 2006 : 333-336.
10. Rossi M. Segmentation automatique de la parole.
Pourquoi ? Quel segments ? Traitement du signal
1990, 7: 315-326.
11. Schwartz JL, Bo LJ, Valle N. Major trends in
vowel system inventories. J Phonetics 1997, 25:
233-253.
12. Serniclaes W. (1987). Etude exprimentale de la
perception du trait de voisement des occlusives du
franais. Tse de lUniversit Libre de Bruxelles.
Bruxelles. Belgique.
13. Tubach JP. (1989). La parole et son traitement
automatique. Masson. Paris.