Académique Documents
Professionnel Documents
Culture Documents
yohann.meynadier@lpl-aix.fr, yulia.gaydina@lpl-aix.fr
RÉSUMÉ____________________________________________________________________________________________________________
Ce travail porte sur le contraste phonologique de voisement en parole chuchotée qui se
caractérise par une configuration semi-ouverte des cordes vocales empêchant leur
vibration. En parole modale, outre la vibration des cordes vocales, le contraste entre
consonnes voisées et sourdes est supporté par d’autres corrélats phonétiques : durées des
consonnes et des voyelles, pression intraorale, entre autres. Les analyses acoustiques et
aérodynamiques des consonnes voisées vs sourdes montrent que ces corrélats secondaires
du voisement sont préservés en parole chuchotée, pouvant donner une assise à la
persistance de la perception de ce contraste malgré l’absence de vibration des cordes.
ABSTRACT _________________________________________________________________________________________________________
Voicing contrast in whispered speech
This paper presents analyses on the phonological voicing contrast in whispered speech,
which is characterized by a semi-open configuration of the vocal folds preventing them
from vibrating. In modal speech, in addition to vocal fold vibration, the contrast between
voiced and unvoiced consonants is realized by other phonetic correlates: e.g. consonant
and pre-consonantal vowel durations, intraoral pressure differences. Acoustic and
aerodynamic analyzes show that these voicing correlates are preserved in whispered
speech. These findings seem consistent with those showing that voiced contrast is
maintained in perception despite the absence of vocal fold vibration.
MOTS-CLÉS : phonétique, voisement, voix chuchotée, aérodynamique, durée segmentale
KEYWORDS: phonetics, voicing, whisper, aerodynamics, segmental duration
1 Introduction
Cette expérience porte sur l’analyse acoustique de la durée des consonnes voisées vs
sourdes et des voyelles pré-consonantiques en parole modale vs chuchotée.
2.1 Corpus
2.2 Analyses
L’étiquetage du signal acoustique a été réalisé sous Praat (www.fon.hum.uva.nl/praat).
Afin de garantir une segmentation identique dans les deux modes de phonation, elle a
essentiellement été effectuée à partir du spectrogramme. Le début et la fin des voyelles
sont respectivement localisés au début et à la fin de l’énergie des F2-F3. Deux phases
consonantiques ont été mesurées : tenue et relâchement (Figure 1). Pour les plosives, la
tenue a été étiquetée de la fin de la voyelle précédente jusqu’au début de l’explosion, le
relâchement du début de l’explosion au début de la voyelle suivante, incluant le bruit de
friction et les traces formantiques de la transition CV. Pour les fricatives, la tenue,
présentant un bruit de friction intense de 2000 à 8000 Hz (selon la consonne), a été
séparée de la phase de transition CV (ou relâchement) identifiée par l’apparition de
traces formantiques de la voyelle suivante et une diminution marquée de l’énergie du
bruit de friction. La tenue va de la fin de la voyelle précédente au début des traces
formantiques de la voyelle suivante. Son relâchement court de la fin du bruit intense au
début de F2-F3 de la voyelle qui suit.
Seules les consonnes en syllabe inaccentuée (position non finale de mot) et les voyelles
précédant celles-ci ont été analysées ici. Les analyses statistiques effectuées sont des
ANOVA à mesures répétées : les locuteurs et la lexicalité (mot vs logatome) sont en
facteurs aléatoires ; le mode de phonation (modale vs chuchotée), le voisement (voisé vs
sourd) et le mode d’articulation (plosive vs fricative) en facteurs indépendants.
Figure 1 – Étiquetage acoustique des voyelles et des consonnes des mots [egepe] (à
gauche) et [ezete] (à droite) en voix modale (en bas) et chuchotée (en haut)
Figure 2 – Durée moyenne (en ms) de la tenue (en bleu) et du relâchement (en rouge)
des consonnes selon le voisement et la phonation
Ces résultats sur la durée des consonnes voisées vs sourdes, d’une part, sont en accord
avec ceux obtenus dans les études précédentes (Mills 2003, 2009, Jovicic & Saric 2008,
Vercherand 2010), et d’autre part, complètent ces connaissances par une observation
plus détaillée des patrons temporels en jeu dans la production du contraste de voisement
en parole chuchotée.
150
120
90
60
Sourde
30
Voisée
0
Fric Occ Fric Occ
modale chuchotée
Figure 3 – Durée moyenne (en ms) des voyelles pré-consonantiques en fonction de la
nature de la consonne suivante en phonation modale et chuchotée
Outre la durée consonantique, en parole modale le voisement est également marqué par
une durée plus importante des voyelles pré-consonantiques devant consonne voisée. Nos
données confirment ce résultat attendu : une voyelle avant une consonne sourde est en
moyenne plus courte (88 ms) que celle précédant une consonne voisée (103 ms)
[F(1,3)=93,103 ; p=0,00236]. Cet écart de 15 ms est similaire à celui observé en parole
chuchotée dans notre corpus [F(1,3)=245,76 ; p=0,00056], soit 16 ms entre les
voyelles avant une consonne sourde et une consonne voisée. Quel que soit le mode
phonatoire ou d’articulation, cet écart reste assez faible (Figure 3), tenant
potentiellement au fait que la voyelle pré-consonantique observée ici n’est pas
tautosyllabique avec la consonne qui suit. L’observation de voyelles suivies d’une
consonne codaïque devrait montrer des différences plus nettes selon le voisement,
comme dans Mills (2003). Reste que ces différences de durée vocalique pré-
consonantique sont préservées en parole chuchotée et pourraient ainsi comme en parole
modale participer au marquage phonétique du contraste de voisement.
Cette expérience porte sur l’analyse du pic de pression intraorale (Po) atteint lors la
constriction des obstruantes sourdes et voisées en fonction du mode de phonation.
4 Conclusion
CATFORD, J.C. (1964). Phonation types: the classification of some laryngeal components
of speech production. IN D. Abercrombie, D.B. Fry, P.A.D. MacCarthy, N.C. Scott & J.L.M.
Trim (eds.), In honour of Daniel Jones, p. 26-37. London: Longmans.
CATFORD, J.C. (1977). Fundamental problems in phonetics. Edinburgh University Press.
EKLUND, I. & TRAUNMÜLLER, H. (1997). Comparative study of male and female whispered
and phonated versions of long vowels of Swedish. Phonetica 54(1): 1-21.
FARACO, M. (1984). Comparaison des intonations affirmative et interrogative en voix normale
et chuchotée. Thèse de doctorat, Université de Provence, Aix-en-Provence.
GHIO, A. & TESTON, B. (2004). Evaluation of the acoustic and aerodynamic constraints of
a pneumotachograph for speech and voice studies. Proceedings of International Conference
on Voice Physiology and Biomechanics, p. 55-58. Marseille.
ITO, T., TAKEDA, K. & ITAKURA, F. (2005). Analysis and recognition of whispered speech.
Speech Comunication 45(2): 139-152.
JOVICIC, S.T. & SARIC, Z. (2008). Acoustic analysis of consonants in whispered speech.
Journal of Voice 22(3): 263-74.
LEHISTE, I. (1970). Suprasegmentals. Cambridge: MIT Press.
MALÉCOT, A. (1955). An experimental study of force of articulation. Studia Ling. 9: 35-44.
MILLS, T.I.P. (2003). Cues to voicing contrasts in whispered Scottish obstruents. Master of
Science, University of Edinburgh.
MILLS, T.I.P. (2009). Speech motor control variables in the production of voicing contrasts and
emphatic accent. Phd dissertation, University of Edinburgh.
NICHOLSON, H. & TEIG, A.H. (2003). How to tell beans from farmers: cues to the
perception of pitch accent in whispered Norwegian. Nordlyd 31(2): 315-325.
OHALA, J. J. (1997). Aerodynamics of phonology. Proceedings of the 4th Seoul International
Conference on Linguistics, p. 92-97.
SHARIFZADEH, H.R., MCLOUGHLIN, I.V. & AHAMDI, F. (2009). Voiced speech from whispers
for post-laryngectomised patients. IAENG International Journal of Computer Science 36.
SCHWARTZ, M.F. (1967). Syllabe duration in oral and whispered reading. JASA 41:1367-9.
SILBERT, N. & DE JONG, K. (2008). Focus, prosodic context, and phonological feature
specification: Pattern of variation in fricative production. JASA 123: 2769-79.
VERCHERAND, G. (2010). Production et perception de la parole chuchotée en français: analyse
segmentale et prosodique. Thèse de doctorat. Université de Paris 7.
WEISMER, G. & LONGSTRETH, D. (1980). Segmental gestures at laryngeal level in whispered
speech: evidence from an aerodynamic study. Journal of Speech Hear. Res. 23: 383-92.