Vous êtes sur la page 1sur 2

1/2

Modlisation physique de la parole articule.

Ce sujet de thse se situe dans le cadre du projet ANR Artspeech qui vise synthtiser de la
parole partir du texte en simulant numriquement le processus physique de production de la
parole chez un humain, cest--dire les aspects articulatoires, arodynamiques et acoustiques.

Du point de vue de la physique, la production des sons de parole rsulte de la conversion d'un
coulement arien provenant des poumons en une perturbation acoustique. Ceci est ralis
notamment par l'auto-oscillation des plis vocaux, dans le cas des sons voiss, par le relchement
rapide d'une occlusion du conduit vocal, dans le cas des plosives ou bien encore par les fluctuations
internes d'un coulement turbulent en interaction avec les parois du conduit vocal, dans le cas des
fricatives. La modlisation de ces vnements est complexe parce quelle implique la
description conjointe de phnomnes relevant du domaine de la mcanique, de la mcanique
des fluides, de lacoustique ainsi que des leurs interactions cest--dire de larodynamique ou
de larodistorsion et de laro-acoustique. Pour des raisons pratiques (puissance des calculateurs)
et thoriques (validation des algorithmes, stabilit, dfinition des conditions aux limites), la
simulation numrique directe de ces phnomnes reste l'heure actuelle limite l'tude de
configurations ponctuelles, souvent trs simplifies. Mme ainsi restreinte, la simulation numrique
de l'acoustique du conduit vocal ncessite typiquement une dizaine d'heures [1]. Celle de
l'coulement au travers des cordes vocales se compte en jours sur un supercalculateur [2]. La
simulation numrique directe reste un outil coteux et inadapt aux fins de la synthse.

Lapproche propose dans cette thse consiste dvelopper des modles thoriques simplifis et
valids, visant rendre compte des phnomnes physiques essentiels.
Ainsi, plutt que de considrer une infinit de degrs de libert, les modles distribus de type
masse-ressort [3] ne prennent en compte que les modes de vibration principaux des cordes vocales.
De la mme manire, la mthode modale en acoustique permet de modliser de manire trs
efficace et avec une prcision comparable la simulation numrique par Elments Finis [1],
des phnomnes tridimensionnels qui ne peuvent pas tre prdits par les thories classiquement
utilises en parole (modles d'ondes planes).
En ce qui concerne la modlisation de l'coulement arien, l'analyse thorique [4, 5], soutenue par
des travaux exprimentaux [6, 7], permet d'identifier la nature des phnomnes physiques les plus
importants et de rationaliser un certain nombre d'hypothses simplificatrices. L'analyse
dimensionnelle des quations de Navier Stokes applique au larynx, permet ainsi de justifier
l'utilisation de modles d'coulement localement incompressible (faible nombre de Helmoltz),
quasi-stationnaire (faible nombre de Strouhal) et faible viscosit (nombre de Reynold
modr). De mme, l'utilisation d'analogies aroacoustiques permet de modliser la production
de son par turbulence sans ncessiter une description dtaille de l'coulement [8, 9].
Le champ d'applications de ces travaux est vaste puisqu'il va de la recherche fondamentale l'tude
des pathologies, du contrle moteur et de la synthse de la parole, bien sr.

Lobjectif est de modliser thoriquement le processus physique de production de la parole chez un


humain, cest--dire rendant compte :
des gestes des articulateurs de la parole (mandibule, langue, lvres, voile du palais, larynx),

GIPSA-lab
Grenoble Campus
11 rue des Mathmatiques - BP46 UMR5216
F-38402 SAINT MARTIN DHERES Cedex CNRS
Tl. +33 (0)4 76 57 45 36 www.gipsa-lab.fr Grenoble INP
Fax +33 (0)4 76 82 64 26 xavier.pelorson@gipsa-lab.fr UGA
2/2

du contrle des cordes vocales dont la vibration est lune des sources sonores qui excitent le
conduit vocal,
des phnomnes arodynamiques qui modifient le flux dair depuis les plis vocaux jusquaux
lvres,
de la propagation de londe acoustique dans le conduit vocal et du rayonnement aux lvres pour
donner le signal acoustique tel quil est peru par des auditeurs,
et enfin des interactions entre ces diffrents lments.

Des modles thoriques de complexit croissante seront donc dvelopps et valids sur la base dun
banc exprimental reproduisant sur maquette le fonctionnement du conduit vocal humain. Ces
modles seront enfin implments et tests acoustiquement sur un synthtiseur articulatoire
dvelopp par nos partenaires du projet ANR.

Encadrement :
Xavier Pelorson (xavier.pelorson@gipsa-lab.grenoble-inp.fr), Annemie Van Hirtum
(annemie.vanhirtum@gipsa-lab.grenoble-inp.fr).

Rfrences :

[1] R. Blandin, M. Arnela, R. Laboissire, X. Pelorson, O. Guasch, A. Van Hirtum, and X. Laval.
Effects of higher order propagation modes in vocal tract like geometries. Journal of the Acoustical Society of
America, 137(2):832843, 2015.
[2] J. Jansson, A. Holmberg, R.V. de Abreu, C. Degirmenci, J. Hoffman, M.K. arlsson, and M. Abom.
Adaptive stabilized finite element framework for simulation of vocal fold turbulent fluid-structure
interaction. In Proceedings of 21st International Congress on Acoustics, ICA 2013 - 165th Meeting of the
Acoustical Society of America, Montreal, 2013.
[3] K. Ishizaka and J. L. Flanagan. Synthesis of voiced sounds from a two-mass model of the vocal
cords. Bell Syst. Technol. J., 51:12331268, 1972.
[4] X. Pelorson, A. Hirschberg, A.P.J. Wijnands, H.M., and A. Bailliet. Theoretical and experimental
study of quasisteady-flow separation within the glottis during phonation. application to a modified two-mass
model. Journal of the Acoustical Society of America, 96(6):34163431, 1994.
[5] B.D. Erath, S.D. Peterson, M. Za nartu, G.R. Wodicka, and M.W. Plesniak. A theoretical model of
the pressure field arising from asymmetric intraglottal flows applied to a two-mass model of the vocal folds.
Journal of the Acoustical Society of America, 130(1):389403, 2011.
[6] N. Ruty, X. Pelorson, A. Van Hirtum, I. Lopez-Arteaga, and A. Hirschberg. An in vitro setup to test
the relevance and the accuracy of low-order vocal folds models. Journal of the Acoustical Society of
America, 121(1):479490, 2007.
[7] R. C. Scherer, D. Shinwari, K.J. DeWitt, C. Zhang, B.R. Kucinschi, and A.A. Afjeh. Intraglottal
pressure profiles for a symmetric and oblique glottis with a uniform duct. Journal of the Acoustical Society of
America, 112(4):12531256, 2001.
[8] M.S. Howe and R.S. McGowan. Aeroacoustics of [s]. Proc. of the Royal Society A, 461:10051028,
2005.
[9] M. Krane. Aeroacoustic production of low-frequency unvoiced speech sounds. Journal of the
Acoustical Society of America, 118(1):410427, 2005.

GIPSA-lab
Grenoble Campus
11 rue des Mathmatiques - BP46 UMR5216
F-38402 SAINT MARTIN DHERES Cedex CNRS
Tl. +33 (0)4 76 57 45 36 www.gipsa-lab.fr Grenoble INP
Fax +33 (0)4 76 82 64 26 xavier.pelorson@gipsa-lab.fr UGA