Vous êtes sur la page 1sur 1

J .-P .

HATON

e traitement automatique de la parole est un multilocuteurs (cf . C . Gagnoulet - D . Jouvet et J . C .

L domaine de recherche pour lequel un effort


important a été consenti au cours des trois
dernières décennies. Les problèmes à résoudre sont
Junqua) et en adaptation automatique au locuteur
(cf. J . P. Tubach et coll .) . Les systèmes de reconnais-
sance de mots sont pour l'essentiel fondés sur des
considérables et de nature fondamentale . Ils sont de modèles formels qui ont été progressivement optimi-
plus par essence pluridisciplinaires : traitement du sés : programmation dynamique (cf . J. C . Junqua,
signal, reconnaissance des formes, intelligence artifi- qui utilise par ailleurs un ensemble de connaissances
cielle, informatique, phonétique, linguistique, ergo- phonétiques), modèles stochastiques de Markov, les
nomie, neurosciences interviennent à des degrés plus performants actuellement (cf . C . Gagnoulet -
divers dans les solutions apportées . D . Jouvet), réseaux neuronaux, plus récents mais
Ces travaux de longue haleine donnent néanmoins prometteurs (cf. l'article de J . P. Haton et coll . où
naissance dès à présent à des produits intermédiaires un modèle neuronal est utilisé pour un autre pro-
qui trouvent leur place dans des applications prati- blème, le décodage acoustico-phonétique) .
ques dans le cadre de la communication homme- La reconnaissance de phrases en parole continue
machine . C'est le cas aussi bien en synthèse de la est un problème encore plus complexe que la
parole (processus de production vocale), qu'en reconnaissance de mots et fait nécessairement appel
reconnaissance (perception vocale) ou en vérificia- à des connaissances (phonétiques, linguistiques,
tion de locuteur (identification de la personne qui etc .) relatives à la communication parlée . Une étape
parle) . importante est constituée par le décodage acoustico-
Ce numéro spécial est consacré exclusivement à la phonétique . L'article de J . P . Haton et coll . illustre
reconnaissance automatique de la parole . Ce différentes approches de ce problème et les questions
domaine donne lieu à des projets de grande enver- qui se posent . La segmentation du semi-continuum
gure un peu partout dans le monde (Europe, Japon, vocal en unités de différents niveaux (mots, syllabes,
USA) tandis que des produits de bonne qualité sont phonèmes, etc .) est une opération délicate, indispen-
déjà proposés ou sur le point d'apparaître . Le sable dans tout système de reconnaissance de parole
moment est donc bien choisi pour faire le point sur la continue . M . Rossi présente ce problème et ses
question et il faut remercier Bruno Georgel qui a eu différentes implications .
l'idée de consacrer un numéro spécial de la revue TS Un système de reconnaissance automatique de la
à ce thème . Ce numéro comprend neuf articles qui parole doit être intégré dans un système plus général
abordent les aspects les plus importants du pro- d'interaction homme-machine, éventuellement mul-
blème, tant sur le plan de la recherche que des timédia, et comportant une véritable composante de
applications et qui illustrent bien sa diversité . Tous dialogue . De nouveaux problèmes se posent pour
ces articles sont issus de laboratoires participant au réussir une telle intégration ; ils sont présentés dans
GRECO-PRC Communication Homme-Machine l'article de J . M . Pierrel et coll . La plupart des
(pôle Parole), structure de coordination mise en travaux relatifs au dialogue sont à long terme .
place par le CNRS et le Ministère de la Recherche et Néanmoins des applications existent déjà : elles
de la Technologie . peuvent être simples comme le système Mairievox
L'article de J . Mariani constitue une bonne introduc- de C . Gagnoulet - D. Jouvet, ou plus complexes
tion, complète et documentée, au problème, à ses comme les systèmes DIRA décrit dans l'article de
techniques et à ses applications . J. Caellen et coll. e t DIAPASON décrit dans l'article
La reconnaissance de mots, prononcés isolément ou de E . Gallais et coll.
de façon enchaînée, constitue la quasi-totalité des Pour terminer cette introduction, je tiens à remercier
applications existantes, dans la mesure où il s'agit J. Malbos pour son amabilité et son efficacité ainsi
d'une simplification du problème général de la que tous les lecteurs qui ont aidé à améliorer la
reconnaissance de la parole naturelle prononcée qualité des articles : P . Alinat, G . Bailly, C . Bourjot,
continûment . La plupart des systèmes actuels sont J. Caelen, R. Carré, M . Eskenazi, J. Guizol,
monolocuteurs et nécessitent un apprentissage préa- M . Guyomard, J. C . Junqua, J. Mariani,
lable pour tout nouveau locuteur . Néanmoins, de H . Maynard, H . Meloni, G . Mercier, M . A . Morel,
bonnes performances sont maintenant possibles en F. Néel, G . Perennou, J . M . Pierrel, J . Siroux .

237
Traitement du Signal volume 7 - n° 4