Vous êtes sur la page 1sur 3

Définition et Principe

 Définition
La reconnaissance de la parole est une technique visant à reconnaître, dans une
suite de signaux sonores, les phonèmes et les phrases prononcées par un
locuteur.
La reconnaissance de la parole se situe à l’intersection de nombreux domaines
tels que l’acoustique, l’électronique, la phonétique, la sémiologie, etc.

 Principe de la reconnaissance vocale


La reconnaissance de la parole s’insère dans le cadre plus général de la
reconnaissance des formes. Un son correspondant à un mot est prononcé
oralement devant le microphone, qui convertit le signal acoustique en un signal
électrique. Celui-ci est soumis à un prétraitement (numérisation, séparation du
signal pertinent par rapport au bruit ambiant), puis il subit la paramétrisation
(extraction de paramètres). Ce traitement s’applique tant en phase
d’apprentissage qu’en phase de reconnaissance. L’utilisation du système
consiste à comparer un nouveau son à un son de l’ensemble d’apprentissage.

Figure 1 :le principe de la reconnaissance vocale


Figure : Modèle acoustique + linguistique

Rapport Signal/Bruit

Le rapport signal/bruit S/B (Signal to Noise Ratio S/N ou SNR en anglais ),


appelé encore rapport signal à bruit, permet de mesurer la qualité d'un canal de
transmission. C'est un nombre sans unité qui est d'autant plus grand que le bruit
est négligeable.
On le calcule à l'aide de l'une ou
l'autre des formules représentées ci
contre :
formule n°1
Ps : puissance du signal en W
PB : puissance de bruit en W

SNR=Ps/PB
formule n°2
Us : tension efficace du signal en V
UB : tension du bruit en V
L'impédance aux bornes de laquelle ces deux tensions sont mesurées peut
prendre n'importe quelle valeur pourvu qu'elle soit la même pour les deux
mesures.

SNR=US²/UB²

formule n°3
Comme la valeur de S/B peut être très grande, quand la qualité de la
transmission est très bonne par exemple, on préfère souvent exprimer le rapport
𝑆
S/B en décibels. 𝑆𝑁𝑅 = 20 log( )
𝐵

Exemple :
L'amplitude du signal à la sortie d'un amplificateur est de 224mV tandis que le
niveau du bruit est de 10mV. Le rapport S/B est de 502 ce qui équivaut à 27dB.

La segmentation correspond au découpage du signal acoustique en unités


discrètes linguistiques. Des difficultés apparaissent notamment dans plusieurs
contextes comme l’acquisition de la langue maternelle, la reconnaissance de
mots parlés et l’acquisition d’une seconde langue, du fait de la double
articulation.