Vous êtes sur la page 1sur 18

HTK sous Windows

Acquisition des fichiers sons:

On utilise le logiciel wavesurfer pour lacquisition des fichiers sons du vocabulaire.


Wavesurfer est un outil qui nous permet de lire un fichier son .
ou mme en crer un nouveau, de faire une analyse acoustique (dures, intensit)
Nous allons utiliser wavesurfer pour crer nos fichiers sons.

tiquetage des fichiers sons:

La syntaxe de la CommandeHSlab:

Le but de l'tiquetage est de dlimiter chaque entit lexicale. Ceci sera fait manuellement avec le logiciel HSLab.
Nous allons utiliser un tiquetage par phonme.

tiquetage des fichiers sons:

Le rsultat de cette phase est une base de donnes des tiquettes des diffrents fichiers sons. (Les tiquettes sont dans le
dossier labels)

Les fichiers
sons (.wav)

HSla
b

Les tiquettes
(.lab)

Enregistrement et tiquetage des fichiers sons

Reprsentation acoustique du signal:

Fichier de configuration

parametrisation.conf

Les fichiers sons (.wav)


(hcopyliste.conf)
sittatoun.wav
sittatoun1.wav
sittatoun2.wav

HCop
y

Les Fichiers MFCC


sittatoun.mfcc
sittatoun1.mfcc
sittatoun2.mfcc

Reprsentation acoustique du signal

Aprs avoir acquis les fichiers sons, on construira une


reprsentation acoustique du signal. On appellera la commande
HCopy pour copier les fichiers contenants les cepstraux.

Reprsentation acoustique du signal:


On peut afficher ces coefficients avec la commande

Modles de Markov

Exemple : du model en phontique reprsentant le mot du vocabulaire wahidon


Fichiers gabarits

A chaque entit lexical (mot du vocabulaire) on va cre un fichier Gabarit (model) reprsentant lentit lexical.

Modles de Markov
Exemple : fichier gabarits/hi

<NumStates> : nombre dtat du modle


<VecSize> : nombre de composantes du
vecteur spectral
<state > : qui contient les lois dmission
<mean> et <variance>
<TransP> : contient les probabilit des
transition entre les tat du model (delimit par
<TransP> et <EndHMM> )
lnergie est initialise par 0 et la variance par
1 et les probabilits de transition sont
initialises de valeur simple. Ces valeurs
seront estimer et re-estimer dans la phase
dapprentissage

Apprentissage

Chaque modle doit tre appris : les


moyennes, les variances et les probabilits
de transition entre tats sont r-estimes
jusqu' ce qu'un seuil de convergence ou
qu'un nombre maximum d'itration soient
atteint.
Ceci est fait par l'algorithme de Viterbi.

Le fichier rsultat de cette commande est


hinit/hi
9

Apprentissage

Les modles sont ensuite estims de faon


indpendante avec lalgorithme de Baum
Welch en utilisant la commande HRest.
Pour chaque phonme on applique la
commande HRest

Le fichier rsultat de cette commande est


hrest/wa.

10

Apprentissage

On peut amliorer lapprentissage en


utilisant la commande HERest sui se base
sur lalgorithme de Baume Welch pour restim tous els modles a la fois.
La commande HERest utilise un fichier de
configuration config/herest.conf et un
fichier listes/listemodeles.txt et les
fichiers rsultats de HRest et la liste des
fichiers MFCC listes/mfcc.lst et le dossiers
labels/

11

Apprentissage
Le fichier rsultat de cette commande est herest/
newMacros qui contient :

.
.
.
.
.

12

Reconnaissance
Grammaire du langage :
On doit dfinir le modle de notre langage ; la
grammaire de notre langage est dfinie dans le
fichier listes/modeleLangage.txt

13

Reconnaissance
Grammaire du langage :
On doit dfinir le modle de notre langage ; la
grammaire de notre langage est dfinie dans le
fichier listes/modeleLangage.txt

On va appliquer la commande HParse cette


grammaire pour gnrer le modeleDeMots .

14

Reconnaissance

Le rsultat est un fichier listes/modeledemots.txt qui


contient tous les mots de notre langage :

15

Reconnaissance

Dictionnaire du langage :
Un fichier listes/dictionnaire.txt contient le dictionnaire de
notre langage :

La reconnaissance sera ensuite effectue sur chaque fichier .

16

Reconnaissance
Le rsultat est un fichier .rec pour chaque fichier
reconnatre.

17

Reconnaissance
Lvaluation des performances:
Cette valuation sera faite avec la commande HResults.
On doit tiqueter le fichier wahidr.wav
La syntaxe de la commande HResults:

18