Académique Documents
Professionnel Documents
Culture Documents
Master 1 informatique
jerome.farinas@irit.fr
Institut de Recherche en Informatique de Toulouse
Universite Paul Sabatier
5 mars 2009
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 1 / 52
Presentation des TPs
6 seances de TP de 2h
Evaluation :
au : format SUN
En plus du chier brut, ces formats encapsulent des informations
complementaires, comme la valeur de la frequence dechantillonnage,
la quantication utilisee, le nombre de canaux...
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 13 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 14 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 15 / 52
Lancer Matlab
se connecter sur Windows
lancer matlab
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 16 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 17 / 52
Charger un chier audio
cd T :\M1OP3\ ;
[signal,fs,q,options] = wavread(Signal/essai.wav) ;
Quelles sont les valeurs de fs et q ? Que contient options ?
Achez les 10 premi`eres valeurs de signal.
Quel est lintervalle de variation des echantillons du signal ? Comment
ramener le vecteur `a des valeurs enti`eres ?
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 18 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 19 / 52
Acher un signal audio
plot(signal) ;
Calculez la longueur en secondes du signal
Achez dans une nouvelle fenetre le vecteur converti en entier
Achez la portion de signal comprise entre les echantillons 11345 et
11375 en bleu
Figez lachage et achez avec des croix rouge la meme portion
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 20 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 21 / 52
Spectre dun signal
1
Charger le chier Signal/note.wav dans la variable note.
2
Achez le signal de note avec laxe des abscisses en secondes.
3
Achez le spectre de note (avec la fonction fft) avec laxe des
abscisses en Hertz. Que remarquez-vous ?
4
Quelle est la frequence de base de cette note de musique ?
5
Calculez la transformee de Fourier rapide de lextrait du signal de
parole (signal) et achez le resultat sur une demi-periode, avec les
abscisses en Hertz.
6
Comparez le spectre de note et celui de signal.
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 22 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 23 / 52
Spectrogramme du signal
figure ;
specgram(signal,1024,fs,hamming(1024)) ;
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 24 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 25 / 52
Echelle MEL
en = canaux(signal,11300,512,16,24,voyelle o) ;
1
fenetre danalyse (512 points de signal)
2
Module du spectre sur 256 points
3
Canaux denergies dans les 24 bandes reparties selon lechelle MEL
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 26 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 27 / 52
Calcul du spectre et fenetrage de Hamming
figure ;
extrait = signal(11300 :12323) ;
subplot(511) ;
plot(extrait) ;
subplot(512) ;
plot(hamming(1024)) ;
subplot(513) ;
plot(hamming(1024).*extrait) ;
subplot(514) ;
f=abs(fft(extrait)) ;
plot(f(1 :512)) ;
subplot(515) ;
h=abs(fft(extrait.*hamming(1024))) ;
plot(h(1 :512)) ;
Expliquez ces dierents traces.
Quel est linteret de lutilisation dune fenetre de Hamming ?
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 28 / 52
Plan
1
Numerisation du signal de parole
Frequence dechantillonnage
Quantication
Fichiers informatiques
2
Analyse du signal de parole
Lancer Matlab
Charger un chier audio
Acher un signal audio
Spectre du signal
Spectrogramme du signal
Echelle MEL
Application : spectre du signal
Application : analyse cepstrale
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 29 / 52
Calcul du cepstre
1
Realisez le calcul du cepstre sur lextrait de signal de parole.
2
Achez lextrait, son spectre et son cepstre dans la meme fenetre.
3
Achez le spectre lisse du signal.
4
Pourquoi la valeur du premier coecient cepstral est-elle aussi elevee ?
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 30 / 52
Deuxi`eme partie II
Modelisation GMM (locuteur)
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 31 / 52
Plan
3
Enregistrement chiers audio
4
Analyse triangle vocalique des locuteurs
5
Modelisation GMM des locuteurs
Theorie
Mise en pratique
jerome.farinas@irit.fr (IRIT) TP OP3 / TAP 5 mars 2009 32 / 52
Enregistrement chiers audio
En utilisant wavesurfer (sous linux) vous allez enregistrer 3 versions
dierentes dun texte equilibre phonetiquement ( la bise et le
soleil ) :
n=1
log
p(y
m
/X)
p(y
m
/)
au locuteur ?