1- Le but de ce projet est de dterminer l'identit de l'orateur a partir de
lchantillon de parole quil gnre et les vecteurs forms enregistrs . Les vecteurs forms sont drivs des chantillons de parole des diffrents orateurs . En effet , le signal de parole d'entre analogique est numris une frquence d'chantillonnage de 8 KHZ en utilisant un ADC (convertisseur analogiquenumrique). L'chantillon de parole est stock ensuite dans un tableau unidimensionnel. 2Framing :Le signal de parole est divis en trames. Chacune dentre elles est constitue de 128 chantillons considrs comme stationnaire. La taille du buffer de stockage varie en fonction du temps pendant lequel le signal sonore d'entre est pris. D'o la longueur du signal audio en temps rel est variable. Donc, avant d'effectuer FFT sur ces donnes, il est ncessaire de diviser les donnes en trames uniformes. Dans cette tape, le signal de parole en continu est bloqu en trames de N chantillons, avec des cadres adjacents tant spars par M (M <N). La premire trame est constitue de N chantillons les premiers. Ce processus se poursuit jusqu' ce que toute la parole est reprsent dans une ou plusieurs trames. Des valeurs typiques pour N et M sont N = 256 et M = 100. 3-Fentrage : L'tape suivante du traitement est deffectuer le fentrage sur chacune des trames de telle sorte minimiser les discontinuits de signaux au dbut et la fin de chaque trame. Le concept ici est de minimiser la distorsion spectrale afin de restreindre le signal zro . Une fois les donnes sont rparties en trames , il est ncessaire de passer travers une fentre de faon rduire les fuites spectrale Les fuites spectrales : Le spectre de frquence de 1000 Hz se caractrise par sa forme sinusodale qui contient une seule sinusode damplitude leve .
Cet talement de l'nergie spectrale travers plusieurs frquences canaux
est appel fuite spectrale. Ce phnomne affecte toute composante de frquence d'un signal qui ne concide pas exactement avec un canal de frquence. Les composantes de frquence d'un signal arbitraire sont peu susceptibles de satisfaire cette exigence, la fuite spectrale est plus susceptible de se produire que de ne pas avec des signaux chantillonns de la vie relle. Les canaux de frquences", sont reprsentes par des lignes dans le spectre, ces lignes sont des multiples de nombre entier exact (harmoniques) de la frquence fondamentale 1 / Nh. Une onde sinusodale dont la frquence concide avec l'un des canaux de frquence a la proprit dadapter un nombre entier exact de cycles sinusode dans la longueur de l'chantillon complet du signal chantillonn. (Le nombre de cycles est juste le nombre harmonique). Sil y a un dcalage, la hausse soudaine ou la discontinuit cre par le motif inadquat donne lieu des composantes parasites dans le spectre du signal, provoquant ainsi une composante de frquence particulire qui napparait pas comme une ligne de dmarcation unique mais comme une propagation de frquences, plus ou moins centre entre les deux canaux de frquence les plus proches de part et d'autre. Les signaux real life ne sont pas des ondes sinusodales simples. De mme, une forme d'onde de parole contient de nombreuses composantes de frquences diffrentes, et il est extrmement peu probable qu'il y aura une lgre liaison du dbut jusqu la fin du signal chantillonn. La fuite spectrale va donc presque certainement affecter le spectre de tout signal d'intrt pratique. La rduction des fuites spectrale La seule faon d'viter une telle fuite pourrait tre entirement d'organiser toutes les composantes de frquence du signal en cours d'examen de telle sorte quelles concident exactement avec la frquence des canaux dans le spectre calcul.
Ceci, cependant, est peu pratique pour un signal arbitraire contenant de
nombreuses composantes de frquence. Alors que la fuite spectrale ne peut en gnral pas tre compltement limine, ses effets peuvent tre rduite. Cela se fait en appliquant une fonction de fentre au le signal chantillonn. Les valeurs chantillonnes du signal sont multiplies par une fonction qui tend vers zro chaque extrmit. Cela rduit l'effet des discontinuits o les sections du signal se rejoignent et rduisent par consquent la quantit de fuite galement. Le choix des fentres Le fentrage gre ce problme de fuite spectrale en modifiant les amplitudes du segment de forme donde, de sorte que les chantillons les plus proches des bords ont de faibles amplitude et les chantillons du milieu du segment sont pleine amplitude. Les programmes informatiques offrent souvent plusieurs types de fentres. Les plus courantes sont "Hamming" et "rectangulaire".
La fentre de Hamming rduit les amplitudes des chantillons proximit des
bords du segment de forme d'onde, comme illustr sur la figure ; alors que la fentre rectangulaire ne change pas les chantillons de forme d'onde du tout. La fentre de Hamming fait appel l'analyse FFT tandis que le fentrage rectangulaire travaille avec tous les autres types d'analyse, y compris lautocorrlation , suivi de terrain, l'amplitude RMS, et l'analyse de LPC.
FFT Ensuite on effectue la transforme de Fourier rapide, qui convertit chaque
trame de N chantillons du domaine temporel au domaine frquentiel. La
transforme de Fourier rapide (FFT) est une transforme de Fourier discrte qui rduit le nombre de calculs ncessaires 3- Conversion en decibels 4- Calcul du spectre de puissance du signal sonore Le signal de parole est un signal rel, mais son FFT a deux composantes relles et imaginaires. La puissance du domaine de frquence est calcule en effectuant la somme du carr des composantes relles et imaginaires du signal pour obtenir un signal rel. La deuxime moiti des chantillons de la trame sont ignors car elles sont symtriques a la premire moiti . Le spectre de puissance peut tre calcul pour le signal entier ou priodiquement a travers la segmentation de celui-ci . 5- Calcul de la MFCC (Mel-Frequency wrapping)