LAB4DSP

UNIVERSIDAD TECNOLGICA DE PANAM FACULTAD DE INGENIERA ELCTRICA LIC.
EN INGENIERA EN ELECTRNICA Y TELECOMUNICACIONES
INFORME DE LABORATORIO N4
FILTRADO DE LA SEAL DE VOZ

ASIGNATURA: INTRODUCCIN AL PROCESAMIENTO DE SEALES
INTEGRANTES: MANUEL AGUILAR NAZARETH TAX S. 9-731-1652 6-713-957
PROFESOR: EDGAR BATISTA
GRUPO: 1IT152
2012
NDICE
RESUMEN.... 2 MARCO TEORICO....................................................................................................3 OBJETIVO..................................................................................................................6 PROCEDIMIENTO Y DESARROLLO ...7 ETAPA....7 ETAPA ...9 CONCLUSIONES.... 11 ANEXOS.. 12 BIBLIOGRAFA...13
Resumen
El reconocimiento de voz comprende una etapa inicial que convierte una seal de voz en algunas representaciones con el objetivo de eliminar los ruidos producidos por el sistema de grabacin utilizado en el filtrado de seales de voz, evaluando sus ventajas e inconvenientes. Los filtros de una seal de voz, evalan la calidad del filtrado de la transformada wavread directa e inversa para obtener su seal, esto hace que se compare con la seal original del filtrado viendo los destalles de cada una de las etapas. Desarrollando un conjunto de funciones que muestra ambas seales en los espectrogramas, para poder eliminar casi por completo el ruido en grabaciones, se pretende que la energa de la seal sea cero, mientras que la energa de la seal de voz deber ser modifica lo menos posible. Por lo tanto, al verificar el filtrado de la seal deber ser totalmente reconstruida respecto al su seal original para poder escuchar nuestra voz en el programa Matlab.
Marco terico
El denominador comn de todo sistema de reconocimiento de voz es la etapa inicial (front-end) de procesamiento de seales, que convierte la seal de voz en alguna representacin paramtrica para su posterior anlisis y procesamiento.
Un buen entendimiento de la forma en la cul se utilizan las tcnicas de procesamiento de seales para implementar la fase de clculo de
parmetros es fundamental para entender los diferentes enfoques para el reconocimiento de voz.
Descripcin del aparato fonador humano
El aparato fonador es el conjunto de rganos que tienen como funcin producir la voz humana, lo conforman los pulmones, los cuales producen un flujo de aire; la laringe, que contiene las cuerdas vocales, la faringe, las
cavidades oral y nasal y una serie de elementos articulatorios como los labios, los dientes, el alvolo, el paladar, el velo del paladar y la lengua. En el proceso de generacin de la voz, el sonido inicial proviene de la vibracin de las cuerdas vocales conocida como vibracin glotal, es decir, el efecto sonoro se genera por la rpida apertura y cierre de las cuerdas vocales conjuntamente con el flujo de aire emitido desde los pulmones. Las cuerdas vocales son dos membranas ubicadas dentro de la laringe, la abertura entre ambas cuerdas se denomina glotis. Cuando la glotis comienza a cerrarse, el aire proveniente desde los pulmones experimenta una turbulencia, emitindose un ruido de origen aerodinmico. Al cerrarse ms las cuerdas vocales comienzan a vibrar a modo de lengetas, producindose un sonido tonal, es decir peridico y cuya frecuencia varia en forma inversa al tamao de las cuerdas. Este sonido es propio del hablante y es ms agudo para el caso de mujeres y nios. Carece de informacin lingstica. Luego de atravesar la glotis el sonido pasa a travs de la cavidad supragltica, que es la porcin del aparato fonador que permite modificar el sonido dentro de mrgenes muy amplios. Est conformado principalmente por tres cavidades, la cavidad oral, la cavidad labial y la cavidad nasal, correspondientes a la garganta, los labios y la nariz respectivamente. Estas cavidades constituyen resonadores acsticos, los cuales modifican los sonidos de acuerdo a la forma que adopten, la lengua y los labios permiten efectuar esta variacin de manera voluntaria.
5
OBJETIVOS:
Usar Matlab para representar seales de voz en el dominio tiempo (formas de onda), mediante los comandos plot, y en el dominio tiempo-frecuencia (espectrogramas), mediante el comando specgram. Ingresar archivos de sonido (en particular de seales de voz) en formato WAV (formato de sonido WAVE de Microsoft) al espacio de trabajo de Matlab, mediante el comando wavread. Usar Matlab para reproducir archivos de sonido mediante el comando sound.
Manipulacin No.1: Filtrado de la seal de voz Etapa 1 Cargue la seal de voz del archivo formato .wav que cre con el programa audiocity. Para esto utilice la funcin wavread. Represente la seal y su espectrograma con la ayuda de la funcin specgram o spectrogram segn su versin de Matlab. Escuche la seal con la funcin soundsc.
Cdigo:
clc j=wavread('manuu.wav') spectrogram(j) soundsc(j)
Cdigo:
clc j=wavread('nazar.wav') spectrogram(j) soundsc(j)
Comentar
Podemos ver que la voz de un hombre es ms gruesa y fuerte en el espectro segn los colores se ve que el espectro del hombre posee ms azul que naranja.
Solicite a su instructor el archivo waziwaza.raw y crguela en Matlab. Para esto utilizar los siguientes:
fid=fopen('waziwaza.raw','r') F=fread(fid,'short'); wazi=F(1:16688,1);
Represente la seal y su espectrograma con la ayuda de la funcin specgram o spectrogram segn su versin de Matlab. Esta seal fue muestreada a 16KHz. Escuche la seal con la funcin soundsc.
fid=fopen('waziwaza.raw','r') F=fread(fid,'short'); wazi=F(1:16688,1); spectrogram (wazi) soundsc (wazi)
Comentario:
Con el comando spectrogram obtuvimos diagrama del espectro de la seal contenida en waziwaza.wav, Cada
vocal
puede caracterizarse por la suma de ondas sonoras cuyas frecuencias recaen sobre bandas de frecuencia, denominadas formante.
Etapa 2 Agregue a la seal obtenida del archivo waziwaza.raw una sinusoidal con frecuencia de 7650 Hz. Represente la seal y su espectrograma con la ayuda de la funcin specgram o spectrogram segn su versin de Matlab. Escuche la seal con la funcin soundsc.
Codigo
t=0:1/16687:1; y=500*cos(2*pi*7650*t); wazi_wa1=wazi'; wazi_wa2=wazi_wa1+y; spectrogram(wazi_wa2,128,120,128,16e3); soundsc(wazi_wa2);
Comentario:
Podemos ver el espectro de la seal waziwaza agregndole una onda sinodal la cual hace que en el audio salga un ruido constante en forma de tono.
9
Su objetivo es filtrar la seal de voz perturbada por la componente de alta frecuencia (7650Hz). Para esto utilice una tcnica basada en la posicin de los polos y ceros de la funcin de transferencia del filtro. Sintetice el filtro y filtre la seal. Represente la seal y su espectrograma con la ayuda de la funcin specgram o spectrogram segn su versin de Matlab. Escuche la seal con la funcin soundsc.
Codigo :
t=0:1/16687:1; y=500*cos(2*pi*7650*t); wazi_wa1=wazi'; wazi_wa2=wazi_wa1+y; spectrogram(wazi_wa2,128,120,128,16e3); soundsc(wazi_wa2); [NUM, DEN] = butter(1,2*50/7650,'low'); wazi_wa3 = filter(NUM, DEN, wazi_wa2); spectrogram(wazi_wa3,128,120,128,16e3); soundsc(wazi_wa3);
Comente.
El ruido senoidal desaparece gracias al filtro butterworth que le hemos aadido, adicional a esto, se filtran las componentes de frecuencias ms altas a 7650Hz que contena la seal.
10
CONCLUSIONES
El teorema de Nyquist se nos sirve para saber si la seal seal se puede recuperar en su totalidad segn la frecuencia de Nyquist fs = > 2*fmax . Al desarrollar este laboratorio nos permiti apreciar los filtros para poder visualizar y comprender mejor las seales. Tambin podemos seleccionar los diferentes tipos de filtros para poder eliminar una banda de ruido y solucionar el problema. El uso de herramientas, como MATLAB facilita mucho el anlisis y el conocimiento de seales aleatorias como la voz humana. Al poder filtrar ruido con esta herramienta facilita muchas cosas que conciernen al anlisis de seales.
11
Anexos
La accin combinada del resonador complejo y la excitacin turbulenta hace que el sonido producido por las flautas de chinos llene de energa de manera muy excepcional el espectro de frecuencias, generando el caracterstico sonido rajado (Prez de Arce: 1993).
12
BIBLIOGRAFIA
http://www.mundodvd.com/psicoacustica-la-percepcion-del-sonido-2876/
http://es.wikipedia.org/wiki/Filtro_de_Butterworth
http://jorge-gonzalez-reymond.blogspot.com/2011_03_01_archive.html
http://es.wikipedia.org/wiki/Voz_(m%C3%BAsica)#Matices_vocales
http://seysiii.blogspot.com/2010/09/polos-y-ceros-en-el-diseno-defiltros.html
13

LAB4DSP

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

LAB4DSP

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSIDAD TECNOLGICA DE PANAM FACULTAD DE INGENIERA ELCTRICA LIC.

EN INGENIERA EN ELECTRNICA Y TELECOMUNICACIONES

FILTRADO DE LA SEAL DE VOZ

INTEGRANTES: MANUEL AGUILAR NAZARETH TAX S. 9-731-1652 6-713-957

PROFESOR: EDGAR BATISTA

Descripcin del aparato fonador humano

fid=fopen('waziwaza.raw','r') F=fread(fid,'short'); wazi=F(1:16688,1); spectrogram (wazi) soundsc (wazi)

Vous aimerez peut-être aussi