Académique Documents
Professionnel Documents
Culture Documents
INTEGRANTES:
PROFESOR:
Ing.Villafuerte
23 DE NOVIEMBRE DE 2016
FIEE-UNMSM
CAPTULO 1
1.1. INTRODUCCIN
Para la transformacin de seales de voz a texto, debemos considerar muchos
aspectos, como el tono de voz, el ambiente en donde se realiza la transformacin
de voz (de preferencia lugares donde haya poco ruido para tener una mejor
muestra) y la vocalizacin.
Este programa, est diseado con el fin de poder ayudar a las personas con
deficiencia auditiva a que puedan familiarizar su lenguaje de seas con smbolos
que describen el alfabeto y los nmeros a travs de un sistema de codificacin, en
este caso seales de voz a texto. Lo que se desea es que estas personas puedan
distinguir estos smbolos para mejorar su comunicacin con otras personas
(normales o sordo-mudas) de una manera ms didctica, usando la tecnologa.
1.2. EL PROBLEMA:
1.2.1. Contextualizacin:
Los mtodos que se han desarrollado para posibilitar a las personas con deficiencia
auditiva a que puedan comunicarse, son netamente fsicos, como por ejemplo la
lectura de labios y el lenguaje de seas, pero dichos mtodos implican otros
problemas en la comunicacin. Para el primer mtodo, la persona con deficiencia,
debe saber el idioma que habla la otra persona, de otro modo, la lectura de labios
ser mal interpretada. En el segundo mtodo la persona no discapacitada deber
conocer el lenguaje de seas y dominarlo para poder entablar una comunicacin
adecuada.
1.2.2. Contenido:
Este trabajo, est basado en aplicar nuestros conocimientos de Matlab para poder
ayudar a personas con cualquier tipo de deficiencia que padezca que le impida
poder comunicarse con otras personas, ya sean de su misma condicin o personas
normales sin ningn tipo de deficiencia.
La voz humana se produce por medio del aparato fonatorio, el cual est formado
por los pulmones como fuente de energa en la forma de un flujo de aire, la laringe,
que contiene las cuerdas vocales, la faringe, las cavidades orales (o bucal) y nasal
y una serie de elementos articulatorios: los labios, los dientes, el alvolo, el paladar,
el velo del paladar y la lengua.
Los formantes son elementos que sirven para distinguir componentes del habla
humana, principalmente, las vocales y sonidos sonantes. El formante con la
frecuencia ms baja se llama F1, el segundo F2, el tercero F3, etc.
Son necesarios slo los dos primeros para caracterizar una vocal, aunque la pueden
caracterizar ms formantes. Generalmente, los formantes posteriores determinan
propiedades acsticas como el timbre.
Los dos primeros formantes se determinan principalmente por la posicin de la
lengua. Sucediendo que F1 tiene una frecuencia ms alta cuanto ms baja esta la
lengua, es decir una mayor abertura. Para el F2 tiene mayor frecuencia cuanto ms
hacia delante est posicionada la lengua.
No todos los sonidos se componen de formantes definidos. Solamente aparecen en
sonantes, que incluyen los sonidos pulmonares: vocales, aproximantes y nasales.
stas ltimas tienen un formante adicional F3, en torno a los 1500 Hz.
Si la frecuencia fundamental es mayor que la frecuencia de los formantes, entonces
el carcter del sonido se pierde y se vuelven difciles de distinguir, por lo cual son
difciles de reconocer.
A continuacin, se muestran algunos anchos de banda entre los cuales se localizan
las vocales:
Clasificacin de las Vocales 4
Cerradas (i, u)
Medias (e, o)
Abiertas (a)
Anteriores (i, e)
Centrales (a)
Posteriores (o, u)
a) La Directividad
b) El Transductor
2.2.5. Matlab
Clculo matemtico
Desarrollo de algoritmos
Adquisicin de datos
Modelado, simulacin y prototipado
Anlisis de datos y visualizacin
Grficos
Desarrollo de aplicaciones e interfaces grficas de usuario (GUI)
Al decir digitalizar, podemos decir que se convierte la entrada de voz a una forma
que el reconocedor pueda procesar o que la seal sea ms accesible para
manipular posteriormente.
Las redes digitales de transmisin de voz y datos son comunes en nuestra era.
Fueron creadas ya que presentan ciertas ventajas sobre las redes analgicas como,
por ejemplo: que conservan la seal casi inalterable a travs de su recorrido. Es
decir que es ms difcil que la comunicacin se vea afectada por factores externos
como el ruido elctrico.
En conclusin, digitalizar una seal de voz no es otra cosa que tomar muestras (a
intervalos de tiempo regulares) de la amplitud de la seal analgica y transformar
esta informacin a binario. Este proceso de denomina muestreo.
La forma tpica de obtener una representacin discreta x[n] a partir de una seal
continua xc(t) es mediante muestreo peridico por medio de un conversor
continuo/discreto (C/D), obteniendo la secuencia discreta segn la expresin:
Ec. 1
Cuantificacin uniforme
Cuantificacin logartmica
Cuantificacin no uniforme
Cuantificacin vectorial
Cuantificacin uniforme:
En los cuantificadores uniformes o lineales la distancia entre los niveles de
reconstruccin es siempre la misma, la mayora usan un nmero de niveles que es
una potencia de 2. No hacen ninguna suposicin acerca de la seal a cuantificar,
de all que no proporcionen los mejores resultados. Pero son los ms fciles y
menos costosos a implementar.
Cuantificacin logartmica:
Para evitar desperdicio de niveles de reconstruccin y de ancho de banda se
utiliza un mtodo sencillo para mejorar el incremento de la distancia entre los
niveles de reconstruccin conforme aumenta la amplitud de la seal. Para
conseguir esto se hace pasar la seal por un compresor logartmico antes de la
cuantificacin. Esta seal comprimida puede ser cuantificada uniformemente. A la
salida del sistema la seal pasa por un expansor. A esta tcnica se le llama
compresin.
Cuantificacin no uniforme:
Este cuantificador utiliza la funcin de la distribucin de probabilidad, conociendo
esto se puede ajustar los niveles de reconstruccin a la distribucin de forma que
se minimice el error cuadrtico medio.
Cuantificacin vectorial:
Este mtodo cuantifica los datos en bloques de N muestras. En este tipo de
cuantificacin, el bloque de N muestras se trata como un vector N-dimensional.