Trabajo

SISTEMA DE CODIFICACIN DE SEALES DE VOZ A
TEXTO USANDO MATLAB PARA PERSONAS CON

DEFICIENCIA AUDITIVA
INTEGRANTES:
Cuba Crdenas Karla Fiorella 14190256

Navarro Espinoza Diana Carolina 14190139
Chavez Arias Csar 14190255
PROFESOR:
Ing.Villafuerte
23 DE NOVIEMBRE DE 2016
FIEE-UNMSM
CAPTULO 1
1.1. INTRODUCCIN
Para la transformacin de seales de voz a texto, debemos considerar muchos
aspectos, como el tono de voz, el ambiente en donde se realiza la transformacin
de voz (de preferencia lugares donde haya poco ruido para tener una mejor
muestra) y la vocalizacin.
Este programa, est diseado con el fin de poder ayudar a las personas con
deficiencia auditiva a que puedan familiarizar su lenguaje de seas con smbolos
que describen el alfabeto y los nmeros a travs de un sistema de codificacin, en
este caso seales de voz a texto. Lo que se desea es que estas personas puedan
distinguir estos smbolos para mejorar su comunicacin con otras personas
(normales o sordo-mudas) de una manera ms didctica, usando la tecnologa.
1.2. EL PROBLEMA:
Planteamiento del Problema
1.2.1. Contextualizacin:
Como seres humanos, tenemos muchos sistemas de comunicacin, como el

telfono, la radio, televisin, etc.; pero si nos damos cuenta, estos fueron creados
con la intensin de que puedan comunicarse las personas que no poseen ningn
tipo de discapacidad.
Sabemos que en todo proceso de la comunicacin se encuentra un emisor (que es

el que enva una informacin) y un receptor (el que recibe la informacin del emisor),
pero si uno de los dos est ausente o falla, no existe comunicacin. Este problema
viene desde hace mucho tiempo para personas que poseen algn tipo de
discapacidad que pueda afectar el proceso de poder comunicarse, esto hace notar
que la sociedad excluye de una u otra forma a estas personas por no padecer de
los mismos problemas.
Los mtodos que se han desarrollado para posibilitar a las personas con deficiencia
auditiva a que puedan comunicarse, son netamente fsicos, como por ejemplo la
lectura de labios y el lenguaje de seas, pero dichos mtodos implican otros
problemas en la comunicacin. Para el primer mtodo, la persona con deficiencia,
debe saber el idioma que habla la otra persona, de otro modo, la lectura de labios
ser mal interpretada. En el segundo mtodo la persona no discapacitada deber
conocer el lenguaje de seas y dominarlo para poder entablar una comunicacin
adecuada.
Los mtodos que pudimos describir anteriormente deben realizarse siempre en

presencia de ambas personas y a corta distancia, sin usar la tecnologa (donde se
emitan seales de audio como: radio, telfonos celulares y fijos, etc.). Por lo tanto,
se han visto excluidos y marginados de muchas actividades sociales.
En muchos pases, actualmente, se estn implementando planes de inclusin

social, en donde se pretende ayudar a todas las personas que tengan cualquier tipo
de discapacidad fsica o mental, obligando a las empresas a contratar personas con
discapacidades, y sean ubicadas en reas en donde son aptas, y puedan
desenvolverse en el mbito laboral con total normalidad. De alguna manera se est
tratando de eliminar la marginacin y discriminacin que ha existido contra las
personas discapacitadas, pero mientras no existan formas de comunicacin
didctica diseada para estas personas, no podrn tener una verdadera inclusin y
seguirn siendo vctimas de discriminacin.
Cabe mencionar que muchas de las personas sordo-mudas son analfabetas,

muchas veces por falta de recursos o de informacin.
Delimitacin del Problema
1.2.2. Contenido:
o rea: Procesamiento Digital de Seales

o Aspecto: Codificacin de seales de voz a texto
o Campo: Electrnica
Declaracin de las Variables
Variable Independiente: Sistema de Codificacin de seales de voz a texto usando

Matlab.
Variable Dependiente: Capacidad de comunicacin de Personas con Deficiencia

Auditiva.
1.3. Objetivos
1.3.1. Objetivo general
Sistema de codificacin de seales de voz a texto, usando Matlab para personas

con deficiencia auditiva.
1.3.2. Objetivos Especficos
o Analizar el proceso de codificacin de seales de voz a texto.
o Plantear una propuesta que permita mejorar la comunicacin de las

personas con deficiencia auditiva mediante la implementacin de un
sistema de codificacin de seales de voz a texto usando matlab.
CAPTULO 2
2.1. MARCO TERICO
Este trabajo, est basado en aplicar nuestros conocimientos de Matlab para poder
ayudar a personas con cualquier tipo de deficiencia que padezca que le impida
poder comunicarse con otras personas, ya sean de su misma condicin o personas
normales sin ningn tipo de deficiencia.
En este programa, digitalizaremos seales de voz a texto, con una serie de

muestras para obtener una mejor respuesta del programa diseado.
2.2. Componentes del Sistema de Codificacin de Voz a Texto
2.2.1. La Voz Humana
La voz humana se produce por medio del aparato fonatorio, el cual est formado
por los pulmones como fuente de energa en la forma de un flujo de aire, la laringe,
que contiene las cuerdas vocales, la faringe, las cavidades orales (o bucal) y nasal
y una serie de elementos articulatorios: los labios, los dientes, el alvolo, el paladar,
el velo del paladar y la lengua.
Corte Esquemtico del aparato Fonatorio Humano
La produccin de sonido viene generada fundamentalmente por las cuerdas

vocales, que se encuentran en la laringe. La abertura entre las cuerdas se denomina
glotis.
A medida que se cierran las cuerdas vocales, stas comienzan a vibrar,
producindose un sonido tonal, es decir peridico. La frecuencia de dicho sonido
depende de varios factores, entre otros del tamao y la masa de las cuerdas
vocales, de la tensin que se les aplique y de la velocidad del flujo del aire
proveniente de los pulmones. A mayor tamao, menor frecuencia de vibracin, lo
cual explica por qu en los varones, cuya glotis, es en promedio mayor que la de
las mujeres, por lo tanto, la voz en general es ms grave. A mayor tensin la
frecuencia aumenta, siendo los sonidos ms agudos. As, para lograr emitir sonidos
en el registro extremo de la voz es necesario un mayor esfuerzo vocal. Tambin
aumenta la frecuencia (a igualdad de las otras condiciones) al crecer la velocidad
del flujo de aire, razn por la cual al aumentar la intensidad de emisin se tiende a
elevar espontneamente el tono de voz.
2.2.2. Fonologa y fontica
La Fonologa se dedica al estudio de los sonidos de la lengua en cuanto a su

carcter simblico o de representacin mental. A cada uno de los sonidos abstractos
identificados se lo conoce como fonema. Uno de los objetivos de la fonologa es
acotar al mximo la cantidad de fonemas requeridos para representar cada idioma
de una manera suficientemente precisa.
En cuanto a la Fontica, se refiere a los sonidos en el habla, incluyendo su

produccin acstica y los procesos fsicos y fisiolgicos de emisin y articulacin
involucrados. Se ocupa, por consiguiente, de las realizaciones de los fonemas.
2.2.3. Formantes
Los formantes son elementos que sirven para distinguir componentes del habla
humana, principalmente, las vocales y sonidos sonantes. El formante con la
frecuencia ms baja se llama F1, el segundo F2, el tercero F3, etc.
Son necesarios slo los dos primeros para caracterizar una vocal, aunque la pueden
caracterizar ms formantes. Generalmente, los formantes posteriores determinan
propiedades acsticas como el timbre.
Los dos primeros formantes se determinan principalmente por la posicin de la
lengua. Sucediendo que F1 tiene una frecuencia ms alta cuanto ms baja esta la
lengua, es decir una mayor abertura. Para el F2 tiene mayor frecuencia cuanto ms
hacia delante est posicionada la lengua.
No todos los sonidos se componen de formantes definidos. Solamente aparecen en
sonantes, que incluyen los sonidos pulmonares: vocales, aproximantes y nasales.
stas ltimas tienen un formante adicional F3, en torno a los 1500 Hz.
Si la frecuencia fundamental es mayor que la frecuencia de los formantes, entonces
el carcter del sonido se pierde y se vuelven difciles de distinguir, por lo cual son
difciles de reconocer.
A continuacin, se muestran algunos anchos de banda entre los cuales se localizan
las vocales:
Clasificacin de las Vocales 4
Por el modo de articulacin (formante 1)
Cerradas (i, u)
Medias (e, o)
Abiertas (a)
Por el lugar de articulacin (formante 2)
Anteriores (i, e)
Centrales (a)
Posteriores (o, u)
Grfica de la Pronunciacin de las Vocales

2.2.4. Micrfono
Es aquel elemento que transforma energa acstica (sonido) en energa elctrica

(seal de audio). La fidelidad con la que este elemento genera una representacin
elctrica del sonido depende en parte del mtodo que utiliza para la conversin de
energa. A lo largo del tiempo se ha diseado una serie de mtodos distintos para
propsitos varios; de este modo, hoy podemos contar con una amplia variedad en
tipos de micrfono disponibles.
La calidad de cada micrfono viene dada por sus caractersticas, las cuales se
describen a continuacin:
Sensibilidad: es la eficiencia del micrfono, la relacin entre la presin

sonora que incide (expresada en Pascales) y la tensin elctrica de salida
(expresada en voltios). O sea, expresa que tan bien convierte el micrfono
la presin acstica en voltaje de salida. La sensibilidad se expresa en mili-
voltios por Pascal.
Fidelidad: indica la variacin de sensibilidad con respecto a la frecuencia.
Adems, la fidelidad, viene definida como la respuesta en frecuencia del
micrfono, cuanto ms lineal sea la respuesta en frecuencia mayor fidelidad
tendr el micrfono. La fidelidad se expresa en dB.
En funcin de esta respuesta en frecuencia o fidelidad se elabora la
llamada Curva de respuesta de un micrfono, que es la representacin
grfica del nivel obtenido en la captacin de sonidos de igual intensidad,
pero de distinta frecuencia.
Directividad: esta caracterstica determina en qu direccin capta mejor el

sonido un micrfono, es decir indica la sensibilidad del micrfono a las
diferentes direcciones.
4. Ruido de fondo: es la tensin que entrega el micrfono sin que exista

ningn sonido incidiendo sobre l. Este ruido se produce por el movimiento
trmico de los electrones en la carcasa que no tiene masa. El ruido de
fondo debe estar en torno a los 60dB, pero mientras ms bajo sea, mejor
calidad ofrece el micrfono.
5. Impedancia interna: es la resistencia que opone el micrfono al paso de

la corriente. La impedancia segn su valor viene caracterizada por baja, alta
y muy alta impedancia.
Si el micrfono es de alta impedancia y se tiene un cable largo se produce

una prdida muy grande. Si se tiene una impedancia baja se puede utilizar
un cable muy largo y no se pierde tanto la seal. Por ltimo, se puede bajar
la resistencia para evitar prdidas en altas frecuencias.
2.2.4.1. Tipos de Micrfonos
Se pueden dividir segn:
a) La Directividad
Como ya se mencion en las caractersticas, segn la directividad hay tres tipos de

micrfonos:
Micrfono omnidireccional: este es aquel cuyo

diagrama polar es considerado como un crculo
perfecto. Aunque esto es en el caso ideal.
Micrfono bidireccional: en este caso el diagrama
polar muestra como captan por la parte frontal y la
lateral.
Micrfono unidireccional: existe gran nmero de

patrones polares para este tipo.
b) El Transductor
Se encuentran tres grandes grupos segn el tipo de transductor:
Micrfono de Condensador o Capacitor: lo que sucede con este micrfono es

que las ondas sonoras provocan el movimiento oscilatorio del diafragma, el
cual acta como una de las placas de un capacitor y la vibracin provoca una
variacin en la energa almacenada en el condensador que forma el ncleo
de la capsula microfnica. Esta variacin genera una tensin elctrica que es
la seal de salida del sistema. La seal de salida de este sistema es anloga.
Segn el principio de operacin:
Micrfono de condensador DC.

Micrfono de condensador electret.
Micrfono de condensador de radiofrecuencia (RF).
Para nuestra aplicacin en MATLAB utilizamos un micrfono simple de tipo

electret, ya que son los menos costos y ms comunes.
Micrfono Dinmico: trabajan por medio de induccin electromagntica, la

vibracin del diafragma provoca el movimiento de una bobina mvil o cinta
corrugada ancladas a un imn permanente que genera un campo
magntico que a su vez genera una tensin elctrica, que es la seal de
salida. Esta seal elctrica es anloga. Hay dos tipos bsicos:
Micrfono de bobina mvil o dinmico
Micrfono de cinta
Micrfono piezoelctrico: utilizan el fenmeno de piezoelectricidad, cuando

las ondas sonoras hacen vibrar el diafragma el movimiento de este hace
que se mueva el material contenido en su interior (cuarzo, carbn, etc.). La
friccin entre estas partculas genera sobre la superficie del material una
tensin elctrica.
La respuesta en frecuencia de estos micrfonos es muy irregular, ya que

son micrfonos piezoelctricos:
Micrfono de carbn
Micrfono de cristal
Micrfono de cermica
2.2.5. Matlab
MATLAB es el nombre abreviado de MAT rix LABoratory. MATLAB es un programa

para realizar clculos numricos con vectores y matrices. Como caso particular
puede tambin trabajar con nmeros escalares tanto reales como complejos, con
cadenas de caracteres y con otras estructuras de informacin ms complejas. Una
de las capacidades ms atractivas es la de realizar una amplia variedad de grficos
en dos y tres dimensiones, y adems posee un lenguaje de programacin propio.
MATLAB es un gran programa de clculo tcnico y cientfico. Para ciertas
operaciones es muy rpido, cuando puede ejecutar sus funciones en cdigo nativo
con los tamaos ms adecuados para aprovechar sus capacidades de
vectorizacin. MATLAB dispone de un cdigo bsico y de varias libreras
especializadas (toolboxes).
El lenguaje est construido por cdigo llamado M-code que puede ser fcilmente
ejecutado en la ventana de comandos. Con lo cual se pueden crear funciones, etc.
Pero la razn principal para la eleccin de este lenguaje de programacin son las
herramientas que proporciona para el procesamiento de seales, y el conjunto de
funciones para el procesamiento digital.
Adems, para crear entornos grficos se puede utilizar el GUIDE de MATLAB, que
provee herramientas para crear GUIs, Graphical User Interface, con lo cual se
puede crear la forma del entorno grfico, as como asociar funciones a los
elementos del GUI. MATLAB tambin incluye funciones para manipular archivos.
2.2.5.1. Aplicaciones Tpicas de Matlab
Clculo matemtico
Desarrollo de algoritmos
Adquisicin de datos
Modelado, simulacin y prototipado
Anlisis de datos y visualizacin
Grficos
Desarrollo de aplicaciones e interfaces grficas de usuario (GUI)
2.2.6 Digitalizacin de la Voz
Las seales se representan matemticamente como funciones de una o ms

variables independientes. La variable independiente ms comn es el tiempo, y
algunas seales que dependen de l son, por ejemplo, la voz, una onda de radio,
un electrocardiograma, etc. Otras seales, tales como las imgenes, son funciones
de 2 variables independientes, ya que contienen informacin de brillo o de colorido
en funcin de las coordenadas X e Y de un plano.
Al decir digitalizar, podemos decir que se convierte la entrada de voz a una forma
que el reconocedor pueda procesar o que la seal sea ms accesible para
manipular posteriormente.
Las redes digitales de transmisin de voz y datos son comunes en nuestra era.
Fueron creadas ya que presentan ciertas ventajas sobre las redes analgicas como,
por ejemplo: que conservan la seal casi inalterable a travs de su recorrido. Es
decir que es ms difcil que la comunicacin se vea afectada por factores externos
como el ruido elctrico.
En conclusin, digitalizar una seal de voz no es otra cosa que tomar muestras (a
intervalos de tiempo regulares) de la amplitud de la seal analgica y transformar
esta informacin a binario. Este proceso de denomina muestreo.
Una vez digitalizada la seala, se contina con el Procesamiento de Seales, lo

cual es un rea de la Ingeniera Electrnica que se concentra en la representacin,
transformacin, manipulacin de seales, y de la informacin que ellas contienen.
2.2.7. Muestreo Peridico
La forma tpica de obtener una representacin discreta x[n] a partir de una seal
continua xc(t) es mediante muestreo peridico por medio de un conversor
continuo/discreto (C/D), obteniendo la secuencia discreta segn la expresin:
Ec. 1
Siendo T el periodo de muestreo, y fs=1/T la frecuencia de muestreo.

Grfica de Conversor Continuo/Discreto
El sistema que realiza la operacin de la figura, se denomina conversor ideal de
tiempo continuo a discreto (C/D). En la prctica esta operacin de muestreo se
realiza mediante un conversor analgico-digital. Estos sistemas son
aproximaciones al conversor C/D ideal.
2.2.8. Cuantificacin
En el procesado digital de seales slo dispondremos de un nmero finito de bits

para representar cada una de las muestras. Podemos representar el proceso de
cuantificacin mediante
Grfica de Proceso de Cuantificacin
El cuantificador es un sistema no lineal cuyo propsito es transformar la muestra

de entrada x[n] en un valor dentro de un conjunto de valores prestablecidos,
representamos esta operacin mediante el operador Q:
Se conoce como error de cuantificacin (o ruido), a la diferencia entre la seal de

entrada (sin cuantificar) y la seal de salida (ya cuantificada), interesa que el ruido
sea lo ms bajo posible. Para conseguir esto y segn sea la aplicacin a
desarrollar, se pueden usar distintas tcnicas de cuantificacin:
Cuantificacin uniforme
Cuantificacin logartmica
Cuantificacin no uniforme
Cuantificacin vectorial
Cuantificacin uniforme:
En los cuantificadores uniformes o lineales la distancia entre los niveles de
reconstruccin es siempre la misma, la mayora usan un nmero de niveles que es
una potencia de 2. No hacen ninguna suposicin acerca de la seal a cuantificar,
de all que no proporcionen los mejores resultados. Pero son los ms fciles y
menos costosos a implementar.
Cuantificacin logartmica:
Para evitar desperdicio de niveles de reconstruccin y de ancho de banda se
utiliza un mtodo sencillo para mejorar el incremento de la distancia entre los
niveles de reconstruccin conforme aumenta la amplitud de la seal. Para
conseguir esto se hace pasar la seal por un compresor logartmico antes de la
cuantificacin. Esta seal comprimida puede ser cuantificada uniformemente. A la
salida del sistema la seal pasa por un expansor. A esta tcnica se le llama
compresin.
Cuantificacin no uniforme:
Este cuantificador utiliza la funcin de la distribucin de probabilidad, conociendo
esto se puede ajustar los niveles de reconstruccin a la distribucin de forma que
se minimice el error cuadrtico medio.
Cuantificacin vectorial:
Este mtodo cuantifica los datos en bloques de N muestras. En este tipo de
cuantificacin, el bloque de N muestras se trata como un vector N-dimensional.
2.3.1.5.1. Transformada de Fourier

La historia del anlisis de Fourier tiene ms de 200 aos. Sus orgenes principian
unos 60 aos antes del momento en que Jean Baptiste Joseph Fourier present la
primera versin de su trabajo sobre la teora de la conduccin del calor a la
Academia de Pars (1807).
En ese momento los esfuerzos de los fsicos y matemticos se concentraban en
dos problemas principales que sentaran las bases de lo que posteriormente se
conocera como anlisis de Fourier: El problema de la cuerda vibrante o la
propagacin del sonido en un medio elstico.
La determinacin de las rbitas de los planetas a partir de mediciones.
Generacin de formas de onda de corriente o tensin elctrica por medio de la
superposicin de senoides generados por osciladores electrnicos de amplitud
variable cuyas frecuencias ya estn determinadas. Anlisis en el comportamiento
armnico de una seal, y reforzamiento de seales.
Estudio de la respuesta en el tiempo de una variable circuital elctrica donde la
seal de entrada no es senoidal o cosenoidal, mediante el uso de transformadas
de Laplace y solucin permanente senoidal en el dominio de la frecuencia.
La resolucin de algunas ecuaciones diferenciales en derivadas parciales admite
soluciones particulares en forma de series de Fourier fcilmente computables, y
que obtener soluciones prcticas, en la teora de la transmisin del calor, la teora
de placas, etc.

Trabajo

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Trabajo

Transféré par

Droits d'auteur :

Formats disponibles

SISTEMA DE CODIFICACIN DE SEALES DE VOZ A

TEXTO USANDO MATLAB PARA PERSONAS CON

Cuba Crdenas Karla Fiorella 14190256

Planteamiento del Problema

Como seres humanos, tenemos muchos sistemas de comunicacin, como el

Sabemos que en todo proceso de la comunicacin se encuentra un emisor (que es

Los mtodos que pudimos describir anteriormente deben realizarse siempre en

En muchos pases, actualmente, se estn implementando planes de inclusin

Cabe mencionar que muchas de las personas sordo-mudas son analfabetas,

Delimitacin del Problema

o rea: Procesamiento Digital de Seales

Declaracin de las Variables

Variable Independiente: Sistema de Codificacin de seales de voz a texto usando

Variable Dependiente: Capacidad de comunicacin de Personas con Deficiencia

1.3.1. Objetivo general

Sistema de codificacin de seales de voz a texto, usando Matlab para personas

1.3.2. Objetivos Especficos

o Analizar el proceso de codificacin de seales de voz a texto.

o Plantear una propuesta que permita mejorar la comunicacin de las

2.1. MARCO TERICO

En este programa, digitalizaremos seales de voz a texto, con una serie de

2.2. Componentes del Sistema de Codificacin de Voz a Texto

2.2.1. La Voz Humana

Corte Esquemtico del aparato Fonatorio Humano

La produccin de sonido viene generada fundamentalmente por las cuerdas

2.2.2. Fonologa y fontica

La Fonologa se dedica al estudio de los sonidos de la lengua en cuanto a su

En cuanto a la Fontica, se refiere a los sonidos en el habla, incluyendo su

Por el modo de articulacin (formante 1)

Por el lugar de articulacin (formante 2)

Grfica de la Pronunciacin de las Vocales

Es aquel elemento que transforma energa acstica (sonido) en energa elctrica

Sensibilidad: es la eficiencia del micrfono, la relacin entre la presin

Directividad: esta caracterstica determina en qu direccin capta mejor el

4. Ruido de fondo: es la tensin que entrega el micrfono sin que exista

5. Impedancia interna: es la resistencia que opone el micrfono al paso de

Si el micrfono es de alta impedancia y se tiene un cable largo se produce

2.2.4.1. Tipos de Micrfonos

Se pueden dividir segn:

Como ya se mencion en las caractersticas, segn la directividad hay tres tipos de

Micrfono omnidireccional: este es aquel cuyo

Micrfono unidireccional: existe gran nmero de

Se encuentran tres grandes grupos segn el tipo de transductor:

Micrfono de Condensador o Capacitor: lo que sucede con este micrfono es

Micrfono de condensador DC.

Para nuestra aplicacin en MATLAB utilizamos un micrfono simple de tipo

Micrfono Dinmico: trabajan por medio de induccin electromagntica, la

Micrfono piezoelctrico: utilizan el fenmeno de piezoelectricidad, cuando

La respuesta en frecuencia de estos micrfonos es muy irregular, ya que

MATLAB es el nombre abreviado de MAT rix LABoratory. MATLAB es un programa

2.2.5.1. Aplicaciones Tpicas de Matlab

2.2.6 Digitalizacin de la Voz

Las seales se representan matemticamente como funciones de una o ms

Una vez digitalizada la seala, se contina con el Procesamiento de Seales, lo

Siendo T el periodo de muestreo, y fs=1/T la frecuencia de muestreo.

En el procesado digital de seales slo dispondremos de un nmero finito de bits

Grfica de Proceso de Cuantificacin

El cuantificador es un sistema no lineal cuyo propsito es transformar la muestra

Se conoce como error de cuantificacin (o ruido), a la diferencia entre la seal de

2.3.1.5.1. Transformada de Fourier

Vous aimerez peut-être aussi