Vous êtes sur la page 1sur 13

SISTEMA DE CODIFICACIN DE SEALES DE VOZ A

TEXTO USANDO MATLAB PARA PERSONAS CON


DEFICIENCIA AUDITIVA

INTEGRANTES:

Cuba Crdenas Karla Fiorella 14190256


Navarro Espinoza Diana Carolina 14190139
Chavez Arias Csar 14190255

PROFESOR:

Ing.Villafuerte

23 DE NOVIEMBRE DE 2016
FIEE-UNMSM
CAPTULO 1
1.1. INTRODUCCIN
Para la transformacin de seales de voz a texto, debemos considerar muchos
aspectos, como el tono de voz, el ambiente en donde se realiza la transformacin
de voz (de preferencia lugares donde haya poco ruido para tener una mejor
muestra) y la vocalizacin.
Este programa, est diseado con el fin de poder ayudar a las personas con
deficiencia auditiva a que puedan familiarizar su lenguaje de seas con smbolos
que describen el alfabeto y los nmeros a travs de un sistema de codificacin, en
este caso seales de voz a texto. Lo que se desea es que estas personas puedan
distinguir estos smbolos para mejorar su comunicacin con otras personas
(normales o sordo-mudas) de una manera ms didctica, usando la tecnologa.

1.2. EL PROBLEMA:

Planteamiento del Problema

1.2.1. Contextualizacin:

Como seres humanos, tenemos muchos sistemas de comunicacin, como el


telfono, la radio, televisin, etc.; pero si nos damos cuenta, estos fueron creados
con la intensin de que puedan comunicarse las personas que no poseen ningn
tipo de discapacidad.

Sabemos que en todo proceso de la comunicacin se encuentra un emisor (que es


el que enva una informacin) y un receptor (el que recibe la informacin del emisor),
pero si uno de los dos est ausente o falla, no existe comunicacin. Este problema
viene desde hace mucho tiempo para personas que poseen algn tipo de
discapacidad que pueda afectar el proceso de poder comunicarse, esto hace notar
que la sociedad excluye de una u otra forma a estas personas por no padecer de
los mismos problemas.

Los mtodos que se han desarrollado para posibilitar a las personas con deficiencia
auditiva a que puedan comunicarse, son netamente fsicos, como por ejemplo la
lectura de labios y el lenguaje de seas, pero dichos mtodos implican otros
problemas en la comunicacin. Para el primer mtodo, la persona con deficiencia,
debe saber el idioma que habla la otra persona, de otro modo, la lectura de labios
ser mal interpretada. En el segundo mtodo la persona no discapacitada deber
conocer el lenguaje de seas y dominarlo para poder entablar una comunicacin
adecuada.

Los mtodos que pudimos describir anteriormente deben realizarse siempre en


presencia de ambas personas y a corta distancia, sin usar la tecnologa (donde se
emitan seales de audio como: radio, telfonos celulares y fijos, etc.). Por lo tanto,
se han visto excluidos y marginados de muchas actividades sociales.

En muchos pases, actualmente, se estn implementando planes de inclusin


social, en donde se pretende ayudar a todas las personas que tengan cualquier tipo
de discapacidad fsica o mental, obligando a las empresas a contratar personas con
discapacidades, y sean ubicadas en reas en donde son aptas, y puedan
desenvolverse en el mbito laboral con total normalidad. De alguna manera se est
tratando de eliminar la marginacin y discriminacin que ha existido contra las
personas discapacitadas, pero mientras no existan formas de comunicacin
didctica diseada para estas personas, no podrn tener una verdadera inclusin y
seguirn siendo vctimas de discriminacin.

Cabe mencionar que muchas de las personas sordo-mudas son analfabetas,


muchas veces por falta de recursos o de informacin.

Delimitacin del Problema

1.2.2. Contenido:

o rea: Procesamiento Digital de Seales


o Aspecto: Codificacin de seales de voz a texto
o Campo: Electrnica

Declaracin de las Variables

Variable Independiente: Sistema de Codificacin de seales de voz a texto usando


Matlab.

Variable Dependiente: Capacidad de comunicacin de Personas con Deficiencia


Auditiva.
1.3. Objetivos

1.3.1. Objetivo general

Sistema de codificacin de seales de voz a texto, usando Matlab para personas


con deficiencia auditiva.

1.3.2. Objetivos Especficos

o Analizar el proceso de codificacin de seales de voz a texto.

o Plantear una propuesta que permita mejorar la comunicacin de las


personas con deficiencia auditiva mediante la implementacin de un
sistema de codificacin de seales de voz a texto usando matlab.
CAPTULO 2

2.1. MARCO TERICO

Este trabajo, est basado en aplicar nuestros conocimientos de Matlab para poder
ayudar a personas con cualquier tipo de deficiencia que padezca que le impida
poder comunicarse con otras personas, ya sean de su misma condicin o personas
normales sin ningn tipo de deficiencia.

En este programa, digitalizaremos seales de voz a texto, con una serie de


muestras para obtener una mejor respuesta del programa diseado.

2.2. Componentes del Sistema de Codificacin de Voz a Texto

2.2.1. La Voz Humana

La voz humana se produce por medio del aparato fonatorio, el cual est formado
por los pulmones como fuente de energa en la forma de un flujo de aire, la laringe,
que contiene las cuerdas vocales, la faringe, las cavidades orales (o bucal) y nasal
y una serie de elementos articulatorios: los labios, los dientes, el alvolo, el paladar,
el velo del paladar y la lengua.

Corte Esquemtico del aparato Fonatorio Humano

La produccin de sonido viene generada fundamentalmente por las cuerdas


vocales, que se encuentran en la laringe. La abertura entre las cuerdas se denomina
glotis.
A medida que se cierran las cuerdas vocales, stas comienzan a vibrar,
producindose un sonido tonal, es decir peridico. La frecuencia de dicho sonido
depende de varios factores, entre otros del tamao y la masa de las cuerdas
vocales, de la tensin que se les aplique y de la velocidad del flujo del aire
proveniente de los pulmones. A mayor tamao, menor frecuencia de vibracin, lo
cual explica por qu en los varones, cuya glotis, es en promedio mayor que la de
las mujeres, por lo tanto, la voz en general es ms grave. A mayor tensin la
frecuencia aumenta, siendo los sonidos ms agudos. As, para lograr emitir sonidos
en el registro extremo de la voz es necesario un mayor esfuerzo vocal. Tambin
aumenta la frecuencia (a igualdad de las otras condiciones) al crecer la velocidad
del flujo de aire, razn por la cual al aumentar la intensidad de emisin se tiende a
elevar espontneamente el tono de voz.

2.2.2. Fonologa y fontica

La Fonologa se dedica al estudio de los sonidos de la lengua en cuanto a su


carcter simblico o de representacin mental. A cada uno de los sonidos abstractos
identificados se lo conoce como fonema. Uno de los objetivos de la fonologa es
acotar al mximo la cantidad de fonemas requeridos para representar cada idioma
de una manera suficientemente precisa.

En cuanto a la Fontica, se refiere a los sonidos en el habla, incluyendo su


produccin acstica y los procesos fsicos y fisiolgicos de emisin y articulacin
involucrados. Se ocupa, por consiguiente, de las realizaciones de los fonemas.
2.2.3. Formantes

Los formantes son elementos que sirven para distinguir componentes del habla
humana, principalmente, las vocales y sonidos sonantes. El formante con la
frecuencia ms baja se llama F1, el segundo F2, el tercero F3, etc.
Son necesarios slo los dos primeros para caracterizar una vocal, aunque la pueden
caracterizar ms formantes. Generalmente, los formantes posteriores determinan
propiedades acsticas como el timbre.
Los dos primeros formantes se determinan principalmente por la posicin de la
lengua. Sucediendo que F1 tiene una frecuencia ms alta cuanto ms baja esta la
lengua, es decir una mayor abertura. Para el F2 tiene mayor frecuencia cuanto ms
hacia delante est posicionada la lengua.
No todos los sonidos se componen de formantes definidos. Solamente aparecen en
sonantes, que incluyen los sonidos pulmonares: vocales, aproximantes y nasales.
stas ltimas tienen un formante adicional F3, en torno a los 1500 Hz.
Si la frecuencia fundamental es mayor que la frecuencia de los formantes, entonces
el carcter del sonido se pierde y se vuelven difciles de distinguir, por lo cual son
difciles de reconocer.
A continuacin, se muestran algunos anchos de banda entre los cuales se localizan
las vocales:
Clasificacin de las Vocales 4

Por el modo de articulacin (formante 1)

Cerradas (i, u)
Medias (e, o)
Abiertas (a)

Por el lugar de articulacin (formante 2)

Anteriores (i, e)
Centrales (a)
Posteriores (o, u)

Grfica de la Pronunciacin de las Vocales


2.2.4. Micrfono

Es aquel elemento que transforma energa acstica (sonido) en energa elctrica


(seal de audio). La fidelidad con la que este elemento genera una representacin
elctrica del sonido depende en parte del mtodo que utiliza para la conversin de
energa. A lo largo del tiempo se ha diseado una serie de mtodos distintos para
propsitos varios; de este modo, hoy podemos contar con una amplia variedad en
tipos de micrfono disponibles.
La calidad de cada micrfono viene dada por sus caractersticas, las cuales se
describen a continuacin:

Sensibilidad: es la eficiencia del micrfono, la relacin entre la presin


sonora que incide (expresada en Pascales) y la tensin elctrica de salida
(expresada en voltios). O sea, expresa que tan bien convierte el micrfono
la presin acstica en voltaje de salida. La sensibilidad se expresa en mili-
voltios por Pascal.
Fidelidad: indica la variacin de sensibilidad con respecto a la frecuencia.
Adems, la fidelidad, viene definida como la respuesta en frecuencia del
micrfono, cuanto ms lineal sea la respuesta en frecuencia mayor fidelidad
tendr el micrfono. La fidelidad se expresa en dB.
En funcin de esta respuesta en frecuencia o fidelidad se elabora la
llamada Curva de respuesta de un micrfono, que es la representacin
grfica del nivel obtenido en la captacin de sonidos de igual intensidad,
pero de distinta frecuencia.

Directividad: esta caracterstica determina en qu direccin capta mejor el


sonido un micrfono, es decir indica la sensibilidad del micrfono a las
diferentes direcciones.

4. Ruido de fondo: es la tensin que entrega el micrfono sin que exista


ningn sonido incidiendo sobre l. Este ruido se produce por el movimiento
trmico de los electrones en la carcasa que no tiene masa. El ruido de
fondo debe estar en torno a los 60dB, pero mientras ms bajo sea, mejor
calidad ofrece el micrfono.

5. Impedancia interna: es la resistencia que opone el micrfono al paso de


la corriente. La impedancia segn su valor viene caracterizada por baja, alta
y muy alta impedancia.

Si el micrfono es de alta impedancia y se tiene un cable largo se produce


una prdida muy grande. Si se tiene una impedancia baja se puede utilizar
un cable muy largo y no se pierde tanto la seal. Por ltimo, se puede bajar
la resistencia para evitar prdidas en altas frecuencias.

2.2.4.1. Tipos de Micrfonos

Se pueden dividir segn:

a) La Directividad

Como ya se mencion en las caractersticas, segn la directividad hay tres tipos de


micrfonos:

Micrfono omnidireccional: este es aquel cuyo


diagrama polar es considerado como un crculo
perfecto. Aunque esto es en el caso ideal.
Micrfono bidireccional: en este caso el diagrama
polar muestra como captan por la parte frontal y la
lateral.

Micrfono unidireccional: existe gran nmero de


patrones polares para este tipo.

b) El Transductor

Se encuentran tres grandes grupos segn el tipo de transductor:

Micrfono de Condensador o Capacitor: lo que sucede con este micrfono es


que las ondas sonoras provocan el movimiento oscilatorio del diafragma, el
cual acta como una de las placas de un capacitor y la vibracin provoca una
variacin en la energa almacenada en el condensador que forma el ncleo
de la capsula microfnica. Esta variacin genera una tensin elctrica que es
la seal de salida del sistema. La seal de salida de este sistema es anloga.
Segn el principio de operacin:

Micrfono de condensador DC.


Micrfono de condensador electret.
Micrfono de condensador de radiofrecuencia (RF).

Para nuestra aplicacin en MATLAB utilizamos un micrfono simple de tipo


electret, ya que son los menos costos y ms comunes.

Micrfono Dinmico: trabajan por medio de induccin electromagntica, la


vibracin del diafragma provoca el movimiento de una bobina mvil o cinta
corrugada ancladas a un imn permanente que genera un campo
magntico que a su vez genera una tensin elctrica, que es la seal de
salida. Esta seal elctrica es anloga. Hay dos tipos bsicos:
Micrfono de bobina mvil o dinmico
Micrfono de cinta

Micrfono piezoelctrico: utilizan el fenmeno de piezoelectricidad, cuando


las ondas sonoras hacen vibrar el diafragma el movimiento de este hace
que se mueva el material contenido en su interior (cuarzo, carbn, etc.). La
friccin entre estas partculas genera sobre la superficie del material una
tensin elctrica.

La respuesta en frecuencia de estos micrfonos es muy irregular, ya que


son micrfonos piezoelctricos:
Micrfono de carbn
Micrfono de cristal
Micrfono de cermica

2.2.5. Matlab

MATLAB es el nombre abreviado de MAT rix LABoratory. MATLAB es un programa


para realizar clculos numricos con vectores y matrices. Como caso particular
puede tambin trabajar con nmeros escalares tanto reales como complejos, con
cadenas de caracteres y con otras estructuras de informacin ms complejas. Una
de las capacidades ms atractivas es la de realizar una amplia variedad de grficos
en dos y tres dimensiones, y adems posee un lenguaje de programacin propio.
MATLAB es un gran programa de clculo tcnico y cientfico. Para ciertas
operaciones es muy rpido, cuando puede ejecutar sus funciones en cdigo nativo
con los tamaos ms adecuados para aprovechar sus capacidades de
vectorizacin. MATLAB dispone de un cdigo bsico y de varias libreras
especializadas (toolboxes).
El lenguaje est construido por cdigo llamado M-code que puede ser fcilmente
ejecutado en la ventana de comandos. Con lo cual se pueden crear funciones, etc.
Pero la razn principal para la eleccin de este lenguaje de programacin son las
herramientas que proporciona para el procesamiento de seales, y el conjunto de
funciones para el procesamiento digital.
Adems, para crear entornos grficos se puede utilizar el GUIDE de MATLAB, que
provee herramientas para crear GUIs, Graphical User Interface, con lo cual se
puede crear la forma del entorno grfico, as como asociar funciones a los
elementos del GUI. MATLAB tambin incluye funciones para manipular archivos.

2.2.5.1. Aplicaciones Tpicas de Matlab

Clculo matemtico
Desarrollo de algoritmos
Adquisicin de datos
Modelado, simulacin y prototipado
Anlisis de datos y visualizacin
Grficos
Desarrollo de aplicaciones e interfaces grficas de usuario (GUI)

2.2.6 Digitalizacin de la Voz

Las seales se representan matemticamente como funciones de una o ms


variables independientes. La variable independiente ms comn es el tiempo, y
algunas seales que dependen de l son, por ejemplo, la voz, una onda de radio,
un electrocardiograma, etc. Otras seales, tales como las imgenes, son funciones
de 2 variables independientes, ya que contienen informacin de brillo o de colorido
en funcin de las coordenadas X e Y de un plano.

Al decir digitalizar, podemos decir que se convierte la entrada de voz a una forma
que el reconocedor pueda procesar o que la seal sea ms accesible para
manipular posteriormente.

Las redes digitales de transmisin de voz y datos son comunes en nuestra era.
Fueron creadas ya que presentan ciertas ventajas sobre las redes analgicas como,
por ejemplo: que conservan la seal casi inalterable a travs de su recorrido. Es
decir que es ms difcil que la comunicacin se vea afectada por factores externos
como el ruido elctrico.

En conclusin, digitalizar una seal de voz no es otra cosa que tomar muestras (a
intervalos de tiempo regulares) de la amplitud de la seal analgica y transformar
esta informacin a binario. Este proceso de denomina muestreo.

Una vez digitalizada la seala, se contina con el Procesamiento de Seales, lo


cual es un rea de la Ingeniera Electrnica que se concentra en la representacin,
transformacin, manipulacin de seales, y de la informacin que ellas contienen.
2.2.7. Muestreo Peridico

La forma tpica de obtener una representacin discreta x[n] a partir de una seal
continua xc(t) es mediante muestreo peridico por medio de un conversor
continuo/discreto (C/D), obteniendo la secuencia discreta segn la expresin:
Ec. 1

Siendo T el periodo de muestreo, y fs=1/T la frecuencia de muestreo.


Grfica de Conversor Continuo/Discreto
El sistema que realiza la operacin de la figura, se denomina conversor ideal de
tiempo continuo a discreto (C/D). En la prctica esta operacin de muestreo se
realiza mediante un conversor analgico-digital. Estos sistemas son
aproximaciones al conversor C/D ideal.
2.2.8. Cuantificacin

En el procesado digital de seales slo dispondremos de un nmero finito de bits


para representar cada una de las muestras. Podemos representar el proceso de
cuantificacin mediante

Grfica de Proceso de Cuantificacin

El cuantificador es un sistema no lineal cuyo propsito es transformar la muestra


de entrada x[n] en un valor dentro de un conjunto de valores prestablecidos,
representamos esta operacin mediante el operador Q:

Se conoce como error de cuantificacin (o ruido), a la diferencia entre la seal de


entrada (sin cuantificar) y la seal de salida (ya cuantificada), interesa que el ruido
sea lo ms bajo posible. Para conseguir esto y segn sea la aplicacin a
desarrollar, se pueden usar distintas tcnicas de cuantificacin:

Cuantificacin uniforme
Cuantificacin logartmica
Cuantificacin no uniforme
Cuantificacin vectorial
Cuantificacin uniforme:
En los cuantificadores uniformes o lineales la distancia entre los niveles de
reconstruccin es siempre la misma, la mayora usan un nmero de niveles que es
una potencia de 2. No hacen ninguna suposicin acerca de la seal a cuantificar,
de all que no proporcionen los mejores resultados. Pero son los ms fciles y
menos costosos a implementar.

Cuantificacin logartmica:
Para evitar desperdicio de niveles de reconstruccin y de ancho de banda se
utiliza un mtodo sencillo para mejorar el incremento de la distancia entre los
niveles de reconstruccin conforme aumenta la amplitud de la seal. Para
conseguir esto se hace pasar la seal por un compresor logartmico antes de la
cuantificacin. Esta seal comprimida puede ser cuantificada uniformemente. A la
salida del sistema la seal pasa por un expansor. A esta tcnica se le llama
compresin.

Cuantificacin no uniforme:
Este cuantificador utiliza la funcin de la distribucin de probabilidad, conociendo
esto se puede ajustar los niveles de reconstruccin a la distribucin de forma que
se minimice el error cuadrtico medio.

Cuantificacin vectorial:
Este mtodo cuantifica los datos en bloques de N muestras. En este tipo de
cuantificacin, el bloque de N muestras se trata como un vector N-dimensional.

2.3.1.5.1. Transformada de Fourier


La historia del anlisis de Fourier tiene ms de 200 aos. Sus orgenes principian
unos 60 aos antes del momento en que Jean Baptiste Joseph Fourier present la
primera versin de su trabajo sobre la teora de la conduccin del calor a la
Academia de Pars (1807).
En ese momento los esfuerzos de los fsicos y matemticos se concentraban en
dos problemas principales que sentaran las bases de lo que posteriormente se
conocera como anlisis de Fourier: El problema de la cuerda vibrante o la
propagacin del sonido en un medio elstico.
La determinacin de las rbitas de los planetas a partir de mediciones.
Generacin de formas de onda de corriente o tensin elctrica por medio de la
superposicin de senoides generados por osciladores electrnicos de amplitud
variable cuyas frecuencias ya estn determinadas. Anlisis en el comportamiento
armnico de una seal, y reforzamiento de seales.
Estudio de la respuesta en el tiempo de una variable circuital elctrica donde la
seal de entrada no es senoidal o cosenoidal, mediante el uso de transformadas
de Laplace y solucin permanente senoidal en el dominio de la frecuencia.
La resolucin de algunas ecuaciones diferenciales en derivadas parciales admite
soluciones particulares en forma de series de Fourier fcilmente computables, y
que obtener soluciones prcticas, en la teora de la transmisin del calor, la teora
de placas, etc.

Vous aimerez peut-être aussi