Vous êtes sur la page 1sur 3

Instituto Tecnolgico y de Estudios Superiores de Monterrey.

Weiss Bonilla Ana Dbora, Mendez Hijar, Manuel, Davila


Diosdado, Marijose, Cortes Leal, Luis, Cipres Ramos, Eric, Lizarraga Gonzales, Ismael, Pia Vizcarra, Alan Fernando,
Benitez Cruz, Ricardo Arturo, Movilidad Inteligente.

MOVILIDAD INTELLIGENTE
Weiss Bonilla, Ana Dbora, Mndez Hijar, Manuel, Dvila Diosdado, Marijose, Cortes Leal, Luis, Cipres Ramos, Eric,
Lizrraga Gonzales, Ismael, Pia Vizcarra, Alan Fernando, Bentez Cruz, Ricardo Arturo.
{A01209517, A00231994, A01630826, A01631163, A1229074, A01630333, A00225917, A01018084}@itesm.mx
Instituto Tecnolgico y de Estudios Superiores de Monterrey

La intencin de este taller vertical fue el crear un sistema


embebido capaz de reconocer las rutas de transporte pblico
dentro de la ciudad de Guadalajara, para el uso personal de
individuos con discapacidad visual, consistira en 5 tareas las
cuales fueron: la adquisicin de imagen, procesamiento de la
imagen, extraccin de datos, reconocimiento de patrones, y
por ltimo el traductor a voz.
DISCAPACIDAD VISUAL
Como cualquier otro rgano, el ojo puede verse afectado por
diversas enfermedades, de forma directa o como parte de un
problema sistmico. Estas enfermedades requieren cuidados
profesionales para poder conservar la visin.
Segn datos del Instituto Nacional de Estadstica, Geografa e
Informacin (INEGI), en Mxico hay alrededor de 4 millones
de discapacitados, de los cuales ms de 1 milln son por el
sentido de la vista, contabilizadas las personas que tienen
prdida total de la vista en uno o ambos ojos, los dbiles
visuales y quienes a pesar de utilizar lentes no cuentan con una
visin de calidad.
La ceguera legal significa que una persona posee una visin de
20/200 o menor, explica Iowa Department for the Blind. Por
ejemplo, una persona que tiene 20/200 de visin puede ver
objetos a 20 pies (6 metros) a diferencia de una persona con
un perfecto 20/20 que puede ver a 200 pies (60,9 metros).
Viajar o simplemente caminar por una calle llena de gente
puede generar grandes dificultades. Por esta razn, muchas
personas con poca visin caminan junto a un amigo o familiar
que los ayude a conducirse en entornos desconocidos. De la
misma forma, las personas invidentes deben aprender todos
los detalles de su hogar. Los obstculos grandes como mesas y
sillas deben permanecer en un lugar para prevenir lesiones. Si
una persona invidente vive con otras personas, cada miembro
del hogar debe, diligentemente, mantener los pasillos libres de
obstculos y todos los objetos deben permanecer en su lugar.
Viajar o simplemente caminar por una calle llena de gente
puede generar grandes dificultades. Por esta razn, muchas
personas con poca visin caminan junto a un amigo o familiar
que los ayude a conducirse en entornos desconocidos. De la
misma forma, las personas invidentes deben aprender todos
los detalles de su hogar. Los obstculos grandes como mesas y
sillas deben permanecer en un lugar para prevenir lesiones. Si
una persona invidente vive con otras personas, cada miembro

del hogar debe, diligentemente, mantener los pasillos libres de


obstculos y todos los objetos deben permanecer en su lugar.
Los transportistas deben cumplir con la fraccin novena del
artculo 46 del captulo de las personas con discapacidad del
Reglamento de la Ley de Movilidad y Transporte del Estado
de Jalisco, para facilitar la identificacin del nmero de las
rutas y la puerta de acceso para las personas con discapacidad
visual. Que las unidades de transporte pblico masivo y
colectivo cuenten con seales visuales y auditivas para la
correcta identificacin de la ruta y apertura y cierre de
puertas, seala el contenido del artculo.

l taller vertical de este ao se desarroll en una Raspberry


Pi siendo esta es una placa de bajo costo que inicialmente
fue implementada para fines educativos, principalmente,
cultivar en los nios una cultura por la informtica de una
forma fcil y eficiente. La Raspberry Pi funciona como un
ordenador comn y corriente, pero teniendo la gran ventaja
que su tamao es muy compacto, ya que sus medidas son de
85 x 54 milmetros (Castro, 2014).

Fig.1 Diagrama Raspberry Pi 2

sta placa contiene un chip Broadcom BCM2835 con un


procesador ARM de hasta un 1 Ghz de velocidad, una GPU
VideoCoreIV y una memoria RAM de 512 Mb. Es un
ordenador muy completo en cuanto a puertos, tiene puerto
RCA, salida de audio, dos puertos USB, puerto Ethernet y uno
HDMI. (Castro, 2014).
Tiene como funcin en el taller vertical detectar mediante
fotografas implementadas, un camin, sin importar que otros
objetos/personas se encuentren en la foto (esto mediante un
motor de bsqueda de imgenes). Seguido de que el camin
ha sido identificado, al ser procesada la imagen, el programa
detecta el nmero de la ruta grabado en el camin y as
transforma la imagen de la ruta a texto mediante Tesseract y

Instituto Tecnolgico y de Estudios Superiores de Monterrey. Weiss Bonilla Ana Dbora, Mendez Hijar, Manuel, Davila
Diosdado, Marijose, Cortes Leal, Luis, Cipres Ramos, Eric, Lizarraga Gonzales, Ismael, Pia Vizcarra, Alan Fernando,
Benitez Cruz, Ricardo Arturo, Movilidad Inteligente.

por ltimo se manda ese texto capturado a Festival, nuestro


programa que dice, mediante audio el texto que ha recibido.
Ya que son muchas acciones las que tienen que ejecutarse,
todo esto es recomendable de almacenarlo en un script de
Bash (es el lenguaje de scripting de Linux), para que todo est
automticamente programado y pueda ejecutarse sin
problemas.

soporte en diversos lenguajes como Ruby y Python (ULL,


2015)
Esta librera cuenta con cientos de funciones incluyendo una
sublibrera de aprendizaje automtico, la cual es utilizada para
el reconocimiento de patrones; tambin cuenta con
optimizacin en C y logra sacar ventaja de los procesadores
con mltiples ncleos (ULL, 2015).

el desarrollo del proyecto se llev acabo en 5 etapas durante


las cuales se utilizaron diferentes plataformas para poder
integrar el proyecto y poder as generar el producto final,
algunas de esas plataformas fueron Raspbian, OpenCV,
Tesseract, y Festival.
Antes que nada se instalaron cada una de las plataformas a la
Tarjeta Raspberry utilizando lo que llamamos Terminal o
Bash.
Siendo as las etapas de trabajo fueron las siguientes:
1. ADQUISICION DE IMAGEN
En esta etapa se busc el funcionamiento de la cmara junto
con la tarjeta Raspberry Pi 2 mostrando una imagen como
resultado, primeramente se tom una fotografa como esta:

Fig.2 procesamiento de las fotos en blanco y negro

3. EXTRACCION DE DATOS
La extraccin de datos se bas en dos cosas primeramente
deteccin de los camiones mediante el entrenamiento
automatizado de la Rasperberry Pi, el cual realizamos
mostrando varias imgenes similares de camiones a la misma.

Fig.2 Fotografa tomada con la Webcam utilizando la Raspberry

Guardndola as en una carpeta dentro del sistema, despus de


esto se comprob que la funcin de video funcionara
igualmente a la perfeccin junto con el reconocimiento facial,
teniendo como resultado un video.

2. PROCESAMIENTO DE LA IMAGEN
Durante esta etapa se realizo la escala de grises, binarizacin,
ecualizacin, y normalizacin de las imgenes esta etapa se
realiz con la plataforma conocida como OpenCV.
OpenCV es una librera de cdigo abierto, escrita en lenguaje
C, esta librera es utilizada para obtener una infraestructura de
visin por computador rpida y sencilla. OpenCV es
compatible con Windows, Linux y OS X; tambin cuenta con

#cd ~/opencv-3.0.0/samples/python2/
#python facedetect.py --cascade=cascade.xml
# kill -INT 888
# The past command stops the running command; == Crtl+C
Y segundo en la extraccin de la parte del camin donde se
encuentra el nmero de ruta, generando una imagen la cual se
mandara a tesseract para su reconocimiento de caracteres.
Utilizando el siguiente cdigo:
# Assuming we got the image of the bus cut correctly
# we run the command for cutting the image in the quadrant
desired
cd ~/Desktop/
python crop.py

Instituto Tecnolgico y de Estudios Superiores de Monterrey. Weiss Bonilla Ana Dbora, Mendez Hijar, Manuel, Davila
Diosdado, Marijose, Cortes Leal, Luis, Cipres Ramos, Eric, Lizarraga Gonzales, Ismael, Pia Vizcarra, Alan Fernando,
Benitez Cruz, Ricardo Arturo, Movilidad Inteligente.

britnico), espaol, italiano, hindi, y posiblemente otros


(Lazalde, 2010).
Fig.3 Imagen obtenida

4. RECONOCIMIENTO DE PATRONES
Para esta etapa se utiliz la plataforma Tesseract la cual es un
software de reconocimiento ptico de caracteres (OCR)
compatible con diversos sistemas operativos, fue desarrollado
por HP y desde el 2006 ha sido financiado por google
(Bartolom, 2016).
Este programa utiliza el algoritmo llamado line finding
algorithm, el cual consiste en reconocer una pgina sesgada
sin la necesidad de desosegarla, con el consiguiente de no
perder calidad de imagen; posteriormente Tesseract usa lneas
en el texto para encontrar texto de paso fijo el cual reconoce
letra por letra (Smith, 2007).

Durante la ltima etapa se recibi un archivo .txt previamente


convertido por Tesseract haba, as al recibirlo Festival,
mandando as una seal de audio a la salida auxiliar.

Conclusiones
Al pasar este taller vertical podemos concluir que el querer
ayudar a una comunidad no es tarea fcil, pero siempre con un
gran esfuerzo se pueden lograr cosas maravillosas, ninguno de
los integrantes del equipo sabia utilizar la plataforma Linux y
mucho menos la de Raspbian al igual que las herramientas,
pero al final se logr completar el proyecto con una ardua
investigacin y ganas de aprender y ayudar a los dems
porque no sabes cuando nosotros vayamos a necesitar de
alguien ms. Hubo ciertos problemas con el procesamiento de
imgenes grandes ya que la Raspberry Pi no soportaba cargas
de archivos tan pesados y nuestras computadoras tampoco
podan entrenar con archivos tan grandes debido a
limitaciones de la memoria complicando as nuestro trabajo, a
pesar de eso logramos grandes cosas aunque si sabemos que
con un poco ms de tiempo para procesar y mejor equipo
podremos hacer algo aun mejor.

REFERENCIAS
[1] Catlogo de Software Libre, Recuperado el 21/04/2016, Sitio web:
http://www.cdlibre.org/consultar/catalogo/Ofimatica_OCR.html

[2] Grupo Frmula. (24 de Diciembre, 2014). Ms de un milln de personas


en Mxico sufren discapacidad visual. GrupoFormula. Recuperado de
http://www.radioformula.com.mx/notas.asp?Idn=466000&idFC=2014.

Fig.4 Reconocimiento de patrones

Utilizndolo para la deteccin de caracteres dentro de las


imgenes de camiones, el cual posteriormente procesamos
para convertirlo en audio.
Utilizando el siguiente cdigo:
tesseract esele.jpg output

[3] Bausch. (s.f.). Problemas de visin. Bausch.com.ar.


Recuperado de http://www.bausch.com.ar/problemas-de
visi%C3%B3n/
[4] Ramrez, A. (23 de enero de 2015). El transporte pblico
olvida a personas ciegas. Milenio. Recuperado de
http://www.milenio.com/region/transporte-publico-olvida
personas-ciegas_0_451154923.html

[5] Qu es Raspberry Pi, dnde comprarla y cmo usarla?, Recuperado el


21/04/2016, Sitio web: http://computerhoy.com/noticias/hardware/que-esraspberry-pi-donde-comprarla-como-usarla-8614

# The name of the file of output is output.txt


5. TRADUCTOR A VOZ
Su nombre completo es Festival Speech Synthesis System, es
un programa con una funcionalidad de convertir texto a sonido
y tambin en viceversa. El programa fue creado por
investigadores de la Universidad de Edimburgo. Consiste de
un sistema TTS con soporte para idiomas ingls (americano,

[6] OpenCV: Librera de Visin por Computado, Recuperado el 21/04/2016,


Sitio web: http://osl.ull.es/software-libre/opencv-libreria-vision-computador/

Vous aimerez peut-être aussi