Vous êtes sur la page 1sur 5

Identificacin de cantidades manuscritas de depsitos en

cheques mediante imgenes digitales


Erick Rolando Apaza Vilca
Elvis Tellez Mendoza
Escuela Profesional de Ingeniera de Sistemas
Universidad Nacional de San Agustn
Arequipa, Peru
Resumen.- En este trabajo se presenta un sistema
reconocedor de nmeros manuscritos con un diseo
novedoso, sencillo y modular, que incluye el desarrollo de una
tcnica de aprendizaje tipo Off Line, basada en la utilizacin
de redes monocapa ADELINE Para medir el rendimiento del
sistema, se realizaron pruebas utilizando la base de datos de
modelos de cheques encontrados en la UCI y obtenindose
resultados competitivos. El sistema propuesto no slo permite
clasificar dgitos; tambin permite explicar las respuestas
dadas y detectar patrones ambiguos, indicando a qu otras
clases podran pertenecer.
La utilizacin de varias
caractersticas representativas extradas de los datos de
entrada durante la etapa previa de pre procesamiento, y el
tratamiento de las mismas en forma independiente, permite
que la presencia de errores en los patrones de entrada no
tenga gran influencia en la respuesta del sistema

I.

INTRODUCCION

En los ltimos aos el reconocimiento de imgenes es


por medio de redes neuronales artificiales. Esto fue
aplicado para especficamente toma de fotografas y
enfoque por medio de un dispositivo especializado
tomando de ejemplo algunas instituciones usan
aplicaciones de google o brinkster para sus casos de
investigacin
y
reconocimiento.
Aplicando
los
conocimiento de Alan Turing y Donald Hebben en cuanto
al aprendizaje y a la neurologa computacional.
Las redes neuronales pueden usarse en un gran nmero
de aplicaciones tanto como comerciales o militares, algunas
aplicaciones comerciales (biologa - empresa - finanzas manufacturas) este trabajo se abocar a presentar
aplicaciones sobre reconocimiento y deteccin de
caracteres escritos.
Histricamente, las problemticas planteadas en el rea
del reconocimiento de patrones, fueron estudiadas desde
dos pticas diferentes: la estadstica (teora de decisin) y la
sintctica o estructural. En los ltimos aos el desarrollo de
la tecnologa de Redes Neuronales ha proporcionado un
nuevo enfoque basado en estrategias de tipo caja negra.
Esta caracterstica es atractiva para los diseadores de
sistemas de Reconocimiento de Patrones, dado que la
cantidad de conocimiento previo necesario para la
implementacin del sistema es mnimo, as como tambin
el conocimiento de detalles de la operacin interna del
mismo. De esta manera, las redes neuronales ofrecen una

alternativa frente al software tradicional, donde el


desarrollo de programas es reemplazado por el desarrollo
de arquitecturas de red apropiadas y algoritmos de
entrenamiento que permiten la adaptacin del rendimiento
de la red a un problema especfico.
II.

CONCEPTOS

A. Redes Neuronales
Las Redes Neuronales son una base importante para el
desarrollo de la IA (Inteligencia artificial). Son inspiradas
en el comportamientos de las neuronas y conexiones del
cerebro humano tratando de crear un programa, sistema o
mquina que sea capaz de solucionar problemas difciles,
actuar de forma humana, y realizar trabajos pesados
mediante tcnicas algortmicas convencionales.
B. Tipos de Redes Neuronales
Una red neuronal o red neural, puede referirse a:
B.1 Red neuronal artificial: Modelos matemticos,
computacionales, artificiales, ideales de una red neuronal
empleados en estadstica, psicologa cognitiva, e
inteligencia artificial.
B.2 Red neuronal biolgica: Cmulo de neuronas
fsicamente interconectadas cuya actividad ayuda a definir
un circuito reconocible en el sistema nervioso.
C. OCR
El reconocimiento ptico de caracteres (ROC),
generalmente conocido como reconocimiento de caracteres
y expresado con frecuencia con la sigla OCR (del ingls
Optical Character Recognition), es un proceso dirigido a la
digitalizacin de textos, los cuales identifican
automticamente a partir de una imagen smbolos o
caracteres que pertenecen a un determinado alfabeto, para
luego almacenarlos en forma de datos. As podremos
interactuar con estos mediante un programa de edicin de
texto o similar.
En los ltimos aos la digitalizacin de la informacin
(textos, imgenes, sonido, etctera) ha devenido un punto
de inters para la sociedad. En el caso concreto de los
textos, existen y se generan continuamente grandes
cantidades de informacin escrita, tipogrfica o manuscrita

en todo tipo de soportes. En


automatizar la introduccin de
entrada por teclado implica un
recursos humanos y un aumento
mismo tiempo que se mantiene,
calidad de muchos servicios.

este contexto, poder


caracteres evitando la
importante ahorro de
de la productividad, al
o hasta se mejora, la

D. Segmentacin de Imgenes
La segmentacin subdivide una imagen en sus partes
constituyentes u objetos, con el fin de separar las partes de
inters del resto de la imagen, por lo tanto el nivel al que se
lleva a cabo esta subdivisin depende del problema a
resolver. En el proceso de detectar las partes en una imagen
se identifican bordes de la imagen, o se segmenta est en
regiones, lneas o curvas, etc. Otra definicin considera a la
segmentacin como la clasificacin de los puntos de la
imagen (pixeles), indicando las clases a la que pertenecen
los diferentes pixeles. Los atributos bsicos de
segmentacin de una imagen son: la luminancia en
imgenes monocromticas, los componentes de color en
imgenes en color, textura, forma, etc.
La segmentacin automtica es una de las tareas ms
difciles del procesamiento de imgenes, esta etapa
determina el eventual xito o fracaso del anlisis, de hecho
rara vez llega a alcanzar una solucin satisfactoria, se debe
buscar un mtodo alternativo de comprobacin para la
verificacin de los resultados. Un considerable nmero de
trabajos de investigacin se centran en este problema. Los
algoritmos de segmentacin de imgenes monocromticas
generalmente se basan en una de las dos propiedades
bsicas de los valores del nivel de gris: discontinuidad y
similaridad.
E. Binarizacion
La binarizacin de una imagen digital consiste en
transformar la imagen en escala de grises en una imagen en
blanco y negro. Para realizar la operacin de binarizacin,
se deber elegir un valor adecuado de umbral dentro de los
niveles de grises. Una vez elegido el umbral, todos los
niveles de grises menores que el valor de umbral fijado se
convertirn en negro y todos los que resulten ser mayores
en blanco.
F. KNN
Para OCR, existe un mtodo muy conveniente, no
paramtrico y supervisado, que proporciona resultados muy
adecuados para la aplicacin que se est tratando, El
algoritmo K-NN (K vecinos ms prximos). Este mtodo
es muy popular debido a su sencillez y a cierto nmero de
propiedades estadsticas bien conocidas que le
proporcionan un buen comportamiento para afrontar
diversos tipos de problemas de clasificacin, siendo uno de
ellos el de OCR.
Dado un conjunto de objetos prototipo de los que ya se
conoce su clase (es decir, dado un conjunto de caracteres de
muestra) y dado un nuevo objeto cuya clase no conocemos
(imagen de un carcter a reconocer) se busca entre el
conjunto de prototipos los k ms parecidos a nuevo
objeto. A este se le asigna la clase ms numerosa entre los
k objetos prototipos seleccionados. Fase de
entrenamiento y fase de test. Conociendo el funcionamiento

bsico del mtodo de clasificacin de los k vecinos ms


prximos es obvio que para poder empezar a trabajar con
este mtodo es necesario reunir un conjunto de datos
etiquetados, es decir, un conjunto de muestras prototipo con
las clases a las que pertenecen.
En OCR, esta recoleccin implica disponer de una base
de datos de imgenes de los tipos de caracteres que
posteriormente se esperen reconocer. A este conjunto de
datos se le denomina conjunto de entrenamiento. Sin
embargo, la fase de entrenamiento no solo consiste en la
recopilacin de estos datos, sino que, tpicamente, los datos
originales que se dedican al entrenamiento deben ser pre
procesados adecuadamente para obtener representaciones
compactas y coherentes.

III.

MODELOS REDES NEURONALES

A. Adaline
El adaline (de ADAptative LINear Element) es un tipo
de red neuronal artificial desarrollada por el profesor
Bernie Widrow y su alumno Ted Hoff en la Universidad de
Stanford en 1960.1 El modelo est basado en la Neurona de
McCulloch-Pitts. Este modelo es el que estar siendo
implementado a posterior para este proyecto.
IDEA: Modificacin de pesos para tratar de reducir la
diferencia entre la salida deseada y la actual (para cada
patrn).Se denomina LMS: minimiza el Error Cuadrtico
Medio sobre todos los patrones de entrenamiento.
Con respecto al perceptrn el Adaline posee la ventaja
de que su grfica de error es un hiperparaboloide que posee
o bien un nico mnimo global, o bien una recta de infinitos
mnimos, todos ellos globales. Esto evita la gran cantidad
de problemas que da el perceptrn a la hora del
entrenamiento debido a que su funcin de error (tambin
llamada de coste) posee numerosos mnimos locales.

Es un tipo de aprendizaje OffLine

Se enmarca dentro del tipo de aprendizaje por


correccin de error.

Se utiliza para entrenar un Elemento simple de


procesado, con una funcin de transferencia lineal.

Se le conoce tambin con el nombre de Regla de


Widrow-Hoff (Adaline: Adaptive Lineal Element).

Se puede combinar un cierto nmero de neuronas


en la capa de salida (estructura con un cierto grado de
complejidad). La regla se aplica sobre cada una de las
neuronas de manera individual.
B. Backpropagation
La propagacin hacia atrs de errores o
retropropagacin (del ingls backpropagation) es un
algoritmo de aprendizaje supervisado que se usa para
entrenar redes neuronales artificiales. El algoritmo emplea
un ciclo propagacin adaptacin de dos fases. Una vez
que se ha aplicado un patrn a la entrada de la red como
estmulo, este se propaga desde la primera capa a travs de

las capas superiores de la red, hasta generar una salida. La


seal de salida se compara con la salida deseada y se
calcula una seal de error para cada una de las salidas.

La mayora del trabajo reciente de reconocimiento de


caracteres se ha enfocado en aproximaciones estadsticas,
sintticas y estructurales.

Las salidas de error se propagan hacia atrs, partiendo


de la capa de salida, hacia todas las neuronas de la capa
oculta que contribuyen directamente a la salida. Sin
embargo las neuronas de la capa oculta slo reciben una
fraccin de la seal total del error, basndose
aproximadamente en la contribucin relativa que haya
aportado cada neurona a la salida original. Este proceso se
repite, capa por capa, hasta que todas las neuronas de la red
hayan recibido una seal de error que describa su
contribucin relativa al error total.

La realizacin de este proyecto podr relajar las tareas


realizadas por el personal ahorrando de esta manera tiempo
y dinero. Adems de esto se dar pie a una posible
expansin en la cual se reconocer tambin la cuenta a
depositar y la cuenta de procedencia, esto tambin con fines
de alivianar el trabajo al personal que trabaja en el banco

La importancia de este proceso consiste en que, a


medida que se entrena la red, las neuronas de las capas
intermedias se organizan a s mismas de tal modo que las
distintas neuronas aprenden a reconocer distintas
caractersticas del espacio total de entrada. Despus del
entrenamiento, cuando se les presente un patrn arbitrario
de entrada que contenga ruido o que est incompleto, las
neuronas de la capa oculta de la red respondern con una
salida activa si la nueva entrada contiene un patrn que se
asemeje a aquella caracterstica que las neuronas
individuales hayan aprendido a reconocer durante su
entrenamiento.
C. Perceptron
Las redes neuronales del tipo Perceptrn Multicapa
(MLP) han sido utilizadas en las ltimas dcadas en los
sistemas OCR. Estas redes pueden comportarse como
clasificadores y tambin como extractores
de
caractersticas.
Durante la etapa de entrenamiento, los pesos asociados
al conexionado son modificados de forma tal que la red
neuronal aprende. Uno de los algoritmos de aprendizaje
ms utilizado denominado de Retro propagacin hacia
atrs o Backpropagation (BP), utiliza la tcnica de descenso
por gradiente para encontrar el mnimo de la funcin de
costo que mide el error del sistema como una funcin
diferenciable de los pesos.
Existen mltiples variantes para el diseo y
entrenamiento de una red neuronal usando los algoritmos
BP, orientadas a evitar o disminuir el efecto de ciertos
problemas inherentes al mtodo en cuestin. Por ejemplo,
durante el entrenamiento el parmetro puede permanecer
constante o no, dando origen a dos clases de
backpropagation. La segunda alternativa es una mejora con
respecto a la primera y la idea principal para llevarla a cabo
es mantener un valor de tan alto como sea posible
mientras que el aprendizaje sea estable, es decir, no
oscilante.
IV.

JUSTIFICACION

El reconocimiento de caracteres y dgitos es una de las


reas de aplicacin ms efectiva de las redes neuronales, al
punto de que ya es comn el diseo eficiente, manufactura,
y comercio de sistemas de reconocimiento de caracteres
basados en redes neuronales.

Adems de lo dicho anteriormente los fines acadmicos


tambin estarn presentes siendo para este caso el estudio y
demostracin de uso de las distintas tcnicas de
inteligencia artificial tales como las redes neuronales y
sistemas difusos.
V.

FUNCIONALIDAD

El software de reconocimiento consta de 4 partes para


su funcionamiento:
A. Binarizacin:
Para el cual se llevar a cabo mediante 2 procesos:

Proceso de llevado a escala de grises: En el caso


de los cheques generalmente estn escritos en blanco y
negro .No obstante la tinta del lapicero puede ser azul o un
negro claro. Es por eso que se tomara en cuenta este
proceso de todas maneras.

Binarizacin a blanco o negro .Existen diferentes


tipo de binarizacin de pixeles .En este caso lo primero que
se hallara ser la mayor cantidad de pixeles de un
determinado color haciendo que todos los dems sean
considerados como negro y los de la intensidad dada como
blanco. En el algoritmo de binarizacin.
B. Fragmentacion de la Imagen
Se hace una proyeccin horizontal (histograma)
consistente en contar los elementos de tinta que existentes
en cada una de las filas, traspasando estos valores a otra
matriz, unidimensional, resultado de la proyeccin, en la
que existirn diferentes zonas de densidad de tinta
separadas por otras vacas. Cada zona donde la proyeccin
d un valor no nulo ser interpretado como un hipottico
rengln.
Se analiza la matriz unidimensional para detectar
los posibles renglones de los que est compuesto el texto.
Si se detecta una lnea con densidad de proyeccin no nula
y adems la anterior estaba en blanco, en esa lnea
comienza un rengln. A continuacin se realiza la misma
operacin pero a la inversa, se busca la lnea posterior que
sea blanca y que la anterior no lo fuera, ah estar el final
del rengln. Este mtodo se aplica sucesivamente hasta el
final de la matriz de proyeccin, consiguiendo as
delimitar los renglones que forman el texto.

Para facilitar lo anterior se comprobar el mapeado de


bordes con el operador solver para determinar el llenado
de los bordes de cada nmero.
C. Adelgazamiento de Patrones
Una vez obtenida las componentes conexas de la
imagen, se deber realizar un proceso de adelgazamiento
de cada una de ellas. El procedimiento de adelgazamiento
consiste en ir borrando sucesivamente los puntos del borde
de cada componente conexa, de forma que se preserve su
topologa.
Para esto la regla que usaremos es que un pxel puede
estar cuanto mucho adyacente con 3 pixeles considerando
tambin adyacente aquellos que estn en diagonal .Para
esto se usar el algoritmo de Zhang-Suen

La metodologa es enteramente acadmica. Los


distintos casos empleando la red adaline .La red adaline
usada presenta 400 neuronas de entrada y 10 neuronas de
salida.
Las neuronas de salida representan cada una a un
nmero del 0 al 9, estas pueden estar activadas de distinta
manera.
Las neuronas estn activadas dependiendo de la
funcin signo es por eso adems la ms con respecto a
lnea de decisin ser la salida activada.

VIII. HERRAMIENTAS

D. Comparacion de Patrones
Una vez obtenido el la imagen preprocesada por todos
los pasos anteriores se pasar a la identificacin de
patrones con dicha imagen procesada. Para comparar
patrones usaremos una red neural con backpropagation
para determinar la secuencia de patrones se usar una
aprendizaje de 100 caracteres por nmero.
VI.

Eclipse Luna
Android SDK ADT Bundle
Funcin de Activacin (Red Neuronal
ADALINE)
Encog 3.2.0 (librera de redes neuronales
referencia)

CARACTERISTICAS

La propuesta del proyecto es la creacin de una


mquina cuyo propsito general es la separacin parcial de
cheques .No obstante debido a las complicaciones de
tiempo se priorizar la parte del software para lo cual
utilizaremos aplicaciones android. Esta mquina tendr sus
principios de clasificacin en un software a base de redes
neuronales que tendr la funcin de separar los nmeros
ilegibles como los legibles.
Mediante funciones de separado condicional a la
claridad y posible interpretacin de los nmeros la
mquina ser capaz de clasificar los cheques en 2 grupos
significativos .Separando as los interpretados de los de
decisin dudosa.
La base de software que usara ser una aplicacin en
android que se comunicara con la mquina. Dicha
aplicacin usar redes neuronales para la identificacin de
la cantidad de los cheques .El software
descrito
anteriormente leer la informacin solo de la seccin
donde se encuentra el monto escrito numricamente de
manera manuscrita.
Una vez decidido esto la mquina pasar a realizar el
clasificado en 2 grupos, siendo uno el grupo aprobado con
dgitos interpretados y el otro un grupo con smbolos cuya
clasificacin es difcil o ambigua.
VII.

Herramientas de software:

METODOLOGIAS

Herramientas hardware

Modelo para la prueba: Samsung galaxy


Computadores de la Escuela Profesional de
Ingeniera de Sistemas de la Universidad
Nacional de San Agustn

IX.

CONLUSIONES

Como primera conclusin el estudio prob que la


soluciones de dadas por una red monocapa tienen sus
limitaciones con respecto a la una multicapa .
En el informe demostramos que para poder solucionar
los problemas de la computacin es mejor usar la
pseudoiversa en lugar de la inversa esto por necesidades
matemticas.
Las diferencias de entrada tambin marcan una gran
diferencia obtenindose mejores resultados al usar -1 en
lugar de cero para las redes adeline .
El preprocesador marca unas sustancial diferencia entre
los distintos objetos a presentar . los nmeros .
BIBLIOGRAFIA

[1]

[2]
[3]
[4]
[5]

[6]
[7]
[8]
[9]
[10]

[11]
[12]
[13]
[14]

[15]
[16]
[17]

RECONOCIMIENTO
DE
DGITOS
MANUSCRITOS
MEDIANTE REDES NEURONALES: UNA TCNICA HBRIDA
Leticia Mara Seijas Director de Tesis Dr. Enrique Segura
Departamento de Computacin Facultad de Cs. Exactas y
Naturales Universidad de Buenos Aires Pabelln I Ciudad
Universitaria Buenos Aires - Argentina
APLICACIN PARA RECONOCIMIENTO DE CARACTERES A
TRAVS DE REDES NEURONALES Luis Feijoo
MAPAS AUTOORGANIZATIVAS DE KOHONEN
(SOM)
Rodrigo Salas
Reconocimiento ptico de nmeros escritos a mano usando
funciones de base radial y sistema memtico diferencial
RECONOCIMIENTO OPTICO DE NUMEROS ESCRITOS A
MANO USANDO FUNCIONES DE BASE RADIAL Y SISTEMA
MEMETICO DIFERENCIA L Oscar Piragauta Gmez M, David
Bello O, Montes Castaeda B
http://eprints.ucm.es/31485/1/Memoria%20Final.pdf
http://www.saylor.org/site/wp-content/uploads/2011/11/CS405-1.1WATSON.pdf
http://www4.ujaen.es/~satorres/practicas/practica3_vc.pdf
http://grupo.us.es/gtocoma/pid/pid10/OCR.htm
https://www.researchgate.net/profile/Jesus_Tello/publication/22885
7048_Reconocimiento_de_patrones_y_el_aprendizaje_no_supervis
ado/links/0c960517e7e677b522000000.pdf
http://digital.bl.fcen.uba.ar/Download/Tesis/Tesis_4997_Seijas.pdf
http://www.it.uc3m.es/jvillena/irc/practicas/08-09/09.pdf
https://engineering.purdue.edu/~bethel/main1.pdf
http://opencv-pythontutroals.readthedocs.io/en/latest/py_tutorials/py_ml/py_svm/py_sv
m_opencv/py_svm_opencv.html
http://www-2.dc.uba.ar/materias/rn/Aplicaciones/Kohonen/LSeijas32JAIIO.PDF
https://github.com/mark-watson/Java-AI-Book-Code
http://sedici.unlp.edu.ar/bitstream/handle/10915/5534/Documento_c
ompleto.pdf?sequence=1

Vous aimerez peut-être aussi