Vous êtes sur la page 1sur 51

Universidad Nacional de Trujillo

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

ESCUELA ACADÉMICO PROFESIONAL DE INFORMÁTICA

Trabajo de Tesis
DESARROLLO DE UN SISTEMA DE RECONOCIMIENTO ÓPTICO DE
MARCAS PARA MEJORAR EL PROCESAMIENTO DE ENCUESTAS

AUTORES:
▪ Guevara Honores, Sara
sarix92@gmail.com

▪ Lulichac Rojas, Eduardo


lulichaceduardo@gmail.com

ASESOR:
Ing. Orlando Salazar Campos
salazarcjo@gmail.com

Trujillo – Perú
2014
Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

INDICE GENERAL

CAPITULO I: GENERALIDADES DEL PROYECTO .............................................. 5


1.1. Título: ............................................................................................................. 5
1.2. Realidad Problemática: .................................................................................. 5
1.2.1. Características de la Problemática: ........................................................... 6
1.2.2. Enunciado del Problema: ........................................................................... 6
1.3. Hipótesis: ....................................................................................................... 6
1.4. Variables de Estudio: ..................................................................................... 6
1.4.1. Variable Independiente: ............................................................................. 6
1.4.2. Variable Dependiente: ............................................................................... 6
1.5. Objetivos: ....................................................................................................... 6
1.5.1. Objetivo General: ....................................................................................... 6
1.5.2. Objetivos Específicos:................................................................................ 6
1.6. Justificación:................................................................................................... 6
1.6.1. Justificación Académica: ............................................................................ 6
1.6.2. Justificación Empresarial: .......................................................................... 7
1.7. Antecedentes del Proyecto: ........................................................................... 7
CAPITULO II: MATERIALES Y MÉTODOS............................................................ 9
2.1. Población y Muestra: ...................................................................................... 9
2.1.1. Población: .................................................................................................. 9
2.1.2. Muestra: ..................................................................................................... 9
2.2. Técnicas e Instrumentos: ............................................................................. 10
2.3. Fuentes: ....................................................................................................... 10
2.4. Análisis e Interpretación de Resultados: ...................................................... 10
2.4.1. Diseño de Contrastación: ......................................................................... 10
2.4.2. Indicadores. ............................................................................................. 10
CAPITULO III: MARCO TEÓRICO ....................................................................... 10
3.1. La Encuesta y su procesamiento: ................................................................ 10
3.1.1. Definición de Encuesta: ........................................................................... 10
3.1.2. Historia de la Encuesta: ........................................................................... 10

Guevara Honores, S. & Lulichac Rojas, E. 1


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

3.1.3. Tipos de Encuestas en Función de la forma: ........................................... 11


3.1.4. Tipos de pregunta: ................................................................................... 14
3.1.5. Procesamiento de Datos de Encuestas: .................................................. 15
A. Preparación para el ingreso de datos: ..................................................... 15
B. Procesamiento primario de datos: ........................................................... 15
C. Procesamiento secundario de datos: ...................................................... 16
3.2. Visión Computacional y Procesamiento Digital de imágenes: ..................... 16
3.2.1. La Imagen Digital: .................................................................................... 16
3.2.2. Visión Computacional: ............................................................................. 16
3.2.3. Procesamiento Digital de Imágenes: ....................................................... 17
A. Histograma de una imagen: .................................................................... 18
B. Binarización de imágenes: ...................................................................... 19
C. Umbralización: ......................................................................................... 19
D. Filtrado Espacial de Imágenes: ............................................................... 21
3.3. Sistema de Reconocimiento Óptico de Marcas aplicado al Procesamiento
Digital de Imágenes: .................................................................................... 22
3.3.1. Reconocimiento Óptico de Marcas (OMR): ............................................. 22
3.3.2. Sistema de Reconocimiento Óptico de Marcas: ...................................... 23
3.3.3. Etapas del Procesamiento Digital de imágenes: ...................................... 24
A. Captura y Adquisición de imágenes: ....................................................... 24
B. Pre procesamiento: ................................................................................. 25
C. Segmentación: ........................................................................................ 34
D. Descripción: ............................................................................................. 38
E. Reconocimiento: ...................................................................................... 39
CAPITULO IV: DESARROLLO METODOLÓGICO .............................................. 41
4.1. Captura y Adquisición: ................................................................................. 41
4.2. Pre procesamiento: ...................................................................................... 42
4.2.1. Realce de Contraste: ............................................................................... 42
4.2.2. Binarización: ............................................................................................ 43
4.2.3. Reducción de Ruido:................................................................................ 43
4.2.4. Realce de Características: ...................................................................... 44
4.3. Segmentación: ............................................................................................. 44
4.4. Descripción: ................................................................................................. 45

Guevara Honores, S. & Lulichac Rojas, E. 2


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

4.5. Reconocimiento: .......................................................................................... 45


REFERENCIAS BIBLIOGRÁFICAS: .................................................................... 47

INDICE DE FIGURAS

Figura 1: Mecanismos de contestación de una encuesta con preguntas cerradas .. 14


Figura 2: Mecanismos de contestación de una encuesta con preguntas abiertas ... 15
Figura 3: Esquema general de visión por computadora ........................................... 17
Figura 4: Etapas de un sistema de visión computacional ......................................... 17
Figura 5: Esquema general del procesamiento de imágenes. .................................. 17
Figura 6: Imagen y su histograma ............................................................................ 19
Figura 7: Histograma Bimodal Elemental ................................................................. 20
Figura 8: Histograma no Bimodal elemental con 2 umbrales ................................... 20
Figura 9: Máscara cuadrada básica para el umbral local de la vecindad N(r,c). ...... 21
Figura 10: Representación de tipos de ventana para filtrado de imágenes. ............. 22
Figura 11: Imagen e histograma original (superior), Imagen y su histograma
ecualizado (inferior) .................................................................................................. 27
Figura 12: Representación de la primera y segunda derivada del histograma
suavizado mediante promedio. ................................................................................. 28
Figura 13: Procedimiento para la determinación del umbral mediante el método del
Triángulo................................................................................................................... 29
Figura 14: Filtro de la mediana con máscara 3x3 ..................................................... 31
Figura 15: Máscara 5x5 para un filtro gaussiano ...................................................... 32
Figura 16: Matrices para aplicación de filtros de búsqueda de gradiente ................. 33
Figura 17: Matrices para aplicación de filtros detectores de líneas .......................... 33
Figura 18: Segmentación por histograma ................................................................. 34
Figura 19: Histograma de una imagen con múltiples regiones. ................................ 35
Figura 20: Crecimiento de regiones. ......................................................................... 35
Figura 21: Ejemplo de segmentación por división agrupamiento en una imagen
sintética .................................................................................................................... 37
Figura 22: Ejemplo de segmentación por división agrupamiento en una imagen
sintética .................................................................................................................... 38

Guevara Honores, S. & Lulichac Rojas, E. 3


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 23: Espacio paramétrico con 2 parámetros y 3 clases .................................. 39


Figura 24: Ejemplo de Algoritmo de Hamming ......................................................... 41

INDICE DE TABLAS

Tabla 1: Ventajas y desventajas de la Encuesta Personal ....................................... 11


Tabla 2: Ventajas y desventajas de la Encuesta Telefónica ..................................... 12
Tabla 3: Ventajas y desventajas de la Encuesta Postal ........................................... 13
Tabla 4: Ventajas y desventajas de la Encuesta por Internet ................................... 13
Tabla 5: Escala de Calificación para la comparación de técnicas ............................ 41
Tabla 6: Cuadro comparativo de los dispositivos de captura de una imagen digital. 41
Tabla 7: Cuadro comparativo de los algoritmos de realce de Contraste. ................. 42
Tabla 8: Cuadro comparativo de los algoritmos de binarización. ............................. 43
Tabla 9: Cuadro comparativo de los algoritmos de reducción de ruido. ................... 43
Tabla 10: Cuadro comparativo de los algoritmos de realce de características. ........ 44
Tabla 11: Cuadro comparativo de los algoritmos de segmentación. ........................ 44
Tabla 12: Cuadro comparativo de los algoritmos de descripción. ............................ 45
Tabla 13: Cuadro comparativo de algoritmos de reconocimiento ............................. 46

Guevara Honores, S. & Lulichac Rojas, E. 4


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

CAPITULO I: GENERALIDADES DEL PROYECTO

1.1. Título:
Desarrollo de un Sistema de Reconocimiento Óptico de Marcas para mejorar el
procesamiento de encuestas.

1.2. Realidad Problemática:


En la actualidad el manejo de datos ha crecido exponencialmente tal es el caso
que la gran mayoría de empresas se dedican al manejo y extracción de
información a partir de encuestas, entrevistas, cuestionarios, censos etc. Los
estudios de encuestas tienen una amplia aceptación como forma de
proporcionar datos estadísticos en un amplio rango de temas, tanto de
investigación como para objetivos políticos y administrativos (Rosal, Á. B.,
2007).

Con el uso de la tecnología e internet, las encuestas online son muy útiles, sin
embargo la gran limitación de este procedimiento es la dificultad que tienen
determinados colectivos para acceder a esta tecnología, como por ejemplo,
existen empresas que aplican encuestas directamente a campo, a sus
trabajadores o a un conjunto de individuos que en el momento prescinden de
un computador (Díaz R. V, Flavián C. & Guinalíu M., 2012). Las encuestas
online son un medio relativamente económico pero sólo generan índices de
captación de datos entre 3% y 15%; a diferencia de éstas, las encuestas físicas
pueden llegar a generar índices de captación de datos más del 90% (Sucar, L.
E. 2008). Por tal motivo las empresas optan por realizar encuestas físicas,
obteniendo así, un gran volumen de datos en papeles y documentos. Para un
análisis posterior de la información recopilada, se necesita digitalizar y
almacenar los datos de las encuestas.

Cabe resaltar que, se tiene que contratar personal para pasar los datos de las
encuestas en físico hacia el computador, lo cual demanda costo, además el
personal contratado puede cometer errores y por consiguiente no podemos
asegurar que la información procesada sea la correcta. Por otro lado, la
digitalización de los datos de las encuestas puede demorar días o semanas.
Frente a éste problema, se plantea desarrollar un Sistema OMR para mejorar el
procesamiento de Encuestas, el cual pueda automatizar el proceso de
digitalización y almacenamiento de los datos de encuestas físicas, reduciendo
el tiempo y los errores que puedan tener en el procesamiento de éstas de
forma manual.

Guevara Honores, S. & Lulichac Rojas, E. 5


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

1.2.1. Características de la Problemática:


• Elevado tiempo en el procesamiento de encuestas.
• Falta de Optimización en el Procesamiento de encuestas.
• Baja confiabilidad en la información procesada de las encuestas.

1.2.2. Enunciado del Problema:


¿Cómo mejorar el procesamiento de encuestas?

1.3. Hipótesis:
El Desarrollo de un Sistema de Reconocimiento Óptico de Marcas permite
mejorar el procesamiento de encuestas

1.4. Variables de Estudio:

1.4.1. Variable Independiente:


Sistema de Reconocimiento Óptico de Marcas

1.4.2. Variable Dependiente:


Mejora del Procesamiento de Encuestas.

1.5. Objetivos:

1.5.1. Objetivo General:


Desarrollar un Sistema de Reconocimiento Óptico de Marcas para
mejorar el procesamiento de encuestas.

1.5.2. Objetivos Específicos:


 Investigar aspectos fundamentales de Sistema OMR y obtener
información sobre encuestas.
 Análisis para Determinar los algoritmos que se utilizarán en el
desarrollo del Sistema OMR.
 Implementar el Sistema OMR.
 Evaluar los resultados obtenidos.

1.6. Justificación:

1.6.1. Justificación Académica:


Con el presente Proyecto de investigación pretendemos poner en
práctica los conocimientos adquiridos en nuestra formación académica.
Además incentivar a los estudiantes a la investigación de técnicas
pertenecientes al área de Percepción y Visión Computacional para su
aplicación en la solución de problemas empresariales.

Guevara Honores, S. & Lulichac Rojas, E. 6


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

1.6.2. Justificación Empresarial:


En el ámbito Empresarial se busca, evitar arduos trabajos operacionales
en el procesamiento de encuestas, reduciendo el tiempo y mejorando la
confiabilidad de éstas. A mediano y largo plazo, disminuir costos en
salarios de personal que laboran en el área de procesamiento de
encuestas; la inversión en un Sistema OMR tendrá gastos iniciales sin
embargo posteriormente sólo se gastará en su mantenimiento.
Implementar herramientas tecnológicas, usando diversos algoritmos del
área Visión Computacional que permitan automatizar procesos
manuales.

1.7. Antecedentes del Proyecto:


A continuación se presenta las siguientes referencias relacionados al proyecto
de investigación:

Según Granados Córdoba H. (2012), en su tesis “Análisis, diseño e


implementación de un producto de reconocimiento de marcas para el
procesamiento de evaluaciones en el proceso de preparación para los
ECAES en el programa de Ingeniería de Sistemas y Computación de la
UTP”, desarrollado en Colombia en la Universidad Tecnológica de Pereira,
surge como problema el proceso manual de calificación de los ECAES
(Exámenes de Estado de Calidad de la Educación Superior), el cual demanda
mucho tiempo; dando como solución el desarrollo de un producto para la
calificación de dichos exámenes y su posterior análisis por medio de técnicas
de procesamiento de imágenes digitales. Usaron un formato estándar de
marcado, el tipo de marcado burbuja, y el procedimiento para reconocimiento
de marcas consiste en primer lugar la detección de marcas de alineación, luego
alineación de la imagen usando transformaciones lineales, posteriormente
realiza la eliminación de la información innecesaria aplicando una operación de
umbral y finalmente la detección de marcas, es decir respuestas del examen.

Según Fuertes J., Lucena M. y Rodríguez F. (2010), en su Paper


“Procesamiento Automático de Cuestionarios y Encuestas” desarrollado
en España en la Universidad de Jaén, se hace una descripción del problema en
el arduo trabajo que toma al docente revisar un cuestionario evaluativo en cada
clase teórica; dando como propuesta el desarrollo de una aplicación para la
creación, edición, lectura automática y autocorrección de documentos tipo
cuestionario/encuesta, procesando los mismos mediante escáneres
convencionales. Utilizando técnicas de OCR (Reconocimiento óptico de
Caracteres), y algoritmos de procesamiento de imágenes, la aplicación fue
capaz de manejar tipos de preguntas como: preguntas con respuestas de
verdadero y falso, preguntas de elección simple, preguntas de elección múltiple

Guevara Honores, S. & Lulichac Rojas, E. 7


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

(tres, cuatro o cinco opciones), preguntas de escala de Opinion/Linkert (escala


de cinco, siete o nueve) y preguntas de asociación por pares.

Según Inglés R. J y Vicente Ch. C. (2010) en su paper “Desarrollo de un


Sistema de Reconocimiento de Marcas basado en Análisis de Contenido
en Incertidumbre” desarrollado en Colombia, en la Universidad Politécnica de
Cartagena [10], el proceso diseñado pretende aportar una solución versátil a
las tareas de lectura y valoración de documentos de tipo ‘test’ con un Sistema
basado en el análisis de documentos MCQ (Múltiple Choices Questions),
previamente escaneados; en primer lugar, se realiza un aprendizaje
supervisado del formato del documento y, posteriormente, se analiza su
contenido, utilizando vectores de características básicas centradas en la forma
y tamaño de los objetos como: descriptores de Fourier, excentricidad, y ejes de
elipse equivalente. Como resultados, se obtuvo una precisión de
reconocimiento de marcas de 97,54% usando un rotulador (plumón) y un tipo
de trazado de segmentos como criterio de respuesta; por otro lado empleando
lápiz o bolígrafo, y usando un criterio de marcado arbitrario, la precisión bajo al
80%.

Según De armas R. y Bautista L. (2005), en su paper “Reconocimiento


automático de caracteres manuscritos y marcas, orientado al procesado
de encuestas” desarrollado en Colombia en la Universidad de Santander [2],
se describe brevemente el problema en el tedioso proceso de digitación manual
necesario para el archivado de grandes cantidades de documentos y
encuestas; y proponen la implementación de un Sistema de reconocimiento de
caracteres manuscritos y marcas. Se basaron en las etapas del PDI
(Procesamiento Digital de imágenes), usando como descriptores: firma del
contorno, características por zonas de la imagen, descriptores de Fourier; y en
la clasificación de descriptores usaron redes neuronales. Obteniendo como
resultados un sistema de carácter cooperativo capaz de extraer
automáticamente la información de una encuesta que contiene datos de
marcas y/o letras mayúsculas y números; teniendo una precisión para
reconocimiento de marcas del 100% y del 90% para caracteres.

Guevara Honores, S. & Lulichac Rojas, E. 8


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

CAPITULO II: MATERIALES Y MÉTODOS

2.1. Población y Muestra:

2.1.1. Población:
La población está constituida por todas las encuestas proporcionadas
por la “Cámara de Comercio y Producciones La Libertad”.

2.1.2. Muestra:
Dado que la cantidad de la población es indefinida, aplicamos la
siguiente fórmula, para calcular el tamaño de la muestra:
𝑍𝑛2 ∗ 𝑃 ∗ 𝑄
𝑛 =
𝐸2
Donde:
𝑛: muestra.
𝑍𝑛2 : es el grado de confiabilidad deseado para la muestra.
𝑃 : Proporción de la población que tienen las características de interés.
𝑄 : (1- 𝑃), proporción de la población que no tienen las características.
𝐸 2 : Error permitido.

● El nivel de confianza es el 95% que se aplicará de ahí se deduce


que:
𝑍 = 1,96

● Proporción de la población que tiene las características 𝑃. Si no se


conoce el valor 𝑃 se asume que es el 50%, entonces:
𝑃 = 0.5

● Proporción de la población que no tiene las características 𝑄:


𝑄=1-𝑃
𝑄 = 1 - 0.5
𝑄 = 0.5

● El margen de error es de 5% entonces:


𝐸 = 0.05

Aplicando la fórmula:
1.962 ∗ 0.5 ∗ 0.5
𝑛 =
0.052

De esta manera, obtenemos una muestra “n” de 384 encuestas.

Guevara Honores, S. & Lulichac Rojas, E. 9


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

2.2. Técnicas e Instrumentos:


 Técnica: Observación.
 Instrumentos: Ficha de Observación, cronómetro

2.3. Fuentes:
Las encuestas proporcionadas por la empresa “Cámara de Comercio”.

2.4. Análisis e Interpretación de Resultados:

2.4.1. Diseño de Contrastación:


Nuestro proyecto tomará el tipo de diseño “PRE-EXPERIMENTAL”, el
cual se representa por el siguiente gráfico:

𝐗 𝐎𝟏
𝐎𝟐
Donde:
X: Sistema de Reconocimiento óptico de marcas.
O1: Observación del resultado aplicando X.
O2: Observación del resultado sin aplicación de X.

2.4.2. Indicadores.
 Sensibilidad
 Eficacia
 Tiempo de procesamiento de las encuestas.

CAPITULO III: MARCO TEÓRICO

3.1. La Encuesta y su procesamiento:

3.1.1. Definición de Encuesta:


La encuesta es una técnica de investigación que consiste en una
interrogación verbal o escrita que se realiza a las personas con el fin de
obtener determinada información necesaria para una investigación
(Alelú, Cantín, López & Rodríguez; 2009).

3.1.2. Historia de la Encuesta:


El origen de la encuesta se remonta a los principios de taxonomía
(ciencia de la clasificación) agraria, que pasaron más tarde a los
laboratorios, y desde allí a las Ciencias Sociales como técnica para
ordenar a las poblaciones humanas, sin embargo, el desarrollo y la gran
utilización de encuestas que se emplean en la actualidad tiene el fin de
conocer los movimientos de la opinión pública y la predicción del voto a

Guevara Honores, S. & Lulichac Rojas, E. 10


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

finales del siglo XIX. Al término de la Segunda Guerra Mundial el interés


por las encuestas se extendió a casi todos los países. Pero fue tan sólo
en la década de los sesenta que las encuestas fueron ampliamente
utilizadas, con fines electorales, por los medios de comunicación y los
partidos políticos. A partir de entonces, el uso de encuestas ha crecido
en términos casi exponenciales.

Aunque no debemos olvidar que las primeras utilizaciones de la


encuesta en los trabajos de los reformadores ingleses del siglo XVIII,
destacando entre éstas las investigaciones de Charles Booth sobre la
pobreza, y las encuestas sobre condiciones sociales de trabajo en las
grandes industrias realizadas por Weber a principios del siglo XX. Los
trabajos de Weber, a juicio de Lazarsfeld y Obershall, "anticipan, en
todos los aspectos, la perspectiva moderna en el análisis de la conducta
electoral, audiencia de radio, hábitos de compra, o cualquier otra acción
realizada por grandes números de personas bajo circunstancias
comparables". La gran importancia de la encuesta en la sociedad actual
tiene su origen en el enorme desarrollo de la investigación de mercados
y los estudios de opiniones en la sociedad americana de los años 30 y
40. De hecho, a juicio de este autor en los años 70 es cuando se
consolida la encuesta. (Alelú, Cantín, López & Rodríguez; 2009).

3.1.3. Tipos de Encuestas en Función de la forma:

 La encuesta personal

En la encuesta personal, la información se obtiene mediante un


encuentro directo entre el entrevistador y el entrevistado. El
entrevistador va a plantear directamente las preguntas al
entrevistado basándose en un cuestionario que ira cumplimentando
con las respuestas del entrevistado.

Ventajas Desventajas
Elevado índice de respuestas. Es caro y lento
Facilidad de cooperación de las El entrevistador puede ejercer
personas entrevistadas debido a la influencia y debe estar entrenado a
presencia del entrevistador, a la vez la vez que controlado
que permite resolver dudas.
Permite evitar influencia de otras Difícil acceso a ciertas poblaciones.
personas.
Posibilita la realización de entrevistas
largas
Pueden mostrarse materiales.
Pueden obtenerse datos secundarios
(presencia, ambiente. etc.)

Tabla 1: Ventajas y desventajas de la Encuesta Personal


Fuente: Alelú M., Cantín S., López N. & Rodríguez M., 2009

Guevara Honores, S. & Lulichac Rojas, E. 11


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

 La encuesta Telefónica

La encuesta telefónica es un método cuya utilización va en aumento


en los últimos años a medida que se incrementa el número de
hogares con teléfono y mejora, por tanto, su representatividad.
Consiste en la obtención de la información mediante una
conversación telefónica entre el entrevistador y la persona
seleccionada.

Ventajas Desventajas
Económico con reservas Presenta problemas de muestreo
pues excluye a las personas que no
tienen teléfono.
Técnica muy rápida tanto contactando Existe un nivel de no respuesta no
como recogiendo la información. asociado al muestreo por el hecho
de marcar números telefónicos al
azar.
Puede utilizarse como medio único, No pueden exhibirse materiales
como auxiliar o combinado con otras
técnicas o modalidades de encuesta.
Permite entrevistar a determinadas Brevedad de la entrevista.
poblaciones (personas importantes,
muy ocupadas, de zonas mal
comunicadas. etc.).
Mejor inclinación a responder por No es apropiado para tratar temas
teléfono. delicados ni preguntas complejas.
Se necesitan menos entrevistadores y
la supervisión es adecuada.

Tabla 2: Ventajas y desventajas de la Encuesta Telefónica


Fuente: Alelú M., Cantín S., López N. & Rodríguez M., 2009

 La encuesta Postal

Es la que se emplea en el servicio postal como medio para el envío y


recepción de información a través de un cuestionario. En este caso
el entrevistado llenará el cuestionario directamente y no existirá
comunicación directa entre el encuestado y el entrevistador.

El número de preguntas que se formulan debe ser breve, y las


preguntas cerradas y sencillas de llenar. El cuestionario, además,
tiene que ser atractivo en su presentación y contenido, e incluir un
sobre franqueado para facilitar la devolución del mismo.

Guevara Honores, S. & Lulichac Rojas, E. 12


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Ventajas Desventajas
Económico Bajos índices de respuesta.
Se precisa escaso personal para Inconvenientes formales: pueden
realizar la encuesta darse errores en la cumplimentación,
no se controla el orden de las
preguntas y el cuestionario ha de ser
corto
Accesibilidad Impersonal
Flexibilidad de tiempo para el Pueden influir otras persona
entrevistado que ofrece mayor calidad
a la información
Favorece el anonimato No es apropiado para tratar temas
delicados ni preguntas complejas.
Poco útil para encuestas de
respuesta inmediata. Ciertos grupos
quedan excluidos (analfabetos
absolutos y funcionales).

Tabla 3: Ventajas y desventajas de la Encuesta Postal


Fuente: Alelú M., Cantín S., López N. & Rodríguez M., 2009

 La encuesta por Internet

Este tipo de encuesta consiste en "colocar" un cuestionario en una


página web o en enviarlo a los correos electrónicos de un panel
predefinido.

Ventajas Desventajas
La falta de intermediario entre el No todo el mundo tiene ese
cuestionario y el entrevistado hace que acceso y a lo mejor los que si
los sondeos sean más objetivos. tiene no forman parte de la
muestra.
Se evita que el entrevistador condicione Se pueden mentir muy fácilmente
al entrevistado. datos nulos.
Rapidez en la recogida y análisis de Si no se garantiza el anonimato
datos. pueden darse bajas tasas de
respuesta.
Amplia cobertura La dificultad en controlar la
selección informantes (por
ejemplo, evitar que la misma
persona contesta varias veces a
la encuesta, asegura que la
persona que respondió la
adecuada, y que se.).
El ahorro de tiempo
Los bajos costos
La utilización de medios audiovisuales
durante la encuesta.

Tabla 4: Ventajas y desventajas de la Encuesta por Internet


Fuente: Alelú M., Cantín S., López N. & Rodríguez M., 2009

Guevara Honores, S. & Lulichac Rojas, E. 13


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

3.1.4. Tipos de pregunta:

 Preguntas Cerradas:

Las preguntas cerradas contienen categorías u opciones de


respuesta que han sido previamente delimitadas. Es decir, se
presentan las posibilidades de respuesta a los participantes, quienes
deben acotarse a éstas. Pueden ser dicotómicas (dos posibilidades
de respuesta) o incluir varias opciones de respuesta. Las categorías
de respuesta son definidas a priori por el investigador y se le
muestran al encuestado, quien debe elegir la opción que describa
más adecuadamente su respuesta (Inglés R. J & Vicente Ch. C.
2010).

Figura 1: Mecanismos de contestación de una encuesta con preguntas cerradas


Fuente: Inglés R. J & Vicente Ch. C. 2010

 Preguntas Abiertas:

Las preguntas abiertas no delimitan de antemano las alternativas de


respuesta, por lo cual el número de categorías de respuesta es muy
elevado; en teoría, es infinito, y puede variar de población en
población.

Guevara Honores, S. & Lulichac Rojas, E. 14


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 2: Mecanismos de contestación de una encuesta con preguntas abiertas


Fuente: Hernández R., Fernández C. & Baptista P, 2010

3.1.5. Procesamiento de Datos de Encuestas:


El procesamiento de datos está diseñado para producir los primeros
resultados de una encuesta unas pocas semanas después de terminado
el trabajo de campo. El procesamiento de Datos está dividido en 3 fases
(Unicef, 2005):

A. Preparación para el ingreso de datos:


La meta de prepararse para la fase de ingreso de datos es el estar
listos para comenzar poco después de iniciar el trabajo de campo.
La fase de preparación comprende los siguientes pasos:

 La obtención del equipo de computación y la organización de un


recinto para el procesamiento de datos
 La identificación y contratación del personal adecuado
 La adaptación de los programas de computación al cuestionario
específico de país
 La creación de un sistema para el manejo de cuestionarios y
archivos de datos.

B. Procesamiento primario de datos:


La meta del procesamiento primario de datos es producir archivos de
datos depurados y editados.
El procesamiento primario de datos comprende los siguientes pasos:

 Ingresar en un archivo de datos todos los cuestionarios de un


conglomerado.
 Revisar la estructura del archivo de datos

Guevara Honores, S. & Lulichac Rojas, E. 15


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

 Ingresar los datos por segunda vez y luego verificar el archivo de


datos
 Respaldar el archivo de datos revisado y verificado
 Llevar a cabo la edición secundaria del archivo de datos
 Respaldar el archivo de datos editado o final.

C. Procesamiento secundario de datos:


La meta del procesamiento secundario de datos es producir archivos
de análisis de datos y crear las tablas estándar. El procesamiento
secundario de datos comprende los siguientes pasos:

 Concatenar todos los archivos de datos de los conglomerados en


un solo archivo de datos
 Exportar los datos a un software de procesamiento de estadístico
 Recodificar las variables para simplificar el análisis
 Crear las tablas necesarias para analizar los datos
 Archivar y distribuir los archivos de datos.

3.2. Visión Computacional y Procesamiento Digital de imágenes:

La Visión Computacional y el Procesamiento de Imágenes tienen mucho en


común y aunque sus objetivos finales son diferentes, usan las imágenes
digitales para cumplirlos, por tal motivo a continuación definimos la imagen
digital.

3.2.1. La Imagen Digital:

Una imagen puede definirse como una función bidimensional 𝑓(𝑥, 𝑦)


donde 𝑥 y 𝑦 son coordenadas en el plano y la amplitud 𝑓 es llamada
intensidad o nivel de gris en ese punto. Una imagen digital estará
compuesta por un número finito de elementos llamados píxeles, cada
uno de ellos con un valor y una posición particular (García S. I., 2008).

3.2.2. Visión Computacional:

Visión Computacional es el estudio de reconocer y localizar objetos en el


ambiente mediante el procesamiento de las imágenes, para entenderlos
y construir máquinas con capacidades similares. El objetivo principal de
la visión computacional es extraer características de una imagen para su
descripción e interpretación por la computadora (Sucar, L. & Gómez G.,
2008).

Guevara Honores, S. & Lulichac Rojas, E. 16


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Como se observa en la Figura 3, la imagen de entrada es procesada


para extraer los atributos, obteniendo como salida una descripción de la
imagen analizada.

Figura 3: Esquema general de visión por computadora


Fuente: Sucar, L. & Gómez G., 2008

Los sistemas que se basan en Visión Computacional, presentan


generalmente las siguientes etapas:

Figura 4: Etapas de un sistema de visión computacional


Fuente: García S. I, 2008

3.2.3. Procesamiento Digital de Imágenes:

Es una rama de la visión Computacional, la cual tiene como objetivo


mejorar la calidad de las imágenes para su posterior utilización o
interpretación (Sucar, L. & Gómez G., 2008).

Figura 5: Esquema general del procesamiento de imágenes.


Fuente: Sucar, L. & Gómez G., 2008

Guevara Honores, S. & Lulichac Rojas, E. 17


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

A. Histograma de una imagen:

El histograma ℎ𝐼 de una imagen 𝐼 de escala de grises, es un arreglo


vectorial de orden 1𝑥𝐿 elementos que representa gráficamente los
posibles valores de intensidad desde 0 hasta 𝐿 − 1 en el eje
horizontal y con la cuenta ℎ𝐼 (𝑘) de pixeles con igual intensidad
𝐼(𝑟, 𝑐) = 𝑘 en el eje vertical mediante barras.
Sea 𝑆 un conjunto, y #𝑠 cada uno de los elementos de 𝑆. El
histograma ℎ𝐼 (𝑘) de una imagen 𝐼 se define matemáticamente como:

ℎ𝐼 (𝑘) = #{𝑟, 𝑐} | 𝐼(𝑟, 𝑐) = 𝑘, 𝑟 = 1,2,3, … 𝑁, 𝑐 = 1,2,3, … 𝑀}

Donde:
𝑘 = 1,2,3, … 𝐿 − 1

Se debe notar que la sumatoria de todos los elementos del arreglo


que forma el histograma es igual a la totalidad de los pixeles que
forma la ecuación siguiente:

𝐿−1

∑ ℎ𝐼 (𝑘) = 𝑁𝑥𝑀
𝑘=0

Si se divide el histograma ℎ𝐼 sobre la totalidad de pixeles 𝑁𝑥𝑀 de la


imagen, cada iteración ℎ𝐼 (𝑘) representa la probabilidad de
ocurrencia de intensidad 𝐼(𝑟, 𝑐) = 𝑘

𝐿−1 𝐿−1
ℎ𝐼 (𝑘)
∑ = ∑ 𝑝𝐼 (𝑘) = 1
𝑁𝑥𝑀
𝑘=0 𝑘=0

El histograma proporciona información sobre la distribución de la luz


en la imagen en forma de brillo o contraste y puede ser utilizado para
ajustar dichos parámetros (Cortés J, Muriel A & Mondoza J. 2011).

Guevara Honores, S. & Lulichac Rojas, E. 18


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 6: Imagen y su histograma


Fuente: Grupo de Investigación EDMANS, 2006

B. Binarización de imágenes:
La binarización, es una operación puntual, la cual consiste en
transformar una imagen de entrada a una imagen de salida, de
forma que cada pixel de la imagen de salida sólo depende del
correspondiente pixel de la imagen de entrada. Para obtener una
imagen binaria se hace una transformación no-lineal de la imagen de
entrada, obteniéndose una imagen de salida en la cual cada pixel
puede tomar alguno de dos valores: 0 y 1, 0 y 255, etc. Para esto, se
toma un valor de umbral T (Sucar, L. & Gómez G., 2008).

C. Umbralización:

La umbralización es una técnica de segmentación simple y eficiente


que permite separar los pixel de la imagen en escala de grises en
dos categorías a partir de un una ventana o borde umbral. El umbral
puede ser función de la posición 𝑝(𝑟, 𝑐), de la vecindad 𝑁(𝑟, 𝑐) y de
la intensidad 𝐼(𝑟, 𝑐) actual del pixel (Cortés J, Muriel A & Mondoza J.
2011, Diciembre, 13).

𝑇 = 𝑇((𝑟, 𝑐), 𝑁(𝑟, 𝑐), 𝐼(𝑟, 𝑐))

 Umbral global

El umbral fijo o global es aquel que es único sobre toda la


imagen.

𝑡0 , 𝑠𝑖 𝐼(𝑟, 𝑐) < 𝑇
𝑏(𝑟, 𝑐) = {
𝑡1 , 𝑠𝑖 𝐼(𝑟, 𝑐) ≥ 𝑇

Cuando el valor 𝑡0 = 0 y el valor 𝑡1 =1 se dice que la imagen se


ha binarizado. Esta estrategia puede resultar muy simple

Guevara Honores, S. & Lulichac Rojas, E. 19


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

cuando se posee un histograma que claramente se define como


bimodal (Cortés J, Muriel A & Mondoza J. 2011, Diciembre, 13)

Figura 7: Histograma Bimodal Elemental


Fuente: Cortés J, Muriel A & Mondoza J. 2011

 Umbral Local o adaptivo

Cuando la imagen que se encuentra bajo análisis no posee un


fondo definido y su histograma no es bimodal, se debe encontrar
un umbral T para cada pixel de la vecindad a través de una
máscara que se debe recorrer sobre toda la imagen.

Figura 8: Histograma no Bimodal elemental con 2 umbrales


Fuente: Cortés J, Muriel A & Mondoza J., 2012.

Dicha máscara puede ser de diferentes formas y tamaños, lo


que se define en el momento de implementar el algoritmo para
la determinación del umbral local. El pixel de interés está

Guevara Honores, S. & Lulichac Rojas, E. 20


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

localizado en la fila 𝑟 y la columna 𝑐 (Véase la figura 8), por lo


que dependiendo de la vecindad de este y la operación
efectuada se define el umbral de binarización 𝑇(𝑟, 𝑐) del pixel
[𝑝, 𝐼(𝑝)].

Figura 9: Máscara cuadrada básica para el umbral local de la


vecindad N(r,c).
Fuente: Cortés J, Muriel A & Mondoza J. 2012

De esta forma, no hay un único umbral para toda la imagen, por


lo que pueden aparecer múltiples umbrales sobre la misma
(Cortés J, Muriel A & Mondoza J., 2012).

D. Filtrado Espacial de Imágenes:


Este tipo de filtros suelen consistir en recorrer toda la imagen, pixel a
pixel, y realizar alguna operación aritmética con un número concreto
de pixeles vecinos. Al conjunto de éstos píxeles vecinos se les
denomina ventana o máscara, la cual podrá ser de 3x3, 5x5,... etc.
En la figura 9 se puede ver la representación de una ventana 3x3 y
de 5x5, en la que los píxeles vecinos van del 1 al 9 y del 1 al 25
respectivamente, siendo el píxel central sobre el que se aplica un
algoritmo. La mayoría de los algoritmos suelen ser combinaciones
lineales de los píxeles de la ventana. Para representar un filtro se
suele dar el vector o matriz de convolución o núcleo (Grupo de
Investigación EDMANS, 2006).

Guevara Honores, S. & Lulichac Rojas, E. 21


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 10: Representación de tipos de ventana para filtrado de imágenes.


Fuente: Grupo de Investigación EDMANS, 2006

3.3. Sistema de Reconocimiento Óptico de Marcas aplicado al Procesamiento


Digital de Imágenes:

3.3.1. Reconocimiento Óptico de Marcas (OMR):

A. Definición:

Según Granados Córdova H. (2012), Optical Mark Recogition


(Reconocimiento óptico de Marcas, en español) también llamado,
Optical Mark Reading (Lectura de Marcas Ópticas, en español) o
simplemente OMR, es el proceso de detectar datos de formatos pre-
impresos marcados por humanos. La tecnología OMR detecta la
ausencia o presencia de una marca, pero no la forma de la marca.

B. Historia:
Los inicios del OMR se remontan a los años 1930, en ese entonces
y hasta en la actualidad, se emplearon y se emplean dispositivos
dedicados para procesar los formatos, tales dispositivos son
conocidos como optical mark reader (lector óptico de marcas, en
español). Con el OMR moderno, donde la presencia de una pequeña
marca de tinta es reconocida, el reconocimiento se hace mediante
un escáner óptico. Algunos de los dispositivos iluminan el papel con
un haz de luz, y con una reflexión contrastante se detectan las áreas
marcadas, ya que estas reflejan menos luz que las áreas blancas del
papel. Otros lectores usan formas pre-impresas sobre papel
transparente y miden la cantidad de luz que pasa a través del papel,

Guevara Honores, S. & Lulichac Rojas, E. 22


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

así pues, una marca en cualquier cara del papel reducirá la cantidad
de luz que pasa a través del mismo (Granados C. H., 2012).

El primer escáner sensor de marcas fue la IBM 805 Prueba Scoring


Machine, leía las marcas midiendo la conductividad eléctrica del
grafito en el papel, usando un par de pinceles de alambre que
recorrían la página. A comienzos de 1930, Richard Warren en IBM
experimentó con sistemas sensoriales óptico de marcas de
puntuación de exámenes. El primer escáner exitoso fue desarrollado
por Everett Franklin Lindquist, en 1955. En 1957, IBM también
desarrolló una exitosa máquina de detección de marcas ópticas y
calificación de exámenes (Autor Anónimo, 2012).

Desde la década de los años 70, se ha trabajado intensamente en el


desarrollo y perfeccionamiento de los denominados sistemas OMR
(Optical Mark Recognition), provistos de un scanner dedicado y que
aplican técnicas de reconocimiento de patrones, normalmente
basadas en las diferencias de contraste detectadas en posiciones
predeterminadas del cuestionario (Inglés R. & Vicente Ch., 2010).

C. Ventajas:
 La tecnología OMR es muy útil y eficiente para recabar
información simple y predeterminada.
 La tecnología OMR puede proporcionar una eficacia del 99,9%
de precisión en la lectura de datos en un documento impreso con
calidad.

D. Desventajas:
 La tecnología OMR no es capaz de reconocer caracteres en letra
manuscrita o a máquina.
 Gran dependencia del formato de formulario empleado.

3.3.2. Sistema de Reconocimiento Óptico de Marcas:


Un Sistema OMR es un conjunto de elementos organizados y capaces
de reconocer el significado de distintas marcas y de convertir las
imágenes escaneadas en información legible por la computadora de
acuerdo a su ubicación (Tejerina R. J., 2011).

Guevara Honores, S. & Lulichac Rojas, E. 23


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

3.3.3. Etapas del Procesamiento Digital de imágenes:

A. Captura y Adquisición de imágenes:


El proceso de captura se refiere a la adquisición de la imagen del
mundo físico. La imagen puede ser capturada o generada de varias
maneras o uso de varios dispositivos:

 Cámara Digital:
Resolución: La mayoría de cámaras comerciales generan
imágenes de 640x480 píxeles que son adecuadas para muchas
aplicaciones.
Memoria: Se interesa alojar en la memoria tantas fotografías
como sea posible antes de proceder a su descarga en la
computadora. Las cámaras pueden incluir memoria interna fija,
así como tarjetas de memoria intercambiables.
Sistema de Transferencia: Para el traspaso de imágenes a la
PC, la mayoría cuentan con conexión USB.
Velocidad: Cabe mencionar que depende del Hardware de la
cámara digital.

 Escáner:
Es un dispositivo que le permite realizar una copia digital de una
fotografía u otro tipo de documento.
Resolución: Depende la precisión del motor que impulsa
pausadamente al CCD (Charge Coupled Device - dispositivo de
carga acoplado) a lo largo del documento. Algunas resoluciones
de escáner son: 300, 600, 1200, 2400, 4800, 9600 dpi (dots per
inch – puntos por pulgada).
Memoria: No necesita memoria externa.
Sistema de Transferencia: Cuenta con un CCD con una sola
fila de píxeles fotosensibles. Este CCD líneal registra el valor
lumínico de cada una de las líneas o filas de una imagen. Al
terminar una línea remite la información de inmediato a la PC
para poder proceder la lectura de la línea siguiente. Además
requiere de una conexión USB.
Velocidad: Depende del motor que impulsa pausadamente al
CCD y también del usuario quien coloca los documentos a
escanear.

 Fotocopiadora digital:
Resolución: Desde 300 dpi hasta 9600 dpi.
Memoria: Usa una memoria RAM, la cual hace que las copias
antes de pasar a la impresión se almacenan en la memoria

Guevara Honores, S. & Lulichac Rojas, E. 24


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

RAM. Con 16MB de RAM permite almacenar aproximadamente


50 hojas A4.
Sistema de Transferencia: Usa puerto USB para pasar las
imágenes al computador.
Velocidad: Debido a su sistema de bandejas y a su memoria
RAM aumenta la velocidad de copiado. Por lo general suele
trabajar con 15mil páginas de tipo multicopia.

B. Pre procesamiento:
Esta etapa Incluye técnicas para la binarización, reducción del ruido,
realce del contraste, realce de ciertos detalles, o características de la
imagen, entre otros.

B.1. Técnicas de realce de contraste:

 Aumento lineal del Contraste

Utilizando el valor de intensidad mínimo y máximo en una


imagen, podemos aumentar su contraste.
La idea básica es llevar el valor mínimo (min) a cero y el
máximo (max) a 255, pensando en imágenes
monocromáticas (0-255). Esta transformación genera que
las intensidades se espacíen de acuerdo a cierto factor o
pendiente; el factor para este aumento lineal de contraste es:

𝐼(𝑥, 𝑦) − 𝑚𝑖𝑛
𝐶(𝑥, 𝑦) = ( ∗ 255)
𝑚𝑎𝑥 − 𝑚𝑖𝑛

Donde 𝐼(𝑥, 𝑦) es la imagen a procesar y 𝐶(, 𝑦) es la imagen


con aumento lineal del contraste.
Se puede verificar fácilmente que para 𝐼(𝑥, 𝑦) en 𝑚𝑖𝑛, 𝐶(𝑥, 𝑦)
resulta cero (el numerador es cero); para 𝐼(𝑥, 𝑦) en 𝑚𝑎𝑥,
𝐶(𝑥, 𝑦) resulta en 255, obteniendo como cociente 1 (Sucar,
L. & Gómez G., 2008).

 Ecualización por Histograma

En principio el principal objetivo de la ecualización de


histograma es producir un histograma con una distribución
uniforme, para obtener un alto nivel de contraste.

Guevara Honores, S. & Lulichac Rojas, E. 25


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Sea una variable continua 𝑟 que representa los niveles de


gris de una imagen a ser mejorada.
Se asume que 𝑟 ha sido normalizada en el intervalo [0, 1],
con 𝑟 = 0 representando el negro y 𝑟 = 1 representado el
blanco. Posteriormente, se considerará un planteamiento
discreto, en donde los valores de los píxeles estén en el
intervalo [0, 𝐿 − 1], dado que 𝐿 es el número total de posibles
niveles de gris en la imagen. La siguiente es la forma de la
función de transformación de interés.

𝑆 = 𝐴(𝑟) 0 ≤ 𝑟 ≤ 1

Que produce un nivel 𝑆 para cada píxel 𝑟 en la imagen


original. Ésta función de transformación satisface las
siguientes condiciones (Aguilar M. 2007):

 𝐴(𝑟) es de valor Único y se incrementa monotónicamente


en el intervalo 0 ≤ 𝑟 ≤ 1
 0 ≤ 𝐴(𝑟) ≤ 1 para 0 ≤ 𝑟 ≤ 1.

Por tanto se hace la siguiente transformación sobre los


niveles de intensidad en la imagen:
𝑘
𝑛𝑗
𝑆𝑘 = 𝐴 (𝑟𝑘 ) = ∑
𝑛
𝑗=0
Donde: 𝑘 = 0,1,2, … , 𝐿 − 1

Guevara Honores, S. & Lulichac Rojas, E. 26


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 11: Imagen e histograma original (superior), Imagen y su histograma


ecualizado (inferior)
Fuente: Grupo de Investigación EDMANS, 2006

B.2. Técnicas de Binarización por Umbralización global:

 Método del Mínimo:


El histograma es de tipo bimodal, lo que hace relativamente
fácil la selección del umbral más adecuado. De la inspección
visual del histograma, se puede ver que una buena opción
para la separación de fondo y los objetos es un lugar el cual
corresponde al punto más bajo entre los dos picos principales.
Para realizar el algoritmo se recomienda suavizar la curva
reiteradas veces hasta lograr que solo existan 2 máximos
locales. Si se suaviza el histograma bimodal, se pueden
definir más claramente el umbral adecuado ya que este se
encuentra en el valle localizado entre los 2 únicos picos. Para
localizar los máximos locales, se recurre a los criterios de la
derivada que indican:

Si ℎ′ (𝑘) = 0 𝑦 ℎ′′ (𝑘) < 0 entonces es un máximo local

Guevara Honores, S. & Lulichac Rojas, E. 27


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

El histograma debe generar dos únicos máximos locales.


Seguidamente, se busca el valor mínimo entre los dos
máximos locales siendo este punto el que posee el umbral
adecuado T (Cortés J, Muriel A & Mondoza J. 2011).

Figura 12: Representación de la primera y segunda derivada del


histograma suavizado mediante promedio.
Fuente: Cortés J, Muriel A & Mondoza J. 2011.

 Método del Triángulo

Para determinar el umbral adecuado mediante el método del


triángulo, se deben determinar el valor máximo de la
probabilidad 𝑃𝑚𝑎𝑥 y mínimo 𝑃𝑚𝑖𝑛 de la gráfica del histograma.
El umbral se determina mediante otra línea recta la cual
debe cortar perpendicular a la primera y rodear el
histograma hasta encontrar la máxima distancia d. El punto
donde la recta toca el histograma corresponde a umbral
deseado T. Esta técnica resulta adecuada cuando el
histograma es de tipo bimodal y posee solo picos claramente
definidos (Cortés J, Muriel A & Mondoza J. 2011).

Guevara Honores, S. & Lulichac Rojas, E. 28


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 13: Procedimiento para la determinación del umbral mediante


el método del Triángulo.
Fuente: Cortés J, Muriel A & Mondoza J. 2011, Diciembre, 13

B.3. Técnicas de Binarización por Umbralización local:

Existen técnicas estadísticas básicas para la determinación de


umbral local, dentro de ellas se encuentran la promedio (mean),
la mediana (median), máximo y mínimo (Midgray) (Cortés J,
Muriel A & Mondoza J. 2012).

 Umbral local mediante la media

En esta técnica se deben ordenar de menor a mayor las


intensidades 𝐼(𝑟, 𝑐) incluidas dentro de los pixeles de la
vecindad 𝑁(𝑟, 𝑐) definidos por la máscara.
El umbral corresponde al valor central 𝐼(𝑟, 𝑐) encontrado que
se convierte en el umbral 𝑇(𝑟, 𝑐) del pixel [𝑝, 𝐼(𝑝)], la
ecuación para calcular el umbral local mediante la media es:

𝑇(𝑟, 𝑐) = 𝑚𝑒𝑑𝑖𝑎(𝑁(𝑟, 𝑐))

El Método de la media da un contenido altamente ruidoso de


la imagen y es el más lento de los métodos estadísticos
básicos (Cortés J, Muriel A & Mondoza J. 2012).

Guevara Honores, S. & Lulichac Rojas, E. 29


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

 Umbral local mediante Máximos y mínimos.

Este método determina la intensidad 𝐼(𝑟, 𝑐)𝑀𝑎𝑥 máxima y


𝐼(𝑟, 𝑐)𝑀𝑖𝑛 mínima encontrada dentro de los pixels de la
vecindad 𝑁(𝑟, 𝑐) definida por la máscara de orden 𝑛𝑥𝑚; este
se te convierte en el umbral 𝑇(𝑟, 𝑐) del pixel [𝑝, 𝐼(𝑝)].

max(𝑁(𝑟, 𝑐)) + 𝑚𝑖𝑛(𝑁(𝑟, 𝑐))


𝑇(𝑟, 𝑐) =
2

Pese a la sencillez de procedimiento, es poco ruidoso y


relativamente el más rápido de los métodos estadísticos
básicos (Cortés J, Muriel A & Mondoza J. 2012, Agosto, 30).

 Algoritmo de Niblack

La técnica planteada por Niblack se base esencialmente en


el cálculo del promedio de las intensidades 𝐼(𝑟, 𝑐) de la
vecindad 𝑁(𝑟, 𝑐).

𝑇(𝑟, 𝑐) = 𝑚𝑒𝑎𝑛(𝑁(𝑟, 𝑐)) + 𝐾 + 𝐷𝑒𝑠𝑣𝑒𝑠𝑡(𝑁(𝑟, 𝑐))

De otro lado, este agrega un aporte que es proporcionado


por la desviación estándar de los valores de la ventana, los
cuales son multiplicados por un factor k el cual toma valores
de 0,2 para objetos brillantes y de -0,2 para objetos opacos.
Niblack considera que K es un valor que debe estar entre -1
y 0. El umbral 𝑇(𝑟, 𝑐) se determina mediante la ecuación de
Máximos y Mínimos para cada uno de los pixeles [𝑝, 𝐼(𝑝)] de
la vecindad (Cortés J., Muriel A. & Mondoza J., 2012).

B.4. Técnicas de reducción de ruido mediante filtros:

 Filtro de Mediana:
Es un método de alisamiento que reduce el
emborronamiento de las fronteras. La idea es reemplazar el
valor de la imagen en un punto por la mediana de los niveles
de brillo vecinos. Es obvio que los puntos aislados de ruido
son eliminados (Molina R., 1998).

Es muy usado para eliminar el ruido impulsivo de una


imagen, La ventaja es que con éste filtro los detalles

Guevara Honores, S. & Lulichac Rojas, E. 30


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

abruptos y bordes de los objetos (correspondientes a las


partes altas de frecuencias) no se difuminan tanto (Grupo de
Investigación EDMANS, 2006)

En el filtro de la mediana la máscara de convolución se


emplea asi:
i. Se toman todos valores de la imagen cubiertos por la
máscara.
ii. Se ordenan de menor a mayor.
iii. Se toma el valor central

Figura 14: Filtro de la mediana con máscara 3x3


Fuente: Mauricio Durán G., 2009

 Filtro Gaussiano:

El reductor de ruido Gaussiano se basa en una máscara que


se convoluciona con una imagen, para efectos de reducir el
ruido. Sin embargo, éste tipo de máscara remueve también
detalles de la imagen y la difumina.
El interés para procesamiento de imágenes es una máscara
en dos dimensiones. En éste sentido, una máscara
Gaussiana de 2D se define de la siguiente manera:

1 − 𝑥 2 +𝑦2 2
𝐺 (𝑥, 𝑦) = 2 𝑒 2𝜎
𝜎
Donde 𝜎 es la desviación estándar de la distribución (Aguilar
M., 2007).

Guevara Honores, S. & Lulichac Rojas, E. 31


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

En la figura 15 se da el ejemplo de una máscara de 5x5 para


el filtro gaussiano con 𝜎 = 1.0

Figura 15: Máscara 5x5 para un filtro gaussiano


Fuente: Aguilar M., 2007.

B.5. Realce de características:

 Filtros de Búsqueda de gradiente:


Las técnicas clásicas de detección de orillas o siluetas, se
basan en diferenciar a la imagen, esto es, encontrar la
derivada respecto a los ejes 𝑥 y 𝑦, o también la llamada
gradiente. Este tipo de filtros buscan y acentúan aquellos
puntos donde la gradiente es mayor. El gradiente viene
definido por:
𝛿𝑓 𝛿𝑓
∇𝑓(𝑥, 𝑦) = ( , )
𝛿𝑥 𝛿𝑦
Dando esta función como resultado un vector cuya dirección
indica la dirección de máxima diferencia entre puntos (la
pendiente) y cuyo módulo indica el valor de la pendiente en
esa dirección (Grupo de Investigación EDMANS, 2006).

En la siguiente figura se presentan las matrices:

Guevara Honores, S. & Lulichac Rojas, E. 32


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 16: Matrices para aplicación de filtros de búsqueda de gradiente


Fuente: Grupo de Investigación EDMANS, 2006.

Dependiendo de la dirección del gradiente que se quiere


acentuar, se utilizarán unas matrices u otras. Los gradientes
que se obtienen con las matrices de la primera columna
generan un desplazamiento de medio pixel en la imagen,
pero son más fieles al gradiente ideal. En cambio los
gradientes de la segunda columna no desplazan la imagen
pero no se aproximan tanto al gradiente ideal.

 Filtros detectores de Líneas:


Para detectar líneas, en la siguiente figura se muestran las
matrices:

Figura 17: Matrices para aplicación de filtros detectores de líneas


Fuente: Grupo de Investigación EDMANS, 2006

Guevara Honores, S. & Lulichac Rojas, E. 33


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

C. Segmentación:
Proceso de separar la imagen en unidades significativas para llegar
al reconocimiento de marcas.

C.1. Segmentación por Histograma

Es una técnica global que se basa, inicialmente, en asumir que


hay un sólo objeto sobre un fondo uniforme. Por esto se
consideran dos regiones en la imagen y para dividirlas se toma
como base el histograma de intensidades. Si hay dos regiones
se tiene dos picos en el histograma. Entonces se toma el valle
(mínimo) entre los dos y este se considera la división entre las
dos regiones. De esta forma todos los pixeles que correspondan
a un lado del histograma se toman como una región y el resto
como otra, como se ilustra en la siguiente figura (Sucar, L. &
Gómez G. 2008):

Figura 18: Segmentación por histograma


Fuente: Sucar, L. & Gómez G. 2008.

Esta técnica sólo considera la intensidad (u otro atributo) de los


pixeles, sin tomar en cuenta la coherencia espacial de la región.
Por ello, dos pixeles separados en la imagen, pueden
pertenecer a la misma región si tienen intensidades similares.
La técnica de segmentación por histograma se puede extender
a N regiones, tomando cada pico del histograma como una
región y los mínimos correspondientes como las divisiones entre
regiones. Estos se ilustro en la siguiente figura:

Guevara Honores, S. & Lulichac Rojas, E. 34


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 19: Histograma de una imagen con múltiples regiones.


Fuente: Sucar, L. & Gómez G. 2008

En la práctica, esta forma de segmentación funciona para


“pocas” regiones, ya que al aumentar éstas, se vuelve muy difícil
determinar los picos y valles del histograma.

C.2. Segmentación por Crecimiento de regiones

Son técnicas locales que se basan en tomar un pixel, o conjunto


de pixeles, como una región inicial (semilla) y a partir de éstos
“crecer” la región con puntos similares hasta llegar a ciertos
límites, como se muestra en la siguiente figura:

Figura 20: Crecimiento de regiones.


Fuente: Sucar, L. & Gómez G. 2008.

Para el crecimiento de regiones existen dos problemas básicos:

 Selección de los puntos iniciales: Para esto se puede tomar


ciertos puntos específicos de acuerdo a la información previa
(más negro, más brillante), o buscar grupos de puntos muy
similares y tomar su centroide como punto inicial.
 Criterios de similitud: Para esto se toma alguna heurística de
diferencia máxima entre pixels, junto con criterios de

Guevara Honores, S. & Lulichac Rojas, E. 35


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

conectividad. Se pueden usar otros criterios como el número


de regiones o su dimensión esperada, o información del
histograma (Sucar, L. & Gómez G. 2008).

C.3. Segmentación por División-Agrupamiento

En la segmentación por división {agrupamiento (split & merge),


se combinan técnicas globales (división) y globales
(agrupamiento). Normalmente se parte de una segmentación
inicial, obtenida mediante orillas o regiones, a partir de la cual se
agrupan o dividen regiones. Esto se facilita utilizando una
representación basada en estructura piramidal y/o en arboles
cuaternarios (Sucar, L. & Gómez G. 2008).

 Método basado en pirámide

Inicialmente la imagen se estructura en una forma piramidal,


de forma que cada posible región (cuadrante) está formada
de 4 subregiones. Para ello se representa la imagen a
diferentes resoluciones, desde cierta resolución máxima
hasta cierta resolución mínima. Entonces se aplica el
siguiente algoritmo:
Considerar una medida de homogenidad: H (diferencia en
niveles de gris, por ejemplo). A partir de cierto nivel
(arbitrario) de la pirámide:

 División. Si una región no satisface la medida (H falso),


dividirla en 4 regiones, continuado a los niveles inferiores
de la pirámide.
 Agrupamiento. Si 4 regiones contiguas (mismo cuadrante)
satisfacen el criterio (H verdadera), agruparlas en una
región y continuar a los niveles superiores de la pirámide.

Una vez segmentada la imagen en cuadrantes en cada nivel,


realizar un agrupamiento de regiones vecinas a diferentes
niveles. Si hay dos regiones contiguas, al mismo o diferente
nivel, tal que 𝐻(𝑅𝑖 ∪ 𝑅𝑗) = 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜, agruparlas en una
región. Si no hay más regiones que dividir o agrupar,
terminar.

Al final del proceso, se obtiene una segmentación en N


regiones contiguas de la imagen. La suavidad en la

Guevara Honores, S. & Lulichac Rojas, E. 36


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

aproximación de la forma de las regiones mediante


cuadrantes, depende de la resolución máxima utilizada en la
pirámide. La siguiente figura ilustra esta técnica para una
imagen sintética con dos regiones (Sucar, L. & Gómez G.
2008).

Figura 21: Ejemplo de segmentación por división agrupamiento en


una imagen sintética
Fuente: Sucar, L. & Gómez G. 2008

 Método basado en árboles cuaternarios

Una variante del método de división de agrupamiento es una


técnica basada en árboles cuaternarios (Quadtrees) que se
utiliza cuando se desea segmentar cierta región en
particular.

El algoritmo de segmentación para una región es el


siguiente:

 Dividir la imagen en 4 y calcular la media (𝜇) y desviación


estandar (𝜎) de la intensidad en cada cuadrante.
 Si es una región uniforme en rango, tomar dicho
cuadrante como una región base y pasar al paso 5.
 Si es una región uniforme fuera de rango, desechar dicho
cuadrante.
 Si es una región no uniforme, entonces dividir el
cuadrante en 4 y repetir (1) a (3) hasta que todos los
cuadrantes sean región base o estén fuera de rango, o ya
no sea posible dividirlos.
 Tomar como la región buscada el cuadrante mayor y
unirle todos los cuadrantes adyacentes que satisfagan la

Guevara Honores, S. & Lulichac Rojas, E. 37


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

condición de región uniforme en rango (Sucar, L. &


Gómez G. 2008).

D. Descripción:
Es la obtención de características convenientes para diferenciar un
tipo de marca, como: la forma, el tamaño, área, etc.

D.1. Descriptores de frontera según su longitud:


La longitud de un contorno es uno de los descriptores más
sencillos, Si se cuenta el número de pixeles en el contorno se
obtendrá una aproximación de su longitud. Si la frontera ha sido
codificada usando cadenas de códigos, el número de
componentes verticales más el de horizontales más el de
diagonales multiplicados por √2 da la longitud exacta (Grupo de
Investigación EDMANS, 2006).

El diámetro de una frontera B se define como:


𝐷𝑖𝑎𝑚(𝐵) = máx [ 𝐷 (𝑝1 , 𝑝2 )]
𝑖𝑗
Donde 𝐷 es una medida de distancia y 𝑝1 𝑦 𝑝2 son puntos de la
frontera.

D.2. Descriptor de región según su Área:


Para realizar la medida del área de un objeto, se utiliza el vector
que define su contorno. EL área se va a definir como el número
de píxeles que están dentro del contorno. Uno de los métodos
más rápidos, consiste en contar el número de píxeles que hay
en cada fila de puntos del objeto.

Figura 22: Ejemplo de segmentación por división agrupamiento en una imagen


sintética
Fuente: Grupo de Investigación EDMANS, 2006.

Guevara Honores, S. & Lulichac Rojas, E. 38


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

De esta forma el cálculo del área es muy sencillo:


𝑚𝑎𝑥(𝑓𝑖𝑙𝑎𝑠)

Á𝑟𝑒𝑎 = ∑ 𝑚𝑎𝑥(𝑐𝑜𝑙𝑢𝑚𝑛𝑎(ℎ)) − 𝑚𝑖𝑛(𝑐𝑜𝑙𝑢𝑚𝑛𝑎(ℎ))


ℎ−𝑚𝑖𝑛(𝑓𝑖𝑙𝑎𝑠)

E. Reconocimiento:

El propósito final de visión es reconocimiento. Para ello es necesario


realizar una interpretación de los datos de entrada. Esto se logra
mediante el establecimiento de una correspondencia (match) entre
los atributos obtenidos de la(s) imagen(es) a través de los procesos
de visión de nivel bajo e intermedios y los modelos representados en
la computadora. Dependiendo del tipo de representación podemos
distinguir 3 tipos de técnicas para correspondencia (Sucar, L. &
Gómez G. 2008):

E.1. Reconocimiento estadístico de patrones:

Consiste, básicamente, en buscar, dentro de un espacio


paramétrico, la clase (modelo) más “cercana" a la descripción
del objeto en la imagen. Si consideramos que se tienen, por
ejemplo, dos parámetros y 3 tipos (clases) de objetos, el
problema se puede visualizar como se presenta en la siguiente
figura:

Figura 23: Espacio paramétrico con 2 parámetros y 3 clases


Fuente: Sucar, L. & Gómez G. 2008

Cada punto representa un objeto. Los objetos similares se


muestran con diferentes símbolos (x, +, *), los cuales,
normalmente, están agrupados en el espacio paramétrico. Dado
un objeto desconocido, el problema es encontrar a que grupo

Guevara Honores, S. & Lulichac Rojas, E. 39


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

(clase) pertenece dados sus parámetros (Sucar, L. & Gómez G.


2008).

E.2. Algoritmo de Hamming:


Es un código que se utiliza en la detección y corrección de
errores que se producen en la transmisión de códigos binarios,
la palabra de código se conforma por los bits de comprobación y
los bits de información.
La Distancia entre dos combinaciones binarias, viene dada por
el número de bits que hay que cambiar en una de ellas para
obtener la otra.

El código Hamming se genera a partir de una distancia mínima


de 3, ya que una distancia de 1 o 2 es inconveniente para poder
generar un código para detectar un error.
La distancia mínima de Hamming está dada por la siguiente
ecuación:
𝐷𝑚 = 2𝑋 + 1

Donde 𝐷𝑚 es la distancia mínima de un código para permitir la


corrección de datos y 𝑋 es las líneas de datos.

Si se tuviese una distancia de 1 no tendríamos valores para


saber si hay o no un error.
Si se tienen una distancia de 2 se podría lograr un sistema de
corrección de error con un bit de paridad pero el problema que
esto lleva es que un sistema con distancia 2 puede tener datos
erróneos que pueden pasar como datos correctos. Con la
distancia de 3 se tiene que los códigos no van a tener datos o
resultados similares por ende se puede detectar el error y se
puede desarrollar un sistema para su corrección como el
Hamming (Cisneros Rosero A., & Sepúlveda Núñez D., 2012).

Ejemplo: Se tiene los vectores: ℎ1=GRANDE y ℎ2= GRANOS


Para calcular la distancia de Hamming, Podemos definir la
distancia entre ellas como el número de caracteres en las
mismas posiciones que son distintos, número de entradas
diferentes entre los vectores.

Guevara Honores, S. & Lulichac Rojas, E. 40


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Figura 24: Ejemplo de Algoritmo de Hamming


Fuente: Ramírez Benavides K., 2012

Conforme a la figura 23 se observa que hay 2 errores, por tanto


la distancia de Hamming para el ejemplo está dada por:

𝐻𝐷 (ℎ1, ℎ2) = 2

CAPITULO IV: DESARROLLO METODOLÓGICO

ANÁLISIS DE TÉCNICAS

A continuación se realizará la comparación de técnicas en las etapas


correspondientes a la metodología que se utiliza en el desarrollo de la presente
tesis, para ello se usará una escala de 1 al 5 según la siguiente consideración:

1 2 3 4 5
Malo Regular Normal Bueno Excelente

Tabla 5: Escala de Calificación para la comparación de técnicas


Fuente: Elaboración propia

4.1. Captura y Adquisición:

Como se ha descrito en el apartado 3.3.3., una imagen puede ser capturada


mediante el uso de 3 dispositivos de Adquisición.

DISPOSITIVOS
CRITERIOS
Cámara Escáner Fotocopiadora
Digital Digital
Resolución 2 4 4

Memoria 2 2 5
Sistema de Transferencia 3 3 3
Velocidad de Captura 3 1 5
TOTAL 10 10 17

Tabla 6: Cuadro comparativo de los dispositivos de captura de una imagen digital.


Fuente. Elaboración Propia.

Guevara Honores, S. & Lulichac Rojas, E. 41


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Según los resultados obtenidos en el cuadro anterior, el dispositivo que se


usará para la adquisición de imágenes en el presente trabajo será:
Fotocopiadora Digital.

4.2. Pre procesamiento:

Para analizar algunos algoritmos, se consideró criterios como: Coste


computacional, y Tiempo de ejecución; éstos criterios serán calificados con
la misma escala del 1 al 5, teniendo en cuenta que la ponderación más alta
favorece al desarrollo del sistema, y que todo sistema computacional requiere
algoritmos que tengan Bajo coste computacional, y Menor tiempo de
ejecución.

4.2.1. Realce de Contraste:

En el apartado 3.3.3 parte B.1, se mencionan 2 técnicas de realce de


contraste. La técnica Aumento Lineal del contraste procesa la matriz
de la imagen 𝐼(𝑥, 𝑦) para transformarla recorriendo todas sus filas y
columnas, es decir dos bucles, siendo su complejidad O(𝑛2 ). La técnica
Ecualización por histograma procesa el histograma de la imagen, el
cual es un vector siendo su complejidad O(n).

Aumento Ecualización
ALGORITMOS lineal del por
CRITERIOS Contraste histograma

Coste computacional 2 3

Distribución uniforme de niveles 3 4


de gris en la imagen
Realce de pixeles de interés 2 3

TOTAL 7 10

Tabla 7: Cuadro comparativo de los algoritmos de realce de Contraste.


Fuente. Elaboración Propia

Conforme a los resultados de la tabla 7 se eligió el método de


ecualización por histograma para el realce de contraste.

Guevara Honores, S. & Lulichac Rojas, E. 42


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

4.2.2. Binarización:

El punto clave de la binarización es la elección del valor del umbral, se


ha considerado 2 tipos de umbralización: global y local. Existen
diferentes algoritmos para cada tipo de umbralización. Según el Anexo
1 y 2, se evaluará el criterio: tiempo de ejecución para los algoritmos.

Mínimo Triángulo Media Máximos Niblack


ALGORITMOS y Mínimos
CRITERIOS
Tiempo de ejecución 1 2 3 4 2
Adecuado para 4 4 0 0 0
Histogramas Bimodales
Adecuado para imágenes 3 3 1 1 1
estáticas
TOTAL 12 13 6 7 5

Tabla 8: Cuadro comparativo de los algoritmos de binarización.


Fuente: Elaboración Propia.

Conforme se analizó los criterios en la tabla 8, se eligió el método del


Triángulo como el algoritmo de Binarización para las imágenes.

4.2.3. Reducción de Ruido:


Para elegir el tipo de filtro para la reducción de ruido en la imagen, se
utilizó el siguiente cuadro comparativo:

ALGORITMOS Filtro Filtro


CRITERIOS Mediana Gaussiano
Preserva bordes 3 2
Preserva esquinas 1 3
Preserva líneas finas 1 3
Reduce ruido impulsivo 2 3
Suavizado uniforme 2 3
TOTAL 9 14

Tabla 9: Cuadro comparativo de los algoritmos de reducción de ruido.


Fuente: Elaboración Propia.

Guevara Honores, S. & Lulichac Rojas, E. 43


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Según la tabla 9, el algoritmo que se adapta a las necesidades es:


Filtro Gaussiano.

4.2.4. Realce de Características:

ALGORITMOS Búsqueda de Detector


CRITERIOS gradiente de
Líneas
Acentúa bordes 4 2

Acentúa pixeles de interés 3 4


Confiabilidad en presencia de
2 4
ruido
TOTAL 9 10

Tabla 10: Cuadro comparativo de los algoritmos de realce de características.


Fuente: Elaboración Propia

Conforme a la tabla 10, el algoritmo más adecuado para el realce de


características es: Detector de Líneas.

4.3. Segmentación:

Segmentación Segmentación Segmentación


ALGORITMOS por por por División-
Histograma Crecimiento de Agrupamiento
CRITERIOS regiones

Tiempo de Ejecución 4 2 2

Susceptible a los objetos 3 3 3


a una imagen
Facilita la búsqueda de 2 2 4
regiones de interés
Divide la imagen con 3 1 4
facilidad
TOTAL 12 8 13

Tabla 11: Cuadro comparativo de los algoritmos de segmentación.


Fuente: Elaboración Propia

Guevara Honores, S. & Lulichac Rojas, E. 44


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Conforme a la tabla 11, el algoritmo más adecuado para la etapa de


segmentación es: Segmentación por División-Agrupamiento.

4.4. Descripción:

ALGORITMOS Descriptor de Descriptor


CRITERIOS frontera según su de región
longitud según su
área
Tiempo de Ejecución 3 4

Dependencia de cantidad de 3 4
pixeles para la región de interés
Probabilidad de Acierto en el 3 3
objeto
Confiabilidad al describir el objeto 1 2

TOTAL 10 13

Tabla 12: Cuadro comparativo de los algoritmos de descripción.


Fuente: Elaboración Propia

De acuerdo al cuadro comparativo anterior, el algoritmo más adecuado para


la etapa de descripción es: Descriptor de región según su área.

4.5. Reconocimiento:

Se consideraron los siguientes criterios en la etapa de reconocimiento dado


que, los descriptores son vectores, los cuales indican las respuestas (marcas)
para cada ítem de la encuesta. Para reconocer la respuesta del usuario en un
ítem, se desarrollará una búsqueda por exactitud de los descriptores
obtenidos (encuesta) con los descriptores de comprobación (opciones de
respuestas), especificados por el formato de la encuesta.

Guevara Honores, S. & Lulichac Rojas, E. 45


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

ALGORITMOS Estadístico de Hamming


CRITERIOS patrones

Comparación de descriptores de 3 3
objetos
Búsqueda por exactitud 1 3

Detección de errores 2 3

TOTAL 6 9

Tabla 13: Cuadro comparativo de algoritmos de reconocimiento


Fuente: Elaboración propia

ESQUEMA DE DESARROLLO DEL SISTEMA

 Uso de fotocopiadora digital


Paso 1: Captura y  Escaneo de encuestas
Adquisición  Imágenes Digital de encuestas

Ecualización por Histograma


 Elaboración de Histograma
Paso 2: Realce de  Distribución uniforme del Histograma
Contraste  Obtención de niveles de contraste

Método del Triangulo


 Calculo del valor máximo y mínimo
del Histograma
Paso 3: Binarización  Calculo del Umbral con el valor Máx y
Min
 Utilización del Umbrar para binarizar
la imagen

Guevara Honores, S. & Lulichac Rojas, E. 46


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

Descriptor de región según su área:


Paso 4: Reducción de  Aplicar mascara de detección de
Ruido contorno
 Calcular el área que está dentro del
contorno, contando los pixeles.

Algoritmo de Hamming:
 Transformar las áreas calculadas a
Paso 5: Realce de valores binarios
Características  Almacenar resultados en forma
matricial
 Comparar fila a fila los resultados
obtenidos con los valores esperados.

Filtro Gaussiano:
Paso 6: Segmentación  Definir mascara de Convolución
 Aplicar mascara a Imagen Binarizada
 Almacenar Imagen sin ruido

Filtro detector de líneas:


Paso 7: Descripción  Aplicar mascara de detección de
líneas
 Aplicar mascara de realce de
características

Segmentación por División-Agrupamiento:


Paso 8: Reconocimiento  Dividir la imagen con una medida de
homogeneidad
 Agrupar las regiones contiguas que
cumplen el criterio de Homogeneidad

Guevara Honores, S. & Lulichac Rojas, E. 47


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

REFERENCIAS BIBLIOGRÁFICAS:

[1]. Fuertes J., Lucena M. & Rodríguez F. (2010). Procesamiento Automático de


Cuestionarios y Encuestas. Iniciación a la Investigación, vol. 4, 11.
Departamento de Informática, Universidad de Jaén, Campus de las Lagunillas,
23071, Jaén, España.

[2]. De armas R. & Bautista L. (2005, Noviembre 03). Reconocimiento Automático


de caracteres manuscritos y marcas, orientado al procesado de encuestas.
Escuela de Ingeniería Eléctrica, Electrónica y de Telecomunicaciones,
Universidad de Santander (UDES), Floridablanca, Colombia.

[3]. Rosal, Á. B. (2007, Noviembre 23). Diseño y análisis de encuestas.


Recuperado el 19 de agosto del 2014 en:
http://aborges.webs.ull.es/encuesta_com.pdf.

[4]. Díaz R. V, Flavián C. & Guinalíu M. (2012, Noviembre 14). Encuestas en


Internet: Algo más que una simple versión mejorada de la tradicional encuesta
autoadministrada. Recuperado el 1 de setiembre del 2014 en:
http://www.aedemo.es/aedemo3/socios/revista82/Ad-82-06.pdf

[5]. Instituto Pyme. (2002). SMEToolkit. Técnicas de investigación de mercado.


Recuperado el 23 de Agosto del 2014 en:
http://mexico.smetoolkit.org/mexico/es/content/es/196/T%C3%A9cnicas-de-
investigaci%C3%B3n-de-mercado.

[6]. Sucar, L. & Gómez G. (2008). Vision Computacional. Puebla, México.


Recuperado el 25 de Agosto del 2014 en:
http://ccc.inaoep.mx/~esucar/Libros/vision-sucar-gomez.pdf.

[7]. Granados, C. H (2012, Febrero 20) Análisis, diseño, implementación de un


producto de reconocimiento de Marcas para el procesamiento de evaluaciones
en el proceso de preparación para los ECAES en el programa de ingeniería de
sistemas y computación de la UTP. Ingeniería de sistemas y computación
.Universidad tecnológica de Pereira. Colombia.

[8]. García S. I (2008). Visión Artificial y Procesamiento Digital de Imágenes usando


Matlab. Recuperado el 24 de agosto del 2014 en: http://vision-artificial-
matlab.blogspot.com/

Guevara Honores, S. & Lulichac Rojas, E. 48


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

[9]. Alelú M., Cantín S., López N. & Rodríguez M. (2009, Octubre, 03). Estudio de
Encuestas. Área de Métodos de investigación de Educación Especial
Universidad Autónoma de Madrid.

[10]. Inglés R. J & Vicente Ch. C. (2010) Desarrollo de un sistema de


Reconocimiento de Marcas basado en Análisis de Contenido en Incertidumbre.

[11]. Unicef (2005) Manual para la Encuesta de Indicadores Múltiples por


Conglomerdos 2005. División de Politicas y planificaciones de UNICEF.

[12]. Fuentelsaz G. C (2004) Cálculo del tamaño de la muestra. Hospital


Universitario “Vall d Hebron”. Barcelona

[13]. Autor Anónimo, (2012) Reconocimiento óptico de marca, Fondo OMR, Software
OMR, Historia, General. Recuperado el 01 de septiembre del 2014 en:
http://centrodeartigo.com/articulos-utiles/article_122553.html

[14]. Tejerina R. J. (2011). Implicancia en la digitalización, OCR, ICR, y OMR.


Universidad Provada de Tacna. Recuperado el 27 de agosto del 2014 en:
https://es.scribd.com/doc/134686797/02-OCR-OMR-ICR

[15]. Cortés J, Muriel A & Mondoza J. (2011, Diciembre, 13) Comparación


cuantitativa y cualitativa de las Técnicas básicas de umbralización global
basadas en histogramas para el procesamiento digital de imágenes.
Universidad Tecnológica de Pereira. Colombia

[16]. Cortés J, Muriel A & Mondoza J. (2012, Agosto, 30) Comparación cuantitativa y
cualitativa de las Técnicas básicas de umbralización local para el
procesamiento digital de imágenes. Universidad Tecnológica de Pereira.
Colombia.

[17]. Aguilar M. (2007, Diciembre, 19) Desarrollo de una etapa de pre-procesamiento


para reducción de ruido, mejoramiento de contraste y de nitidez en imágenes
digitalizadas de geles de electroforesis, Insitituto Tecnológico de Costa Rica.

[18]. Grupo de Investigación EDMANS, 2006. Técnicas y algoritmos Básicos de


Visión Artificial. Universidad de La Rioja, España.

[19]. Molina R., 1998. Introducción al Procesamiento y Análisis de imágenes


Digitales. Universidad de Granada.

Guevara Honores, S. & Lulichac Rojas, E. 49


Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT

[20]. Mauricio Durán G., 2009. Reconocimiento de caracteres ópticos OCR por
medio de correlación y redes neuronales. Universidad Pontifica Bolivariana.
Floridablanca, Bolivia.

[21]. Hernández R., Fernández C. & Baptista P, 2010. Metodología de la


investigación. México.

[22]. Cisneros Rosero A., & Sepúlveda Núñez D., 2012. Código de Hamming para
detección y corrección de errores. Universidad Distrital Francisco José de
Caldas, Bogotá, Colombia.

[23]. Ramírez Benavides K., 2012. Algoritmos de Similaridad y Distancia. Escuela de


Ciencias de la Computación e Informática, Universidad de Costa Rica.

ANEXOS:

ALGORITMO TIEMPO (S) INCERTIDUMBRE


Promedio 0,1219 ±0,0001
Media 0,1472 ±0,0002
Max y Min 0,1280 ±0,0001
Sauvola 0,1602 ±0,0002
Niblack 0,1546 ±0,0002
Otsu 0,4512 ±0,0013
Entropia 0,4385 ±0,0012
Anexo 1: Comparativo de la rapidez en segundos de los algoritmos de
umbralización local y global con una ventana de 15x15.
Fuente: Cortés J, Muriel A & Mondoza J., 2012

ALGORITMO TIEMPO EJECUCIÓN


Minino 0.864461
Entropía 0.420397
Triángulo 0.422047
Otsu 0.428861
Anexo 2: Comparativo de la rapidez de los algoritmos de umbralización global.
Fuente: Cortés J, Muriel A & Mondoza J., 2011

Guevara Honores, S. & Lulichac Rojas, E. 50

Vous aimerez peut-être aussi