Trabajo de Tesis: Universidad Nacional de Trujillo

Universidad Nacional de Trujillo
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS
ESCUELA ACADÉMICO PROFESIONAL DE INFORMÁTICA
Trabajo de Tesis
DESARROLLO DE UN SISTEMA DE RECONOCIMIENTO ÓPTICO DE
MARCAS PARA MEJORAR EL PROCESAMIENTO DE ENCUESTAS
AUTORES:
▪ Guevara Honores, Sara
sarix92@gmail.com
▪ Lulichac Rojas, Eduardo

lulichaceduardo@gmail.com
ASESOR:
Ing. Orlando Salazar Campos
salazarcjo@gmail.com
Trujillo – Perú
2014
Desarrollo de un Sistema de Reconocimiento Óptico de Marcas
para mejorar el Procesamiento de Encuestas
UNT
INDICE GENERAL
CAPITULO I: GENERALIDADES DEL PROYECTO .............................................. 5

1.1. Título: ............................................................................................................. 5
1.2. Realidad Problemática: .................................................................................. 5
1.2.1. Características de la Problemática: ........................................................... 6
1.2.2. Enunciado del Problema: ........................................................................... 6
1.3. Hipótesis: ....................................................................................................... 6
1.4. Variables de Estudio: ..................................................................................... 6
1.4.1. Variable Independiente: ............................................................................. 6
1.4.2. Variable Dependiente: ............................................................................... 6
1.5. Objetivos: ....................................................................................................... 6
1.5.1. Objetivo General: ....................................................................................... 6
1.5.2. Objetivos Específicos:................................................................................ 6
1.6. Justificación:................................................................................................... 6
1.6.1. Justificación Académica: ............................................................................ 6
1.6.2. Justificación Empresarial: .......................................................................... 7
1.7. Antecedentes del Proyecto: ........................................................................... 7
CAPITULO II: MATERIALES Y MÉTODOS............................................................ 9
2.1. Población y Muestra: ...................................................................................... 9
2.1.1. Población: .................................................................................................. 9
2.1.2. Muestra: ..................................................................................................... 9
2.2. Técnicas e Instrumentos: ............................................................................. 10
2.3. Fuentes: ....................................................................................................... 10
2.4. Análisis e Interpretación de Resultados: ...................................................... 10
2.4.1. Diseño de Contrastación: ......................................................................... 10
2.4.2. Indicadores. ............................................................................................. 10
CAPITULO III: MARCO TEÓRICO ....................................................................... 10
3.1. La Encuesta y su procesamiento: ................................................................ 10
3.1.1. Definición de Encuesta: ........................................................................... 10
3.1.2. Historia de la Encuesta: ........................................................................... 10
Guevara Honores, S. & Lulichac Rojas, E. 1

UNT
3.1.3. Tipos de Encuestas en Función de la forma: ........................................... 11

3.1.4. Tipos de pregunta: ................................................................................... 14
3.1.5. Procesamiento de Datos de Encuestas: .................................................. 15
A. Preparación para el ingreso de datos: ..................................................... 15
B. Procesamiento primario de datos: ........................................................... 15
C. Procesamiento secundario de datos: ...................................................... 16
3.2. Visión Computacional y Procesamiento Digital de imágenes: ..................... 16
3.2.1. La Imagen Digital: .................................................................................... 16
3.2.2. Visión Computacional: ............................................................................. 16
3.2.3. Procesamiento Digital de Imágenes: ....................................................... 17
A. Histograma de una imagen: .................................................................... 18
B. Binarización de imágenes: ...................................................................... 19
C. Umbralización: ......................................................................................... 19
D. Filtrado Espacial de Imágenes: ............................................................... 21
3.3. Sistema de Reconocimiento Óptico de Marcas aplicado al Procesamiento
Digital de Imágenes: .................................................................................... 22
3.3.1. Reconocimiento Óptico de Marcas (OMR): ............................................. 22
3.3.2. Sistema de Reconocimiento Óptico de Marcas: ...................................... 23
3.3.3. Etapas del Procesamiento Digital de imágenes: ...................................... 24
A. Captura y Adquisición de imágenes: ....................................................... 24
B. Pre procesamiento: ................................................................................. 25
C. Segmentación: ........................................................................................ 34
D. Descripción: ............................................................................................. 38
E. Reconocimiento: ...................................................................................... 39
CAPITULO IV: DESARROLLO METODOLÓGICO .............................................. 41
4.1. Captura y Adquisición: ................................................................................. 41
4.2. Pre procesamiento: ...................................................................................... 42
4.2.1. Realce de Contraste: ............................................................................... 42
4.2.2. Binarización: ............................................................................................ 43
4.2.3. Reducción de Ruido:................................................................................ 43
4.2.4. Realce de Características: ...................................................................... 44
4.3. Segmentación: ............................................................................................. 44
4.4. Descripción: ................................................................................................. 45

UNT
4.5. Reconocimiento: .......................................................................................... 45

REFERENCIAS BIBLIOGRÁFICAS: .................................................................... 47
INDICE DE FIGURAS
Figura 1: Mecanismos de contestación de una encuesta con preguntas cerradas .. 14

Figura 2: Mecanismos de contestación de una encuesta con preguntas abiertas ... 15
Figura 3: Esquema general de visión por computadora ........................................... 17
Figura 4: Etapas de un sistema de visión computacional ......................................... 17
Figura 5: Esquema general del procesamiento de imágenes. .................................. 17
Figura 6: Imagen y su histograma ............................................................................ 19
Figura 7: Histograma Bimodal Elemental ................................................................. 20
Figura 8: Histograma no Bimodal elemental con 2 umbrales ................................... 20
Figura 9: Máscara cuadrada básica para el umbral local de la vecindad N(r,c). ...... 21
Figura 10: Representación de tipos de ventana para filtrado de imágenes. ............. 22
Figura 11: Imagen e histograma original (superior), Imagen y su histograma
ecualizado (inferior) .................................................................................................. 27
Figura 12: Representación de la primera y segunda derivada del histograma
suavizado mediante promedio. ................................................................................. 28
Figura 13: Procedimiento para la determinación del umbral mediante el método del
Triángulo................................................................................................................... 29
Figura 14: Filtro de la mediana con máscara 3x3 ..................................................... 31
Figura 15: Máscara 5x5 para un filtro gaussiano ...................................................... 32
Figura 16: Matrices para aplicación de filtros de búsqueda de gradiente ................. 33
Figura 17: Matrices para aplicación de filtros detectores de líneas .......................... 33
Figura 18: Segmentación por histograma ................................................................. 34
Figura 19: Histograma de una imagen con múltiples regiones. ................................ 35
Figura 20: Crecimiento de regiones. ......................................................................... 35
Figura 21: Ejemplo de segmentación por división agrupamiento en una imagen
sintética .................................................................................................................... 37
sintética .................................................................................................................... 38

UNT
Figura 23: Espacio paramétrico con 2 parámetros y 3 clases .................................. 39

Figura 24: Ejemplo de Algoritmo de Hamming ......................................................... 41
INDICE DE TABLAS
Tabla 1: Ventajas y desventajas de la Encuesta Personal ....................................... 11

Tabla 2: Ventajas y desventajas de la Encuesta Telefónica ..................................... 12
Tabla 3: Ventajas y desventajas de la Encuesta Postal ........................................... 13
Tabla 4: Ventajas y desventajas de la Encuesta por Internet ................................... 13
Tabla 5: Escala de Calificación para la comparación de técnicas ............................ 41
Tabla 6: Cuadro comparativo de los dispositivos de captura de una imagen digital. 41
Tabla 7: Cuadro comparativo de los algoritmos de realce de Contraste. ................. 42
Tabla 8: Cuadro comparativo de los algoritmos de binarización. ............................. 43
Tabla 9: Cuadro comparativo de los algoritmos de reducción de ruido. ................... 43
Tabla 10: Cuadro comparativo de los algoritmos de realce de características. ........ 44
Tabla 11: Cuadro comparativo de los algoritmos de segmentación. ........................ 44
Tabla 12: Cuadro comparativo de los algoritmos de descripción. ............................ 45
Tabla 13: Cuadro comparativo de algoritmos de reconocimiento ............................. 46

UNT
CAPITULO I: GENERALIDADES DEL PROYECTO
1.1. Título:
Desarrollo de un Sistema de Reconocimiento Óptico de Marcas para mejorar el
procesamiento de encuestas.
1.2. Realidad Problemática:

En la actualidad el manejo de datos ha crecido exponencialmente tal es el caso
que la gran mayoría de empresas se dedican al manejo y extracción de
información a partir de encuestas, entrevistas, cuestionarios, censos etc. Los
estudios de encuestas tienen una amplia aceptación como forma de
proporcionar datos estadísticos en un amplio rango de temas, tanto de
investigación como para objetivos políticos y administrativos (Rosal, Á. B.,
2007).
Con el uso de la tecnología e internet, las encuestas online son muy útiles, sin
embargo la gran limitación de este procedimiento es la dificultad que tienen
determinados colectivos para acceder a esta tecnología, como por ejemplo,
existen empresas que aplican encuestas directamente a campo, a sus
trabajadores o a un conjunto de individuos que en el momento prescinden de
un computador (Díaz R. V, Flavián C. & Guinalíu M., 2012). Las encuestas
online son un medio relativamente económico pero sólo generan índices de
captación de datos entre 3% y 15%; a diferencia de éstas, las encuestas físicas
pueden llegar a generar índices de captación de datos más del 90% (Sucar, L.
E. 2008). Por tal motivo las empresas optan por realizar encuestas físicas,
obteniendo así, un gran volumen de datos en papeles y documentos. Para un
análisis posterior de la información recopilada, se necesita digitalizar y
almacenar los datos de las encuestas.
Cabe resaltar que, se tiene que contratar personal para pasar los datos de las
encuestas en físico hacia el computador, lo cual demanda costo, además el
personal contratado puede cometer errores y por consiguiente no podemos
asegurar que la información procesada sea la correcta. Por otro lado, la
digitalización de los datos de las encuestas puede demorar días o semanas.
Frente a éste problema, se plantea desarrollar un Sistema OMR para mejorar el
procesamiento de Encuestas, el cual pueda automatizar el proceso de
digitalización y almacenamiento de los datos de encuestas físicas, reduciendo
el tiempo y los errores que puedan tener en el procesamiento de éstas de
forma manual.

UNT
1.2.1. Características de la Problemática:

• Elevado tiempo en el procesamiento de encuestas.
• Falta de Optimización en el Procesamiento de encuestas.
• Baja confiabilidad en la información procesada de las encuestas.
1.2.2. Enunciado del Problema:

¿Cómo mejorar el procesamiento de encuestas?
1.3. Hipótesis:
El Desarrollo de un Sistema de Reconocimiento Óptico de Marcas permite
mejorar el procesamiento de encuestas
1.4. Variables de Estudio:
1.4.1. Variable Independiente:

Sistema de Reconocimiento Óptico de Marcas
1.4.2. Variable Dependiente:

Mejora del Procesamiento de Encuestas.
1.5. Objetivos:
1.5.1. Objetivo General:

Desarrollar un Sistema de Reconocimiento Óptico de Marcas para
mejorar el procesamiento de encuestas.
1.5.2. Objetivos Específicos:

 Investigar aspectos fundamentales de Sistema OMR y obtener
información sobre encuestas.
 Análisis para Determinar los algoritmos que se utilizarán en el
desarrollo del Sistema OMR.
 Implementar el Sistema OMR.
 Evaluar los resultados obtenidos.
1.6. Justificación:
1.6.1. Justificación Académica:

Con el presente Proyecto de investigación pretendemos poner en
práctica los conocimientos adquiridos en nuestra formación académica.
Además incentivar a los estudiantes a la investigación de técnicas
pertenecientes al área de Percepción y Visión Computacional para su
aplicación en la solución de problemas empresariales.

UNT
1.6.2. Justificación Empresarial:

En el ámbito Empresarial se busca, evitar arduos trabajos operacionales
en el procesamiento de encuestas, reduciendo el tiempo y mejorando la
confiabilidad de éstas. A mediano y largo plazo, disminuir costos en
salarios de personal que laboran en el área de procesamiento de
encuestas; la inversión en un Sistema OMR tendrá gastos iniciales sin
embargo posteriormente sólo se gastará en su mantenimiento.
Implementar herramientas tecnológicas, usando diversos algoritmos del
área Visión Computacional que permitan automatizar procesos
manuales.
1.7. Antecedentes del Proyecto:

A continuación se presenta las siguientes referencias relacionados al proyecto
de investigación:
Según Granados Córdoba H. (2012), en su tesis “Análisis, diseño e

implementación de un producto de reconocimiento de marcas para el
procesamiento de evaluaciones en el proceso de preparación para los
ECAES en el programa de Ingeniería de Sistemas y Computación de la
UTP”, desarrollado en Colombia en la Universidad Tecnológica de Pereira,
surge como problema el proceso manual de calificación de los ECAES
(Exámenes de Estado de Calidad de la Educación Superior), el cual demanda
mucho tiempo; dando como solución el desarrollo de un producto para la
calificación de dichos exámenes y su posterior análisis por medio de técnicas
de procesamiento de imágenes digitales. Usaron un formato estándar de
marcado, el tipo de marcado burbuja, y el procedimiento para reconocimiento
de marcas consiste en primer lugar la detección de marcas de alineación, luego
alineación de la imagen usando transformaciones lineales, posteriormente
realiza la eliminación de la información innecesaria aplicando una operación de
umbral y finalmente la detección de marcas, es decir respuestas del examen.
Según Fuertes J., Lucena M. y Rodríguez F. (2010), en su Paper

“Procesamiento Automático de Cuestionarios y Encuestas” desarrollado
en España en la Universidad de Jaén, se hace una descripción del problema en
el arduo trabajo que toma al docente revisar un cuestionario evaluativo en cada
clase teórica; dando como propuesta el desarrollo de una aplicación para la
creación, edición, lectura automática y autocorrección de documentos tipo
cuestionario/encuesta, procesando los mismos mediante escáneres
convencionales. Utilizando técnicas de OCR (Reconocimiento óptico de
Caracteres), y algoritmos de procesamiento de imágenes, la aplicación fue
capaz de manejar tipos de preguntas como: preguntas con respuestas de
verdadero y falso, preguntas de elección simple, preguntas de elección múltiple

UNT
(tres, cuatro o cinco opciones), preguntas de escala de Opinion/Linkert (escala

de cinco, siete o nueve) y preguntas de asociación por pares.
Según Inglés R. J y Vicente Ch. C. (2010) en su paper “Desarrollo de un

Sistema de Reconocimiento de Marcas basado en Análisis de Contenido
en Incertidumbre” desarrollado en Colombia, en la Universidad Politécnica de
Cartagena [10], el proceso diseñado pretende aportar una solución versátil a
las tareas de lectura y valoración de documentos de tipo ‘test’ con un Sistema
basado en el análisis de documentos MCQ (Múltiple Choices Questions),
previamente escaneados; en primer lugar, se realiza un aprendizaje
supervisado del formato del documento y, posteriormente, se analiza su
contenido, utilizando vectores de características básicas centradas en la forma
y tamaño de los objetos como: descriptores de Fourier, excentricidad, y ejes de
elipse equivalente. Como resultados, se obtuvo una precisión de
reconocimiento de marcas de 97,54% usando un rotulador (plumón) y un tipo
de trazado de segmentos como criterio de respuesta; por otro lado empleando
lápiz o bolígrafo, y usando un criterio de marcado arbitrario, la precisión bajo al
80%.
Según De armas R. y Bautista L. (2005), en su paper “Reconocimiento

automático de caracteres manuscritos y marcas, orientado al procesado
de encuestas” desarrollado en Colombia en la Universidad de Santander [2],
se describe brevemente el problema en el tedioso proceso de digitación manual
necesario para el archivado de grandes cantidades de documentos y
encuestas; y proponen la implementación de un Sistema de reconocimiento de
caracteres manuscritos y marcas. Se basaron en las etapas del PDI
(Procesamiento Digital de imágenes), usando como descriptores: firma del
contorno, características por zonas de la imagen, descriptores de Fourier; y en
la clasificación de descriptores usaron redes neuronales. Obteniendo como
resultados un sistema de carácter cooperativo capaz de extraer
automáticamente la información de una encuesta que contiene datos de
marcas y/o letras mayúsculas y números; teniendo una precisión para
reconocimiento de marcas del 100% y del 90% para caracteres.

UNT
CAPITULO II: MATERIALES Y MÉTODOS
2.1. Población y Muestra:
2.1.1. Población:
La población está constituida por todas las encuestas proporcionadas
por la “Cámara de Comercio y Producciones La Libertad”.
2.1.2. Muestra:
Dado que la cantidad de la población es indefinida, aplicamos la
siguiente fórmula, para calcular el tamaño de la muestra:
𝑍𝑛2 ∗ 𝑃 ∗ 𝑄
𝑛 =
𝐸2
Donde:
𝑛: muestra.
𝑍𝑛2 : es el grado de confiabilidad deseado para la muestra.
𝑃 : Proporción de la población que tienen las características de interés.
𝑄 : (1- 𝑃), proporción de la población que no tienen las características.
𝐸 2 : Error permitido.
● El nivel de confianza es el 95% que se aplicará de ahí se deduce

que:
𝑍 = 1,96
● Proporción de la población que tiene las características 𝑃. Si no se

conoce el valor 𝑃 se asume que es el 50%, entonces:
𝑃 = 0.5
● Proporción de la población que no tiene las características 𝑄:

𝑄=1-𝑃
𝑄 = 1 - 0.5
𝑄 = 0.5
● El margen de error es de 5% entonces:

𝐸 = 0.05
Aplicando la fórmula:
1.962 ∗ 0.5 ∗ 0.5
𝑛 =
0.052
De esta manera, obtenemos una muestra “n” de 384 encuestas.

UNT
2.2. Técnicas e Instrumentos:

 Técnica: Observación.
 Instrumentos: Ficha de Observación, cronómetro
2.3. Fuentes:
Las encuestas proporcionadas por la empresa “Cámara de Comercio”.
2.4. Análisis e Interpretación de Resultados:
2.4.1. Diseño de Contrastación:

Nuestro proyecto tomará el tipo de diseño “PRE-EXPERIMENTAL”, el
cual se representa por el siguiente gráfico:
𝐗 𝐎𝟏
𝐎𝟐
Donde:
X: Sistema de Reconocimiento óptico de marcas.
O1: Observación del resultado aplicando X.
O2: Observación del resultado sin aplicación de X.
2.4.2. Indicadores.
 Sensibilidad
 Eficacia
 Tiempo de procesamiento de las encuestas.
CAPITULO III: MARCO TEÓRICO
3.1. La Encuesta y su procesamiento:
3.1.1. Definición de Encuesta:

La encuesta es una técnica de investigación que consiste en una
interrogación verbal o escrita que se realiza a las personas con el fin de
obtener determinada información necesaria para una investigación
(Alelú, Cantín, López & Rodríguez; 2009).
3.1.2. Historia de la Encuesta:

El origen de la encuesta se remonta a los principios de taxonomía
(ciencia de la clasificación) agraria, que pasaron más tarde a los
laboratorios, y desde allí a las Ciencias Sociales como técnica para
ordenar a las poblaciones humanas, sin embargo, el desarrollo y la gran
utilización de encuestas que se emplean en la actualidad tiene el fin de
conocer los movimientos de la opinión pública y la predicción del voto a

UNT
finales del siglo XIX. Al término de la Segunda Guerra Mundial el interés

por las encuestas se extendió a casi todos los países. Pero fue tan sólo
en la década de los sesenta que las encuestas fueron ampliamente
utilizadas, con fines electorales, por los medios de comunicación y los
partidos políticos. A partir de entonces, el uso de encuestas ha crecido
en términos casi exponenciales.
Aunque no debemos olvidar que las primeras utilizaciones de la

encuesta en los trabajos de los reformadores ingleses del siglo XVIII,
destacando entre éstas las investigaciones de Charles Booth sobre la
pobreza, y las encuestas sobre condiciones sociales de trabajo en las
grandes industrias realizadas por Weber a principios del siglo XX. Los
trabajos de Weber, a juicio de Lazarsfeld y Obershall, "anticipan, en
todos los aspectos, la perspectiva moderna en el análisis de la conducta
electoral, audiencia de radio, hábitos de compra, o cualquier otra acción
realizada por grandes números de personas bajo circunstancias
comparables". La gran importancia de la encuesta en la sociedad actual
tiene su origen en el enorme desarrollo de la investigación de mercados
y los estudios de opiniones en la sociedad americana de los años 30 y
40. De hecho, a juicio de este autor en los años 70 es cuando se
consolida la encuesta. (Alelú, Cantín, López & Rodríguez; 2009).
3.1.3. Tipos de Encuestas en Función de la forma:
 La encuesta personal
En la encuesta personal, la información se obtiene mediante un

encuentro directo entre el entrevistador y el entrevistado. El
entrevistador va a plantear directamente las preguntas al
entrevistado basándose en un cuestionario que ira cumplimentando
con las respuestas del entrevistado.
Ventajas Desventajas
Elevado índice de respuestas. Es caro y lento
Facilidad de cooperación de las El entrevistador puede ejercer
personas entrevistadas debido a la influencia y debe estar entrenado a
presencia del entrevistador, a la vez la vez que controlado
que permite resolver dudas.
Permite evitar influencia de otras Difícil acceso a ciertas poblaciones.
personas.
Posibilita la realización de entrevistas
largas
Pueden mostrarse materiales.
Pueden obtenerse datos secundarios
(presencia, ambiente. etc.)
Tabla 1: Ventajas y desventajas de la Encuesta Personal

Fuente: Alelú M., Cantín S., López N. & Rodríguez M., 2009

UNT
 La encuesta Telefónica
La encuesta telefónica es un método cuya utilización va en aumento

en los últimos años a medida que se incrementa el número de
hogares con teléfono y mejora, por tanto, su representatividad.
Consiste en la obtención de la información mediante una
conversación telefónica entre el entrevistador y la persona
seleccionada.
Económico con reservas Presenta problemas de muestreo
pues excluye a las personas que no
tienen teléfono.
Técnica muy rápida tanto contactando Existe un nivel de no respuesta no
como recogiendo la información. asociado al muestreo por el hecho
de marcar números telefónicos al
azar.
Puede utilizarse como medio único, No pueden exhibirse materiales
como auxiliar o combinado con otras
técnicas o modalidades de encuesta.
Permite entrevistar a determinadas Brevedad de la entrevista.
poblaciones (personas importantes,
muy ocupadas, de zonas mal
comunicadas. etc.).
Mejor inclinación a responder por No es apropiado para tratar temas
teléfono. delicados ni preguntas complejas.
Se necesitan menos entrevistadores y
la supervisión es adecuada.
Tabla 2: Ventajas y desventajas de la Encuesta Telefónica

 La encuesta Postal
Es la que se emplea en el servicio postal como medio para el envío y

recepción de información a través de un cuestionario. En este caso
el entrevistado llenará el cuestionario directamente y no existirá
comunicación directa entre el encuestado y el entrevistador.
El número de preguntas que se formulan debe ser breve, y las

preguntas cerradas y sencillas de llenar. El cuestionario, además,
tiene que ser atractivo en su presentación y contenido, e incluir un
sobre franqueado para facilitar la devolución del mismo.

UNT
Económico Bajos índices de respuesta.
Se precisa escaso personal para Inconvenientes formales: pueden
realizar la encuesta darse errores en la cumplimentación,
no se controla el orden de las
preguntas y el cuestionario ha de ser
corto
Accesibilidad Impersonal
Flexibilidad de tiempo para el Pueden influir otras persona
entrevistado que ofrece mayor calidad
a la información
Favorece el anonimato No es apropiado para tratar temas
delicados ni preguntas complejas.
Poco útil para encuestas de
respuesta inmediata. Ciertos grupos
quedan excluidos (analfabetos
absolutos y funcionales).
Tabla 3: Ventajas y desventajas de la Encuesta Postal

 La encuesta por Internet
Este tipo de encuesta consiste en "colocar" un cuestionario en una

página web o en enviarlo a los correos electrónicos de un panel
predefinido.
La falta de intermediario entre el No todo el mundo tiene ese
cuestionario y el entrevistado hace que acceso y a lo mejor los que si
los sondeos sean más objetivos. tiene no forman parte de la
muestra.
Se evita que el entrevistador condicione Se pueden mentir muy fácilmente
al entrevistado. datos nulos.
Rapidez en la recogida y análisis de Si no se garantiza el anonimato
datos. pueden darse bajas tasas de
respuesta.
Amplia cobertura La dificultad en controlar la
selección informantes (por
ejemplo, evitar que la misma
persona contesta varias veces a
la encuesta, asegura que la
persona que respondió la
adecuada, y que se.).
El ahorro de tiempo
Los bajos costos
La utilización de medios audiovisuales
durante la encuesta.
Tabla 4: Ventajas y desventajas de la Encuesta por Internet


UNT
3.1.4. Tipos de pregunta:
 Preguntas Cerradas:
Las preguntas cerradas contienen categorías u opciones de

respuesta que han sido previamente delimitadas. Es decir, se
presentan las posibilidades de respuesta a los participantes, quienes
deben acotarse a éstas. Pueden ser dicotómicas (dos posibilidades
de respuesta) o incluir varias opciones de respuesta. Las categorías
de respuesta son definidas a priori por el investigador y se le
muestran al encuestado, quien debe elegir la opción que describa
más adecuadamente su respuesta (Inglés R. J & Vicente Ch. C.
2010).
Figura 1: Mecanismos de contestación de una encuesta con preguntas cerradas

Fuente: Inglés R. J & Vicente Ch. C. 2010
 Preguntas Abiertas:
Las preguntas abiertas no delimitan de antemano las alternativas de

respuesta, por lo cual el número de categorías de respuesta es muy
elevado; en teoría, es infinito, y puede variar de población en
población.

UNT
Figura 2: Mecanismos de contestación de una encuesta con preguntas abiertas

Fuente: Hernández R., Fernández C. & Baptista P, 2010
3.1.5. Procesamiento de Datos de Encuestas:

El procesamiento de datos está diseñado para producir los primeros
resultados de una encuesta unas pocas semanas después de terminado
el trabajo de campo. El procesamiento de Datos está dividido en 3 fases
(Unicef, 2005):
A. Preparación para el ingreso de datos:

La meta de prepararse para la fase de ingreso de datos es el estar
listos para comenzar poco después de iniciar el trabajo de campo.
La fase de preparación comprende los siguientes pasos:
 La obtención del equipo de computación y la organización de un

recinto para el procesamiento de datos
 La identificación y contratación del personal adecuado
 La adaptación de los programas de computación al cuestionario
específico de país
 La creación de un sistema para el manejo de cuestionarios y
archivos de datos.
B. Procesamiento primario de datos:

La meta del procesamiento primario de datos es producir archivos de
datos depurados y editados.
El procesamiento primario de datos comprende los siguientes pasos:
 Ingresar en un archivo de datos todos los cuestionarios de un

conglomerado.
 Revisar la estructura del archivo de datos

UNT
 Ingresar los datos por segunda vez y luego verificar el archivo de

datos
 Respaldar el archivo de datos revisado y verificado
 Llevar a cabo la edición secundaria del archivo de datos
 Respaldar el archivo de datos editado o final.
C. Procesamiento secundario de datos:

La meta del procesamiento secundario de datos es producir archivos
de análisis de datos y crear las tablas estándar. El procesamiento
secundario de datos comprende los siguientes pasos:
 Concatenar todos los archivos de datos de los conglomerados en

un solo archivo de datos
 Exportar los datos a un software de procesamiento de estadístico
 Recodificar las variables para simplificar el análisis
 Crear las tablas necesarias para analizar los datos
 Archivar y distribuir los archivos de datos.
3.2. Visión Computacional y Procesamiento Digital de imágenes:
La Visión Computacional y el Procesamiento de Imágenes tienen mucho en

común y aunque sus objetivos finales son diferentes, usan las imágenes
digitales para cumplirlos, por tal motivo a continuación definimos la imagen
digital.
3.2.1. La Imagen Digital:
Una imagen puede definirse como una función bidimensional 𝑓(𝑥, 𝑦)

donde 𝑥 y 𝑦 son coordenadas en el plano y la amplitud 𝑓 es llamada
intensidad o nivel de gris en ese punto. Una imagen digital estará
compuesta por un número finito de elementos llamados píxeles, cada
uno de ellos con un valor y una posición particular (García S. I., 2008).
3.2.2. Visión Computacional:
Visión Computacional es el estudio de reconocer y localizar objetos en el

ambiente mediante el procesamiento de las imágenes, para entenderlos
y construir máquinas con capacidades similares. El objetivo principal de
la visión computacional es extraer características de una imagen para su
descripción e interpretación por la computadora (Sucar, L. & Gómez G.,
2008).

UNT
Como se observa en la Figura 3, la imagen de entrada es procesada

para extraer los atributos, obteniendo como salida una descripción de la
imagen analizada.
Figura 3: Esquema general de visión por computadora

Fuente: Sucar, L. & Gómez G., 2008
Los sistemas que se basan en Visión Computacional, presentan

generalmente las siguientes etapas:
Figura 4: Etapas de un sistema de visión computacional

Fuente: García S. I, 2008
3.2.3. Procesamiento Digital de Imágenes:
Es una rama de la visión Computacional, la cual tiene como objetivo

mejorar la calidad de las imágenes para su posterior utilización o
interpretación (Sucar, L. & Gómez G., 2008).
Figura 5: Esquema general del procesamiento de imágenes.

Fuente: Sucar, L. & Gómez G., 2008

UNT
A. Histograma de una imagen:
El histograma ℎ𝐼 de una imagen 𝐼 de escala de grises, es un arreglo

vectorial de orden 1𝑥𝐿 elementos que representa gráficamente los
posibles valores de intensidad desde 0 hasta 𝐿 − 1 en el eje
horizontal y con la cuenta ℎ𝐼 (𝑘) de pixeles con igual intensidad
𝐼(𝑟, 𝑐) = 𝑘 en el eje vertical mediante barras.
Sea 𝑆 un conjunto, y #𝑠 cada uno de los elementos de 𝑆. El
histograma ℎ𝐼 (𝑘) de una imagen 𝐼 se define matemáticamente como:
ℎ𝐼 (𝑘) = #{𝑟, 𝑐} | 𝐼(𝑟, 𝑐) = 𝑘, 𝑟 = 1,2,3, … 𝑁, 𝑐 = 1,2,3, … 𝑀}
Donde:
𝑘 = 1,2,3, … 𝐿 − 1
Se debe notar que la sumatoria de todos los elementos del arreglo

que forma el histograma es igual a la totalidad de los pixeles que
forma la ecuación siguiente:
𝐿−1
∑ ℎ𝐼 (𝑘) = 𝑁𝑥𝑀
𝑘=0
Si se divide el histograma ℎ𝐼 sobre la totalidad de pixeles 𝑁𝑥𝑀 de la

imagen, cada iteración ℎ𝐼 (𝑘) representa la probabilidad de
ocurrencia de intensidad 𝐼(𝑟, 𝑐) = 𝑘
𝐿−1 𝐿−1
ℎ𝐼 (𝑘)
∑ = ∑ 𝑝𝐼 (𝑘) = 1
𝑁𝑥𝑀
𝑘=0 𝑘=0
El histograma proporciona información sobre la distribución de la luz

en la imagen en forma de brillo o contraste y puede ser utilizado para
ajustar dichos parámetros (Cortés J, Muriel A & Mondoza J. 2011).

UNT
Figura 6: Imagen y su histograma

Fuente: Grupo de Investigación EDMANS, 2006
B. Binarización de imágenes:
La binarización, es una operación puntual, la cual consiste en
transformar una imagen de entrada a una imagen de salida, de
forma que cada pixel de la imagen de salida sólo depende del
correspondiente pixel de la imagen de entrada. Para obtener una
imagen binaria se hace una transformación no-lineal de la imagen de
entrada, obteniéndose una imagen de salida en la cual cada pixel
puede tomar alguno de dos valores: 0 y 1, 0 y 255, etc. Para esto, se
toma un valor de umbral T (Sucar, L. & Gómez G., 2008).
C. Umbralización:
La umbralización es una técnica de segmentación simple y eficiente

que permite separar los pixel de la imagen en escala de grises en
dos categorías a partir de un una ventana o borde umbral. El umbral
puede ser función de la posición 𝑝(𝑟, 𝑐), de la vecindad 𝑁(𝑟, 𝑐) y de
la intensidad 𝐼(𝑟, 𝑐) actual del pixel (Cortés J, Muriel A & Mondoza J.
2011, Diciembre, 13).
𝑇 = 𝑇((𝑟, 𝑐), 𝑁(𝑟, 𝑐), 𝐼(𝑟, 𝑐))
 Umbral global
El umbral fijo o global es aquel que es único sobre toda la

imagen.
𝑡0 , 𝑠𝑖 𝐼(𝑟, 𝑐) < 𝑇
𝑏(𝑟, 𝑐) = {
𝑡1 , 𝑠𝑖 𝐼(𝑟, 𝑐) ≥ 𝑇
Cuando el valor 𝑡0 = 0 y el valor 𝑡1 =1 se dice que la imagen se

ha binarizado. Esta estrategia puede resultar muy simple

UNT
cuando se posee un histograma que claramente se define como

bimodal (Cortés J, Muriel A & Mondoza J. 2011, Diciembre, 13)
Figura 7: Histograma Bimodal Elemental

Fuente: Cortés J, Muriel A & Mondoza J. 2011
 Umbral Local o adaptivo
Cuando la imagen que se encuentra bajo análisis no posee un

fondo definido y su histograma no es bimodal, se debe encontrar
un umbral T para cada pixel de la vecindad a través de una
máscara que se debe recorrer sobre toda la imagen.
Figura 8: Histograma no Bimodal elemental con 2 umbrales

Fuente: Cortés J, Muriel A & Mondoza J., 2012.
Dicha máscara puede ser de diferentes formas y tamaños, lo

que se define en el momento de implementar el algoritmo para
la determinación del umbral local. El pixel de interés está

UNT
localizado en la fila 𝑟 y la columna 𝑐 (Véase la figura 8), por lo

que dependiendo de la vecindad de este y la operación
efectuada se define el umbral de binarización 𝑇(𝑟, 𝑐) del pixel
[𝑝, 𝐼(𝑝)].
Figura 9: Máscara cuadrada básica para el umbral local de la

vecindad N(r,c).
Fuente: Cortés J, Muriel A & Mondoza J. 2012
De esta forma, no hay un único umbral para toda la imagen, por

lo que pueden aparecer múltiples umbrales sobre la misma
(Cortés J, Muriel A & Mondoza J., 2012).
D. Filtrado Espacial de Imágenes:

Este tipo de filtros suelen consistir en recorrer toda la imagen, pixel a
pixel, y realizar alguna operación aritmética con un número concreto
de pixeles vecinos. Al conjunto de éstos píxeles vecinos se les
denomina ventana o máscara, la cual podrá ser de 3x3, 5x5,... etc.
En la figura 9 se puede ver la representación de una ventana 3x3 y
de 5x5, en la que los píxeles vecinos van del 1 al 9 y del 1 al 25
respectivamente, siendo el píxel central sobre el que se aplica un
algoritmo. La mayoría de los algoritmos suelen ser combinaciones
lineales de los píxeles de la ventana. Para representar un filtro se
suele dar el vector o matriz de convolución o núcleo (Grupo de
Investigación EDMANS, 2006).

UNT
Figura 10: Representación de tipos de ventana para filtrado de imágenes.

3.3. Sistema de Reconocimiento Óptico de Marcas aplicado al Procesamiento

Digital de Imágenes:
3.3.1. Reconocimiento Óptico de Marcas (OMR):
A. Definición:
Según Granados Córdova H. (2012), Optical Mark Recogition

(Reconocimiento óptico de Marcas, en español) también llamado,
Optical Mark Reading (Lectura de Marcas Ópticas, en español) o
simplemente OMR, es el proceso de detectar datos de formatos pre-
impresos marcados por humanos. La tecnología OMR detecta la
ausencia o presencia de una marca, pero no la forma de la marca.
B. Historia:
Los inicios del OMR se remontan a los años 1930, en ese entonces
y hasta en la actualidad, se emplearon y se emplean dispositivos
dedicados para procesar los formatos, tales dispositivos son
conocidos como optical mark reader (lector óptico de marcas, en
español). Con el OMR moderno, donde la presencia de una pequeña
marca de tinta es reconocida, el reconocimiento se hace mediante
un escáner óptico. Algunos de los dispositivos iluminan el papel con
un haz de luz, y con una reflexión contrastante se detectan las áreas
marcadas, ya que estas reflejan menos luz que las áreas blancas del
papel. Otros lectores usan formas pre-impresas sobre papel
transparente y miden la cantidad de luz que pasa a través del papel,

UNT
así pues, una marca en cualquier cara del papel reducirá la cantidad
de luz que pasa a través del mismo (Granados C. H., 2012).
El primer escáner sensor de marcas fue la IBM 805 Prueba Scoring

Machine, leía las marcas midiendo la conductividad eléctrica del
grafito en el papel, usando un par de pinceles de alambre que
recorrían la página. A comienzos de 1930, Richard Warren en IBM
experimentó con sistemas sensoriales óptico de marcas de
puntuación de exámenes. El primer escáner exitoso fue desarrollado
por Everett Franklin Lindquist, en 1955. En 1957, IBM también
desarrolló una exitosa máquina de detección de marcas ópticas y
calificación de exámenes (Autor Anónimo, 2012).
Desde la década de los años 70, se ha trabajado intensamente en el

desarrollo y perfeccionamiento de los denominados sistemas OMR
(Optical Mark Recognition), provistos de un scanner dedicado y que
aplican técnicas de reconocimiento de patrones, normalmente
basadas en las diferencias de contraste detectadas en posiciones
predeterminadas del cuestionario (Inglés R. & Vicente Ch., 2010).
C. Ventajas:
 La tecnología OMR es muy útil y eficiente para recabar
información simple y predeterminada.
 La tecnología OMR puede proporcionar una eficacia del 99,9%
de precisión en la lectura de datos en un documento impreso con
calidad.
D. Desventajas:
 La tecnología OMR no es capaz de reconocer caracteres en letra
manuscrita o a máquina.
 Gran dependencia del formato de formulario empleado.
3.3.2. Sistema de Reconocimiento Óptico de Marcas:

Un Sistema OMR es un conjunto de elementos organizados y capaces
de reconocer el significado de distintas marcas y de convertir las
imágenes escaneadas en información legible por la computadora de
acuerdo a su ubicación (Tejerina R. J., 2011).

UNT
3.3.3. Etapas del Procesamiento Digital de imágenes:
A. Captura y Adquisición de imágenes:

El proceso de captura se refiere a la adquisición de la imagen del
mundo físico. La imagen puede ser capturada o generada de varias
maneras o uso de varios dispositivos:
 Cámara Digital:
Resolución: La mayoría de cámaras comerciales generan
imágenes de 640x480 píxeles que son adecuadas para muchas
aplicaciones.
Memoria: Se interesa alojar en la memoria tantas fotografías
como sea posible antes de proceder a su descarga en la
computadora. Las cámaras pueden incluir memoria interna fija,
así como tarjetas de memoria intercambiables.
Sistema de Transferencia: Para el traspaso de imágenes a la
PC, la mayoría cuentan con conexión USB.
Velocidad: Cabe mencionar que depende del Hardware de la
cámara digital.
 Escáner:
Es un dispositivo que le permite realizar una copia digital de una
fotografía u otro tipo de documento.
Resolución: Depende la precisión del motor que impulsa
pausadamente al CCD (Charge Coupled Device - dispositivo de
carga acoplado) a lo largo del documento. Algunas resoluciones
de escáner son: 300, 600, 1200, 2400, 4800, 9600 dpi (dots per
inch – puntos por pulgada).
Memoria: No necesita memoria externa.
Sistema de Transferencia: Cuenta con un CCD con una sola
fila de píxeles fotosensibles. Este CCD líneal registra el valor
lumínico de cada una de las líneas o filas de una imagen. Al
terminar una línea remite la información de inmediato a la PC
para poder proceder la lectura de la línea siguiente. Además
requiere de una conexión USB.
Velocidad: Depende del motor que impulsa pausadamente al
CCD y también del usuario quien coloca los documentos a
escanear.
 Fotocopiadora digital:
Resolución: Desde 300 dpi hasta 9600 dpi.
Memoria: Usa una memoria RAM, la cual hace que las copias
antes de pasar a la impresión se almacenan en la memoria

UNT
RAM. Con 16MB de RAM permite almacenar aproximadamente

50 hojas A4.
Sistema de Transferencia: Usa puerto USB para pasar las
imágenes al computador.
Velocidad: Debido a su sistema de bandejas y a su memoria
RAM aumenta la velocidad de copiado. Por lo general suele
trabajar con 15mil páginas de tipo multicopia.
B. Pre procesamiento:
Esta etapa Incluye técnicas para la binarización, reducción del ruido,
realce del contraste, realce de ciertos detalles, o características de la
imagen, entre otros.
B.1. Técnicas de realce de contraste:
 Aumento lineal del Contraste
Utilizando el valor de intensidad mínimo y máximo en una

imagen, podemos aumentar su contraste.
La idea básica es llevar el valor mínimo (min) a cero y el
máximo (max) a 255, pensando en imágenes
monocromáticas (0-255). Esta transformación genera que
las intensidades se espacíen de acuerdo a cierto factor o
pendiente; el factor para este aumento lineal de contraste es:
𝐼(𝑥, 𝑦) − 𝑚𝑖𝑛
𝐶(𝑥, 𝑦) = ( ∗ 255)
𝑚𝑎𝑥 − 𝑚𝑖𝑛
Donde 𝐼(𝑥, 𝑦) es la imagen a procesar y 𝐶(, 𝑦) es la imagen

con aumento lineal del contraste.
Se puede verificar fácilmente que para 𝐼(𝑥, 𝑦) en 𝑚𝑖𝑛, 𝐶(𝑥, 𝑦)
resulta cero (el numerador es cero); para 𝐼(𝑥, 𝑦) en 𝑚𝑎𝑥,
𝐶(𝑥, 𝑦) resulta en 255, obteniendo como cociente 1 (Sucar,
L. & Gómez G., 2008).
 Ecualización por Histograma
En principio el principal objetivo de la ecualización de

histograma es producir un histograma con una distribución
uniforme, para obtener un alto nivel de contraste.

UNT
Sea una variable continua 𝑟 que representa los niveles de

gris de una imagen a ser mejorada.
Se asume que 𝑟 ha sido normalizada en el intervalo [0, 1],
con 𝑟 = 0 representando el negro y 𝑟 = 1 representado el
blanco. Posteriormente, se considerará un planteamiento
discreto, en donde los valores de los píxeles estén en el
intervalo [0, 𝐿 − 1], dado que 𝐿 es el número total de posibles
niveles de gris en la imagen. La siguiente es la forma de la
función de transformación de interés.
𝑆 = 𝐴(𝑟) 0 ≤ 𝑟 ≤ 1
Que produce un nivel 𝑆 para cada píxel 𝑟 en la imagen

original. Ésta función de transformación satisface las
siguientes condiciones (Aguilar M. 2007):
 𝐴(𝑟) es de valor Único y se incrementa monotónicamente

en el intervalo 0 ≤ 𝑟 ≤ 1
 0 ≤ 𝐴(𝑟) ≤ 1 para 0 ≤ 𝑟 ≤ 1.
Por tanto se hace la siguiente transformación sobre los

niveles de intensidad en la imagen:
𝑘
𝑛𝑗
𝑆𝑘 = 𝐴 (𝑟𝑘 ) = ∑
𝑛
𝑗=0
Donde: 𝑘 = 0,1,2, … , 𝐿 − 1

UNT
Figura 11: Imagen e histograma original (superior), Imagen y su histograma

ecualizado (inferior)
B.2. Técnicas de Binarización por Umbralización global:
 Método del Mínimo:

El histograma es de tipo bimodal, lo que hace relativamente
fácil la selección del umbral más adecuado. De la inspección
visual del histograma, se puede ver que una buena opción
para la separación de fondo y los objetos es un lugar el cual
corresponde al punto más bajo entre los dos picos principales.
Para realizar el algoritmo se recomienda suavizar la curva
reiteradas veces hasta lograr que solo existan 2 máximos
locales. Si se suaviza el histograma bimodal, se pueden
definir más claramente el umbral adecuado ya que este se
encuentra en el valle localizado entre los 2 únicos picos. Para
localizar los máximos locales, se recurre a los criterios de la
derivada que indican:
Si ℎ′ (𝑘) = 0 𝑦 ℎ′′ (𝑘) < 0 entonces es un máximo local

UNT
El histograma debe generar dos únicos máximos locales.

Seguidamente, se busca el valor mínimo entre los dos
máximos locales siendo este punto el que posee el umbral
adecuado T (Cortés J, Muriel A & Mondoza J. 2011).
Figura 12: Representación de la primera y segunda derivada del

histograma suavizado mediante promedio.
Fuente: Cortés J, Muriel A & Mondoza J. 2011.
 Método del Triángulo
Para determinar el umbral adecuado mediante el método del

triángulo, se deben determinar el valor máximo de la
probabilidad 𝑃𝑚𝑎𝑥 y mínimo 𝑃𝑚𝑖𝑛 de la gráfica del histograma.
El umbral se determina mediante otra línea recta la cual
debe cortar perpendicular a la primera y rodear el
histograma hasta encontrar la máxima distancia d. El punto
donde la recta toca el histograma corresponde a umbral
deseado T. Esta técnica resulta adecuada cuando el
histograma es de tipo bimodal y posee solo picos claramente
definidos (Cortés J, Muriel A & Mondoza J. 2011).

UNT
Figura 13: Procedimiento para la determinación del umbral mediante

el método del Triángulo.
Fuente: Cortés J, Muriel A & Mondoza J. 2011, Diciembre, 13
B.3. Técnicas de Binarización por Umbralización local:
Existen técnicas estadísticas básicas para la determinación de

umbral local, dentro de ellas se encuentran la promedio (mean),
la mediana (median), máximo y mínimo (Midgray) (Cortés J,
Muriel A & Mondoza J. 2012).
 Umbral local mediante la media
En esta técnica se deben ordenar de menor a mayor las

intensidades 𝐼(𝑟, 𝑐) incluidas dentro de los pixeles de la
vecindad 𝑁(𝑟, 𝑐) definidos por la máscara.
El umbral corresponde al valor central 𝐼(𝑟, 𝑐) encontrado que
se convierte en el umbral 𝑇(𝑟, 𝑐) del pixel [𝑝, 𝐼(𝑝)], la
ecuación para calcular el umbral local mediante la media es:
𝑇(𝑟, 𝑐) = 𝑚𝑒𝑑𝑖𝑎(𝑁(𝑟, 𝑐))
El Método de la media da un contenido altamente ruidoso de

la imagen y es el más lento de los métodos estadísticos
básicos (Cortés J, Muriel A & Mondoza J. 2012).

UNT
 Umbral local mediante Máximos y mínimos.
Este método determina la intensidad 𝐼(𝑟, 𝑐)𝑀𝑎𝑥 máxima y

𝐼(𝑟, 𝑐)𝑀𝑖𝑛 mínima encontrada dentro de los pixels de la
vecindad 𝑁(𝑟, 𝑐) definida por la máscara de orden 𝑛𝑥𝑚; este
se te convierte en el umbral 𝑇(𝑟, 𝑐) del pixel [𝑝, 𝐼(𝑝)].
max(𝑁(𝑟, 𝑐)) + 𝑚𝑖𝑛(𝑁(𝑟, 𝑐))

𝑇(𝑟, 𝑐) =
2
Pese a la sencillez de procedimiento, es poco ruidoso y

relativamente el más rápido de los métodos estadísticos
básicos (Cortés J, Muriel A & Mondoza J. 2012, Agosto, 30).
 Algoritmo de Niblack
La técnica planteada por Niblack se base esencialmente en

el cálculo del promedio de las intensidades 𝐼(𝑟, 𝑐) de la
vecindad 𝑁(𝑟, 𝑐).
𝑇(𝑟, 𝑐) = 𝑚𝑒𝑎𝑛(𝑁(𝑟, 𝑐)) + 𝐾 + 𝐷𝑒𝑠𝑣𝑒𝑠𝑡(𝑁(𝑟, 𝑐))
De otro lado, este agrega un aporte que es proporcionado

por la desviación estándar de los valores de la ventana, los
cuales son multiplicados por un factor k el cual toma valores
de 0,2 para objetos brillantes y de -0,2 para objetos opacos.
Niblack considera que K es un valor que debe estar entre -1
y 0. El umbral 𝑇(𝑟, 𝑐) se determina mediante la ecuación de
Máximos y Mínimos para cada uno de los pixeles [𝑝, 𝐼(𝑝)] de
la vecindad (Cortés J., Muriel A. & Mondoza J., 2012).
B.4. Técnicas de reducción de ruido mediante filtros:
 Filtro de Mediana:
Es un método de alisamiento que reduce el
emborronamiento de las fronteras. La idea es reemplazar el
valor de la imagen en un punto por la mediana de los niveles
de brillo vecinos. Es obvio que los puntos aislados de ruido
son eliminados (Molina R., 1998).
Es muy usado para eliminar el ruido impulsivo de una

imagen, La ventaja es que con éste filtro los detalles

UNT
abruptos y bordes de los objetos (correspondientes a las

partes altas de frecuencias) no se difuminan tanto (Grupo de
Investigación EDMANS, 2006)
En el filtro de la mediana la máscara de convolución se

emplea asi:
i. Se toman todos valores de la imagen cubiertos por la
máscara.
ii. Se ordenan de menor a mayor.
iii. Se toma el valor central
Figura 14: Filtro de la mediana con máscara 3x3

Fuente: Mauricio Durán G., 2009
 Filtro Gaussiano:
El reductor de ruido Gaussiano se basa en una máscara que

se convoluciona con una imagen, para efectos de reducir el
ruido. Sin embargo, éste tipo de máscara remueve también
detalles de la imagen y la difumina.
El interés para procesamiento de imágenes es una máscara
en dos dimensiones. En éste sentido, una máscara
Gaussiana de 2D se define de la siguiente manera:
1 − 𝑥 2 +𝑦2 2
𝐺 (𝑥, 𝑦) = 2 𝑒 2𝜎
𝜎
Donde 𝜎 es la desviación estándar de la distribución (Aguilar
M., 2007).

UNT
En la figura 15 se da el ejemplo de una máscara de 5x5 para

el filtro gaussiano con 𝜎 = 1.0
Figura 15: Máscara 5x5 para un filtro gaussiano

Fuente: Aguilar M., 2007.
B.5. Realce de características:
 Filtros de Búsqueda de gradiente:

Las técnicas clásicas de detección de orillas o siluetas, se
basan en diferenciar a la imagen, esto es, encontrar la
derivada respecto a los ejes 𝑥 y 𝑦, o también la llamada
gradiente. Este tipo de filtros buscan y acentúan aquellos
puntos donde la gradiente es mayor. El gradiente viene
definido por:
𝛿𝑓 𝛿𝑓
∇𝑓(𝑥, 𝑦) = ( , )
𝛿𝑥 𝛿𝑦
Dando esta función como resultado un vector cuya dirección
indica la dirección de máxima diferencia entre puntos (la
pendiente) y cuyo módulo indica el valor de la pendiente en
esa dirección (Grupo de Investigación EDMANS, 2006).
En la siguiente figura se presentan las matrices:

UNT
Figura 16: Matrices para aplicación de filtros de búsqueda de gradiente

Fuente: Grupo de Investigación EDMANS, 2006.
Dependiendo de la dirección del gradiente que se quiere

acentuar, se utilizarán unas matrices u otras. Los gradientes
que se obtienen con las matrices de la primera columna
generan un desplazamiento de medio pixel en la imagen,
pero son más fieles al gradiente ideal. En cambio los
gradientes de la segunda columna no desplazan la imagen
pero no se aproximan tanto al gradiente ideal.
 Filtros detectores de Líneas:

Para detectar líneas, en la siguiente figura se muestran las
matrices:
Figura 17: Matrices para aplicación de filtros detectores de líneas


UNT
C. Segmentación:
Proceso de separar la imagen en unidades significativas para llegar
al reconocimiento de marcas.
C.1. Segmentación por Histograma
Es una técnica global que se basa, inicialmente, en asumir que

hay un sólo objeto sobre un fondo uniforme. Por esto se
consideran dos regiones en la imagen y para dividirlas se toma
como base el histograma de intensidades. Si hay dos regiones
se tiene dos picos en el histograma. Entonces se toma el valle
(mínimo) entre los dos y este se considera la división entre las
dos regiones. De esta forma todos los pixeles que correspondan
a un lado del histograma se toman como una región y el resto
como otra, como se ilustra en la siguiente figura (Sucar, L. &
Gómez G. 2008):
Figura 18: Segmentación por histograma

Fuente: Sucar, L. & Gómez G. 2008.
Esta técnica sólo considera la intensidad (u otro atributo) de los

pixeles, sin tomar en cuenta la coherencia espacial de la región.
Por ello, dos pixeles separados en la imagen, pueden
pertenecer a la misma región si tienen intensidades similares.
La técnica de segmentación por histograma se puede extender
a N regiones, tomando cada pico del histograma como una
región y los mínimos correspondientes como las divisiones entre
regiones. Estos se ilustro en la siguiente figura:

UNT
Figura 19: Histograma de una imagen con múltiples regiones.

Fuente: Sucar, L. & Gómez G. 2008
En la práctica, esta forma de segmentación funciona para

“pocas” regiones, ya que al aumentar éstas, se vuelve muy difícil
determinar los picos y valles del histograma.
C.2. Segmentación por Crecimiento de regiones
Son técnicas locales que se basan en tomar un pixel, o conjunto

de pixeles, como una región inicial (semilla) y a partir de éstos
“crecer” la región con puntos similares hasta llegar a ciertos
límites, como se muestra en la siguiente figura:
Figura 20: Crecimiento de regiones.

Fuente: Sucar, L. & Gómez G. 2008.
Para el crecimiento de regiones existen dos problemas básicos:
 Selección de los puntos iniciales: Para esto se puede tomar

ciertos puntos específicos de acuerdo a la información previa
(más negro, más brillante), o buscar grupos de puntos muy
similares y tomar su centroide como punto inicial.
 Criterios de similitud: Para esto se toma alguna heurística de
diferencia máxima entre pixels, junto con criterios de

UNT
conectividad. Se pueden usar otros criterios como el número

de regiones o su dimensión esperada, o información del
histograma (Sucar, L. & Gómez G. 2008).
C.3. Segmentación por División-Agrupamiento
En la segmentación por división {agrupamiento (split & merge),

se combinan técnicas globales (división) y globales
(agrupamiento). Normalmente se parte de una segmentación
inicial, obtenida mediante orillas o regiones, a partir de la cual se
agrupan o dividen regiones. Esto se facilita utilizando una
representación basada en estructura piramidal y/o en arboles
cuaternarios (Sucar, L. & Gómez G. 2008).
 Método basado en pirámide
Inicialmente la imagen se estructura en una forma piramidal,

de forma que cada posible región (cuadrante) está formada
de 4 subregiones. Para ello se representa la imagen a
diferentes resoluciones, desde cierta resolución máxima
hasta cierta resolución mínima. Entonces se aplica el
siguiente algoritmo:
Considerar una medida de homogenidad: H (diferencia en
niveles de gris, por ejemplo). A partir de cierto nivel
(arbitrario) de la pirámide:
 División. Si una región no satisface la medida (H falso),

dividirla en 4 regiones, continuado a los niveles inferiores
de la pirámide.
 Agrupamiento. Si 4 regiones contiguas (mismo cuadrante)
satisfacen el criterio (H verdadera), agruparlas en una
región y continuar a los niveles superiores de la pirámide.
Una vez segmentada la imagen en cuadrantes en cada nivel,

realizar un agrupamiento de regiones vecinas a diferentes
niveles. Si hay dos regiones contiguas, al mismo o diferente
nivel, tal que 𝐻(𝑅𝑖 ∪ 𝑅𝑗) = 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜, agruparlas en una
región. Si no hay más regiones que dividir o agrupar,
terminar.
Al final del proceso, se obtiene una segmentación en N

regiones contiguas de la imagen. La suavidad en la

UNT
aproximación de la forma de las regiones mediante

cuadrantes, depende de la resolución máxima utilizada en la
pirámide. La siguiente figura ilustra esta técnica para una
imagen sintética con dos regiones (Sucar, L. & Gómez G.
2008).
Figura 21: Ejemplo de segmentación por división agrupamiento en

una imagen sintética
 Método basado en árboles cuaternarios
Una variante del método de división de agrupamiento es una

técnica basada en árboles cuaternarios (Quadtrees) que se
utiliza cuando se desea segmentar cierta región en
particular.
El algoritmo de segmentación para una región es el

siguiente:
 Dividir la imagen en 4 y calcular la media (𝜇) y desviación

estandar (𝜎) de la intensidad en cada cuadrante.
 Si es una región uniforme en rango, tomar dicho
cuadrante como una región base y pasar al paso 5.
 Si es una región uniforme fuera de rango, desechar dicho
cuadrante.
 Si es una región no uniforme, entonces dividir el
cuadrante en 4 y repetir (1) a (3) hasta que todos los
cuadrantes sean región base o estén fuera de rango, o ya
no sea posible dividirlos.
 Tomar como la región buscada el cuadrante mayor y
unirle todos los cuadrantes adyacentes que satisfagan la

UNT
condición de región uniforme en rango (Sucar, L. &

Gómez G. 2008).
D. Descripción:
Es la obtención de características convenientes para diferenciar un
tipo de marca, como: la forma, el tamaño, área, etc.
D.1. Descriptores de frontera según su longitud:

La longitud de un contorno es uno de los descriptores más
sencillos, Si se cuenta el número de pixeles en el contorno se
obtendrá una aproximación de su longitud. Si la frontera ha sido
codificada usando cadenas de códigos, el número de
componentes verticales más el de horizontales más el de
diagonales multiplicados por √2 da la longitud exacta (Grupo de
Investigación EDMANS, 2006).
El diámetro de una frontera B se define como:

𝐷𝑖𝑎𝑚(𝐵) = máx [ 𝐷 (𝑝1 , 𝑝2 )]
𝑖𝑗
Donde 𝐷 es una medida de distancia y 𝑝1 𝑦 𝑝2 son puntos de la
frontera.
D.2. Descriptor de región según su Área:

Para realizar la medida del área de un objeto, se utiliza el vector
que define su contorno. EL área se va a definir como el número
de píxeles que están dentro del contorno. Uno de los métodos
más rápidos, consiste en contar el número de píxeles que hay
en cada fila de puntos del objeto.

sintética
Fuente: Grupo de Investigación EDMANS, 2006.

UNT
De esta forma el cálculo del área es muy sencillo:

𝑚𝑎𝑥(𝑓𝑖𝑙𝑎𝑠)
Á𝑟𝑒𝑎 = ∑ 𝑚𝑎𝑥(𝑐𝑜𝑙𝑢𝑚𝑛𝑎(ℎ)) − 𝑚𝑖𝑛(𝑐𝑜𝑙𝑢𝑚𝑛𝑎(ℎ))

ℎ−𝑚𝑖𝑛(𝑓𝑖𝑙𝑎𝑠)
E. Reconocimiento:
El propósito final de visión es reconocimiento. Para ello es necesario

realizar una interpretación de los datos de entrada. Esto se logra
mediante el establecimiento de una correspondencia (match) entre
los atributos obtenidos de la(s) imagen(es) a través de los procesos
de visión de nivel bajo e intermedios y los modelos representados en
la computadora. Dependiendo del tipo de representación podemos
distinguir 3 tipos de técnicas para correspondencia (Sucar, L. &
Gómez G. 2008):
E.1. Reconocimiento estadístico de patrones:
Consiste, básicamente, en buscar, dentro de un espacio

paramétrico, la clase (modelo) más “cercana" a la descripción
del objeto en la imagen. Si consideramos que se tienen, por
ejemplo, dos parámetros y 3 tipos (clases) de objetos, el
problema se puede visualizar como se presenta en la siguiente
figura:
Figura 23: Espacio paramétrico con 2 parámetros y 3 clases

Cada punto representa un objeto. Los objetos similares se

muestran con diferentes símbolos (x, +, *), los cuales,
normalmente, están agrupados en el espacio paramétrico. Dado
un objeto desconocido, el problema es encontrar a que grupo

UNT
(clase) pertenece dados sus parámetros (Sucar, L. & Gómez G.

2008).
E.2. Algoritmo de Hamming:

Es un código que se utiliza en la detección y corrección de
errores que se producen en la transmisión de códigos binarios,
la palabra de código se conforma por los bits de comprobación y
los bits de información.
La Distancia entre dos combinaciones binarias, viene dada por
el número de bits que hay que cambiar en una de ellas para
obtener la otra.
El código Hamming se genera a partir de una distancia mínima

de 3, ya que una distancia de 1 o 2 es inconveniente para poder
generar un código para detectar un error.
La distancia mínima de Hamming está dada por la siguiente
ecuación:
𝐷𝑚 = 2𝑋 + 1
Donde 𝐷𝑚 es la distancia mínima de un código para permitir la

corrección de datos y 𝑋 es las líneas de datos.
Si se tuviese una distancia de 1 no tendríamos valores para

saber si hay o no un error.
Si se tienen una distancia de 2 se podría lograr un sistema de
corrección de error con un bit de paridad pero el problema que
esto lleva es que un sistema con distancia 2 puede tener datos
erróneos que pueden pasar como datos correctos. Con la
distancia de 3 se tiene que los códigos no van a tener datos o
resultados similares por ende se puede detectar el error y se
puede desarrollar un sistema para su corrección como el
Hamming (Cisneros Rosero A., & Sepúlveda Núñez D., 2012).
Ejemplo: Se tiene los vectores: ℎ1=GRANDE y ℎ2= GRANOS

Para calcular la distancia de Hamming, Podemos definir la
distancia entre ellas como el número de caracteres en las
mismas posiciones que son distintos, número de entradas
diferentes entre los vectores.

UNT
Figura 24: Ejemplo de Algoritmo de Hamming

Fuente: Ramírez Benavides K., 2012
Conforme a la figura 23 se observa que hay 2 errores, por tanto

la distancia de Hamming para el ejemplo está dada por:
𝐻𝐷 (ℎ1, ℎ2) = 2
CAPITULO IV: DESARROLLO METODOLÓGICO
ANÁLISIS DE TÉCNICAS
A continuación se realizará la comparación de técnicas en las etapas

correspondientes a la metodología que se utiliza en el desarrollo de la presente
tesis, para ello se usará una escala de 1 al 5 según la siguiente consideración:
1 2 3 4 5
Malo Regular Normal Bueno Excelente
Tabla 5: Escala de Calificación para la comparación de técnicas

Fuente: Elaboración propia
4.1. Captura y Adquisición:
Como se ha descrito en el apartado 3.3.3., una imagen puede ser capturada

mediante el uso de 3 dispositivos de Adquisición.
DISPOSITIVOS
CRITERIOS
Cámara Escáner Fotocopiadora
Digital Digital
Resolución 2 4 4
Memoria 2 2 5
Sistema de Transferencia 3 3 3
Velocidad de Captura 3 1 5
TOTAL 10 10 17
Tabla 6: Cuadro comparativo de los dispositivos de captura de una imagen digital.

Fuente. Elaboración Propia.

UNT
Según los resultados obtenidos en el cuadro anterior, el dispositivo que se

usará para la adquisición de imágenes en el presente trabajo será:
Fotocopiadora Digital.
4.2. Pre procesamiento:
Para analizar algunos algoritmos, se consideró criterios como: Coste

computacional, y Tiempo de ejecución; éstos criterios serán calificados con
la misma escala del 1 al 5, teniendo en cuenta que la ponderación más alta
favorece al desarrollo del sistema, y que todo sistema computacional requiere
algoritmos que tengan Bajo coste computacional, y Menor tiempo de
ejecución.
4.2.1. Realce de Contraste:
En el apartado 3.3.3 parte B.1, se mencionan 2 técnicas de realce de

contraste. La técnica Aumento Lineal del contraste procesa la matriz
de la imagen 𝐼(𝑥, 𝑦) para transformarla recorriendo todas sus filas y
columnas, es decir dos bucles, siendo su complejidad O(𝑛2 ). La técnica
Ecualización por histograma procesa el histograma de la imagen, el
cual es un vector siendo su complejidad O(n).
Aumento Ecualización
ALGORITMOS lineal del por
CRITERIOS Contraste histograma
Coste computacional 2 3
Distribución uniforme de niveles 3 4

de gris en la imagen
Realce de pixeles de interés 2 3
TOTAL 7 10
Tabla 7: Cuadro comparativo de los algoritmos de realce de Contraste.

Fuente. Elaboración Propia
Conforme a los resultados de la tabla 7 se eligió el método de

ecualización por histograma para el realce de contraste.

UNT
4.2.2. Binarización:
El punto clave de la binarización es la elección del valor del umbral, se

ha considerado 2 tipos de umbralización: global y local. Existen
diferentes algoritmos para cada tipo de umbralización. Según el Anexo
1 y 2, se evaluará el criterio: tiempo de ejecución para los algoritmos.
Mínimo Triángulo Media Máximos Niblack

ALGORITMOS y Mínimos
CRITERIOS
Tiempo de ejecución 1 2 3 4 2
Adecuado para 4 4 0 0 0
Histogramas Bimodales
Adecuado para imágenes 3 3 1 1 1
estáticas
TOTAL 12 13 6 7 5
Tabla 8: Cuadro comparativo de los algoritmos de binarización.

Fuente: Elaboración Propia.
Conforme se analizó los criterios en la tabla 8, se eligió el método del

Triángulo como el algoritmo de Binarización para las imágenes.
4.2.3. Reducción de Ruido:

Para elegir el tipo de filtro para la reducción de ruido en la imagen, se
utilizó el siguiente cuadro comparativo:
ALGORITMOS Filtro Filtro

CRITERIOS Mediana Gaussiano
Preserva bordes 3 2
Preserva esquinas 1 3
Preserva líneas finas 1 3
Reduce ruido impulsivo 2 3
Suavizado uniforme 2 3
TOTAL 9 14
Tabla 9: Cuadro comparativo de los algoritmos de reducción de ruido.

Fuente: Elaboración Propia.

UNT
Según la tabla 9, el algoritmo que se adapta a las necesidades es:

Filtro Gaussiano.
4.2.4. Realce de Características:
ALGORITMOS Búsqueda de Detector

CRITERIOS gradiente de
Líneas
Acentúa bordes 4 2
Acentúa pixeles de interés 3 4

Confiabilidad en presencia de
2 4
ruido
TOTAL 9 10
Tabla 10: Cuadro comparativo de los algoritmos de realce de características.

Fuente: Elaboración Propia
Conforme a la tabla 10, el algoritmo más adecuado para el realce de

características es: Detector de Líneas.
4.3. Segmentación:
Segmentación Segmentación Segmentación

ALGORITMOS por por por División-
Histograma Crecimiento de Agrupamiento
CRITERIOS regiones
Tiempo de Ejecución 4 2 2
Susceptible a los objetos 3 3 3

a una imagen
Facilita la búsqueda de 2 2 4
regiones de interés
Divide la imagen con 3 1 4
facilidad
TOTAL 12 8 13
Tabla 11: Cuadro comparativo de los algoritmos de segmentación.


UNT
Conforme a la tabla 11, el algoritmo más adecuado para la etapa de

segmentación es: Segmentación por División-Agrupamiento.
4.4. Descripción:
ALGORITMOS Descriptor de Descriptor

CRITERIOS frontera según su de región
longitud según su
área
Tiempo de Ejecución 3 4
Dependencia de cantidad de 3 4
pixeles para la región de interés
Probabilidad de Acierto en el 3 3
objeto
Confiabilidad al describir el objeto 1 2
TOTAL 10 13
Tabla 12: Cuadro comparativo de los algoritmos de descripción.

De acuerdo al cuadro comparativo anterior, el algoritmo más adecuado para

la etapa de descripción es: Descriptor de región según su área.
4.5. Reconocimiento:
Se consideraron los siguientes criterios en la etapa de reconocimiento dado

que, los descriptores son vectores, los cuales indican las respuestas (marcas)
para cada ítem de la encuesta. Para reconocer la respuesta del usuario en un
ítem, se desarrollará una búsqueda por exactitud de los descriptores
obtenidos (encuesta) con los descriptores de comprobación (opciones de
respuestas), especificados por el formato de la encuesta.

UNT
ALGORITMOS Estadístico de Hamming

CRITERIOS patrones
Comparación de descriptores de 3 3
objetos
Búsqueda por exactitud 1 3
Detección de errores 2 3
TOTAL 6 9
Tabla 13: Cuadro comparativo de algoritmos de reconocimiento

Fuente: Elaboración propia
ESQUEMA DE DESARROLLO DEL SISTEMA
 Uso de fotocopiadora digital

Paso 1: Captura y  Escaneo de encuestas
Adquisición  Imágenes Digital de encuestas
Ecualización por Histograma

 Elaboración de Histograma
Paso 2: Realce de  Distribución uniforme del Histograma
Contraste  Obtención de niveles de contraste
Método del Triangulo

 Calculo del valor máximo y mínimo
del Histograma
Paso 3: Binarización  Calculo del Umbral con el valor Máx y
Min
 Utilización del Umbrar para binarizar
la imagen

UNT
Descriptor de región según su área:

Paso 4: Reducción de  Aplicar mascara de detección de
Ruido contorno
 Calcular el área que está dentro del
contorno, contando los pixeles.
Algoritmo de Hamming:
 Transformar las áreas calculadas a
Paso 5: Realce de valores binarios
Características  Almacenar resultados en forma
matricial
 Comparar fila a fila los resultados
obtenidos con los valores esperados.
Filtro Gaussiano:
Paso 6: Segmentación  Definir mascara de Convolución
 Aplicar mascara a Imagen Binarizada
 Almacenar Imagen sin ruido
Filtro detector de líneas:

Paso 7: Descripción  Aplicar mascara de detección de
líneas
 Aplicar mascara de realce de
características
Segmentación por División-Agrupamiento:

Paso 8: Reconocimiento  Dividir la imagen con una medida de
homogeneidad
 Agrupar las regiones contiguas que
cumplen el criterio de Homogeneidad

UNT
REFERENCIAS BIBLIOGRÁFICAS:
[1]. Fuertes J., Lucena M. & Rodríguez F. (2010). Procesamiento Automático de

Cuestionarios y Encuestas. Iniciación a la Investigación, vol. 4, 11.
Departamento de Informática, Universidad de Jaén, Campus de las Lagunillas,
23071, Jaén, España.
[2]. De armas R. & Bautista L. (2005, Noviembre 03). Reconocimiento Automático

de caracteres manuscritos y marcas, orientado al procesado de encuestas.
Escuela de Ingeniería Eléctrica, Electrónica y de Telecomunicaciones,
Universidad de Santander (UDES), Floridablanca, Colombia.
[3]. Rosal, Á. B. (2007, Noviembre 23). Diseño y análisis de encuestas.

Recuperado el 19 de agosto del 2014 en:
http://aborges.webs.ull.es/encuesta_com.pdf.
[4]. Díaz R. V, Flavián C. & Guinalíu M. (2012, Noviembre 14). Encuestas en

Internet: Algo más que una simple versión mejorada de la tradicional encuesta
autoadministrada. Recuperado el 1 de setiembre del 2014 en:
http://www.aedemo.es/aedemo3/socios/revista82/Ad-82-06.pdf
[5]. Instituto Pyme. (2002). SMEToolkit. Técnicas de investigación de mercado.

Recuperado el 23 de Agosto del 2014 en:
http://mexico.smetoolkit.org/mexico/es/content/es/196/T%C3%A9cnicas-de-
investigaci%C3%B3n-de-mercado.
[6]. Sucar, L. & Gómez G. (2008). Vision Computacional. Puebla, México.

Recuperado el 25 de Agosto del 2014 en:
http://ccc.inaoep.mx/~esucar/Libros/vision-sucar-gomez.pdf.
[7]. Granados, C. H (2012, Febrero 20) Análisis, diseño, implementación de un

producto de reconocimiento de Marcas para el procesamiento de evaluaciones
en el proceso de preparación para los ECAES en el programa de ingeniería de
sistemas y computación de la UTP. Ingeniería de sistemas y computación
.Universidad tecnológica de Pereira. Colombia.
[8]. García S. I (2008). Visión Artificial y Procesamiento Digital de Imágenes usando

Matlab. Recuperado el 24 de agosto del 2014 en: http://vision-artificial-
matlab.blogspot.com/

UNT
[9]. Alelú M., Cantín S., López N. & Rodríguez M. (2009, Octubre, 03). Estudio de
Encuestas. Área de Métodos de investigación de Educación Especial
Universidad Autónoma de Madrid.
[10]. Inglés R. J & Vicente Ch. C. (2010) Desarrollo de un sistema de

Reconocimiento de Marcas basado en Análisis de Contenido en Incertidumbre.
[11]. Unicef (2005) Manual para la Encuesta de Indicadores Múltiples por

Conglomerdos 2005. División de Politicas y planificaciones de UNICEF.
[12]. Fuentelsaz G. C (2004) Cálculo del tamaño de la muestra. Hospital

Universitario “Vall d Hebron”. Barcelona
[13]. Autor Anónimo, (2012) Reconocimiento óptico de marca, Fondo OMR, Software
OMR, Historia, General. Recuperado el 01 de septiembre del 2014 en:
http://centrodeartigo.com/articulos-utiles/article_122553.html
[14]. Tejerina R. J. (2011). Implicancia en la digitalización, OCR, ICR, y OMR.

Universidad Provada de Tacna. Recuperado el 27 de agosto del 2014 en:
https://es.scribd.com/doc/134686797/02-OCR-OMR-ICR
[15]. Cortés J, Muriel A & Mondoza J. (2011, Diciembre, 13) Comparación

cuantitativa y cualitativa de las Técnicas básicas de umbralización global
basadas en histogramas para el procesamiento digital de imágenes.
Universidad Tecnológica de Pereira. Colombia
[16]. Cortés J, Muriel A & Mondoza J. (2012, Agosto, 30) Comparación cuantitativa y
cualitativa de las Técnicas básicas de umbralización local para el
procesamiento digital de imágenes. Universidad Tecnológica de Pereira.
Colombia.
[17]. Aguilar M. (2007, Diciembre, 19) Desarrollo de una etapa de pre-procesamiento

para reducción de ruido, mejoramiento de contraste y de nitidez en imágenes
digitalizadas de geles de electroforesis, Insitituto Tecnológico de Costa Rica.
[18]. Grupo de Investigación EDMANS, 2006. Técnicas y algoritmos Básicos de

Visión Artificial. Universidad de La Rioja, España.
[19]. Molina R., 1998. Introducción al Procesamiento y Análisis de imágenes

Digitales. Universidad de Granada.

UNT
[20]. Mauricio Durán G., 2009. Reconocimiento de caracteres ópticos OCR por
medio de correlación y redes neuronales. Universidad Pontifica Bolivariana.
Floridablanca, Bolivia.
[21]. Hernández R., Fernández C. & Baptista P, 2010. Metodología de la

investigación. México.
[22]. Cisneros Rosero A., & Sepúlveda Núñez D., 2012. Código de Hamming para
detección y corrección de errores. Universidad Distrital Francisco José de
Caldas, Bogotá, Colombia.
[23]. Ramírez Benavides K., 2012. Algoritmos de Similaridad y Distancia. Escuela de

Ciencias de la Computación e Informática, Universidad de Costa Rica.
ANEXOS:
ALGORITMO TIEMPO (S) INCERTIDUMBRE

Promedio 0,1219 ±0,0001
Media 0,1472 ±0,0002
Max y Min 0,1280 ±0,0001
Sauvola 0,1602 ±0,0002
Niblack 0,1546 ±0,0002
Otsu 0,4512 ±0,0013
Entropia 0,4385 ±0,0012
Anexo 1: Comparativo de la rapidez en segundos de los algoritmos de
umbralización local y global con una ventana de 15x15.
Fuente: Cortés J, Muriel A & Mondoza J., 2012
ALGORITMO TIEMPO EJECUCIÓN

Minino 0.864461
Entropía 0.420397
Triángulo 0.422047
Otsu 0.428861
Anexo 2: Comparativo de la rapidez de los algoritmos de umbralización global.
Fuente: Cortés J, Muriel A & Mondoza J., 2011

Trabajo de Tesis: Universidad Nacional de Trujillo

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Trabajo de Tesis: Universidad Nacional de Trujillo

Transféré par

Droits d'auteur :

Formats disponibles

Universidad Nacional de Trujillo

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

ESCUELA ACADÉMICO PROFESIONAL DE INFORMÁTICA

▪ Lulichac Rojas, Eduardo

CAPITULO I: GENERALIDADES DEL PROYECTO .............................................. 5

Guevara Honores, S. & Lulichac Rojas, E. 1

3.1.3. Tipos de Encuestas en Función de la forma: ........................................... 11

Guevara Honores, S. & Lulichac Rojas, E. 2

4.5. Reconocimiento: .......................................................................................... 45

Figura 1: Mecanismos de contestación de una encuesta con preguntas cerradas .. 14

Guevara Honores, S. & Lulichac Rojas, E. 3

Figura 23: Espacio paramétrico con 2 parámetros y 3 clases .................................. 39

Tabla 1: Ventajas y desventajas de la Encuesta Personal ....................................... 11

Guevara Honores, S. & Lulichac Rojas, E. 4

CAPITULO I: GENERALIDADES DEL PROYECTO

1.2. Realidad Problemática:

Guevara Honores, S. & Lulichac Rojas, E. 5

1.2.1. Características de la Problemática:

1.2.2. Enunciado del Problema:

1.4. Variables de Estudio:

1.4.1. Variable Independiente:

1.4.2. Variable Dependiente:

1.5.1. Objetivo General:

1.5.2. Objetivos Específicos:

1.6.1. Justificación Académica:

Guevara Honores, S. & Lulichac Rojas, E. 6

1.6.2. Justificación Empresarial:

1.7. Antecedentes del Proyecto:

Según Granados Córdoba H. (2012), en su tesis “Análisis, diseño e

Según Fuertes J., Lucena M. y Rodríguez F. (2010), en su Paper

Guevara Honores, S. & Lulichac Rojas, E. 7

(tres, cuatro o cinco opciones), preguntas de escala de Opinion/Linkert (escala

Según Inglés R. J y Vicente Ch. C. (2010) en su paper “Desarrollo de un

Según De armas R. y Bautista L. (2005), en su paper “Reconocimiento

Guevara Honores, S. & Lulichac Rojas, E. 8

CAPITULO II: MATERIALES Y MÉTODOS

2.1. Población y Muestra:

● El nivel de confianza es el 95% que se aplicará de ahí se deduce

● Proporción de la población que tiene las características 𝑃. Si no se

● Proporción de la población que no tiene las características 𝑄:

● El margen de error es de 5% entonces:

De esta manera, obtenemos una muestra “n” de 384 encuestas.

Guevara Honores, S. & Lulichac Rojas, E. 9

2.2. Técnicas e Instrumentos:

2.4. Análisis e Interpretación de Resultados:

2.4.1. Diseño de Contrastación:

CAPITULO III: MARCO TEÓRICO

3.1. La Encuesta y su procesamiento:

3.1.1. Definición de Encuesta:

3.1.2. Historia de la Encuesta:

Guevara Honores, S. & Lulichac Rojas, E. 10

finales del siglo XIX. Al término de la Segunda Guerra Mundial el interés

Aunque no debemos olvidar que las primeras utilizaciones de la

3.1.3. Tipos de Encuestas en Función de la forma:

En la encuesta personal, la información se obtiene mediante un

Tabla 1: Ventajas y desventajas de la Encuesta Personal

Guevara Honores, S. & Lulichac Rojas, E. 11

La encuesta telefónica es un método cuya utilización va en aumento

Tabla 2: Ventajas y desventajas de la Encuesta Telefónica

Es la que se emplea en el servicio postal como medio para el envío y

El número de preguntas que se formulan debe ser breve, y las

Guevara Honores, S. & Lulichac Rojas, E. 12

Tabla 3: Ventajas y desventajas de la Encuesta Postal