Vous êtes sur la page 1sur 61

RESUMEN El presente trabajo de Proyecto de tesis Implementacin de un sistema de informacin basado en la deteccin biomtrica facial y su aplicacin en los negocios

utilizando software libre, es realzado porque he observado que hoy en da los negocios son ms competitivos, por lo que se necesita aprovechar todas las tecnologas existentes para mantenerse y liderar el mercado, por lo cual es de vital importancia conocer y tener la informacin de los clientes en tiempo real para ofrecer efectivamente productos o servicios obteniendo as su preferencia y fidelidad aumentando las ventas y por tanto las utilidades del negocio en este caso implementaremos este sistema en la empresa Negociaciones Pool s.a. La cual se dedica a la fabricacin y compra de prendas de vestir para distribuir y vender en sus 4 tiendas minoristas ubicadas en las ciudad de Huaral(2) y Chancay(2).

Para ello se ha utilizado como herramienta metodolgica UML y como herramienta de sistematizacin a RUP para la elaboracin de diagramas por otro lado, las herramientas que se utilizaran sern: SharpDevelop 4.3, Base de Datos en Mysql adems del framework de reconocimiento biomtrico EMGUCV para el desarrollo del sistema, de tal forma que el sistema permita identificacin , segmentacin, historial y comportamiento de compras de los clientes, para que se apliquen tcnicas ms efectivas de ventas y marketing.

En busca de este propsito, se ha desarrollado el presente trabajo de tesis que se encuentra organizado en los siguientes captulos:

CAPTULO I: PROBLEMTICA DE LA INVESTIGACIN. Aqu se describe la situacin actual de la empresa Negociaciones POOL s.a. cuyo principales problemas son : la constante prdida de clientes, aumento de quejas de clientes as como las devoluciones , generando esto disminucin de las ventas y por lo tanto reduccin de las utilidades, necesitando una herramienta tecnolgica que le ayude a implantar planes de marketing personalizados , con lo cual se hace el planteamiento del problema, y establecindose el objetivo general y especficos para dar solucin al problema, tambin incluye aspectos que justifican la investigacin. CAPTULO II: MARCO TEORICO

En esta parte se incluyen las distintas investigaciones que han servido de referencia para llevar a cabo el desarrollo de este proyecto, tambin se incluye la descripcin de cada una de las herramientas tecnolgicas que nos servirn para el desarrollo e implementacin del Sistema de Informacin. CAPTULO III: MARCO METODOLGICO En este captulo, se establece el tipo y diseo de investigacin, incluyendo su poblacin y muestra para el desarrollo del Proyecto, para luego plantear la solucin con la descripcin de la Hiptesis, refrendada en la operacionalizacin de las variables. Tambin se establece el mtodo y tcnica para llevar a cabo esta investigacin, describiendo los instrumentos a utilizar, para luego llevar a cabo el anlisis de los datos recopilados. CAPTULO IV: MARCO ADMINNISTRATIVO Para este captulo se ha tomado en cuenta los tiempos que estimados que se necesitara para hacer el proyecto tabulndolos en el cronograma de actividades, tambin se calculara el presupuesto y se propondr el financiamiento respectivo del proyecto.

1.0 DATOS INFORMATIVOS 1.1 Titulo Implementacin de un sistema de informacin basado en la deteccin biomtrica facial y su aplicacin en los negocios utilizando software libre 1.2 Personal Investigador 1.2.1 Autor Cesar Edward Vsquez Manrique 1.2.2. Asesor JUAN CARLOS GUITIERREZ CACERES 1.3 Tipo de Investigacin Tecnolgica - Cuasi experimental 1.4 Facultad y Escuela Profesional Facultad de Ingeniera, Arquitectura y Urbanismo Escuela Acadmico Profesional de Ingeniera de Sistemas. 1.5 Localidad e institucin donde se desarrollar el proyecto Empresa LSSUPPORT SAC. Av. Batalln callao sur #627 Surco -Lima 1.6 Duracin estimada del Proyecto 11 meses. 1.7 Fecha de Inicio 05 mayo 2013

1.8 Presentado por

___________________________________________________ CESAR EDWARD VASQUEZ MANRIQUE AUTOR

____________________________________________________ JUAN CARLOS GUITIERREZ CACERES Asesor

Aprobado por

_______________________________ RAMOS MOSCOL MARIO FERNANDO Presidente

___________________________ MEJIA CABRERA IVAN HEBER Secretario

______________________________ JAIME ARTURO BRAVO RUIZ Vocal

INDICE DE CONTENIDOS CAPITULO I: PROBLEMATICA DE LA INVESTIGACION 1.1. Realidad Problemtica. 1.2. Planteamiento del problema 1.3 Formulacin del Problema 1.4 Justificacin e Importancia de la Investigacin 1.5 Objetivos 1.5.1 Objetivo General 1.5.2 Objetivos Especficos CAPITULO Il: Marco Terico 2.1 2.2 Antecedentes de la Investigacin Base Terica 2.2.1 Mtodo de Deteccin de Rostros de Viola Jones 2.2.2 Pre procesamiento de la imagen 2.2.2.1 Transformacin de la imagen a escala de grises 2.2.2.2. Escalado por Interpolacin 2.2.2.3. Ecualizacin del Histograma 2.2.3. Deteccin del borde Mediante el Algoritmo de Canny] 2.2.4 Extraccin de Descriptores[4]

2.2.5. Block de decisin

2.2.6 Descriptores de Harr 2.3 Biblioteca y programas de reconocimiento facial 2.3.1 Biblioteca Opencv 2.3.2 Emgucv 2.3.3 Entrenamiento usando Haartraining. 2.3.4 Recursos para el desarrollo del proyecto 2.3.4.1 Instrumentos 2.3.1.5. StarUml 2.3 Hiptesis 2.4 Variables 2.4.1 Variable independiente 2.4.2 Variable dependiente CAPITULO III: MARCO METODOLOGICO 3.1 Tipo de Estudio 3.2.1 Poblacin 3.2.2 Muestra 3.3 Mtodos, Tcnicas e instrumentos de recoleccin de datos 3.3.1. Mtodos 3.3.2 Instrumentos

3.3.3 Mtodos

3.4 Plan de anlisis estadstico de datos CAPITULO IV: MARCO ADMINISTRATIVO 4.1 PRESUPUESTO 4.2 Costo de Inversin 4.2.1 Recursos Humanos 4.2.2 Recursos Materiales 4.2.3 Costos de software 4.2.4 Recursos Financieros 4.3 Presupuesto y financiamiento 4.4 cronograma de construccin del proyecto 4.5 Calendarizacin del proyecto CAPITULO V: REFERENCIAS BIBLIOGRAFICAS

CAPITULO I: PROBLEMATICA DE LA INVESTIGACIN

CAPITULO I: PROBLEMATICA DE LA INVESTIGACIN 1.1 Realidad Problemtica:

Hoy en da con la globalizacin y apertura de mercados, la competitividad ente las empresas es muy alta, por lo tanto los negocios dependen mucho de los gustos, preferencias y precepcin de los clientes hacia la empresa o sus productos, por ende las empresas ahora tratan de acercarse y conocer a los c lientes,

aprovechando todas las tecnologas existentes como por ejemplo las redes sociales.

Es as que disean nuevas estrategias de marketing y productos, adems compran y generan base de datos de clientes para analizar gustos, preferencias,

necesidades, hbitos, nivel socio econmico, impulsividad, intereses y decisiones de compra etc. para ser analizados por sus sistemas de informacin.

Es en este mbito donde nos movemos actualmente, en donde debemos destacar con nuestras habilidades como futuros ing enieros de sistemas obteniendo y procesando la informacin inteligentemente para ayudar a lograr los objetivos estratgicos del negocio, mejorando su posicin en el mercado, encontrando nuevos nichos de mercado, o haciendo perfiles de consumo y compras de clientes para adelantarnos as a sus necesidades con nuestras propuestas o productos.

Cabe resaltar que el cliente es la razn principal del negocio ya que si no existen clientes el negocio y las empresas no tendran sentido.

El estado por su parte hace muy poco o casi nada por capacitarlos o darles herramientas que ayuden a mantener sus negocios y a crecer, entendiendo que una empresa que crece genera ms impuestos y ms trabajo a muchas personas mejorando as la calidad de vida de la poblacin.

10

Por lo expuesto nosotros como futuros ingenieros estamos llamados a cambiar la realidad investigando y desarrollando sistemas que impacten en las empresas aumentando su rentabilidad y ayuden a cumplir sus objetivos estratgicos.

Teniendo claro la importancia del cliente en la cadena del negocio existen tecnologas que pueden proporcionar datos importantes para ser aprovechados en el conocimiento y fidelizacin del cliente, esta es la biometra y el reconocimiento facial

11

La Biometra

La biometra se remonta siglos atrs cuando los antiguos Egipcios median a las personas para identificarlas (antropometra). Esta manera rudimentaria de identificacin se basaba en las medidas de algunas partes del cuerpo y sigue siendo utilizada desde entonces. La biomtrica no se puso en prctica en las culturas occidentales hasta finales del siglo XIX, pero era utilizada en China desde al menos el siglo XIV, un explorador y escritor que responda al nombre de Joao de Barros escribi que los comerciantes chinos estampaban las impresiones y las huellas de la palma de las manos de los nios en papel con tinta, como mtodo para distinguir entre los nios y jvenes. En Occidente, la identificacin confiaba simplemente en la memoria fotogrfica hasta que Alphonse Bertillon, jefe del departamento fotogrfico de la Polica de Pars, desarroll el sistema antropomtrico en 1883, este era el primer sistema preciso, ampliamente utilizado cientficamente para identificar a criminales y convirti a la biomtrica en un campo de estudio. Funcionaba midiendo de forma precisa ciertas longitudes y anchuras de la cabeza y del cuerpo, as como registrando marcas individuales como tatuajes y cicatrices. El sistema de Bertillon fue adoptado extensamente en occidente hasta que aparecieron defectos en el sistema principalmente problemas con mtodos distintos de medidas y cambios de medida. Despus de esto, las fuerzas policiales occidentales comenzaron a usar la huella dactilar esencialmente el mismo sistema visto en China cientos de aos antes. La identificacin basada en la huella dactilar se viene utilizando en los Estados Unidos y Europa Occidental desde hace ms de cien (100) aos. Los grandes avances comerciales en los dispositivos biomtricos se dieron en los aos setenta con un sistema llamado Identimat, que meda la forma de la mano y la longitud de los dedos como parte de un reloj, siendo utilizado para el acceso a sitios restringidos en Western Electric, el departamento de inteligencia de la Naval de los EEUU, el departamento de energa y otras empresas. El desarrollo de los sistemas de identificacin de la huella dactilar se dio en las dcadas de los sesentas y setentas cuando varias empresas desarrollaron productos para automatizar la identificacin de las huellas dactilares para fines legales, finalizando los aos sesenta el FBI comenz a verificar automticamente las huellas dactilares y a mediados de los aos setenta ya se haba instalado un gran nmero de sistemas automticos para la huella dactilar en todos

12

los EE.UU, los sistemas automatizados para la identificacin de la huella dactilar (AFIS por sus siglas en ingls) son utilizados en la actualidad por las fuerzas policiales en todo el mundo.

Los sistemas automticos para la medida de otras caractersticas biomtricas se desarrollaron similarmente al de la huella dactilar. El primer sistema para la medicin de la retina fue introducido en los aos ochenta, el trabajo del doctor John Daughman de la Universidad de Cambridge condujo a la primera tecnologa para la medicin de la retina. Ya en el siglo veinte, la mayora de los pases del mundo utiliza las huellas digitales como sistema prctico y seguro de identificacin. Con el avance tecnolgico nuevos instrumentos aparecen para la obtencin y verificacin de huellas digitales, tambin se comienzan a utilizar otros rasgos morfolgicos como variantes de identificacin, por ejemplo el iris del ojo, facial o la voz.

Distribucin de los mtodos biomtricos ms usados

Sealo algunos ejemplos de aplicaciones empresariales de la biometra a) Acceso a cajas de seguridad bancarias b) Acceso a home banking y/o cualquier intranet corporativa c) Sistemas de fidelizacin

13

d) Accesos a socios e) Monedero f) Login a sistemas g) Aprobacin transaccional en sistemas de gestin Estas no son las nicas aplicaciones, pero s las ms populares. Sistemas Biomtricos de Reconocimiento Facial

El reconocimiento facial automatizado es relativamente un concepto nuevo, desarrollado en los aos 60, el primer sistema semiautomtico para reconocimiento facial requera del administrador para localizar rasgos (como ojos, orejas, nariz y boca) en las fotografas antes de que este calculara distancias a puntos de referencia en comn, los cuales eran comparados luego con datos de referencia.

En los aos 70 Goldstein, Harmon, & Lesk, usaron 21 marcadores subjetivos especficos tales como el color del cabello y grosor de labios para automatizar el reconocimiento facial, el problema con estas soluciones previas era que se computaban manualmente en 1988 Kirby & Sirobich aplicaron anlisis de componentes principales, una tcnica estndar del lgebra lineal al problema del reconocimiento facial. Esto fue considerado algo as como un hito al mostrar que eran requeridos menos de 100 valores para cifrar acertadamente la imagen de una cara convenientemente alineada y normalizada .

En 1991 Turk & Pentland utilizando las tcnicas Eigenfaces, noto que el error residual poda ser utilizado para detectar caras en las imgenes este descubrimiento permiti desarrollar sistemas automatizados de reconocimiento facial en tiempo real y fidedignos. Si bien la aproximacin era un tanto forzada por factores ambientales, cre sin embargo un inters significativo en posteriores desarrollos de stos sistemas la tecnologa inicialmente captur la atencin del pblico a partir de la reaccin de los medios a una prueba de implementacin en el Super Bowl de la NFL en enero de 2001, la cual captur imgenes de vigilancia y las compar con una base de datos de fotoarchivos digitales.

Esta demostracin inici un muy requerido anlisis sobre cmo usar la tecnologa para satisfacer necesidades nacionales y empresariales, mientras se tomaban en consideracin las preocupaciones sociales y de privacidad del pblico, hoy la tecnologa de reconocimiento facial

14

est siendo utilizada para combatir el fraude de pasaportes, soporte al orden pblico, identificacin de nios extraviados y minimizar el fraude en las identificaciones etc. Los Sistemas Biomtricos de Reconocimiento Facial y su aplicacin en los negocios

En estos momentos esta herramienta est siendo utilizada en lo que respecta a la seguridad en los establecimientos o negocios, sin embargo se debe tener en cuenta que esta tecnologa es una herramienta muy til para las empresas de produccin, distribuidores , tiendas de retal o a grandes almacenes, ya que a pesar de todos los esfuerzos publicitarios que realizan las empresas de produccin por conseguir que su marca sea elegida entre los consumidores, stos reconocen que la influencia que ejerce el entorno dentro del establecimiento es muy importante en la decisin final de compra.

Las influencias que operan dentro del establecimiento obligan al consumidor a procesar la informacin adicional de los estmulos que recibe en el propio establecimiento.

Por este motivo, tanto los fabricantes como los minoristas estn interesados en conocer la naturaleza de este tipo de comportamiento.

Para los minoristas resulta determinante conocer cmo es la compra dentro del establecimiento a fin de planificar el diseo del mix de marketing dentro de la tienda, la distribucin del surtido en los productos (agrupamiento en categoras), as como la ubicacin de las marcas en las gndolas.

Para los fabricantes resulta muy importante conocer cmo es este comportamiento, pues a partir de este conocimiento podrn determinar cunta informacin habrn de ofrecer al pblico sobre sus productos o junto con ellos.

Es importante para los negocios identificar a los clientes para segmentarlos y atenderlos de acuerdo a sus caractersticas y as aumentar las probabilidades de compra y satisfaccin.

El Planificador: Es aquel comprador que tiene una intencin previa de comprar una categora de producto determinada ,considerando una marca especfica, da lugar a lo que se conoce como compra

15

planificada normalmente ingresa al punto de venta ve directamente al producto luego puede o no mirar otros productos y se va, el tiempo de compra es rpido , aqu el sistema de reconocimiento facial identificara al cliente(cliente planificador) y guardara la hora y fecha de entrada as como de salida adems de los productos comprados y la comparacin con sus anteriores compras buscando productos y fechas repetitivas (tal vez se podra hacer un plan de marketing y de atencin para que el cliente compre rpidamente lo que necesita ya que este valora su tiempo as como tambin hacer la publicidad adecuada para el).

El Planificador parcial: Tiene planificado comprar una categora de producto, pero no ha decidido qu marca va a comprar. Evidentemente este tipo de compra est planificada en cuanto a la categora de producto, pero no en cuanto a la marca es decir, es una compra de impulso parcial, aqu el sistema de reconocimiento facial identificara al cliente(cliente planificador parcial) y guardara la hora y fecha de entrada as como de salida adems de los productos comprados y la comparacin con sus anteriores compras buscando productos y fechas repetitivas (tal vez es un cliente que le gustan las ofertas o productos de una caracterstica o insumo especial) para lo cual el vendedor sabr guiarlo y ofrecer los productos ms adecuados aumentando as la probabilidad de venta y la satisfaccin del cliente.

El comprador impulsivo: No ha planificado ni la compra de un producto genrico ni la compra de una marca especfica, pero, sin embargo, compra un producto, dando lugar a lo que se denomina compra por impulso, generando ms utilidades a la empresa, aqu el sistema de reconocimiento facial identificara al cliente(cliente comprador impulsivo) y guardara la hora y fecha de entrada as como de salida adems de los productos comprados y la comparacin con sus anteriores compras buscando productos y fechas repetitivas (tal vez es un cliente que est pendiente de productos tecnolgicos y deseara lo ms nuevo, o est pendiente de la moda en ropa, etc.) para lo cual el vendedor lo guiara y ofrecer los productos ms actuales incidiendo y llevndolo a comprar teniendo en cuenta que siempre compra, tendr un trato especial y amable generando la venta y su satisfaccin.

16

Cliente de cuidado Es el cliente que ha cometido alguna falta o delito dentro del negocio, el sistema lo reconocer y mostrara un mensaje de alerta para que el personal de seguridad o los empleados del negocio puedan estar atentos a cualquier acto delictivo y se ponga en marcha el procedimiento adecuado.

Los sistemas de reconocimiento facial nos darn datos especficos de cada cliente en cada instante guardndolas en una base de datos para luego hacer un anlisis del cliente, su segmentacin y as llegar afectivamente a cada tipo de cliente para tener un mayor acercamiento y ventaja en la venta.

Un sistema de reconocimiento facial nos proporcionara la siguiente informacin:

a) Hora de entrada del cliente b) Numero de acompaantes c) Productos que busca d) Tiempo que se demora en tomar su decisin e) Zonas dentro de la tienda que recorre f) Que llama su atencin del producto g) Inters en la descripcin del producto h) Monto de compra i) Hora de salida del local

Al procesar la informacin en tiempo real esta nos dar como resultado

a) Cul es su estilo b) Cules son sus preferencias y gustos c) Regularidad con la que compra d) Cuanto de rentabilidad genera a la empresa e) Cules son los productos que podemos sugerir f) Medir el impacto de los productos nuevos o en oferta g) Qu estrategia de venta utilizar. h) Faltas cometidas

17

Este tipo de tecnologa tambin nos permitir

i) Saber el segmento al que pertenece el cliente y accionar el plan de marketing adecuado justo en el momento de la compra, esta es una ventaja ya que actualmente se reconoce al cliente cuando paga (en otras palabras, cuando ya compro) y recin ah se le puede reconocer, pero que tal si el cliente entra y solo se va, tal vez pudo comprar pero nadie le ofreci adecuadamente nada y por lo tanto perdimos una venta.

j) Detectar a personas con antecedentes delictivos en el negocio, esta es una preocupacin para los dueos, por las prdidas que ocasiona.

Cabe resaltar que el sistema de reconocimiento facial no es intrusivo eso quiere decir que no invadimos ni incomodamos al cliente para la toma de esta informacin valiosa, eso nos da mucha ventaja con respecto a otros mtodos de reconocimiento biomtrico.

Tambin es verdad que en EEUU Google tiene problemas legales con respecto a la informacin de los clientes y datos personales, pero nuestro argumento del sistema es que este no registrara datos personales de los clientes solo su rostro y sus datos de compras, bajo este punto no existe ninguna ley en el mundo que lo prohba

1.2 Planteamiento del Problema: En la actualidad es dispensable para cualquier empresa que desee sobrevivir en un mundo tan competitivo como el nuestro, conocer y personalizar el servicio producto o atencin hacia los clientes. Es as que vemos que da a da los sectores industriales, empresas que prestan servicios y otras, ven como sus mrgenes se tornan ms estrechos, producto del incremento en los niveles de competitividad y que cada vez son ms los nuevos productos que salen y productos que sustituyen a los anteriores debido a la competencia. Adems los proveedores y consumidores han mejorado su poder de negociacin y los actuales empresarios de la industria su capacidad de competir.

18

Las empresas en el mundo estn convencidas de que si se logra conocer y satisfacer a los consumidores, ganaran su lealtad, tendr buena imagen, que se trasmitir a nuevos clientes potenciales gracias a lo cual conseguir alcanzar sus objetivos por eso en la actualidad la mayora de las empresas reconocen que si tienen malas ganancias o utilidades , saben que es necesario nuevas estrategias y herramientas para poder revertir esta situacin Por lo que en cualquier negocio es importante que el personal sepa y atienda correctamente a cada uno de los clientes que ingresa al establecimiento de venta teniendo en cuenta que somos seres humanos y necesitamos una atencin personalizada, pero por lo general el personal de ventas es muy variable(es de renovacin rpida) y nuestra capacidad humana no es lo suficientemente rpida para identificar a un cliente y obtener todos los movimientos(compras ventas,devoluciones,estadsticas) que el cliente efectu en el negocio por lo que esto es un impedimento para aplicar correctamente las tcnicas de marketing y ventas adecuadas para asegurar y aproximarnos ms efectivamente a realizar una venta cabe recordar que en estos tiempos donde existe una brutal competencia por captar y llamar la atencin de los clientes, es necesario aprovechar todas las herramientas tecnolgicas para incrementar de manera objetiva el conocimiento sobre el comprador y el proceso de compra, dentro de los negocios El sistema se implantara en las tiendas de la empresa Negociaciones Pool s.a. en la cual el dueo refiere que tiene los siguientes problemas

k) Prdida de clientes En sus 4 tiendas de ventas por menor de sus prendas existe una base de datos en Access con los nombres y direccin de los clientes (datos que son tomados de sus boletas de venta) con lo cual sustenta que los clientes han disminuido, aseverando que la agresiva competencia tambin le afecta .

19

Total de clientes por tienda aproximadamente al mes


700 600 500 400 300 200 100 0 Tienda 1(Chancay) Tienda 2(Chancay)2 Tienda 1(Huaral) Tienda 2(Huaral)

Fuente: Registro de las boletas emitidas

Nmero de quejas aproximadas recibidas mensualmente por tienda


35 30 25 20 15 10 5 0 Tda Tda Tda Chancay 1 Chancay 2 Huaral 1 Tda Huaral 2 Atencion no adecuada Productos Servicios

Fuente: Registrado en cuadernos de control de la empresa

20

Cantidad de devoluciones registradas por tienda


35 30 25 20 15 10 5 0 Tda Chancay 1 Tda Chancay 2 Tda Huaral 1 Tda Huaral 2 Por falla del producto Insatisfaccion del cliente

Fuente: Registrado en cuadernos de control de la empresa

Cuadro comparativo de Ventas anuales por tienda


200000 180000 160000 140000 120000 100000 80000 60000 40000 20000 0 Tda Chancay 1 Tda Chancay 2 Tda Huaral 1 Tda Huaral 2 2010 2011 2012

Fuente: Registro de las boletas emitidas

Analizando la informacin se observa que la prdida de clientes generado por la falta de atencin adecuada, quejas, devoluciones, insatisfaccin y el desconocimiento de los gustos y preferencias as como tambin la falta de un plan de marketing personalizado repercute en las ventas y productividad, ocasionando falta de liquidez, problemas de rotacin de inventarios, aumento de costos, rotacin de personal de ventas y mal clima laboral.

21

1.3 Formulacin del Problema La implementacin de un sistema biomtrico de reconocimiento facial permitir

personalizar su atencin y llegar efectivamente a los clientes para aumentar sus ventas y la satisfaccin de los clientes? 1.4 Justificacin e Importancia de la Investigacin En este mundo globalizado y muy competitivo en donde el factor primordial es el cliente se debe tener en cuenta que la satisfaccin de este es el crecimiento y el sustento de la empresa por lo tanto herramientas que ayuden a cumplir este objetivo(satisfaccin del cliente) deben ser implementadas para dar una mayor competitividad a la empresa aplicando ms efectivamente tcnicas de marketing, as como tambin la constante renovacin del personal no repercutir mucho en la atencin a los clientes. Por lo que este proyecto de tesis se centra en desarrollar un sistema de informacin basado en la deteccin biomtrica facial y su aplicacin en los negocios, capturando informacin especfica de los clientes almacenndola en una base de datos para luego hacer la clasificacin y un perfil de compra del cliente y sugerir una estrategia de venta adecuada. Este tipo de sistemas biomtricos se espera que ayude a la empresa Negociaciones Pool s.a. aumentar sus ventas para que pueda sobrevivir y seguir genera ndo puestos de trabajo 1.5 Objetivos 1.5.1 Objetivo General Implementar un sistema de informacin basado en la deteccin los negocios. 1.5.2 Objetivos Especficos biometral aplicado a

a) Recopilar, evaluar e utilizar las tcnicas y algoritmos ms eficaces de reconocimiento biomtrico facial y su implementacin en software libre. b) Analizar la informacin necesaria para el desarrollo del sistema de deteccin biomtrico facial. c) Desarrollar un perfil de compras y clasificacin de clientes. d) Disear e implementar una base de datos donde se guardaran y consultaran los datos capturados de los clientes.

22

e) Disear las interfaces de usuario del sistema. f) Realizar la evaluacin econmica del proyecto propuesto.

23

CAPITULO II Marco Terico

24

2. Marco Terico 2.1 Antecedentes de la Investigacin

2.1.1 Crecemype, Conoce Bien a tu Cliente. Revista Electrnica Producida por el Ministerio de la produccin (1). Este Material nos da una visin de qu, cmo, cundo, adnde y por qu Consume un cliente, para saber cules son sus necesidades, cmo satisfacerlas y cmo superar sus expectativas, ofrecindole lo que realmente necesita, adems nos muestra Cmo podemos conocer sus preferencias y Expectativas, tambin describe las herramientas ms efectivas para conocer a los clientes, pero las ms efectivas para as intentar predecir su comportamiento de compra y por ultimo brinda unos principios bsicos para alcanzar el xito en los negocios. Toda esta informacin es importante para mi proyecto porque sabr que datos son importantes para disear mi base de datos as como cules son los datos que necesito y la manera de procesar la informacin obtenida. 2.1.2 Tamara Herrero Vez, Sistema automtico de deteccin y etiquetado de caras en imgenes. Proyecto Fin de Carrera Ingeniera de Telecomunicacin Especialidad Sonido e Imagen, UNIVERSIDAD CARLOS III DE MADRID. (2) Detectar rostros en fotografas es un problema en pleno auge en el campo de la visin por ordenador y son muchas las aplicaciones prcticas que se tienen en la actualidad, videoconferencia, vigilancia, control de acceso, etc. Adems el etiquetado de fotos es un recurso muy necesitado en Internet, donde la cantidad de imgenes crece exponencialmente y es una necesidad cada vez mayor el poder clasificarlas de alguna manera. El objetivo de este proyecto es capturar a partir de una imagen detectar todas las caras y etiquetarlas de acuerdo a sus caractersticas (barba, color de ojos, sexo) el sistema utiliza las funciones que dispone Matlab para logar su objetivo, con este proyecto entend ms como es el proceso de reconocimiento facial (pre procesamiento, procesamiento, segmentacin, reconocimiento y deteccin de imgenes)

Fuente

(1):www.crecemype.pe

(2):www.UClll.edu.es

2.1.3 Jorge Rafael Valvert Gamboa, Mtodos y tcnicas de reconocimiento de rostros en imgenes digitales bidimensionales. Trabajo de graduacin, UNIVERSIDAD De San Carlos de Guatemala. (3) En este documento se trata todo lo concerniente a las diferentes tcnicas que existe para el reconocimiento de rostros en imgenes como son (descriptores de contorno, descriptores de regin, reconocimiento de rasgos) as como la preparacin de imgenes

25

para el reconocimiento de rostros y construccin del espacio facial de eigen para el entrenamiento para el posterior reconocimiento. Tambin muestra los diferentes mtodos que se utiliza para la clasificacin y aprendizaje de cars como son las redes neuronales y los algoritmos genticos.

Fuente

(3):www.UDSCG.EDU.GT

26

2.1.4 El reconocimiento facial, la nueva arma de las marcas para desnudar Al consumidor en el punto de venta (4) NeoFace es una tecnologa de deteccin y comparacin de informacin que proporciona a los puntos de venta datos adicionales sobre los hbitos de compra del consumidor. Los datos generados mediante el reconocimiento facial sumados a las fechas y a las horas en que el consumidor visita los puntos de venta permiten analizar tendencias y hbitos de compra, informa PSFK. Este nuevo servicio, destinado fundamentalmente a cadenas de tiendas y a grandes centros comerciales, podra ayudar a redefinir sus estrategias de marketing, pues puede detectar a los consumidores que repiten y a aquellos que gastan considerables sumas de dinero en puntos de venta diferentes. Para poner en marcha este servicio, se necesita simplemente un ordenador, una cmara de vdeo y costes mensuales de alrededor de 880 dlares por tienda Captura de pantalla del sistema NEOFACE

Fuente(4): http://www.marketingdirecto.com/actualidad/marketing-directo/el-reconocimiento-facial-la-nueva-arma-de-las-marcas-para-desnudaral-consumidor-en-el-punto-de-venta/

27

2.1.5 Reconocimiento facial y el marketing (5) El reconocimiento facial es una tecnologa que permite distinguir e identificar caras, en funcin de la captura de una imagen digital y su comparacin con una base de datos (de caras obviamente) preexistente. Esta tecnologa permite as identificar rostros y personas. El Marketing ha captado esta tecnologa, para utilizarlo en acciones concretas con sus clientes. Y a veces en forma muy creativa. Vean este ejemplo. Para el lanzamiento de una nueva lnea de productos (gelatina) para adultos, la marca Jell-o Temptations desarroll un dispositivo de muestras gratis solo para gente adulta. Y gracias a la tecnologa, la misma puede distinguir si el consumidor potencial es un adulto o no, y si es demasiado joven, denegarle el postre. Este dispositivo se incluy estratgicamente en el Shedd Aquarium de Chicago con el fin primario de llamar la atencin de los nios. Es as, son ellos los ms proclives a probar e interactuar con la tecnologa, y el hecho de denegarles el premio, una excusa magnfica para que llamen a sus padres y prueben ellos. Capturas de pantalla, exponiendo el funcionamiento del sistema

Fuente(5): http://www.marketingyestrategia.com/noticia/266/reconocimiento-facial-y-el-marketing

28

2.1.6 El reconocimiento facial y su utilizacin en el marketing (6) La technologies de reconocimiento facial que bsicamente consiste en la capacidad de reconocer una persona a travs de puntos definidos de su cara, es una tcnica que se basa especialmente en algoritmos y que ha despertado en los ltimos tiempos un especial inters en los especialistas de marketing al observar un gran potencial para ser empleada en la vinculacin de productos con los perfiles del usuario. No solo la gente del mundo de la venta ha observado el potencial que presenta esta herramienta sino que un destacado profesor de la Universidad Estatal de Iowa con una base sumamente racional considera que con la tecnologa del reconocimiento facial se pueden crear lo que l llama mavatares que tiene su origen en la frase avatares de marketing. Estos mavatares seran utilizados en forma eficiente en lograr una focalizada comercializacin de productos y adems para tener una base de datos que sirva de soporte tcnico que sirva de herramienta para los tcnicos de marketing. El plan imaginado por los especialistas en marketing y este profesor de Iowa integran de forma importante la participacin de las redes sociales como Facebook y Google +, como grandes proveedores de datos de los potenciales clientes al enlazar un perfil del mismo en materia de gustos, aficiones, tendencias con su imgen y de esta manera asociar las caractersticas del producto o servicio con los mismos para dirigir en forma ms eficiente la publicidad y las oferta de los mismos. Brian Mennecke dice que el programa que escanea de imagen que recibe desde una pantalla los rostros de las personas que observan un anuncio por ejemplo, y reflejan inters en el mismo por el tiempo que pasa observando, se puede utilizar para construir un perfil robusto que incluya datos demogrficos y otros atributos de los usuarios que presentan un inters especial por el producto o servicio. De esta manera se puede configurar un nicho destino con mayor precisin y eficiencia.Las demandas de este tipo de aplicacin sern cada vez ms populares, con un creciente nmero de personas que toman fotos a travs de los dispositivos mviles y las suben a las redes sociales. A medida que los usuarios optan para aplicaciones como las Sugerencias de etiquetas de Facebook, los usuarios pueden ayudar a construir una importante base de datos de reconocimiento facial que ms tarde podran ser vendidos a los comerciantes de negocios como herramienta de marketing.
Fuente(6): http://www.ticweb.es/el-reconocimiento-facial-y-su-utilizacion-en-el-marketing/

29

2.1.7. Maniques equipados con cmaras para analizar a la clientela (7) El fabricante de maniques italiano Almax y Kee Square, una compaa de tecnologa de reconocimiento facial afiliada al Politcnico de Miln, han llevado la investigacin de mercado a un nuevo nivel con el modelo EyeSee. Este nuevo maniqu parece normal, pero incluye una cmara incorporada en un ojo, capacidades de grabacin de audio, software de reconocimiento facial y un mdem para enviar los datos a un servidor. El software registra la edad, el gnero y la etnia de los compradores que pasan delante del maniqu.

Este sistema de reconocimiento facial, proyectado y realizado por Kee Square en colaboracin con Selea (sociedad de investigacin y desarrollo de sistemas avanzados de videovigilancia), permite analizar las caractersticas somticas de las personas que transitan por delante del maniqu y provee datos estadsticos y contextuales, tiles para elaborar especficas estrategias de marketing. El software incorporado provee an otros datos significativos, como el nmero de personas que transitan por delante del escaparate en determinados momentos del da. Por lo tanto, de ahora en adelante, los retailers pueden saber cuntas personas entran en la tienda, registrar en qu horas hay mayor afluencia de clientes (y de que tipologa), adems de entender si algunas zonas arriesgan la aglomeracin.

Las informaciones recogidas por los maniques permiten evaluar la eficacia de la exposicin de los escaparates y al mismo tiempo, mejorar, por ejemplo, el servicio suministrado por el personal de la tienda que, en base a la afluencia y a la parada de la clientela en determinadas reas, puede desplazarse para ofrecer un soporte mayor a la venta o hacer circular mejor la clientela. Asimismo, estos datos mostrarn si un determinado producto ha llamado la atencin del usuario, permitirn evaluar la atraccin y la eficacia del escaparate e incluso descubrir nuevos target de referencia. Y todo esto, con el respeto total de la privacidad, tutelada por un sofisticado mix tecnolgico hardware-software, que elabora los datos cmara a bordo, o bien, sin el auxilio de un ordenador y sin tener que transmitir y registrar informaciones sensibles (imgenes datos biomtricos), sin dejar ningn rastro de los rostros Anlisis de datos analizados.

30

Max Catanese, director general de Almax, ha indicado: El EyeSee puede saber si un comprador es hombre o mujer, su edad, la cantidad de tiempo que pasa mirando al maniqu y a su atuendo. El EyeSee tambin puede i ndicar la etnia de los compradores. El objetivo, como se puede suponer, es que las tiendas puedan saber ms acerca de quin est comprando y mirando la ropa expuesta. El potencial es enorme. Una tienda puede realmente saber quin es su cliente. Digamos que uno tiene ocho plantas de tienda y seis de ellas son para mujeres y dos para hombres, pero te encuentras con que el 80 por ciento de los compradores son hombres. Entonces, obviamente, desear cambiar esa proporcin, ha sealado Catanese. El ordenador en el interior del maniqu captura los datos de cada uno de los compradores que ve y luego los carga en un portal, por lo que la tienda puede ver las estadsticas.Sin embargo, aunque puede parecer una especie de espionaje y una invasin de la privacidad, no es as, segn Catanese. El EyeSee no almacena imgenes ni graba vdeos ni audio, aunque tendr la capacidad de escuchar para captar posibles tendencias. Pronto podra capturar palabras clave entre las personas. Por ejemplo, si alguien est delante de un maniqu con un vestido azul, y le dice a su acompaante: Sera maravilloso tenerlo en rojo, el sistema captar y analizar las palabras, pero no las grabar, concluye Catanese.

31

Captura de pantalla del funcionamiento del sistema dentro de un maniqui

Fuente(7): http://www.burbuja.info/inmobiliaria/burbuja-inmobiliaria/401825-maniquies-equipados-camaras-analizar-a-clientela.html

32

2.2 Base Terica

2.2.1 Mtodo de Deteccin de Rostros de Viola Jones[1] Segn los autores Li y Jain [5], en sus comparaciones de los diversos mtodos de deteccin del rostro, el mtodo de Viola y Jones basado en Adaboost ha sido el ms eficaz de todos los trabajos desarrollados. En trminos de relacin deteccin y falsos positivos, este mtodo es comparable al de la red neuronal [32]pero se realiza varias veces mucho ms rpidamente. Su sistema se considera el primer detector de rostro en tiempo real es por este motivo que realizare este proyecto con la tcnica de Viola y Jones

Viola y Jones presentaron un mtodo rpido de deteccin de objeto basado en un algoritmo en cascada usando descriptores simples llamados los descriptores de "Haar" que pueden ser calculados de modo eficaz utilizando una representacin intermediaria de la imagen llamada imagen integral.

Propusieron tambin un procedimiento de clasificacin a varias etapas el cual reduce considerablemente el tiempo de ejecucin y obteniendo una alta exactitud.

Cuando queremos detectar y seguir un rostro artificialmente debemos tomar en cuenta varios factores estos son: iluminacin, postura y escala, la variacin de cualquiera de estos factores influir considerablemente en el resultado final.

El mtodo de Viola Jones requiere de una fase de aprendizaje en la cual de robustecer la funcin del clasificador, el cual explorara mediante el algoritmo de deteccin de rostro y as podr separar e identificar los rostros de los no rostros a travs de rboles de decisin, previamente el mtodo aplica escala de grises a la imagen.

Para esto es necesaria las siguientes 3 etapas

Procesamiento o tratamiento previo de a imagen Extraccin de caractersticas

33

Toma de decisin

Se muestra el flujo grama para la deteccin de rostros

Fuente: Proyecto de fin de carrera. SISTEMA AUTOMTICO DE DETECCIN Y ETIQUETADO DE CARAS EN IMGENES, pag, 23, figura34

2.2.2 Reprocesamiento de la imagen [2] 2.2.2.1 Transformacin de la imagen a escala de grises

Este mtodo est basado en los descriptores de Haar, en la mayora de casos, la imagen est representada en el espacio de los colores YUV, en ese caso la imagen en nivel de gris correspondiente se deduce directamente de la imagen original considerando nicamente la luminancia de cada pixel (Y). El modelo YUV es un espacio de color en trminos de una componente de luminancia y dos componentes de crominancia. Es el modelo usado en los sistemas PAL y NTSC de difusin de televisin, el cual es el estndar en la mayora del mundo. El modelo YUV est ms prximo al modelo humano de percepcin que el estndar RGB usado en el hardware de grficos por computadora.

34

Diferentes formatos en los que se pueden representar las imgenes

Fuente: Proyecto de fin de carrera. SISTEMA AUTOMTICO DE DETECCIN Y ETIQUETADO DE CARAS EN IMGENES, pag, 78, figura49

2.2.2.2. Escalado por Interpolacin

Otro procesamiento, que resulta til, consiste en cambiar el tamao de la imagen para controlar mejor el tiempo de clculo y el espacio memoria, esto se realiza mediante la interpolacin que puede considerarse como el clculo del valor de intensidad de un pixel, en una posicin cualquiera, como una funcin de los pixeles que lo rodea.

Existen diferentes tcnicas de interpolacin, entre los cuales los ms utilizados en el procesamiento geomtrico de imgenes son: bilineal, cbica y vecino ms cercano

En la interpolacin cbica se requiere del valor de los 16 puntos para calcular el valor de punto central.

35

Fuente: Diapositiva, Eliminacin del ruido en imgenes, Universidad de Crdova. Da. 23, fig. 7

2.2.2.3. Ecualizacin del Histograma Es una transformacin que pretende obtener, para una imagen, un histograma con distribucin uniforme. Es decir, que exista el mismo nmero de pixeles para cada nivel de gris del histograma. En la transformacin, todos los pixeles de un mismo nivel de gris se transformarn a otro nivel de gris, y el histograma se distribuir en todo el rango disponible separando en lo posible las ocupaciones de cada nivel. Se puede aplicar diferentes tipos de ecualizacin: uniforme, exponencial, de Rayleigh

36

2.2.3. Deteccin del borde Mediante el Algoritmo de Canny [3]

El detector del borde de Canny se usa para rechazar algunas regiones de la imagen que contengan demasiados o pocos contornos, regiones que no puede contener el objeto buscado, el objetivo de este procedimiento es acelerar el proceso de deteccin.

El algoritmo de Canny se considera uno de los mejores detectores del borde en procesamiento de imgenes. Este algoritmo se fundamenta en la teora de operadores de la primera derivada, debido a que toma el valor de cero en todas las regiones donde no vara la intensidad y tiene un valor constante en toda la transicin de intensidad, por lo tanto un cambio de intensidad se manifiesta como un cambio brusco en la primera derivada, caracterstica que es usada para detectar un borde. El detector de Canny resulta particularmente interesante porque extrae bordes y cierra los contornos evitando posible rupturas de los mismos durante su extraccin, este es desglosado en tres Mdulos . 1Obtencin del gradiente: en este paso se calcula la magnitud y orientacin del vector gradiente en cada pxel. 2Supresin no mxima: en este paso se logra el adelgazamiento del ancho de los bordes, obtenidos con el gradiente, hasta lograr bordes de un pxel de ancho. 3Histresis de umbral: en este paso se aplica una funcin de histresis basada en dos umbrales; con este proceso se pretende reducir la posibilidad de aparicin de contornos falsos.

37

En la figura se muestra la deteccin del borde Mediante el Algoritmo de Canny

2.2.4 Extraccin de Descriptores [4]

A partir de la imagen transformada en nivel de gris, redimensionada y con una regulacin ptima y automtica del contraste, se realiza la extraccin de caractersticas o descriptores que van a constituir la entrada del sistema de reconocimiento.

Los descriptores son extrados a partir de la imagen en nivel de gris mediante la imagen integral, se calcula la imagen integral de los cuadrados el valor de la imagen integral de los cuadrados al punto (x; y) es la suma de todos los valores de pxeles al cuadrado situados encima y a la izquierda.

La imagen integral permite reducir considerablemente el tiempo de clculo de los descriptores, lo mismo la imagen integral de los cuadrados es una representacin de la imagen que permite calcular la covariancia en una ventana muy rpidamente a partir de cuatro referencias solamente.

38

2.2.5. Block de decisin La imagen integral y la funcin de clasificacin son las entradas de un bucle, a cada iteracin la ventana de barrido ser redimensionada; siendo ms precisos, ser aumentada por un factor bien escogido de escala. Por consecuencia, los datos de la funcin de clasificacin deben ser adaptados a este cambio.

La adaptacin principalmente consiste en redimensionar los rectngulos de Haar proporcionalmente al tamao de la ventana, este bucle garantiza la deteccin de rostro a toda escala, pues su parmetro principal es el factor de escala este parmetro generalmente es entre 1.1 y 1.4. a fin de poder localizar los rostros en todo emplazamiento de la imagen esta ventana debe recorrer toda la imagen.

2.2.6 Descriptores de Harr[4] El valor de un punto de la imagen solo nos informa sobre el color en este punto una tcnica ms elaborada es encontrar detectores basados en caractersticas ms globales del objeto, es el caso de los descriptores de Haar. Estos descriptores son funciones que permiten acentuar la diferencia de contraste entre diferentes regiones rectangulares adyacente en una imagen es una manera de codificar los contrastes existentes entre un rostro y las relaciones espaciales. Un descriptor es representado por un rectngulo definido por su vrtice, su altura, su longitud y sus pesos (negativo o positivo, de cada rectngulo).

39

Hay muchas motivaciones para el uso de los descriptores ms bien que los pxeles directamente ya que son ms precisos y por ende ms rpidos a comparacin de los pixeles.

Representacin grafica de un descriptor

El algoritmo de Viola y Jones utiliza tres tipos de descriptores

- Un descriptor a dos rectngulos es la diferencia entra la suma de los pxeles de ambas regiones rectangulares las regiones tienen el mismo tamao, forma y estn horizontalmente o verticalmente adyacentes.

- Un descriptor a tres rectngulos, es la suma de los pxeles en ambos rectngulos exteriores sustrados por la suma en el rectngulo central.

- Un descriptor a cuatro rectngulos es la diferencia entre los pares diagonales de los rectngulos.

40

Descriptores utilizados en el mtodo de Viola Jones

Importancia de los descriptores de Haar

Los descriptores rectngulos son atributos simples en comparacin con otros medios de anlisis pero a pesar de la sencillez son sensibles a la presencia de los contornos, las barras y otras estructuras simples en la imagen, adems tiene la propiedad de ser evaluado en cualquier escala y cualquier lugar mediante muy pocas operaciones.

Como demostraron Viola y Jones los algoritmos de deteccin con resultados aceptables podan ser construidos con solamente dos descriptores.

Algoritmos de aprendizaje

En los trabajos de Viola y Jones una versin de algoritmo de aprendizaje conocido bajo el nombre de AdaBoost, que significa adaptative boosting , se emple para elegir los descriptores y formar la funcin de clasificacin, es uno de los algoritmos ms utilizados en aprendizaje automtico.

Bajo su forma original, el algoritmo de aprendizaje de AdaBoost se emple para mejorar un algoritmo de aprendizaje simple su principio consiste en combinar un conjunto de funciones sencillas o dbiles de clasificacin para formar una funcin de la clasificacin fuerte, La funcin de clasificacin es dbil si es solamente capaz de reconocer dos clases al menos.

Por ejemplo para caracterizar bien el rostro, los descriptores rectngulos iniciales elegidos por AdaBoost son significativos y fcilmente interpretados la eleccin del primer descriptor se basa en la propiedad que la regin de los ojos es a menudo ms oscura que la regin de la nariz y las mejillas. El segundo descriptor elegido se basa en

41

la propiedad que los ojos son ms oscuros que el puente de la nariz y as se da forma al reconocimiento.

Descriptores de Haar mas discriminante seleccionados por Adaboost

Las Funciones de clasificacin (decisin) en cascada

El algoritmo de Viola-Jones utiliza un rbol binario de clasificadores para decidir si una regin se trata de una cara o no. Esta cascada est formada por nodos en los que se analizan las diferentes caractersticas de las diferentes regiones de la imagen. Cada nodo representa un clasificador obtenido con el algo-ritmo AdaBoost.

Representacin de un rbol de decisiones para el reconocimiento de rostro

El proceso de aprendizaje que utiliza el algoritmo de Viola-Jones permite como valor de entrada un error que permitiremos en la clasificacin en el primer nodo del rbol.

42

Utilizando ese valor lo que intenta el algoritmo es crear un clasificador que en el primer nodo permite el error mximo que hemos permitido en la deteccin y segn el rbol se vuelve ms profundo el criterio con el que descartamos es mucho ms estricto, de esta manera cuando una muestra llega al ltimo nivel del rbol sabemos que ha pasado por todos los niveles de deteccin.

Adems, esta forma de organizar el rbol de decisin nos permite descartar en un primer momento las muestras ms sencillas de detectar y aplicar un mayor esfuerzo a aquellas cuya clasificacin sea ms dudosa.

2.3 Biblioteca y programas de reconocimiento facial

En la actualidad podemos procesar imgenes en Matlab o en Opencv pero por motivos que voy a utilizar software libre para desarrollar el proyecto de tesis usare Open cv de la cual describir a continuacin:

2.3.1 Biblioteca Opencv [6]

OpenCV es una biblioteca libre de visin artificial originalmente desarrollada por Intel. Desde que apareci su primera versin alfa en el mes de enero de 1999, se ha utilizado en infinidad de aplicaciones. Desde sistemas de seguridad con deteccin de movimiento, hasta aplicativos de control de procesos donde se requiere reconocimiento de objetos. Esto se debe a que su publicacin se da bajo licencia BSD, que permite que sea usada libremente para propsitos comerciales y de investigacin con las condiciones en ella expresadas. Open CV es multiplataforma, existiendo versiones para GNU/Linux, Mac OS X y Windows. Contiene ms de 500 funciones que abarcan una gran gama de reas en el proceso de visin, como reconocimiento de objetos (reconocimiento facial), calibracin de cmaras, visin estreo y visin robtica. El proyecto pretende proporcionar un entorno de desarrollo fcil de utilizar y altamente eficiente. Esto se ha logrado, realizando su programacin en cdigo C y C++ optimizados, aprovechando adems las capacidades que proveen los procesadores multi ncleo. OpenCV puede adems utilizar el sistema de primitivas de rendimiento

43

integradas de Intel, un conjunto de rutinas de bajo nivel especficas para procesadores Intel. Opencv contiene cerca de 500 funciones, esta librera proporciona un alto nivel de funciones para el procesado de imgenes, ofrece varios tipos de datos de alto nivel como juegos, arboles, grficos, matrices, etc. Algunas de las caractersticas que permite Open CV, son operaciones bsicas, procesamiento de imgenes y anlisis. Anlisis estructural, anlisis de movimiento, reconocimiento del modelo, reconstruccin 3D y calibracin de la cmara etc. Open CV implementa una gran variedad de herramientas para la interpretacin de la imagen, es compatible con la librera de procesamiento de imgenes de Intel (Intel Image Processing Library (IPL)) la cual implementa algunas operaciones en imgenes digitales, a pesar de primitivas como binarizacin, filtrado, estadsticas de la imagen, pirmides, Open CV es principalmente una librera que implementa algoritmos para las tcnicas de la calibracin (Calibracin de la Cmara), deteccin de rasgos, para rastrear (Flujo ptico), anlisis de la forma (Geometra, Contorno que Procesa), anlisis del movimiento (Plantillas del Movimiento, Estimadores), reconstruccin 3D (Transformacin de vistas), segmentacin de objetos y reconocimiento (Histograma, etc.). El rasgo esencial de la librera junto con funcionalidad y la calidad es su desempeo. Los algoritmos estn basados en estructuras de datos muy flexibles, acoplados con estructuras IPL; ms de la mitad de las funciones ha sido optimizada provechndose de la Arquitectura de Intel.

2.3.2 Emgucv [7]

Emgu CV es una plataforma cruzada .Net ligada a la librera de Intel Open CV de procesamiento de imgenes, permitiendo que las funciones de Open CV sean llamadas desde .NET, compatible con lenguajes como C#, VB, VC ++ etc. Emgu CV est escrito en C#, pude ser compilado en forma Mono (Monodevelop) por lo cual puede correr en cualquier plataforma que contenga la forma Mono, incluyendo Linux/Solaris y mac. Es necesario bajar todos los dlls que vienen incluidos en Emgu CV en la carpeta donde se ejecuta el cdigo. Para que el cdigo pueda correr sin ningn problema adems de manejar la plataforma a 32 bits.

44

Estructura interna del Framework Emgucv

2.3.3 Entrenamiento usando Haartraining. La librera de Open CV, provee programas o comandos los cuales son usados para entrenar clasificadores llamado HaarTraining por lo tanto es posible crear clasificadores propios haciendo uso de stas. Estos comandos son: createsamples.exe, haaartraining.exe y performance.exe. Por otro lado, OpenCV viene con unos clasificadores ya entrenados Para deteccin facial frontal y otros objetos en uno archivos con extensin xml (apartado4.3.3). El objeto de inters puede ser cualquier objeto como rbol, fruta, coche, etc., no solamente el rostro. Para el logro de este clasificador es preciso completar los siguientes pasos

45

Imgenes de muestra La parte ms importante del proceso de entrenamiento del clasificador es la de recoleccin de una gran cantidad de muestras positivas y negativas, de forma que de ellas se puedan extraer las mejores reglas posibles que formen un detector de objetos potente. El conjunto de imgenes se dividen en dos grupos: (1) las muestras positivas son en imgenes que contienen mltiples ejemplos de la clase objeto de inters (2) la muestras negativas con una coleccin de imgenes donde no se encuentren dichos objetos que se pretende detectar.

En realidad cuatro muestras son necesarias: a) b) c) d) Muestras positivas para el entrenamiento (generacin del clasificador) Muestras negativas para la prueba de clasificador Muestras positivas para el entrenamiento Muestras negativas para la prueba de clasificador

Preparacin de muestra Las muestras positivas necesarias para construir el clasificador se crean con la utilidad Createsamples. Tras su ejecucin, se crea un archivo de extensin vec que servir al clasificador para su entrenamiento. El Createsamples puede tomar como base para la creacin del archivo de entrenamiento una nica imagen del objeto o una coleccin de imgenes con las coordenadas exactas

46

donde se encuentre el objeto en cada una (archivo ndice). El programa es capaz de, a partir de rotaciones aleatorias, cambios en el color, as como colocacin sobre diversos fondos, generar un gran conjunto de muestras positivas que sirvan para el entrenamiento. Por ello es necesario crear un archivo de ndices con informacin sobre el conjunto de muestras. Este archivo de ndices (de extensin txt o idx) tendr la siguiente estructura: nombre_archivo1 nmero_muestras x11 y11 w11 h11 x12 y12... nombre_archivo2 nmero_muestras x21 y21 w21 h21 x22 y22... . . Siendo nombre_archivo el nombre de la imagen donde se encuentran los objetos a buscar. Debemos destacar que el nombre del archivo debe ir acompaado de su direccin dentro del sistema de archivos. nmero_muestras el nmero de objetos positivos que se encuentran en la imagen. La llamada al programa para crear el archivo de extensin vec tiene los siguientes argumentos: vec: tras este flag se escribe el nombre del archivo vec que crear el Createsamples a partir de las muestras proporcionadas. info: preceder al nombre del archivo lista que contendr todas las imgenes de los objetos que constituyen las muestras positivas. bg: nombre del archivo con la lista de las imgenes que servirn de fondos (muestras negativas). num: indica al Createsamples el nmero de muestras que contiene el archivo lista y que por tanto aadir en el formato adecuado en el archivo vec. w: indica el ancho deseado para las muestras creadas en la ejecucin del Createsamples. Su valor por defecto es de 24 pxeles. h: indica el valor para el alto de las muestras. Su valor por defecto es 24 pxeles. Adems de stas, el programa tambin dispone de otras opciones cuyo objetivo es indicar los ngulos mximos en cada direccin para realizar las rotaciones o para hacer la inversin de los colores de la muestra. Cabe resaltar que para que sea una buena muestra para crear nuestro clasificador Harr en xml debemos tener por lo menos unas 5000 imgenes negativas y 3000 positivas (esta es la parte mas difcil) Por ejemplo si queremos entrenar y generar un xml para detectar una bolita de ping pong tendremos que tomar imgenes negativas

47

Imgenes Negativas

Imgenes positivas

Para estas imgenes tambin debe generarse un archivo ndice, pero que contienen algo ms de informacin: positivas/img1.bmp positivas/img1.bmp positivas/img1.bmp positivas/img1.bmp 100 100 25 25 120 110 27 28 130 900 30 31 140 105 22 23

En este archivo se especifica donde se encuentra el objeto dentro de la imagen positiva. Siendo las 2 primeras coordenadas x e y (respectivamente) y las siguientes 2 ancho y largo. Para generar este archivo se cuenta con una herramienta que trae OpenCV llamada objectmarker. Opencv contiene todas las herramientas para hacer los entrenamientos de reconocimiento que podemos aprovechar en .net y hacer muchas aplicaciones en este caso la deteccin facial y otros rasgos.

2.3.4

Recursos para el desarrollo del proyecto

2.3.4.1

Instrumentos Tecnolgicos Software

48

2. 3.4.1Sharp Develop 4.3 Es un entorno de desarrollo integrado libre para los lenguajes de programacin C#, Visual Basic .NET, Python, F#, Ruby y Boo, puede importar proyectos de Visual Studio .NET. La versin 4.0 es capaz de editarlos directamente e integra soporte para los lenguajes de programacin Python , F# y Ruby. Adems puede efectuar la conversin entre c# a vb y al revs., no es tan pesado, hasta hay versiones portables, est en constante desarrollo y actualizaciones. 2.3.4.2.Open CV OpenCV viene de las siglas Open Source Computer Vision Library [7], es una librera abierta desarrollada por Intel en el ao de 1999, contiene cerca de 500 funciones, esta librera proporciona un alto nivel de funciones para el procesado de imgenes permitiendo a los programadores crear aplicaciones poderosas. Open CV ofrece varios tipos de datos de alto nivel como juegos, arboles, grficos, matrices, etc. adems funciona en muchas plataformas como son (Windows, Linux,android,os) Algunas de las caractersticas que permite Open CV son: Operaciones bsicas, procesamiento de imgenes y anlisis. Anlisis estructural, anlisis de movimiento, reconocimiento del modelo, reconstruccin 3D y calibracin de la cmara etc. Open CV implementa una gran variedad de herramientas para la interpretacin de la imagen. Es compatible con la librera de procesamiento de imgenes de Intel (Intel Image Processing Library (IPL)) la cual implementa algunas operaciones en imgenes digitales. A pesar de primitivas como binarizacin, filtrado, estadsticas de la imagen, pirmides, Open CV es principalmente una librera que implementa algoritmos para las tcnicas de la calibracin (Calibracin de la Cmara), deteccin de rasgos, para rastrear (Flujo ptico), anlisis de la forma (Geometra, Contorno que Procesa), anlisis del movimiento (Plantillas del Movimiento, Estimadores), reconstruccin 3D (Transformacin de vistas),segmentacin de objetos y reconocimiento (Histograma, etc.). 2. 3.4.3 EmguCV Emgu CV es una plataforma cruzada .Net ligada a la librera de Intel Open CV de procesamiento de imgenes, permitiendo que las funciones de Open CV sean llamadas desde .NET, compatible con lenguajes como C#, VB, VC ++ etc. Emgu CV est escrito en C#, pude ser compilado en forma Mono (Monodevelop) por lo cual puede correr en cualquier plataforma que contenga la forma Mono, incluyendo Linux/Solaris y mac. Es necesario bajar todos los descargar que vienen incluidos en Emgu CV en la carpeta donde se ejecuta el cdigo para que el cdigo pueda correr sin ningn problema.

49

2.3.4.4 Base de Datos My SQL Es un sistema de gestin de bases de datos relacional, fue creada por la empresa sueca MySQL AB, la cual tiene el copyright del cdigo fuente del servidor SQL, as como tambin de la marca. MySQL es un software de cdigo abierto, licenciado bajo la GPL de la GNU, aunque MySQL AB distribuye una versin comercial, en lo nico que se diferencia de la versin libre, es en el soporte tcnico que se ofrece, y la posibilidad de integrar este gestor en un software propietario, ya que de otra manera, se vulnerara la licencia GPL. El lenguaje de programacin que utiliza MySQL es Structured Query Language (SQL) que fue desarrollado por IBM en 1981 y desde entonces es utilizado de forma generalizada en las bases de datos relacionales. Caractersticas principales Inicialmente, MySQL careca de algunos elementos esenciales en las bases de datos relacionales, tales como integridad referencial y transacciones. A pesar de esto, atrajo a los desarrolladores de pginas web con contenido dinmico, debido a su simplicidad, de tal manera que los elementos faltantes fueron complementados por la va de las aplicaciones que la utilizan. Poco a poco estos elementos faltantes, estn siendo incorporados tanto por desarrolladores internos, como por desarrolladores de software libre. Ventajas e) Velocidad al realizar las operaciones, lo que le hace uno de los gestores con mejor rendimiento f) Bajo costo en requerimientos para la elaboracin de bases de datos, ya que debido a su bajo consumo puede ser ejecutado en una mquina con escasos recursos sin ningn problema. g) Facilidad de configuracin e instalacin. h) Soporta gran variedad de Sistemas Operativos. i) Baja probabilidad de corromper datos, incluso si los errores no se producen en el propio gestor, sino en el sistema en el que est. j) Conectividad y seguridad. Desventajas a) Un gran porcentaje de las utilidades de MySQL no estn documentadas. b) No es intuitivo, como otros programas (ACCESS).

50

2.3.4.5. StarUml StarUml, es una herramienta UML de licencia gratuita para el modelamiento de software, basndose en estndares UML y DMA, es muy fcil de usar e intuitiva, debido a la simplicidad y rpida percepcin de sus objetos, funciones y caractersticas, otra caracterstica fundamental es que su cdigo es compatible con lenguajes como C++ y Java. Algunas de sus caractersticas son: a) b) c) d) e) f) g) h) i) Diagrama de casos de uso Diagrama de clase Diagrama de secuencia Diagrama de colaboracin. Diagrama de estados Diagrama de actividad. Diagrama de componentes Diagrama de despliegue. Diagrama de composicin estructural (UML 2.0)

La capacidad de generar cdigo a partir de los diagramas y viceversa, actualmente funcionando para los lenguajes c++, c# y java Capacidad para generar documentacin en formatos Word, Excel y PowerPoint sobre los diagramas. 2.3 Hiptesis Con la implementacin de un sistema biometrico de reconocimiento identificara y generara el perfil de compra de los clientes logrando una mayor satisfaccin y 2.4 Variables 2.4.1 Variable independiente Sistema de Identificacin facial de clientes 2.4.2 Variable dependiente Rentabilidad del negocio personalizando facial su se atencin

rentabilidad al negocio

3.0 MARCO METODOLOGICO

51

3.1 Tipo de Estudio En este proyecto utilizare el tipo de investigacin Tecnolgica - Cuasi experimental

3.2 Poblacin y Muestra

3.2.1 Poblacin La poblacin est determinada por la cantidad de personas que visitan el negocio Pool Jeans en este caso se implementara en la tienda Huaral (1) donde la cantidad

aproximada de clientes es de 621 mensual 3.2.2 Muestra La muestra est determinada en funcin a la poblacin, para ello se ha utilizado la presente formula:

Dnde: n = Tamao de la muestra N = Total de la Poblacin Z = Nivel de confianza que se da a la investigacin (95%). e = Margen de error muestras (Se sugiere valores en torno al 5%). p = Proporcin de xito (cuando no se conoce este valor es 60%). q = Proporcin de fracaso (cuando no se conoce este valor es 40%).

Por lo tanto la muestra es de n=134.78

52

3.3 Mtodos, Tcnicas e instrumentos de recoleccin de datos 3.3.1. Mtodos Para llevar a cabo este proyecto de investigacin se ha tomado en cuenta las siguientes tcnicas: c) Encuestas: Son herramientas, sofisticadas, cientficas y necesarias en el mundo moderno. Nadie que quiera hacer una inversin, ya sea publicitaria o para importar o exportar un producto o servicio, debera olvidar el recurrir a ellas para lograr resultados mejores en la misma. d) Anlisis Documental: Se realizar consultas bibliogrficas relacionadas con el tema investigado, revistas, publicaciones, tesis aplicadas y otros documentos que se encuentren vinculados a la investigacin. e) Observacin Directa: A travs de esta tcnica se tomaran todos los datos necesarios para el sistema. 3.3.2 Instrumentos a) Unidades de almacenamiento externo. b) Computadora personal (mnimo core 2 duo, 1 giga ram) c) Cmara web (VGA, resolucin mnima de 640 x480) d) Base de datos Mysql e) IDE Sharpdevelop 3.3.3 Mtodos El mtodo para la recoleccin de datos consistir en una encuesta realizada al personal y dueo de la empresa. La encuesta nos permitir obtener datos reales que nos ayudar a conseguir la informacin necesaria y as clasificarla de acuerdo al proyecto realizado y al problema de la investigacin.

53

3.4 Plan de anlisis estadstico de datos Los datos que se obtendrn mediante la aplicacin de las tcnicas, sern luego procesados y analizados y obtener los respectivos resultados. Esto se har utilizando como herramienta para la elaboracin de un perfil de compras de los clientes los cuales sern representarlos en cuadros, grficos para ser analizadas por los dueos del negocio. Los datos que se lograrn mediante el mtodo indicado anteriormente sern tratados, utilizando herramientas de anlisis estadsticos como Excel, para ordenarlos, tabularlos y presentarlos en cuadros grficos para sus interpretaciones. 4.0 Cronograma de actividades y Presupuesto 4.1 PRESUPUESTO

4.2 Costo de Inversin Los costos de inversin son costos necesarios para poder llevar a cabo nuestro proyecto, los costos de inversin a los cuales incurriremos sern tales como:

4.2.1 Recursos Humanos Es aquella inversin que se incurrir para poder contratar a las personas que formarn el equipo de proyecto y llevar a cabo el sistema ofrecido de los cuales estarn conformados por los siguientes:

Jefe de Proyecto (1) Es la persona responsable de lograr que los objetivos del proyecto se cumplan en la fecha pactada y en los costos estimados; su participacin en el proyecto es desde el inicio del proyecto hasta el final por tanto el clculo para el costos de la mano de obra se considera como el tiempo que dura todo el proyecto a realizar.

Costo de un jefe de proyecto x hora = $ 12

54

Analista (1) Son las personas que se encargarn de analizar la empresa, sus procesos y definir los problemas que tiene la empresa y analizar las necesidades que tiene los usuarios.

Se encargar tambin del modelamiento de la base de datos y de la migracin de la data necesaria para el sistema a desarrollar.

Costo de un analista x hora = $10.00

Programadores (1) Son los encargados de introducir, ordenar y establecer los controles necesarios para el desarrollo del sistema de informacin.

Otras de las funciones que tienen ser de corregir deficiencias o errores que puedan ocurrir en el desarrollo del sistema.

Costo de un Programador x hora = $6.00 Supervisor de sistemas Analista QA Es la persona que se encargar de la revisin y evaluacin de los controles, sistemas y procedimientos de informtica; de los equipos de cmputo, su utilizacin, eficiencia y seguridad, a fin de que por medio de este logre una utilizacin ms eficiente y segura de la informacin para una adecuada toma de decisiones.

Su participacin en el proyecto debe ser todo el tiempo en que se realizar el proyecto ya que debe auditar todo los procesos para llevar a cabo el desarrollo de sistema.

Tambin se encargar de llegar la informacin documentada del anlisis y diseo del sistema para que se encargue de entregarla de tal forma que presente los

55

manuales tcnicos de usuario y de instalacin, completos y ordenados como productos finales.

Costo de un supervisor de sistema x hora = $12.00

Capacitaciones

El especialista analista QA realizara el proceso de capacitacin al personal para el uso del sistema implementados. Capacitara a los usuarios administradores para la utilizacin de los equipos en los procesos de reconocimiento facial, mediante los registros de usuarios con determinados perfiles.

Costo de un capacitador de sistema x hora = $10.00

Cuadro con totales de costo de mano de obra Concepto Cant Tiempo(meses) Costo x Costos(S/MES) Importe a 20 das x

Hora(s) mes Jefe proyecto Analista 1 2 3 1 10 6 12 1600 960 1920 4800 8640 11520 de 1 6 12 1920 11520

Programador 1 Supervisor de sistemas Capacitador 1 1

2 das

10

20

20 36500

56

Distribucion de Costo de personal

Jefe de Proyecto Analista Programador Supervisor Sist

4.2.2 Recursos Materiales

El costo de equipo por unidad, para la implementacin del sistema estara conformado por una cmara web y la PC administradora de la BD.

Nombre de equipo: Logitech HD Web Cam C270 Costo = S/80.00 Dispositivo USB 4 gigas costo= S/16.00 2 pcs costo = S/. 3000

4.2.3 Costos de software Todos los software a utilizar son libres lo cual no representa ningn costo para el proyecto.

4.2.4 Recursos Financieros El financiamiento del proyecto estar a cargo de la empresa Negociaciones Pool s.a.

57

4.3 Presupuesto Materiales Internet Computadoras Copias Transportes Tinta Impresin Papel bon(2000) Material didctico Imprevistos Total Presupuesto S/. 300 S/. 3000 S/. 350 S/. 2000 S/. 180 S/. 22 S/. 400 S/. 3000 S/. 6552

58

4.4 Calendarizacin del proyecto A continuacin se presenta un calendario de las principales tareas del proyecto incluyendo solo las fases de inicio y elaboracin, ya que el proceso interactivo incremental de rup est caracterizado por la realizacin en paralelo de todas las disciplinas de desarrollo a lo largo del proyecto, con lo cual la mayora de los artefactos son generados en el inicio del proyecto pero van desarrollndose en mayor o menor grado de acuerdo a la fase e iteracin del proyecto

Calendarizacon del proyecto

59

Referencias Bibliogrficas

[1] Paul Viola and Michael J. Jones. Robust real-time face detection. International Journal of Computer Vision, May 2004. [2] LIC. MARA ESTHER GARCA CHANG. Diseo e implementacin de una herramienta de deteccin facial. Instituto Politcnico Nacional Centro de Innovacin y Desarrollo Tecnolgico en Cmputo, Junio 2009. [3] Tamara Herrero Vez. Sistema Automatico de deteccin y etiquetado de caras en imgenes.Universidad Carlos III de Madrid,Marzo 2010. [4] Miguel Delgado Rodriguez.Extraccin automtica de caras en imgenes captadas con mviles Android.Universidad Publica de Catalua.noviembre 2012.

[5] Modesto Fernando Castrilln Santana. Tutorial Viola-Jones. Octubre 2009. [6] Ral Igual Carlos Medrano. Tutorial de OpenCV,Computer vision lab, Abril 2008. [7] Pagina Web Oficial de Emgucv, disponible en :http:/www.emgu.com [8] H. Rowley, S. Baluja and T. Kanade, Neural networkbased face detection, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 20, no. 1, pp. 2338, 1998. [9] P. Viola and M. Jones., Robust real time object detection, In IEEE ICCV Workshop on Statistical and Computational Theories of Vision, Vancouver, 2001. [10] G. R. Bradski, A. Kaehler, Learning OpenCV Computer Vision with the OpenCV Library, OREILLY., September 2008. P. Viola and M. Jones, "Rapid object detection using boosted cascade of simple features," in Proceedings IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol. 1, pp. 511 518, Kauai, Hawaii 2001, [10] G. R. Bradski, A. Kaehler, Learning OpenCV Computer Vision with the OpenCV Library,OREILLY., September 2008. [11] Canny, A Computational Approach to Edge Detection, IEEE Trans. on Pattern Analysis and Machine Intelligence, vol. 8, no. 6, pp. 679698, 1986.

60

[12] Cristina Conde Villa, Biometria: reconocimientofacial mediante fusin 2D y 3D,1ra edicin.Dykinson, SL- LIBROS, 2007 [13] Sotomayor, C, Desarrollo de un Equipo Autnomo Biomtrico para la Identificacin de Personas. Chile Universidad Mayor, 2007. [14] Rendn, A., "Desarrollo de Sistemas Informticos Usando UML y RUP. Una Visin General". Universidad del Cauca. Agosto de 2004 [15] Conallen, J., "Building Web Applications with UML". Addison-Wesley. 2000.

61