Vous êtes sur la page 1sur 56

UNIVERSIDADE FEDERAL DO PARÁ

INSTITUTO DE TECNOLOGIA
FACULDADE DE ENGENHARIA DA COMPUTAÇÃO

JANIZE MONTEIRO DE CASTILHO

ESTUDO E IMPLEMENTAÇÃO DE TÉCNICAS DE PROCESSAMENTO DE


IMAGENS APLICADAS EM RECONHECIMENTO DE FACE.

Belém
2012
ii

UNIVERSIDADE FEDERAL DO PARÁ


INSTITUTO DE TECNOLOGIA
FACULDADE DE ENGENHARIA DA COMPUTAÇÃO

JANIZE MONTEIRO DE CASTILHO

ESTUDO E IMPLEMENTAÇÃO DE TÉCNICAS DE PROCESSAMENTO DE


IMAGENS APLICADAS EM RECONHECIMENTO DE FACE.

Trabalho de Conclusão de Curso


apresentado como exigência parcial
para obtenção do título de Bacharel
em Engenharia da Computação, pela
Universidade Federal do Pará.

Orientador: Prof. Ronaldo de Freitas Zampolo

Belém
2012
iii

UNIVERSIDADE FEDERAL DO PARÁ


INSTITUTO DE TECNOLOGIA
FACULDADE DE ENGENHARIA DA COMPUTAÇÃO

ESTUDO E IMPLEMENTAÇÃO DE TÉCNICAS DE PROCESSAMENTO DE


IMAGENS APLICADAS EM RECONHECIMENTO DE FACE.

Este trabalho foi julgado ____/____/______ adequado para obtenção do Grau de


Engenheiro da Computação, aprovado em sua forma pela banca examinadora que atribuiu
o conceito________.

Banca Examinadora:

______________________________________
Prof. Ronaldo de Freitas Zampolo
Faculdade de Engenharia da Computação/UFPA
Orientador

_______________________________________
Prof. Agostinho Luiz da Silva Castro
Faculdade de Engenharia da Computação/UFPA

________________________________________
Prof. Eurípedes Pinheiro dos Santos
Faculdade de Engenharia da Computação/UFPA
iv

Aos meus pais e aos meus


irmãos, por acreditarem em mim,
me apoiarem e ajudarem em
todos os momentos.
v

AGRADECIMENTOS

Agradeço, primeiramente, ao meu Deus por está comigo todos os dias de


minha vida.

Aos meus pais, que sempre acreditaram em mim, me apoiando e ensinando.


Essa foi minha força diária.

Ao meu irmão que admiro muito e tenho muito carinho, e quem sempre me
ajudou.

À minha irmã, minha parceira de todas as horas, pela presença constante e


pelos pensamentos que me fazem refletir.

Ao meu avô, tios, primos e cunhada pelo cuidado e confiança, que me motivam
a nunca pensar em parar.

Aos meus amigos Fernanda Leal, Felipe Coelho, Cássio Peixoto, Marina
Campos e Werson Araujo, que foram meus parceiros diários nesses 5 anos de
graduação, me ajudando e ensinando muito além de assuntos acadêmicos, mas
pensamentos que hoje fazem parte da minha vida.

Aos meus amigos Débora Cunha, Francis Penha e Jairo Oliveira, por estarem
comigo em um momento muito importante da minha vida, tornando-se minha família
naquele momento especial.

Aos integrantes do LaRV (Laboratório de Realidade Virtual), especialmente ao


Diego Pinheiro e a Débora Cunha, que me ajudaram muito na elaboração deste trabalho.

A todos os amigos que me ajudaram na realização deste trabalho, pela


disposição e paciência para participar dos treinos e testes do sistema e ao Maylson
Gonçalves, também, pelas ajudas na elaboração do sistema.

A todos os meus amigos das longas e boas conversas tomando coca-cola e


jogando UNO, bons momentos de grande descontração.

A todos os meus professores, por me ajudarem e incitarem minha curiosidade


para buscar novos conhecimentos.
vi

“O impossível é pra quem não tem um


sonho. Inalcançável é pra quem não tem o
dom de transformar desejos em pontes pra
chegar.”

- Beno César/Solange de César


vii

LISTA DE SIGLAS
PCA Principal Component Analysis.

OpenCV Open Source Computer Vision.

DNA Deoxyribonucleic Acid.

INSS Instituto Nacional do Seguro Social.


viii

LISTA DE FIGURAS
Figura 1.1: Etapas para o reconhecimento de faces [15]. ....................................................................... 3
Figura 1.2: Figura 1.2: Mudança de iluminação. [15]. . ......................................................................... 4
Figura 2.1: Esquemático das funções de sistemas biométricos [21]. . ...................................................... 6
Figura 2.2: Coleta de saliva. Processo pode ser invasivo e indivíduo pode recusar fazer [15]. ................ 9
Figura 2.3: Identificação biométrica já utilizada em terminais de auto-atendimento bancário utilizando
varredura de veias da mão [15].. ............................................................................................................ 9
Figura 2.4: Etapas realizadas no processo de reconhecimento de orelha [6]. ........................................ 10
Figura 2.5: (a) Imagem binária de uma impressão digital; (b) Uma impressão digital após a
identificação das minúcias [2].. ............................................................................................................ 11
Figura 2.6: Tipos de minúcias identificadas na digital [44]... ................................................................ 12
Figura 2.7: Amostras das articulações e ângulos observadas durante a caminhada [48].. ..................... 13
Figura 2.8: Termograma facial [8]. ...................................................................................................... 14
Figura 2.9: Imagem da íris humana [44].. ............................................................................................ 15
Figura 2.10: Padrões que caracterizam a retina [47]............................................................................ 16
Figura 3.1: Imagem frontal - Pontos que podem ser analisados no reconhecimento de faces [2]............ 22
Figura 3.2: Face Interna: Imagem filtrada para extração somente da face interna na imagem capturada;
Escala cinza: Imagem convertida em escala cinza; Equalizada; Imagem com o histograma equalizado..
............................................................................................................................................................ 24
Figura 3.3: Histograma da imagem em escala cinza. ............................................................................ 25
Figura 3.4: Histograma equalizado da imagem..................................................................................... 25
Figura 3.5: (a) Componente principal não representa a direção mais eficiente para representar os dados,
(b) Componente principal que representa uma direção eficiente para representar os dados.. ................. 27
Figura 3.6: Imagem média utilizada para projetar as imagens de entrada no novo espaço .................... 30
Figura 3.7: Eigenfaces para um treinamento com 25 imagens. .............................................................. 31
Figura 4.1: Etapas para o reconhecimento de faces Face localizada próximo a câmera, longe da câmera
e com um acessório em um ambiente com menor luminosidade. ............................................................ 33
Figura 4.2: Indivíduo de perfil. Sistema não consegue localizar a face.. ................................................ 33
Figura 4.3: Indivíduo que faz parte do banco de dados e foi identificado e indivíduo que não faz parte e
não foi identificado.. ............................................................................................................................. 36
ix

LISTA DE TABELAS
Tabela 2.1: Tabela com os requisitos gerais de um sistema biométrico [21].. ......................................... 7
Tabela 2.2: Tabela comparativa do desempenho dos métodos biométricos [21]..................................... 19
Tabela 4.1: Resultados dos testes realizados, indicando a percentagem de acerto.................................. 34
x

RESUMO

Biometria é o estudo estatístico das características físicas ou comportamentais


dos seres vivos. Muitos trabalhos utilizam essas características para desenvolver
sistemas biométricos, utilizados em diversas aplicações, principalmente na área de
segurança. O reconhecimento de faces é uma das modalidades biométricas mais
investigadas, por ser bastante intuitiva e menos invasiva que outras modalidades
existentes.

Este trabalho propõe uma abordagem capaz de reconhecer faces em um sistema


offline, sendo treinado e testado com imagens armazenadas no banco de dados e um
sistema online que propõe uma abordagem capaz de localizar faces a partir de quadros
de vídeo, e posteriormente, reconhecê-las por meio de análise de imagens.

Pode-se dividir o trabalho em três módulos principais: (1) Buscar um objeto


face na imagem; (2) Localizar e rastrear faces em uma sequência de imagem (frames),
além de segmentar a região rastreada da imagem; (3) Reconhecimento de faces,
identificando a qual pessoa pertence. Para a primeira e segunda etapas foi implementado
um sistema de análise de movimento que possibilitou buscar um objeto na imagem e
validá-lo como uma face, significando que a face foi localizada, e também rastrear esta
face em uma sequência de imagens, extraindo a face localizada. Para a terceira etapa
foram implementados os modelos de redução de informações (técnica PCA - Análise de
Componentes Principais), e de classificação e identificação de faces (distância
euclidiana).

Foi feito um pré-processamento para converter as imagens em escala cinza,


redimensionar as imagens e equalizar o histograma para preparar as imagens para
melhor desempenho do sistema.

Foi utilizada a biblioteca OpenCV para todas as etapas da implementação deste


trabalho.

Palavras-chave: Biometria, Reconhecimento de faces, Localização de faces, PCA,


OpenCV.
xi

ABSTRACT
Biometrics is the statistical study of the physical or behavioral characteristics
of human being. Many studies use these characteristics to develop biometric systems,
used in various applications, particularly in the area of security. Face recognition is one
of the most studied biometric modalities, due to be quite intuitive and less invasive than
others existing methods.

This study proposes an approach capable of recognizing faces in an offline


system, being trained and tested with images stored in database and an online system
that proposes an approach that locates faces from video frames, and then recognize them
by means of image analysis.

This study can be divided into three main modules: (1) Find an object in the
image side; (2) Location and tracking of faces in an image sequence (frames), and
segment the region traced the image; (3) Recognition of faces, identifying from which
one the tracked face belongs. For the first and second phases was implemented a motion
analysis system that allowed to seek an object in the image and validate it as a face,
meaning that the face was located, and also track this face in a sequence of image,
drawing the face localized. For the third step an information reduction model was
implemented (PCA technique) alongside with classification and identification of faces
(Euclidean distance).

It made a pre-processing to convert the images on the grayscale, resize images


and histogram equalization to prepare the images for better system performance.

OpenCV library was used for all stages of the implementation of this work.

Keywords: Biometrics, face recognition, face location, PCA, OpenCV.


xii

Sumário
LISTA DE SIGLAS ................................................................................................................vii
LISTA DE FIGURAS ........................................................................................................... viii
LISTA DE TABELAS .............................................................................................................ix
RESUMO .................................................................................................................................x
ABSTRACT ............................................................................................................................xi
1. INTRODUÇÃO ................................................................................................................... 1
1.1 OBJETIVO/JUSTIFICATIVA ............................................................................................ 2
1.2 METODOLOGIA ............................................................................................................... 2
1.3 MOTIVAÇÃO .................................................................................................................... 3
1.4 LIMITAÇÕES DA TÉCNICA ............................................................................................ 4
1.5 ORGANIZAÇÃO DO TRABALHO ................................................................................... 4
2. SISTEMAS BIOMÉTRICOS ......................................................................................... 5
2.1 INTRODUÇÃO .................................................................................................................. 5
2.2 BIOMETRIA ...................................................................................................................... 5
2.3 MODALIDADES BIOMÉTRICAS .................................................................................... 8
2.3.1 DNA ..................................................................................................................................... 8
2.3.2 Varredura de Veias da Mão.................................................................................................... 9
2.3.3 Pulso Arterial ...................................................................................................................... 10
2.3.4 Orelha ................................................................................................................................. 10
2.3.5 Impressão Digital ................................................................................................................ 11
2.3.6 Reconhecimento de Marcha ................................................................................................. 12
2.3.7 Termograma Facial .............................................................................................................. 14
2.3.8 Íris ...................................................................................................................................... 14
2.3.9 Padrão de Digitação ............................................................................................................. 16
2.3.10 Palma da Mão .................................................................................................................... 16
2.3.11 Varredura de Retina ........................................................................................................... 16
2.3.12 Assinatura ......................................................................................................................... 17
2.3.13 Voz ................................................................................................................................... 17

2.4 APLICAÇÕES DA BIOMETRIA ..................................................................................... 18


2.5 CONSIDERAÇÕES FINAIS ............................................................................................ 19
3. IMPLEMENTAÇÃO DE LOCALIZAÇÃO E RECONHECIMENTO FACIAL
............................................................................................................................................... 20
3.1 INTRODUÇÃO ................................................................................................................ 20
3.2 CARACTERÍSTICAS....................................................................................................... 21
3.3 LOCALIZAÇÃO E RASTREAMENTO FACIAL ............................................................ 22
xiii

3.4 PRÉ-PROCESSAMENTO ................................................................................................ 23


3.5 RECONHECIMENTO FACIAL ....................................................................................... 25
3.5.1 Análise de Componentes Principais...................................................................................... 26
3.6 CONSIDERAÇÕES FINAIS ............................................................................................ 31
4. TESTES E RESULTADOS .............................................................................................. 33
4.1 RESULTADOS DA LOCALIZAÇÃO E RASTREAMENTO DE FACE .......................... 33
4.2 RESULTADOS DO RECONHECIMENTO DE FACE ..................................................... 34
4.2.1 Resultados para os testes no sistema offline .......................................................................... 34
4.2.1.1 Primeiro teste ................................................................................................................... 34
4.2.1.2 Segundo teste ................................................................................................................... 35
4.2.2 Resultados para teste no sistema online ................................................................................ 35
4.3 CONSIDERAÇÕES FINAIS ............................................................................................ 36
5. CONCLUSÃO E TRABALHOS FUTUROS ................................................................... 38
5.1 CONCLUSÃO .................................................................................................................. 38
5.2 TRABALHOS FUTUROS ................................................................................................ 39
REFERÊNCIAS BIBLIOGRÁFICAS ..................................................................................... 40
1

1. INTRODUÇÃO

Processamento de Sinais é a análise e/ou modificação de sinais a fim de extrair


informações e/ou torná-los apropriados para uma aplicação específica. O processamento
de sinais pode ser feito de forma analógica ou digital.

O processamento digital de sinais consiste no método de analisar sinais do


mundo real (representado por uma sequência de números) usando ferramentas
matemáticas, podendo assim realizar transformações ou extrair informações desses
sinais. O mundo real consiste numa infinidade de sinais analógicos, que abrangem o
som, a luz, pressão, temperatura, entre outros. Para trabalhar com esses sinais na forma
digital, é necessário que haja uma transformação, utilizando conversores
analógico-digitais para transformar estas informações analógicas em sequências de 0s e
1s.

Devido ao avanço das técnicas utilizadas, a evolução e a crescente redução do


custo dos componentes eletrônicos, o processamento de sinais digitais está disseminado
em diversas áreas do conhecimento como a física, química, biologia, astronomia, entre
outras, como o processamento digital de imagens nas áreas de medicina e biometria [1].

Biometria é a ciência envolvendo a análise estatística de características


biológicas. Com técnicas biométricas, é possível fazer medições de características
únicas em cada ser vivo. No ser humano, pode-se citar a impressão digital, a voz e a
face. O uso de técnicas biométricas nos seres humanos tem como principal objetivo
identificar pessoas a partir de suas características peculiares, podendo ser fisiológicas,
como a face, ou comportamentais, como a voz.

Nas duas últimas décadas, algumas das principais aplicações do processamento


de imagens são nas áreas biomédicas e biométricas [1]. O uso de computadores tornou
possível a automatização e melhor qualidade na identificação humana e viabilizou a
exploração de características impossíveis de serem analisadas sem o auxílio de sistemas
computacionais, como a análise da íris. Em consequência disso, aumentou o interesse
em pesquisas relacionadas à biometria humana, o que vem contribuindo para o avanço
das técnicas.

Na implementação de um sistema biométrico eficiente e flexível é necessário


aliá-lo a um sistema computacional, isso porque a captura das características humanas é
realizada por sensores ópticos e/ou eletrônicos, que as transformam em sinais, como
imagem e sons. Após essa etapa, é realizada a extração das características que irão
identificar a pessoa. Por isso, o desenvolvimento de sistemas biométricos está
diretamente ligado ao processamento de sinais.

Para se desenvolver um sistema biométrico, é importante definir dois


parâmetros: a modalidade biométrica do indivíduo que será analisada e o poder
computacional do sistema. Depois de definidos esses parâmetros, é possível medir o
2

nível de informações que a modalidade fornece, além da capacidade de análise e


extração que o sistema possui. Para a escolha desses parâmetros, é necessário considerar
a aplicação para qual o sistema é destinado: identificação ou verificação. Deste modo, é
possível projetar um sistema que atenda aos requisitos estabelecidos.

A escolha da modalidade que será utilizada para a identificação deve ser tal,
que maximize a relação entre a capacidade de identificar o indivíduo e o custo para
utilizá-la. Nesta etapa, é importante atentar para alguns aspectos teóricos, tais como
universalidade, singularidade, permanência e mensurabilidade, e também aspectos
práticos, como desempenho, aceitabilidade e proteção.

1.1 OBJETIVO/J USTIFICATIVA

O objetivo desse trabalho é implementar um sistema biométrico de


reconhecimento de face.
Na prática, para que um sistema de reconhecimento facial funcione bem, deve
automaticamente (i) detectar se uma face está presente na imagem adquirida, (ii)
localizar a face, se houver, e (iii) reconhecer o rosto de um ponto de vista geral [2].
Para isso, o trabalho foi dividido em três módulos: (1) detectar a face de uma pessoa em
uma sequência de imagens (captadas a partir de uma web cam); (2) localizar a face, se
houver, e extrair a região da imagem que a contém; (3) fazer o reconhecimento da face
extraída e exibir o nome cadastrado da pessoa cuja face pertence. Assim, o objetivo é
desenvolver os processos de localização, rastreamento e reconhecimento da face.

1.2 METODOLOGIA

Para realização desta tarefa, inicialmente, tem-se que capturar a imagem da face
do indivíduo por meio de uma web cam. Posteriormente, realiza-se o pré-
processamento, aplicando filtros de imagem para tornar a imagem capturada mais
adequada ao modelo. Esta etapa estará presente na fase de treinamento do algoritmo, e
também na fase de reconhecimento para que os ruídos sejam minimizados e as imagens
tornem-se o mais similar possível.
Na fase do reconhecimento, captura-se a imagem de entrada, realiza-se a
detecção da face do indivíduo, extraindo as features e comparando-as com a base de
dados, como ilustrado na Figura 1.1, resultando em uma massa de dados de imagens
reconhecidas ou não. A partir dos dados de reconhecimento, pode-se fazer uma análise,
validando ou não o modelo. Para este fim, utilizaram-se os métodos holísticos,
considerados por Jenkins [22], Tan [33] e Yang, Ahuja e Kriegman [40], as técnicas
mais bem sucedidas, ou seja, técnicas que buscam aproximar-se do método humano de
reconhecimento, que realiza o reconhecimento por comparação. A técnica mais utilizada
na atualidade é a Eigenface, que utiliza a combinação de álgebra linear e modelos
estatísticos para gerar um espaço de faces, posteriormente, comparando com outras
faces.
3

Figura 1.1: Etapas para o reconhecimento de faces [15].

A capacidade de identificar e reconhecer faces, percebendo as emoções que elas


transmitem é uma importante habilidade humana, que pode facilmente perceber a
fisionomia, estimar a idade, entre outras observações. Esta tarefa, ao ser humano,
revela-se como algo extremamente trivial, entretanto, em ambientes computacionais
esta trivialidade torna-se um problema extremamente complexo e instigante. O grande
desafio é construir um sistema computacional que reproduza essa capacidade e que
busque aperfeiçoar esta habilidade.

1.3 MOTIVAÇÃO

O reconhecimento facial tem tido uma atenção significativa por parte da


comunidade científica [2], [18], [22], disponibilizando sistemas de reconhecimento
facial com desempenhos de verificação razoáveis [18]. Um dos principais motivos que
impulsionaram as pesquisas na área de biometria foi à segurança [22]. Com a
necessidade de proteger o crescente volume de informações, controlar o acesso a
determinados locais, identificar criminosos e/ou terroristas nos aeroportos, localizar
pessoas desaparecidas, entre outras, com uma precisão aceitável, é que se procura
desenvolver sistemas de segurança confiáveis. Isso é possível unindo a esses sistemas
modalidades de biometria que, em geral, são menos suscetíveis a falhas. Apesar dos
avanços conseguidos, vários problemas ainda precisam ser solucionados para que um
sistema de reconhecimento obtenha índices de acerto acima de 95% [42]. Este cenário
torna a pesquisa na área de grande valor tanto científico quanto prático.
4

1.4 LIMITAÇÕES DA TÉCNICA

A implementação de um sistema de reconhecimento de face, pressupõe o estudo


de técnicas de detecção e extração automática de faces em imagens complexas, extração
de features, e classificação. Para viabilizar esta última etapa, sistemas de
reconhecimento de faces realizam comparações de métricas padrões entre features.
Estas comparações são utilizadas para decidir se a face é ou não do indivíduo. Para
Jenkins [22] essa abordagem não é confiável. A razão é que as pequenas diferenças
entre as métricas das faces são facilmente distorcidas por mudanças na iluminação,
pose, expressão, modificações da face do usuário (crescimento de barba ou
envelhecimento, por exemplo), ligeiras mudanças de ângulo de aquisição da imagem, e
até mesmo a distância focal da lente da câmera. Um sistema robusto precisa apresentar
capacidade de suportar alterações entre a imagem sob análise e as imagens usadas na
etapa de treinamento do reconhecedor. A Figura 1.2 ilustra a mudança de iluminação.

Figura 1.2: Mudança de iluminação [15].

1.5 ORGANIZAÇÃO DO TRABALHO

O trabalho está dividido em 5 capítulos. O capítulo 2 aborda os principais


conceitos da biometria, as características gerais, as modalidades mais exploradas e
alguns exemplos de aplicações biométricas.
O Capítulo 3, restringe o universo do trabalho ao reconhecimento de faces,
explorando as principais técnicas utilizadas nos métodos de localização e
reconhecimento, apresentando os conceitos matemáticos das técnicas utilizadas na
implementação do trabalho.
No Capítulo 4 será apresentado detalhes da implementação, os testes realizados
e os respectivos resultados.
Por fim, o capítulo 5 apresentará as conclusões gerais e as perspectivas
futuras.
5

2 SISTEMAS BIOMÉTRICOS

2.1 INTRODUÇÃO

Nos últimos dez anos os esforços para desenvolver sistemas biométricos,


especialmente reconhecedores de faces, se intensificaram. Simular a capacidade humana
de reconhecimento não é uma tarefa trivial, demanda grande poder computacional e
encontra diversas limitações, como algumas que foram apresentadas no capítulo
anterior. Neste capítulo, será feita uma apresentação da biometria, serão mencionadas
algumas modalidades mais usuais e as aplicações para estes sistemas.

2.2 BIOMETRIA

A palavra biometria deriva das palavras gregas bios (vida) e metrikos (medida).
É uma ciência que estuda o uso das características físicas e comportamentais dos seres
vivos para identificá-los e/ou reconhecê-los. As informações biométricas como altura,
cor dos olhos, simetria da face, dentre outras, são maneiras de quantificar as
características de determinado indivíduo e assim descrevê-lo.

A utilização da biometria é muito antiga [19], no entanto, com o surgimento


dos computadores, os sistemas biométricos ganharam um grande aliado pois, com a
tecnologia oferecida por esses equipamentos tornou-se viável a pesquisa de
características importantes que antes eram difíceis de se analisar de maneira adequada,
como a íris e a retina. Além disso, possibilitou aumentar a confiabilidade e o
detalhamento nas análises, viabilizando sistemas biométricos com maior qualidade.

Um sistema biométrico é essencialmente um sistema de reconhecimento de


padrões que realiza operações de aquisição de dados biométricos do indivíduo, extração
de características dos dados adquiridos e comparação dessas características com os
padrões de sua base de dados [21]. Os sistemas biométricos podem oferecer as seguintes
funções:

 Verificação: o sistema compara os dados biométricos capturados com os


modelos biométricos da pessoa que estão armazenados no banco de dados para
fazer a validação da identidade da pessoa. Nestes sistemas, o indivíduo deseja
ser reconhecido e reivindica sua identificação. O reconhecimento positivo tem o
objetivo de evitar que várias pessoas usem a mesma identidade [37].
 Identificação: o sistema reconhece o indivíduo comparando as informações de
todos os usuários no banco de dados com os dados de entrada, estabelecendo a
identidade do indivíduo sem que esse solicite sua identificação [37].

Ambos os sistemas são importantes, contudo são apresentados em contextos diferentes.


Nos sistemas de verificação, o indivíduo diz ser uma determinada pessoa e o sistema
6

verifica se a métrica introduzida é igual à previamente armazenada no banco de dados.


Estes são sistemas 1-1 (um para um), pois ele confere a veracidade dos dados de entrada
com os armazenados. Nos sistemas de identificação, procura-se no banco de dados as
mesmas informações biométricas que estão sendo introduzidas, que podem existir ou
não. Estes são sistemas 1-N (um para muitos), pois os dados de entrada são comparados
com vários dados armazenados. A Figura 2.1 ilustra como funcionam essas funções,
além do processo de inscrição do usuário ao sistema.

A análise do domínio da aplicação é uma etapa muito importante no


desenvolvimento de sistemas biométricos. Nesta etapa, são levantadas as necessidades
quanto ao poder de processamento e também a modalidade biométrica a partir da qual
serão obtidas as informações biométricas. A partir destas informações e realizando-se os
testes é possível mensurar a eficiência do sistema e o custo para o desenvolvimento.

Figura 2.1: Esquemático das funções de sistemas biométricos [21].


7

Além de saber a função do sistema, é necessário definir quais modalidades


biométricas serão utilizadas para reconhecer o indivíduo e quais técnicas devem ser
usadas para extrair as características do sinal biométrico obtido. Estas definições
independem da função do sistema.

A escolha da modalidade que será utilizada para reconhecer o indivíduo, em


princípio, pode ser qualquer uma, desde que represente uma característica humana
fisiológica ou comportamental. As características fisiológicas são as inatas ao ser
humano e as comportamentais são adquiridas. No ponto de vista de eficiência e
generalidade, as características fisiológicas são mais eficientes que as comportamentais,
pois a variação na classe de característica fisiológica tende a ser menor [19]. No entanto,
devem-se seguir alguns critérios na escolha dessas informações, obedecendo aos
requisitos necessários para que se possa desenvolver um sistema de reconhecimento de
pessoas viável. Estes requisitos estão descritos na Tabela 2.1.

Tabela 2.1: Tabela com os requisitos gerais de um sistema biométrico [21].

Universalidade Todo indivíduo deve possuir a característica biométrica adotada;

Distinção Quaisquer que sejam, duas pessoas devem ser suficientemente


diferentes em termos da característica biométrica;

Permanência A característica biométrica deve ser imutável, ou seja, invariável


com o tempo;

Mensuração A característica biométrica dever ser passível de ser medida;

Desempenho Refere-se à exatidão possível, à velocidade do reconhecimento e aos


recursos necessários para um reconhecimento com a capacidade de
reconhecimento e velocidade aceitáveis, bem como os fatores
operacionais e ambientais que afetam a capacidade e a velocidade
do reconhecimento;

Aceitabilidade Número de pessoas que estão dispostas a aceitar o uso de uma


identificação biométrica;

Fraude Dificuldade ou facilidade do sistema ser enganado por meio de


métodos fraudulentos.

Apesar da tecnologia biométrica ter provado ser eficiente na substituição de


PINs (tradução, do inglês personal identification number) e senhas, tendo como
principais vantagens a segurança, velocidade e aceitação do usuário [21], esta
tecnologia tem problemas de confiabilidade, principalmente, pelo elevado número de
8

falsos-positivos e rejeitados [12] que é observado em sistemas reais, contrapondo às


taxas de acerto em condições ideais que chegam a 90% de acertos.

Em situações reais, as condições deixam de ser animadoras e muitas pessoas


deixam de utilizar o sistema por não confiarem em sua eficiência [31]. No entanto,
avanços nas pesquisas [7], [12], [13], [24], [29], [31], [39], [41], têm diminuído este
hiato entre as situações reais e as simuladas ou típicas de um ambiente controlado.

2.3 MODALIDADES BIOMÉTRICAS

Atualmente existem várias modalidades biométricas sendo utilizadas, algumas


comerciais e outras somente nas pesquisas ainda. Algumas dessas modalidades serão
apresentadas brevemente.

2.3.1 DNA

O ácido desoxirribonucléico é uma molécula formada por duas cadeias,


geralmente na forma de dupla hélice, que contém informações genéticas dos organismos
celulares e da maior parte dos vírus. É um código único para cada organismo, exceto no
caso de gêmeos univitelinos que possuem padrões de DNA idênticos. É atualmente
utilizado, principalmente, no contexto das aplicações forenses de reconhecimento de
pessoas e pode ser coletado através do sangue, fio de cabelo, células dos dentes, unhas,
urina, saliva, como é mostrado na Figura 2.2 e outros fluidos corporais [3]. No entanto,
possui três questões limitantes para outras aplicações:

1. Contaminação e sensibilidade: é fácil roubar uma amostra de DNA de


um sujeito;
2. Problemas no reconhecimento automático em tempo real: a tecnologia
atual para analisar DNA requer métodos químicos que necessitam do
trabalho de especialistas e não é voltado para um reconhecimento
não-invasivo;
3. Questões de privacidade: informações sobre susceptibilidade de uma
pessoa para determinadas doenças poderiam ser adquiridas a partir do
padrão de DNA, podendo resultar em discriminação, por exemplo, no
momento de uma contratação para emprego.
9

Figura 2.2: Coleta de saliva. Processo pode ser invasivo e indivíduo pode recusar fazer [15].

2.3.2 Varredura de Veias da Mão

Esta modalidade consiste em analisar os padrões dos vasos sanguíneos na parte


posterior da mão, utilizando a luz infravermelha. Esta informação das veias é exclusiva
em cada indivíduo, mesmo entre gêmeos univitelinos, e até mesmo entre a mão direita e
esquerda de uma pessoa. Desta maneira, o reconhecimento através desta técnica, foi
considerado muito seguro e difícil de violar, já que os padrões de veias da palma da mão
estão dentro do corpo [50].

A tecnologia não é invasiva, pois a análise é feita sem contato físico direto com
a superfície do dispositivo de varredura. Está comercialmente disponível em terminais
de auto-atendimento bancário (Figura 2.3).

Figura 2.3: Identificação biométrica já utilizada em terminais de auto-atendimento bancário


utilizando varredura de veias da mão [15].
10

2.3.3 Pulso Arterial

Nesta modalidade, o pulso sanguíneo em um dedo, é medido com sensores


infravermelhos. Ainda em fase experimental tem uma alta taxa de falsos positivos,
tornando-se atualmente inadequada para a identificação pessoal.

2.3.4 Orelha

Sugere-se que a forma da orelha e da estrutura do tecido cartilaginoso do


pavilhão auricular tem uma estrutura singular em cada indivíduo. Iannarelli [20]
concluiu que “em, literalmente, milhares de orelhas examinadas, nunca duas orelhas
foram classificadas como idênticas – nem mesmo as orelhas do mesmo indivíduo. A
singularidade mantém-se verdadeira em casos de gêmeos idênticos, triplos e
quádruplos”.

As abordagens de reconhecimento de orelha são baseadas na correspondência


da distância dos pontos mais proeminentes do ouvido, além de contornos e tamanho do
pavilhão. Esta técnica pode ser usada como uma fonte suplementar de provas em
sistemas de identificação e reconhecimento. A Figura 2.4 ilustra as etapas identificação
dos contornos e as distâncias dos pontos mais proeminentes da orelha.

Figura 2.4: Etapas realizadas no processo de reconhecimento de orelha [6].


11

2.3.5 Impressão Digital

A impressão digital é uma das mais populares e também uma das mais antigas
modalidades biométricas [19]. Apresenta características únicas em cada indivíduo e
imutabilidade durante toda a vida. É comumente utilizada para identificação de seres
humanos e amplamente explorada no desenvolvimento de sistemas biométricos [32],
[34]. Diversos governos utilizam está modalidade para identificação e comprovação de
identidade do indivíduo, e esta modalidade vem mostrando resultados aceitáveis no
reconhecimento e identificação de pessoas [26].

A impressão digital é formada por uma série de traços e sulcos nas


extremidades dos dedos. Estes traços e sulcos são características inimitáveis presentes
nas digitais, denominados minúcias, que são formadas pelas bifurcações ou terminações
entre esses traços e sulcos. A posição relativa das minúcias são características imutáveis
e inimitáveis de um indivíduo e através do posicionamento das minúcias é possível
identificar e reconhecer uma pessoa. A Figura 2.5 ilustra a impressão digital e suas
minúcias.

Figura2.5: (a) Imagem binária de uma impressão digital; (b) Uma impressão digital após a
identificação das minúcias [2].

Um sistema biométrico de reconhecimento de impressão digital necessita de


um sensor de aquisição para capturar a imagem. É necessário que o sensor permita a
captura de imagens de boa qualidade, já que a identificação depende dos detalhes
obtidos na representação dos traços e sulcos. Nestas imagens capturadas é realizado o
afinamento dos traços e sucos, de modo que sejam transformados em simples linhas, o
que facilita a identificação das terminações e bifurcações, possibilitando encontrar as
minúcias. A identificação do indivíduo é feita através da avaliação relativa das posições
das minúcias. A Figura 2.6 mostra alguns tipos de minúcias da impressão digital.
12

Figura 2.6: Tipos de minúcias identificadas na digital [43].

Imagens com baixa qualidade e pouca resolução de detalhes podem dificultar a


identificação de minúcias, propiciando uma falha na identificação.

Devido ao seu baixo custo, é uma técnica acessível para um grande número de
aplicações. Suas limitações são provocadas por fatores de envelhecimento e rugosidade
da pele e sujeira no leitor digital. A maior desvantagem destes sistemas está na
possibilidade de ser facilmente burlado. Cientistas japoneses conseguiram burlar um
sistema desses servindo-se de métodos fraudulentos [28]. Utilizou-se moldes de
impressões digitais feitas a base de silicone e gelatina caseira e o sistema validou os
moldes como se fossem pessoas. Com esses moldes, os cientistas conseguiram burlar a
segurança do sistema 80% das tentativas realizadas, demonstrando a fragilidade que a
impressão digital pode oferecer aos sistemas biométricos.

2.3.6 Reconhecimento de Marcha

Reconhecimento de marcha é uma modalidade biométrica emergente que


envolve a identificação de pessoas através da análise da maneira como elas andam.
Embora a investigação ainda esteja em andamento, esta modalidade tem atraído o
interesse, como um método de identificação, porque é não-invasivo e não requer a
cooperação do sujeito.

Reconhecimento de marcha também poderia ser usado à distância, tornando-se


adequado para identificar agressores em uma cena de crime. No entanto, o
reconhecimento de marcha não se limita a aplicações de segurança, sendo também
13

empregada em aplicações médicas. Por exemplo, reconhecer precocemente mudanças


nos padrões de caminhar pode ajudar a identificar doenças, como a doença de Parkinson
e esclerose múltipla em seus estágios iniciais.

A tecnologia de reconhecimento de marcha ainda está em seus estágios de


desenvolvimento. Nenhum modelo, que seja suficientemente preciso e comercializável,
foi desenvolvido até o momento. A tecnologia está avançando em um ritmo rápido,
principalmente, devido a patrocínios governamentais para apoiar projetos de pesquisa,
como o que acontece no Instituto de Tecnologia de Georgia, no Instituto de Tecnologia
de Massachusetts, a Universidade de Tecnologia de Lappeenranta, e outras instituições
acadêmicas.

Existem, atualmente, dois tipos principais de técnicas de reconhecimento de


marcha em desenvolvimento. A primeira, o reconhecimento de marcha com base na
análise automática de imagens de vídeo, é a mais amplamente estudada e experimentada
entre as duas. Amostras de vídeo da caminhada do sujeito são tomadas e as trajetórias
das articulações e ângulos ao longo do tempo são analisadas, conforme a Figura 2.7.
Um modelo matemático do movimento é criado, e posteriormente é comparada com
outras amostras a fim de determinar sua identidade.

Figura 2.7: Amostras das articulações e ângulos observadas durante a caminhada [48].
14

O segundo método usa um sistema de radar muito semelhante ao utilizado por


policiais para identificar carros em alta velocidade. O radar registra o ciclo da marcha
que é criado pelas várias partes do corpo do sujeito quando anda. Esta informação é
então comparada com outras amostras para identificá-los.

Esforços estão sendo feitos para tornar o reconhecimento de marcha tão preciso
e útil possível, esta tecnologia pode não ser tão fiável quanto à impressão digital ou o
reconhecimento de íris, no entanto prevê-se que sistemas de reconhecimento de marcha
serão lançados em um estado funcional dentro dos próximos cinco anos, e serão usados
em conjunto com outras modalidades como método de identificação e autenticação [49].

2.3.7 Termograma Facial

Modalidade que detecta padrões de calor gerados pela ramificação dos vasos
sanguíneos emitidos a partir da pele. Estes padrões, denominados termogramas, são
distintos e são capturados por uma câmera infravermelha. A grande vantagem do
método é que, ao contrário de sistemas que dependem de boas condições de iluminação,
os infravermelhos podem reconhecer com pouca luz. Embora os sistemas de
identificação facial com termogramas tenham sido idealizados em 1997, sua pesquisa é
difícil devido aos altos custos envolvidos no processo. A Figura 2.8 ilustra um
termograma facial.

Figura 2.8: Termograma facial [8].

2.3.8 Íris

A íris é um órgão interno do olho de formato anelar que está situada atrás da
córnea e do humor aquoso, entre a esclera (parte mais clara do olho) e a pupila (parte
mais escura do olho). É responsável pela coloração dos olhos, e ajuda a regular a
quantidade de luz que entra no olho.

A formação da textura da íris no olho humano depende das condições iniciais


da mesoderma embrionária a partir da qual se desenvolve. Inicia-se no terceiro mês de
gestação e as estruturas que criam seu padrão completam-se, na sua maior parte, no
15

oitavo mês, embora o crescimento da pigmentação possa continuar nos primeiros anos
após o nascimento [10].

A estrutura da íris constitui-se de diversas características de minúcias, tais


como: sardas, sulcos de contração, listras, etc. Essas características, geralmente
chamadas de textura da íris, são únicas e permanecem praticamente inalteradas por toda
existência do indivíduo [4], [11], [38]. Todas essas características intrínsecas da íris
produzem grande autenticidade e exclusividade dentre os indivíduos.

Esta modalidade de reconhecimento é considerada simples, no entanto,


eficiente. Sistemas baseados nesta técnica possibilitam uma identificação com elevado
grau de precisão, mesmo com limitados recursos computacionais [9]. Por isso, existem
muitas pesquisas que utilizam a íris como modalidade biométrica [23] [25].
A Figura 2.9, mostra uma íris humana.

Figura 2.9: Imagem da íris humana [44].

De forma resumida, um sistema de reconhecimento baseado na análise da íris é


constituído de três etapas. A primeira etapa é a de aquisição de imagens, onde uma
sequência é capturada para garantir um número suficiente de imagens. É necessário que
sejam capturadas várias imagens, pois é comum as pessoas sentirem-se desconfortáveis
quando necessitam aproximar o olho do scanner, movimentado a cabeça e piscando os
olhos, resultando na aquisição de imagens com pouca qualidade para o reconhecimento.
Nesta etapa, é necessário também um processamento dessas imagens, visando melhorar
a sua qualidade e realçar as características de textura da íris. Na próxima etapa, no
processo de localização, os objetivos são: detecção da íris viva, para que o sistema não
seja burlado por fotos de íris ou até mesmo lente de contato; extração da imagem da íris,
que tem a finalidade de obter somente a região da íris, descartando a pupila e esclera; e
a extração de características, onde o padrão da íris é codificado através de um vetor,
contendo as informações processadas apenas desta região de interesse. A última etapa é
o reconhecimento, onde este vetor de características é comparado com os demais
padrões do banco de dados [45].
16

2.3.9 Padrão de Digitação

A modalidade padrão de digitação é baseada no monitoramento dos padrões


comportamentais do usuário ao digitar durante uma sessão. De modo geral, o sistema
requer que o usuário, na primeira utilização, digite a mesma frase determinado número
de vezes. Contudo, teoricamente, um sistema pode na primeira utilização recolher a
informação necessária para encontrar um padrão, sem o conhecimento do usuário.
Também é possível ao sistema adaptar o modelo do padrão ao longo do tempo, de
forma a ajustar-se a novos padrões recolhidos [46].

2.3.10 Palma da Mão

Esta modalidade analisa os padrões que a palma da mão possui que são
similares aos encontrados na impressão digital. Considerando que a área da mão e maior
que a área do dedo humano, espera-se que o reconhecimento seja melhor, já que o
sistema teria mais dados para comparar. Em um scanner de alta resolução, todas as
características da palma da mão, como a geometria, cume e vale, linhas principais e
rugas podem ser observadas, criando um sistema de verificação com precisão aceitável.

2.3.11 Varredura de Retina

Sistemas de reconhecimento de retina identificam o indivíduo através dos


padrões de vasos sanguíneos existentes na retina, como ilustrado na Figura 2.10. Estes
padrões constituem uma das características mais estáveis e únicas no indivíduo [17],
não apresentando variabilidade durante a vida, possivelmente devido à origem
embrionária da retina. No entanto, alguns tipos de doenças podem alterar
significativamente essas informações, embora a possibilidade seja remota. Por
apresentar tais características, a retina pode possibilitar o desenvolvimento de sistemas
biométricos altamente seguros [27]. Porém a aquisição das imagens é um processo
voluntário o que contribui negativamente para a utilização do método.
17

Figura 2.10: Padrões que caracterizam a retina [47].

2.3.12 Assinatura

A assinatura possibilita o reconhecimento de uma pessoa de maneira única.


Esse conceito de unicidade é utilizado há décadas para identificar pessoas e validar
documentos [19]. Desta forma, o uso dessa característica em sistemas biométricos é
explorado de maneira ampla, tendo grande aceitabilidade, devido às pessoas
considerarem seu funcionamento intuitivo [14] [30].

A verificação da assinatura manuscrita pode ser estática ou dinâmica. Na


verificação estática, são analisadas as formas geométricas da assinatura do usuário,
observando a tendência para letras arredondadas ou inclinadas. Na verificação dinâmica,
além da análise das formas geométricas, é feita uma análise física de como a assinatura
é escrita, avaliando a velocidade, pressão aplicada na caneta, identificação dos
movimentos da caneta e os pontos em que a caneta é suspensa.

A verificação mais comum é a dinâmica, ou seja, sistemas que analisam como


é assinado e não apenas a imagem da assinatura.

2.3.13 Voz

Esta modalidade consiste em identificar um indivíduo através da análise das


características comportamentais e fisiológicas vocais, como trato vocal, boca, fossas
nasais e lábios. Estas características, que propiciam a emissão da voz humana, são
únicas para cada indivíduo, o que possibilita a sua exploração em sistemas biométricos
[16] [36].

Com um sistema de aquisição de som, é captada uma amostra da voz de um


indivíduo. Em seguida, é realizada uma análise dessa amostra, utilizando técnicas de
processamento de sinais. Normalmente, são analisados os padrões harmônicos do som
18

captado, utilizando principalmente análise de Fourier, que analisa a forma de onda do


som, permitindo encontrar o espectro de frequência. Desta forma, diversos sons
emitidos pelas vozes podem ser caracterizados de maneira distinta, possibilitando a
identificação de uma pessoa. A identificação de uma pessoa por reconhecimento de voz
pode seguir duas abordagens diferentes: dependentes do texto e independentes do texto.
Na primeira, o trecho de fala captado para a identificação deve conter uma frase pré-
determinada. Na segunda, o sistema independe da frase pronunciada no momento da
aquisição. A abordagem independente do texto é a mais genérica, todavia é mais
complexa para desenvolver.

Alguns problemas podem propiciar variabilidade na voz, adquiridos por


exemplo, por fatores ambientais que geram ruído e podem impossibilitar a identificação
do usuário, e ainda alterações e variações da voz por razões físicas, provocadas por
gripes, resfriados, fatores emocionais, que também podem tornar impossível a
identificação do usuário. Uma maneira de burlar o sistema seria utilizar a gravação da
voz de um usuário.

2.4 APLICAÇÕES DA BIOMETRIA

A utilização de modalidades biométricas pelo homem não é recente. Há relatos


do uso de digitais desde o começo do século XIX, quando eram usadas para garantir
transações comerciais e, também, posteriormente para identificar suspeitos de crimes
[19]. Entretanto, foi no início do século XX, quando puderam ser incluídos em sistemas
computacionais, que os sistemas biométricos ganharam força, visto que os sistemas
computacionais além de melhorarem e facilitarem os métodos existentes, possibilitaram
o desenvolvimento de novas modalidades, como o reconhecimento da íris.

Hoje em dia o universo das aplicações da biometria é vasto e versátil, podendo


proporcionar ao usuário ganhos admiráveis em termos de segurança, simplicidade e
rapidez na validação de resultados [6]. As aplicações de sistemas biométricas são
voltadas, principalmente, para a área de segurança. E, podem ser categorizadas como:

 Aplicações comerciais - login de redes, segurança de dados eletrônicos,


comércio eletrônico, acesso a Internet, cartões de banco, ensino à distância,
reconhecimento do usuário para acionamento automático de suas preferências,
etc.
 Aplicações governamentais - Cartão de identidade, carteira nacional de
habilitação, INSS, controle de passaportes, controle de fronteira, etc.
 Aplicações forenses - Identificação de cadáveres, investigação criminal, combate
ao terrorismo, análise de paternidade e maternidade, localização de pessoas
desaparecidas [21].
19

2.5 CONSIDERAÇÕES FINAIS

Cada modalidade biométrica tem suas vantagens e desvantagens. Então, na


escolha de uma modalidade a ser utilizada, há necessidade de avaliação de vários
fatores, como logísticos, de confiabilidade e financeiros, sabendo que nenhuma dessas
modalidades é completa ou perfeita, mas adequada a solução do problema.

Em evolução constante, estes sistemas estarão cada vez mais presentes no


cotidiano das pessoas. A Tabela 2.2 apresenta uma comparação entre as modalidades
apresentadas neste capítulo, além da técnica de reconhecimento de face que será
apresentada detalhadamente no capítulo seguinte, em relação aos sete requisitos que
devem ser considerados na adoção de uma modalidade biométrica. A análise da tabela
mostra como a face tem uma excelente aceitação, porém tem problemas com seu
desempenho e com a similaridade entre as pessoas.

Tabela 2.2: Tabela comparativa do desempenho dos métodos biométricos [21].


Universalidade

Aceitabilidade
Identificador

Permanência

Desempenho
Mensuração
Biométrico

Distinção

Fraude
DNA Alta Alta Alta Baixa Alta Baixa Baixa
Orelha Média Média Média Média Média Alta Média
Termograma da Alta Alta Baixa Alta Média Alta Baixa
Face
Impressão Média Alta Alta Média Alta Média Média
Digital
Marcha Média Baixa Baixa Alta Baixa Alta Média
Geometria da Média Média Média Alta Média Média Média
Mão
Veias da Mão Média Média Média Média Média Média Baixa
Íris Alta Alta Alta Média Alta Baixa Baixa
Teclar Baixa Baixa Baixa Média Baixa Média Média
Odor Alta Alta Alta Baixa Baixa Média Baixa
Impressão da Média Alta Alta Média Média Média Média
Mão
Retina Alta Alta Média Baixa Média Média Média
Assinatura Baixa Baixa Baixa Alta Baixa Alta Alta
Voz Média Baixa Baixa Média Baixa Alta Alta
Face Alta Baixa Média Alta Baixa Alta Alta
20

3 IMPLEMENTAÇÃO DE LOCALIZAÇÃO E RECONHECIMENTO FACIAL

3.1 INTRODUÇÃO

A partir da face humana é possível extrair características que possibilitem o


reconhecimento de uma pessoa. Por este motivo, a face foi uma das modalidades
biométricas mais estudadas dos últimos anos. Especialmente para o desenvolvimento de
sistemas de monitoramento de segurança, aplicações em sistemas robóticos e no
desenvolvimento de sistemas de análise de expressões do rosto, como os usados na
psicologia.

O reconhecimento de faces é intuitivo para o ser humano, e as pesquisas


baseiam-se no entendimento desta premissa para o desenvolvimento das aplicações.
Para isso, exigem-se métodos computacionais que realizem os processos de localização
e, posteriormente, reconhecimento. Por esse motivo, foram propostos vários algoritmos
nos últimos anos.

As técnicas de localização e reconhecimento de face podem ser divididas em


quatro categorias [40]. No entanto, algumas técnicas podem apresentar aspectos de mais
de uma categoria diferente, devido à combinação de algoritmos, realizada para melhoria
de desempenho de sistemas. Todavia as quatro categorias são suficientes para classificar
as técnicas existentes. São elas:

 Métodos baseados no conhecimento: Nesta abordagem, os métodos


são baseados em regras derivadas do conhecimento comum sobre rostos
humanos. Por exemplo, em uma imagem de rosto geralmente aparecem
dois olhos simétricos entre si, um nariz e uma boca. Tais métodos são
utilizados principalmente para localização.
 Abordagens de características invariantes: O objetivo desta classe é
encontrar e utilizar características estruturais que não sofrem influência
de variações de posição, iluminação, dentre outras. Tais técnicas
geralmente realizam segmentação de pele e modelagem estatística da
textura da face humana. São mais utilizadas para localização.
 Métodos de casamento de padrões (template matching): Nesta
técnica, o processo de reconhecimento é realizado comparando vários
modelos de padrões que descrevem a face com as imagens de entrada.
São utilizados tanto para localização quanto reconhecimento.
 Métodos baseados na aparência: Direfente do casamento de padrões,
nesta abordagem os modelos são ensinados a partir de um treinamento.
Desta forma, o algoritmo aprende a identificar as faces a partir de
exemplos. Estes métodos são utilizados, principalmente, para o
reconhecimento.
21

Tais algoritmos consideram diversos aspectos da face humana, implementando


métodos para localizar a face em uma imagem, podendo realizar o rastreamento quando
sequências de imagens ou vídeos são utilizados. Em seguida, é aplicado um método de
extração de características, para a realização do reconhecimento da face.

É importante entender a diferença entre localizar e reconhecer uma face.


Localizar a face objetiva, simplesmente, definir o posicionamento da face na imagem,
enquanto que o reconhecimento identifica as características inerentes da face e indica a
quem pertence.

Neste capítulo será apresentado o modelo implementado para realizar o


reconhecimento facial. Este modelo está dividido em três etapas: localização e
rastreamento da face, pré-processamento das imagens localizadas e o reconhecimento
da face. Implementou-se um sistema offline e outro online, onde foram feitas análises
quantitativas e qualitativas, respectivamente, em relação aos resultados observados.

3.2 CARACTERÍSTICAS

A face humana possui características, como olhos, boca, nariz, sobrancelhas e


cabelo que, de maneira intuitiva, são utilizadas para reconhecer as pessoas. É possível
caracterizar uma pessoa analisando posicionamento, distância, forma e tamanho destas
características. É assim que os sistemas de reconhecimento de faces são desenvolvidos,
avaliando tais características e relacionando-as a uma determinada pessoa.

As características mais exploradas são sobrancelhas, olhos, nariz e boca [40] e


têm sido utilizadas com sucesso para o reconhecimento de faces frontais (Figura 3.1).
No entanto, no caso de imagens de perfil, há oclusão de características dificultando a
identificação. Juntam-se a este, outros problemas, que têm desafiado e motivado as
pesquisas nesta área:

 Pose: As imagens podem ser frontais e de perfil, podendo ocluir parcial


ou totalmente algumas características.
 Expressão facial: Expressões de choro, riso, caretas, entre outras,
alteram as características da face.
 Outras estruturas: Presença ou ausência de outras estruturas, como
barba, bigode, franja e acessórios, como óculos, podem ocasionar erro
na identificação.
 Oclusão: Objetos da cena podem ocluir parcial ou totalmente
características da face.
 Orientação da imagem: As imagens podem ser apresentadas
distintamente, quanto ao posicionamento, que pode ter ocorrido devido
a rotações em direções diferentes na imagem.
22

 Condições da imagem: Pode haver variações na luminosidade no


momento da captura da imagem, além da presença de ruídos referentes
ao equipamento de aquisição, o que poderia influenciar no resultado do
reconhecimento.

Estes problemas, na maioria das vezes inerentes à aplicação pretendida, devem


ser considerados na decisão sobre o método a ser utilizado, além da escolha da
modalidade que será analisada. Estes desafios impulsionam as pesquisas na área,
resultando na grande quantidade de métodos existentes para o reconhecimento.

Figura 3.1: Imagem frontal - Pontos que podem ser analisados no reconhecimento de faces [2].

3.3 LOCALIZAÇÃO E RASTREAMENTO FACIAL

A localização e o rastreamento de objetos em cenas têm motivado muitas


pesquisas, principalmente pela importância em aplicações como reconhecimento de
faces, videoconferência, visão cibernética e realidade virtual. Por esta razão, existem
inúmeras propostas de algoritmos para tentar viabilizar, de maneira eficiente, tais
objetivos. Os problemas encontrados para o desenvolvimento de um algoritmo robusto
para este fim estão relacionados com a grande variabilidade de aspectos como
iluminação, objetos que ocluem a face e, também, os ambientes com o fundo muito
complexo para análise.

A primeira etapa do processo é a localização da face. Primeiramente, uma


imagem de entrada é analisada, procurando encontrar um objeto que possa ser uma face.
Em seguida, é necessário validar o objeto, como sendo face ou não. Posteriormente, se
foi validado como face, é iniciado o rastreamento. Nesta segunda etapa do processo, o
algoritmo deve acompanhar a face durante o período de duração da sequência de
imagens, sem perdê-la.
23

Algumas abordagens são propostas para tentar solucionar os problemas na


localização e rastreamento da face [18], mas comumente o custo computacional é
elevado. Um algoritmo foi proposto por Viola e Jones [35], que hoje está muito
próximo de ser o padrão na detecção de face por resolver tarefas de detecção com baixo
custo computacional [15]. O sucesso do algoritmo é atribuído principalmente à sua
relativa simplicidade, rapidez de execução e ao bom desempenho obtido [5]. O
algoritmo combina quatro conceitos básicos:

 Características retangulares, chamadas de características de Haar;


 Imagem Integral;
 Algoritmo de aprendizagem – AdaBoost;
 Um classificador em cascata.

Na implementação da etapa de localização de face, utilizou-se o classificador


“CvHaarClassifierCascade”1, disponível na biblioteca OpenCV, para realizar a
localização frontal da face. Optou-se pela localização frontal devido ao seu melhor
desempenho na detecção. Depois da definição do método que o classificador utilizará,
este é passado como parâmetro para a função “cvHaarDetectObjects” que implementa o
algoritmo de Viola e Jones [35], retornando um retângulo na imagem que pode conter o
objeto especificado pelo classificador. Informações detalhadas sobre o método
implementado podem ser encontradas no artigo de Viola e Jones [35].

3.4 PRÉ-PROCESSAMENTO

Uma imagem digital é uma função f(x,y) discretizada tanto em coordenadas


espaciais quanto em brilho. Uma imagem digital pode ser representada como sendo uma
matriz cujos índices de linhas e de colunas identificam um ponto na imagem, e o
correspondente valor do elemento da matriz identifica o nível de cinza naquele ponto.
Os elementos dessa matriz digital são chamados de "pixels" ou "pels" [15].

A finalidade principal do processamento de imagens é o aprimoramento de


informações pictóricas para interpretação humana ou a análise automática por
computador de informações extraídas de uma cena. É caracterizado por soluções
específicas, pois técnicas que funcionam bem para determinado problema podem
mostrar-se inadequadas para outros.

Na implementação deste trabalho, foram aplicadas algumas técnicas de


processamento de imagens visando preparar as imagens para um melhor desempenho do
sistema na identificação. O processamento realizado consiste em converter as imagens
coloridas capturadas para escala cinza, aplicar uma máscara para obter somente a face
interna na imagem, redimensionar a imagem, e equalizar o histograma. Estes
1
Para obter a face frontal no classificador “CvHaarClassifierCascade” é necessário passa o arquivo Haar
Cascade: “haarcascade_frontalface_alt.xml" como parâmetro para esta função.
24

processamentos são facilmente efetuados utilizando funções implementadas da


biblioteca OpenCV.

Para obter apenas a região interna da face, foi aplicada uma máscara nas
imagens de face, eliminando o cabelo e o fundo da imagem. Também foi feita a
conversão da imagem colorida para escala cinza. Esta conversão não é única, existem
ponderações diferentes para a realização desta tarefa. A função utilizada para esta
conversão neste trabalho foi a “cvCvtColor”.

O redimensionamento das imagens foi realizado, utilizando a função


“cvResize”2. O objetivo deste processamento é padronizar o tamanho das imagens para
serem utilizadas pelo sistema. E finalmente, foi realizada a equalização de histograma
da imagem, um método simples de padronizar o brilho e o contraste das imagens.

A Figura 3.2 ilustra os processamentos de segmentação da face, conversão para


níveis de cinza e a imagem após a equalização de histograma. A Figura 3.3 ilustra o
histograma da imagem em escala cinza e a Figura 3.4 o histograma da imagem
equalizado.

Figura 3.2: Face Interna: Imagem filtrada para extração somente da face interna na imagem
capturada; Escala cinza: Imagem convertida em escala cinza; Equalizada; Imagem com o
histograma equalizado.

2
Parâmetros para a ampliação e dizimação foram “CV_INTER_LINEAR” e “CV_INTER_AREA”,
respectivamente.
25

F
r
e
q
u
ê
n
c
i
a

Intensidade de brilho
Figura 3.3: Histograma da imagem em escala cinza.

F
r
e
q
u
ê
n
c
i
a

Intensidade de brilho
Figura 3.4: Histograma equalizado da imagem.

3.5 RECONHECIMENTO FACIAL

Denomina-se reconhecimento facial em processamento de sinais a processos


automatizados ou semi-automatizados que através de técnicas matemáticas comparam
imagens faciais de entrada com imagens faciais armazenadas em um banco de dados e
determinam se tais imagens testadas fazem parte ou não do banco de dados, e se
fizerem, indicam qual é essa imagem.

Para executar o reconhecimento facial é necessário extrair as características da


face, realizando o mapeamento de sua geometria e suas proporções ou ainda
26

decompondo-a. Com esses dados coletados é possível iniciar comparações com a base
de dados previamente montada, calculando a distância euclidiana entre as imagens.

Existem vários métodos propostos para o reconhecimento de faces. Estes


métodos estão divididos em dois tipos:

 Métodos baseados na aparência


 Métodos baseados em característica invariantes

Os métodos baseados na aparência são os mais explorados, sobretudo, por


realizarem o reconhecimento similarmente à maneira que o homem faz [15]. Nestes
métodos, os algoritmos de reconhecimento não possuem nenhuma informação a priori
sobre o objeto a ser detectado. Geralmente, as técnicas que pertencem a este grupo,
necessitam de várias imagens e, a partir delas, aprendem ou codificam somente o que é
necessário para realizar o reconhecimento. Normalmente, utilizam técnicas estatísticas e
aprendizado de máquina para encontrar as características necessárias da face. Um dos
métodos mais explorados nas pesquisas desta área é o de eigenfaces [2]. O objetivo é
gerar uma pequena base de vetores que representem as imagens que estão sendo
analisadas. Essa base é gerada a partir do treinamento com uma amostra das imagens
das faces, usando a transformada de Karhunen-Loève, também conhecida como PCA.

Nos métodos baseados em característica são utilizadas características


estruturais que existem na face mesmo quando a pose, o ponto de vista ou as condições
de iluminação variam.

Este método, baseado em extração de característica, torna-se complicado


quando a aparência do indivíduo altera-se significativamente, por exemplo, ao fechar os
olhos, abrir a boca, colocar óculos. Por isso, os métodos baseados na aparência são mais
robustos quando se trata do manuseio das variações na intensidade da imagem do que
das variações das características [15].

3.5.1 Análise de Componentes Principais

A necessidade de encontrar soluções para o problema de excesso de dados a


serem analisados em aplicações como de reconhecimento de faces, impulsiona
pesquisas que buscam reduzir esses dados sem que haja perdas significativas de
informação, garantindo a qualidade de análises futuras. Considerando essas premissas,
encontra-se, nos métodos de análise multivariada, um recurso prático para redução de
dados.

Análise multivariada é o ramo da estatística que estuda o comportamento das


variáveis dependentes dentro de um determinado conjunto de dados, onde é possível
observar n amostras, ou exemplos, de dados que são formados por p variáveis distintas.
Existem diversos métodos de análise multivariada, contudo seguem basicamente o
27

mesmo objetivo, que é a redução e a simplificação do problema analisado. Isso significa


que esses métodos podem reduzir o número de variáveis a serem computadas, ou
mesmo, eliminar variáveis difíceis de serem analisadas ou medidas, mas, ainda assim,
garantindo que as informações mais relevantes não sejam perdidas [2].

A Análise de Componentes Principais é dos mais antigos e conhecidos


métodos de análise multivariada [2]. Também é conhecido como transformada de
Karhunen-Loève e transformada de Hotelling. O conceito básico da PCA é realizar uma
projeção dos dados de um espaço X para outra Y, onde no espaço X as variáveis são
correlacionadas, e no Y essas novas variáveis não são correlacionadas.

Assim, considerando a aplicação da técnica PCA em um determinado conjunto


de dados, as p variáveis correlacionadas de um dado xi, são projetadas para p variáveis
não correlacionadas yi. Além disso, realiza-se uma ordenação decrescente das variáveis
yi pelas suas variâncias, ou seja, y1 possui maior variância que yp. As variáveis yi são
chamadas de componentes principais (PCs), e a i-ésima variável é o i-ésimo componente
principal. Dada a relação de independência entre as variáveis projetadas, é possível
escolher apenas algumas q variáveis, onde q<p, para representar eficientemente o
conjunto de dados. Considerando que normalmente há componentes principais
ineficientes, é possível realizar a diminuição da dimensão dos dados sem que haja
perdas significativas. A Figura 3.5 (a) ilustra um componente principal que representa a
direção dos dados de maneira eficiente e (b) um que representa de maneira ineficiente a
direção dos dados, podendo ser desconsiderado.

Variável do Variável do
espaço Y espaço Y

Variável do Variável do
espaço Y espaço Y

Figura 3.5: (a) Componente principal que representa uma direção eficiente para representar os
dados; (b) Componente principal não representa a direção mais eficiente para representar os
dados.

Eigenfaces são um exemplo de utilização de PCA aplicado ao problema de


reconhecimento de faces. Estes são autovetores da matriz de covariância associada com
conjunto de imagens de faces. A principal idéia de Eigenfaces, considera o
28

reconhecimento facial como um problema de reconhecimento 2D e baseia-se na


suposição de que no momento do reconhecimento as faces estarão na posição vertical e
frontal.

Quando se encontra os componentes principais ou os autovetores do conjunto


de imagem, cada Eigenvector tem alguma contribuição de cada face utilizada no
conjunto de faces de treinamento. Assim, os autovetores também têm uma aparência de
face e são chamados de Eigenfaces. Cada imagem no conjunto de treinamento3 pode ser
representada como uma combinação linear destas faces base. O número de Eigenfaces
obtidas, portanto, seria igual ao número de imagens no conjunto de treinamento.

Partindo de alguns pressupostos será explicado o algoritmo para encontrar as


Eigenfaces e para realizar o reconhecimento.

Pressupostos:

 Existem M imagens de treinamento de dimensão NxN que podem ser


representadas por um vetor N2x1;
 Existem K Eigenfaces mais significativas que podem satisfatoriamente
aproximar a face. Com K<M.

Algoritmo para encontrar as Eigenfaces:

1. Obter M imagens de treinamento, I1, I2,..., IM, estas imagens devem


estar pré-processadas;

2. Representar Ii como um vetor Γi


⎡ ⎤
… ⎢ ⋮ ⎥
… ⎢ ⎥
I = ⋮ ⋮ ⋮ Γ = ⋮ ⎥
⎢ (3.1)
⎢ ⎥
… ⎢ ⎥
⎢ ⋮ ⎥
⎣ ⎦

3. Encontrar o vetor da imagem média:

= ∑ Γ (3.2)

4. Subtrair a face média de cada vetor de face de entrada Γi, para obter
um conjunto de vetores Φi :

3
Conjunto de faces de treinamento é formado por imagens de faces de indivíduos, capturadas por uma
web cam.
29

Φi = Γi – (3.3)

5. Encontrar a matriz de covariância C:

C = AAT, (3.4)

onde A = [Φ1,Φ2, ... , ΦM]. A tem dimensão N2xM e C N2xN2.

6. Calcular os autovetores ui de C:
Ao invés de considerar AAT que tem dimensão N2xN2, o qual
resultaria em N2 autovetores com dimensão N2, foi considerada
ATA, pois a dimensão de A é N2 xM, portanto ATA é uma matriz
MxM. Encontrando os autovetores da matriz ATA, foi obtido M
autovetores com dimensão Mx1.

( ) = (3.5)

A partir dos autovetores é possível chegar aos autovetores ui de


C:
( )( )= (3.6)
( )( ) = ( ) (3.7)
= (3.8)
= (3.9)

Onde AAT e ATA são matrizes simétricas e a é um autovetor de


AAT e o autovetor de ATA com o mesmo autovalor.

7. Converter os autovetores para uma matriz em um processo revesso


ao passo 2.

8. Agora cada face de treinamento pode ser representada por uma


combinação linear destes autovetores ui.

Φi = ∑ , (3.10)

onde, uj são os Eigenfaces e = Φi

9. Cada imagem de treino é representada nesta base como um vetor:

= ⋮ (3.11)
30

Fase do reconhecimento:

1. Uma imagem de entrada é convertida para representação Γt e é


calculada a diferença entre a imagem de entrada e a imagem média.

Φt = Γt – (3.12)

2. Em seguida, calcular os pesos :

= Φt i = 1,2,...,k. (3.13)

formando o vetor de características da imagem de teste.

3. A imagem Φt pode ser representada como:

= ⋮ (3.14)

4. Encontrar a distância Euclidiana entre a imagem de teste e as


imagens de treino:

= ∑ − (3.15)

 Se < (limiar) a face pertence ao banco de dados.


 Se > (limiar) a face não pertence ao banco de dados.

Na implementação deste trabalho, utilizou-se a função da biblioteca OpenCV


“cvCalcEigenObjects” para calcular a imagem média, os autovalores e os autovetores.
A Figura 3.6 ilustra uma imagem média de 36 imagens de treino e a Figura 3.7 as
Eigenfaces encontradas para um treinamento com 25 imagens.

Figura 3.6: Imagem média utilizada para projetar as imagens de entrada no novo espaço.
31

Figura 3.7: Eigenfaces para um treinamento com 25 imagens.

Para a implementação do cálculo dos valores dos dados no novo espaço ( ),


foi utilizada a função da biblioteca OpenCV, “ cvEigenDecomposite”, que precisa como
atributos da imagem média, os autovetores e autovalores e projeta a imagem no
subespaço PCA.

Considerando as características da técnica PCA apresentadas nessa sessão, é


possível perceber a sua importância para problemas de redução de dados. Com a
reestruturação do espaço de características do conjunto de dados iniciais, é possível
realizar exclusões de algumas características, sem que provoque perdas de informações
relevantes. Para isso, basta tratar os autovalores , ou variâncias, como sendo
informações, e quanto maior o seu valor, maior a quantidade de informações que estão
sendo representadas.

3.6 CONSIDERAÇÕES FINAIS

O modelo implementado constitui-se de duas fases: o treinamento e o


reconhecimento. Na primeira, é necessária a utilização de dados pré-processados e
previamente armazenados em um banco de dados. Disponibilizando assim, uma base de
treino com as faces dos indivíduos que devem ser reconhecidos.

Em seguida, utilizando os frames capturados por uma web cam ou uma


imagem armazenada no banco de dados é extraída uma imagem que contenha a face
frontal de um indivíduo. Normaliza-se esta imagem às mesmas condições das imagens
do banco de dados de treino e projeta-se no espaço de face. Neste momento, a distância
euclidiana é calculada e é verificada se a face está ou não presente no banco de dados e
se estiver, a quem pertence.
32

Neste capítulo, apresentou-se o modelo utilizado na implementação do sistema


para reconhecimento de faces. Além disso, foram apresentados os pressupostos
matemáticos básicos que são necessários ao entendimento do modelo.
33

4 TESTES E RESULTADOS

Este capítulo apresenta os resultados obtidos com o desenvolvimento do


sistema de localização e rastreamento de face. Posteriormente, são apresentados os
experimentos realizados e os respectivos resultados no sistema de reconhecimento de
face.

4.1 RESULTADOS DA LOCALIZAÇÃO E RASTREAMENTO DE FACE

Nesta seção são apresentados os resultados obtidos com o processo de


localização e rastreamento da face utilizando o algoritmo de Viola e Jones [35],
implementado no OpenCV.

Na Figura 4.1, é possível verificar o resultado da localização e do rastreamento


realizados com um indivíduo. Foi observado que o sistema funciona de maneira eficaz,
mesmo quando inserido em ambientes com pouca luminosidade. Esta capacidade foi
observada nos experimentos realizados, onde a câmera utilizada foi à web cam de um
notebook que tem uma fonte de luz que permite iluminar as faces.

Figura 4.1: Face localizada próximo a câmera, longe da câmera e com um acessório em um
ambiente com menor luminosidade.

Como a localização implementada neste sistema foi frontal, quando o usuário


se posiciona de perfil, o sistema não consegue localizar a face, como ilustrado na
Figura 4.2.

Figura 4.2: Indivíduo de perfil. Sistema não consegue localizar a face.


34

4.2 RESULTADOS DO RECONHECIMENTO DE FACE

Nessa seção são apresentados os resultados quantitativos dos cinco testes


realizados no sistema offline para reconhecimento de face. Além disso, é realizada uma
análise qualitativa do sistema online.

4.2.1 Resultados para os testes no sistema offline

Os testes offline foram realizados com um banco de dados com 9 indivíduos e


50 faces de cada um. Todas as faces que popularam o banco de dados foram capturadas
pela web cam de um notebook. As aquisições das imagens de face não foram feitas no
mesmo cenário para todos os indivíduos, ou seja, não houve um padrão no cenário. E as
imagens de face de cada indivíduo foram capturadas no mesmo momento, não havendo
na base de dados faces, por exemplo, do indivíduo com e sem barba, com cabelos
cortados ou penteados de maneira diferente.

Foram realizados dois testes:

O primeiro analisa o sistema quando todos os indivíduos testados fazem parte


da base de dados, havendo variação do número de imagens de treino de cada indivíduo.
O segundo teste avalia o sistema quando há indivíduos testados que não fazem parte da
base de treinamento.

4.2.1.1 Primeiro teste

No primeiro teste foi utilizada uma base de dados com 409 imagens de face de
9 indivíduos. Nesse teste, o número de imagens de treino foi variado e, posteriormente,
o sistema foi testado com as 409 imagens da base de dados. As imagens utilizadas para
treinamento eram diferentes das imagens com as quais foram realizados os testes. O
objetivo deste teste é verificar a implicação da variação do número de imagens de cada
indivíduo na fase de treinamento na etapa de reconhecimento e buscar encontrar a
quantidade de imagens adequada de treinamento para obter uma taxa de erro aceitável
no reconhecimento. A Tabela 4.1 mostra as taxas de acerto do sistema na fase de
reconhecimento em função do número de imagens de face utilizadas na fase de
treinamento.

Tabela 4.1: Resultados dos testes realizados, indicando a percentagem de acerto.


Nº de imagens por % de
indivíduo no treinamento acerto
1 11%
2 11%
3 85%
4 95%
35

Observou-se que quando o sistema é treinado com apenas 1 ou 2 imagens, o


desempenho no reconhecimento é muito baixo. Isso se deve ao pequeno número de
Eigenfaces que são criadas, já que estas são iguais ao número de imagens de
treinamento, o que favorece no momento do reconhecimento, que a distância Euclidiana
seja maior que o limiar, já que as 50 imagens que são testadas possuem algumas
variações em relação às expressões faciais e angulação da cabeça no momento da
aquisição das imagens. No entanto, para um treinamento com 4 imagens o sistema
alcança taxas de 95% de acerto, o que já é aceitável para algumas aplicações.

4.2.1.2 Segundo teste

No segundo teste foi utilizada uma base de dados com 409 imagens de face de
9 indivíduos sendo que 5 faziam parte da base de treinamento e 4 não faziam. Nesse
teste, o sistema foi treinado com 4 imagens de face de 5 indivíduos e, posteriormente, o
sistema foi testado com as 409 imagens da base de dados de 9 indivíduos. As imagens
utilizadas para treinamento eram diferentes das imagens com as quais foram realizados
os testes. O objetivo deste teste é verificar se o sistema reconheceria um indivíduo, não
pertencente à base de dados treinada.

O resultado obtido no sistema foi:

 O sistema não reconhece nenhum indivíduo que não faça parte da base
de dados.
 O sistema tem percentagem de acerto de 97% de reconhecimento dos
indivíduos que fazem parte da base de treinamento.

No sistema offline os acertos são contabilizados quando:

 Reconhece o indivíduo que faz parte do banco de dados;


 Não reconhece o indivíduo que não faz parte do banco de dados.

O sistema offline erra quando:


 Reconhece o indivíduo A como o indivíduo B e ambos estão no banco
de dados.

4.2.2 Resultados para teste no sistema online

O sistema online foi implementado a fim de tentar reconhecer em tempo real


um indivíduo que faça parte da base de dados quando este está no campo de visão da
câmera. Nas análises realizadas neste sistema, os resultados encontrados foram todos
qualitativos.
36

Foi observado que o sistema online é mais eficaz no reconhecimento quando


está treinado com 4 imagens de cada indivíduo que deverá ser reconhecido pelo sistema.
Quando treinado com 4 imagens de face de todos os indivíduos que devem ser
reconhecidos, o sistema consegue reconhecer os indivíduos que fazem parte do banco
de dados e não reconhece os indivíduos que não fazem parte, como ilustrado na
Figura 4.3.

Figura 4.3: Indivíduo que faz parte do banco de dados e foi identificado e indivíduo que não faz
parte e não foi identificado.

No entanto a taxa de erros do sistema referentes a reconhecer um indivíduo


como outro é relativamente considerável. Foi observado que a face do indivíduo que
deve ser reconhecido deve ser bem parecida, em termos de angulação da face e cenário
na qual foi feita a aquisição, com a imagem que foi utilizada no treinamento. Nestes
casos, os reconhecimentos certos observados atingem taxas aceitáveis.

4.3 CONSIDERAÇÕES FINAIS

O processo de localização e rastreamento de faces foi realizado eficientemente


neste trabalho, mostrando que o algoritmo de Viola e Jones [35] é realmente eficaz para
esta tarefa.

Na fase de reconhecimento os resultados observados no sistema offline foram


considerados aceitáveis quando o sistema é treinado com 4 imagens de cada indivíduo.
Já no sistema online foi observado que há uma taxa significativa de reconhecimentos
“errados”, onde o sistema reconhece uma pessoa como outra, ambas estando no banco
de dados.

As imagens utilizadas para treinamento e teste no sistema offline foram


capturadas no mesmo momento, portanto tem pouca variação na pose e no ângulo em
37

que as imagens são capturadas. Já no reconhecimento online as imagens utilizadas nos


testes são diferentes, o que provoca uma variação nos resultados de reconhecimento.

Foi observado que quando o sistema online é utilizado no mesmo cenário e


com a mesma pose das quais foram capturadas as imagens de treinamento o
reconhecimento é muito mais eficaz.
38

5 CONCLUSÃO E TRABALHOS FUTUROS

5.1 CONCLUSÃO

Este trabalho teve o objetivo de desenvolver um sistema biométrico capaz de


realizar o reconhecimento de uma pessoa a partir de sua face. Para isso, foram
implementados dois módulos: (1) um sistema de localização e rastreamento de face, a
partir de uma web cam, a fim de adquirir a imagem da face; (2) um sistema de
reconhecimento de face, o qual deverá ser capaz de identificar uma pessoa a partir de
sua face.

Dados os resultados do sistema de localização e rastreamento implementado, é


possível perceber que a primeira parte do objetivo deste trabalho foi alcançada. O uso
desse sistema permitiu a localização eficaz da face de um indivíduo a partir do uso de
uma web cam. Além disso, o processo de rastreamento de face obteve êxito em todos os
testes realizados. Isso permitiu que as imagens de face, dos indivíduos que participaram
dos testes fossem captadas com rapidez e qualidade em grande parte dos casos.

Nesta implementação, a disposição da cabeça do indivíduo sempre tem que


estar na parte superior do vídeo e deve ser frontal. O sistema localiza apenas 1 face na
cena e não localiza faces em que o indivíduo esteja de perfil.

A implementação do reconhecimento de face completa o objetivo deste


trabalho, e foi alcançado com êxito, atingindo taxas de acerto maiores que 90%. Isso
pode ser comprovado ao analisar os resultados.

Com os resultados obtidos no sistema de reconhecimento offline, foi observado


que o número de mínimo de imagens de faces frontal que o sistema deve ser treinado
para um reconhecimento com taxas de acerto acima dos 90% deve ser de 4 para cada
indivíduo.

No sistema online foi realizada uma avaliação qualitativa, a qual mostrou que o
sistema funciona de maneira aceitável quando o sistema tenta reconhecer o indivíduo no
mesmo cenário e com poses similares as que foram capturadas as imagens para
treinamento. No entanto, quando o sistema tenta reconhecer em um cenário diferente do
que foi capturada a imagem e com poses diferentes, o sistema erra, aceitando um
indivíduo como outro e até mesmo, em alguns momentos, indivíduos que não faziam
parte do banco de dados.
39

5.2 TRABALHOS FUTUROS

A partir dos objetivos desse trabalho, vários outros estudos podem ser
realizados visando sua complementação. A seguir são apresentadas algumas sugestões
de tópicos que podem ser abordados em estudos futuros:

 Implementar a localização de faces utilizando outros arquivos Haar


Cascade para o classificador, como os disponíveis no OpenCV, por
exemplo, de perfil, olhos, nariz e comparar com a implementação
frontal utilizada neste trabalho.
 Combinar os arquivos Haar Cascade para classificação disponíveis no
OpenCV na implementação da localização, verificando as melhorias na
que ocorrem e comparando com a técnica implementada ;
 Implementação de técnicas para que possam ser feitas análises
quantitativas do sistema online, já que no sistema implementado a
avaliação é qualitativa, portanto subjetiva;
 Implementação de outras técnicas de reconhecimento, por exemplo,
SVM (Support Vector Machine) para comparar com a técnica utilizada
na implementação deste trabalho.
40

REFERÊNCIAS BIBLIOGRÁFICAS

[1] ACHARYA, T.; RAY, A. K. Image Processing - Principles and Applications. John
Wiley & Sons, Inc., Hoboken, New Jersey, 2005.

[2] ALMEIDA, O. C. P. d. Técnicas de processamento de imagens para localização e


reconhecimento de faces. Tese (Doutorado) | Mestrado em Ciência da Computação,
ICMC-USP São Carlos, 2006.

[3] BAREA, J.A.; PARDINI, M. I. M. C.; GUSHIKEN, T. Extração de DNA de


materiais de arquivo e fontes escassas para utilização em reação de polimerização em
cadeia (PCR). Rev. bras. hematol. hemoter. 2004;26 (4):274-281

[4] BOLES, W. W. (1997). A Security System Based on Human Iris Using Wavelet
Transform, International Conference on Knowledge-Basic Intelligent Eletronics
System, Vol. 2, pages 533-541.

[5] BRADSKI, G.; KEAHLER, A. OpenCV - Computer Vision with the OpenCV
Library. [S.l.]: O'Reilly Media Inc., 2008.

[6] BURGE, M.; BURGER, W. Ear Biometrics. Johannes Kepler University, Linz,
Austria.

[7] CHICHIZOLA, F.; GIUSTI, L. D.; GIUSTI, A. D.; NAIOUF, M. Face recognition:
reduced image eigenfaces method. In: Proc. 47th International Symposium ELMAR.
[S.l.: s.n.], p. 159-162, 2005.

[8] Curso de Práticas Periciais com Termografia Infravermelha, Brasil Forense, 2008.

[9] DAUGMAN, J.G. High confidence visual recognition of person by a test of


statistical independence. IEEE Transaction PAMI, 15(11), 1993.

[10] DAUGMAN, John. (2001). High Confidence Recognition of Persons by Iris


Patterns. IEEE 35th International Carnahan Conference on Security Technology, 16-19
Oct. 2001, pages 254-263.

[11] DAUGMAN, John. (2002). How Iris Recognition Works. International Conference
on Image Processing, vol. 1, pages 33-36

[12] DELAC, K.; GRGIC, M. A survey of biometric recognition methods. 46th


International Symposium Electronics in Marine, v. 46, p. 16-18, 2004.

[13] EL-BAKRY, H. M.; HAMADA, M. Fast principal component analysis for face
detection using cross-correlation and image decomposition. In: Proc. International Joint
Conference on Neural Networks IJCNN 2009. [S.l.: s.n.], p. 751-756, 2009.

[14] FIERREZ-AGUILAR, J.; ORTEGA-GARCIA, J.; GARCIA-ROMERO, D.;


GONZALEZ-RODRIGUEZ, J. Target dependent score normalization techniques and
41

their application to signature verification. IEEE Transaction on Systems, Man and


Cybernetics, Part C, 35(3):418-425, 2005.

[15] FIGUEREDO, M. B. Reconhecimento de faces aplicado ao problema de pessoas


desaparecidas - Estudo de caso do Eigenface. Dissertação (Mestrado) - SENAI
CIMATEC, Salvador, 2011.

[16] FRISCHHOLZ, R.; DIECKMANN, U. Biold: a multimodal biometric


identification system. In IEEE Computer, volume 33, p. 64-68, 2000b.

[17] HILL, R.B. Apparatus and method for identifying individuals through their retinal
vasculature patterns. US Patent No. 410937, 1978.

[18] HJELMAS ERIK; LOW, B. K. Face detection: Asurvey. Computer Vision and
Image Undertanding, v. 83', n. 83, p. 236-274, 2001.

[19] HONG, L. Automatic Personal Identification Using Fingerprint. PhD thesis,


Department of Computer Science, Michigan State University, 1998.

[20] IANNARELLI, A. Ear Identification. Forensic Identification Series. Paramont


Publishing Company, Fremont, California, 1989

[21] JAIN, K. A.; ROSS, A.; PRABHAKAR, S. An introduction to biometric


recognition. Appeared in IEEE Transactions on Circuits and Systems for Video
Technology, Special Issue on Image- and Video-Based Biometrics, v. 14, n. 1, January
2004.

[22] JENKINS, R. Limitations in faci identification: The evidence. FEATURE OF THE


WEEK, p. 5-12, 2008.

[23] KRICHEN, E.; MELLAKH, M. A.; GARCIA-SALICETTI, S.; DORIZZI, B. Iris


identification using wavelet packets. In Proceeding of the 17th International Conference
on Pattern Recognition. ICPR 2004, volume 4, p. 335-338, 2004.

[24] LIU, N.; WANG, H.; YAU, W.-Y. Face recognition with weighted kernel principal
component analysis. In: Proc. 9th International Conference on Control, Automation,
Robotics and Vision ICARCV '06. [S.l.: s.n.], 2006. p. 1-5.

[25] MA, L.; TAN, T.; WANG, Y.; ZHANG, D. Personal identification based on iris
texture analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence,
25(12):1519-1533, 2003.

[26] MAIO, D.; MALTONI, D.; CAPPELLI, R.; WAYMAN, J. L.; JAIN, A. K.
Fvc2002: Fingerprint veri_cation competition. Proc. International Conference on
Pattern Recognition (ICPR), p. 744-747, Agosto 2002. Quebec City, Canada.
42

[27] MARINO, C.; PENEDO, M. G.; PENAS, M.; CARREIRA, M. J.; GONZALEZ, F.
Personal authentication using digital retinal images. PATTERN ANALYSIS &
APPLICATIONS, 2006.

[28] MATSUMOTO, T.:MATSUMOTO,H.;YAMADA,K.; HOSHINO,S. Impacto f


artificial gummy fingers on fingerprint systems. Im Proceedings of SPIE, Optical
Security and Counterfeit Deterrence Techniques IV, volume 4677, p. 275-289. Int’l
Soc. For Optical Engineering, 2002.

[29] MONWAR, M. M.; PAUL, P. P.; ISLAM, M. W.; REZAEI, S. A real-time face
recognition approach from video sequence using skin color model and eigenface
method. p. 218l1-2185, maio, 2006.

[30] MUNICH, M.E.; PERONA, P. Visual identification by signature tracking. IEEE


Transactions on Pattern Analysis and Machine Intelligence, 25(2):200-217, 2003.

[31] PUYATI, W.; WALAIRACHT, A. E_ciency improvement for unconstrained face


recognition by weightening probability values of modular pca and wavelet pca. In: Proc.
10th International Conference on Advanced Communication Technology ICACT 2008.
[S.l.: s.n.], v. 2, p. 1449-1453, 2008.

[32] SUJAN, V.A.; MULQUEEN, M.P. Fingerprint identification using space invariant
transforms. Published in: Journal Pattern Recognition Letters archive, Volume 23, Issue
5, Elsevier Science Inc. New York, NY, USA, March 2002.

Elsevier Science Inc. New York, NY, USA

[33] TAN, X.; SONGCAN, C.; ZHI-HUA, Z.; FUYAN, Z. Face recognition from a
single image per person: A survey. PATTERN RECOGNITION, The Journal of the
pattern recognition society, v. 39, n. 39, p. 1725-1745, 2006.

[34] VENKATARAMANI, K: KUMAR, B.V.K.V. Fingerprint verification using


correlation filters. In Audio and Video Based Biometric Oerson Authentication, volume
2688 of Lectura Notes in Computer Scienca, p. 886-894. Springer Berlin/Heidelberg,
2003.

[35] VIOLA, P.; JONES, M. J. Robust real-time face detection. International Journal of
Computer Vision, v.2, n. 57, p.137-154, 2004.

[36] WAN, V.; CAMPBELL, W. M. Support vector machines for speaker verification
and identification. In Proccedings of the IEEE Signal Processing Society Workshop on
Neural Networks for Signal Processing X, 2000, volume 2, p.775-784, 2000.

[37] WAYMAN, J. L. Fundamentals of biometric authentication technologies.


International Journal of Image and Graphics, v. 1, n. 1, p. 93-113, 2001.
43

[38] WILDES, R. et. al. (1996). A Machine-vision System for Iris Recognition,
Machine Vision and Applications, vol.9, pp.1-8

[39] WOODWARD, J. D. J.; HORN, C.; GATUNE, J.; THOMAS, A. Biometrics: A


Look at Facial Recognition. [S.l.]: RAND, 2003.

[40] YANG, M.-H.; AHUJA, N.; KRIEGMAN, D. Face recognition using kernel
eigenfaces. In: Proc. International Conference on Image Processing. [S.l.: s.n.], v. 1, p.
37-40, 2000.

[41] ZHAO, L.; ZHUANG, G.; XU, X. Facial expression recognition based on pca and
nmf. In: Proc. 7th World Congress on Intelligent Control and Automation WCICA
2008. [S.l.: s.n.], p. 6826-6829, 2009.

[42] ZHAO, W.; CHELLAPPA, R.; PHILLIPS, P.; A., R. Face recognition: A literature
survey. ACM Computing Surveys, v. 35, n. 4, p. 399-458, Dezembro 2003.

[43] http://acessoeponto.mixlog.com.br/artigo/leitor-biometrico-de-impressao-digital/,
Acesso em 11/2011.

[44] http://www.accessexcellence.org/WN/SU/irisscan.php, Acessado em 11/2011.

[45] http://pt.scribd.com/doc/16676144/9/Biometria-pela-Iris, Acessado em 11/2011.

[46]http://repositorium.sdum.uminho.pt/bitstream/1822/3283/1/TESE%20DE%20MES
TRADO.pdf Acessado em 11/2011.

[47]http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0004-
27492007000100031&lng=pt&nrm=iso#fig1 Acessado 11/2011.

[48]http://www.ee.oulu.fi/~gyzhao/research/gait_recognition.htm, Acessado em
11/2011.

[49] http://globalseci.com/?page_id=44, Acessado em 11/2011.

[50] http://tecnologia.terra.com.br/interna/0,,OI738869-EI4805,00.html, Acessado em


11/2011.

Vous aimerez peut-être aussi