Vous êtes sur la page 1sur 13

Normalizao Espacial de Imagens Frontais de Face em Ambientes

Controlados e No-Controlados

Vagner do Amaral
1
, Claudia Fgaro-Garcia
2
, Gilka Jorge Figaro Gattas
3
e Carlos
Eduardo Thomaz
4


Resumo:
Este artigo prope a implementao de um processo de normalizao espacial
de imagens de face geradas em ambientes controlados e no-controlados. Para
isso, desenvolveu-se um arcabouo computacional capaz de reduzir os desvios
gerados no processo de captura de imagens. Os resultados obtidos demonstram
um aumento de nitidez em pontos especficos das faces mdias e o aumento da
correlao entre as faces de cada conjunto analisado, justificando a aplicao
dos mtodos descritos.
Palavras-chave: Normalizao Espacial de Imagens; Banco de Faces.
Abstract:
This paper proposes and implements a step-by-step image processing tool to
spatially normalize frontal face images. A computational framework has been
developed to minimize variations of not only well-framed face images, but also
images captured under distinct acquisition protocols. Our experimental results
show an increase of sharpness in specific points of the average face images and
higher cross-correlation between the normalized face images compared to the
original ones, in controlled and non-controlled environments.
Keywords: Spatial Normalization of Images; Face Database.




1
Vagner do Amaral Tecnlogo em Anlise e Desenvolvimento de Sistemas (Mestrando em Eng. Eltrica) e
atua no Centro Universitrio da FEI.
2
Claudia Figaro-Garcia Mestre em Psicologia (Doutoranda em Psicologia) e atua na Faculdade de Medicina
da Universidade de So Paulo.
3
Gilka Jorge Figaro Gattas Livre Docente Doutora em Cincias Biolgicas e atua na Faculdade de Medicina
da Universidade de So Paulo.
4
Carlos Eduardo Thomaz Doutor em Cincia da Computao e atua no Centro Universitrio da FEI.



1. Introduo
A normalizao espacial de imagens ou, simplesmente, alinhamento de imagens
uma importante etapa de pr-processamento de dados em qualquer estudo de
reconhecimento de padres em imagens.
A ideia bsica de tal metodologia remover efeitos ou sinais da imagem que no
sejam relevantes e que retratem, na verdade, particularidades indesejadas inerentes a todo
processo imperfeito de aquisio de dados. No contexto desse trabalho, essa metodologia
se resume ao mapeamento automtico de imagens de faces, capturadas em ambientes
controlados e no-controlados, para um sistema comum de coordenadas de tal forma que os
pixels descrevam idealmente localidades idnticas em todas imagens.
Normalmente, o alinhamento de imagens realizado atravs de um processo de
deformao de cada uma dessas imagens com relao a uma imagem referncia, ou pontos
especficos da imagem utilizados como referncia. Tal procedimento de deformao tem
essencialmente duas metas: (a) reduzir a variabilidade das imagens devido a diferenas
referentes ao tamanho, posio e orientao do padro a ser analisado; (b) reduzir a
variabilidade das imagens devido a diferenas na forma do padro (RUECKERT et al.,
1999).
Neste artigo, para normalizar espacialmente cada imagem de face, algoritmos de
deformaes globais sero investigados, baseados nos procedimentos propostos em Amaral
e Thomaz (2008). A deformao ou transformao global modela basicamente diferenas
de rotao, translao e escala, existentes entre a imagem e os pontos de referncia pr-
definidos. O objetivo deste artigo validar essas deformaes no somente em ambientes
de captura controlada, conforme proposto em Amaral e Thomaz (2008), mas tambm em
ambientes onde as caractersticas de aquisio das imagens tais como posio, iluminao e
distncia, so casuais e em alguns casos precrias.
2. Metodologia
Neste trabalho utilizou-se a metodologia apresentada por Amaral e Thomaz (2008)
para o alinhamento das imagens, que fundamenta-se na proposta de interao mnima do
usurio, requerendo apenas a definio das dimenses da imagem (em unidades de pixel) e
a identificao manual da posio das pupilas como pontos de referncia.
A metodologia de normalizao espacial de imagens de face sugerida est
subdividida em etapas de processamento dedicado, que tratam de desvios especficos de
faces frontais e obedecem seguinte sequncia pr-definida: rotao, escala, recorte,
descolorao e suavizao de contorno. Os procedimentos originais propostos em Amaral e
Thomaz (2008) foram preservados, entretanto, as dimenses de escala e recorte foram
alteradas e ao final do processamento foi aplicada uma equalizao de histograma
(GONZALES; WOODS, 2000, p. 124). As subsees seguintes descrevem de forma
sucinta os objetivos e benefcios das etapas de processamento e apresentam em detalhes as
alteraes propostas. O fluxograma dessas etapas de processamento ilustrado na Figura 1.
Figura 1: Etapas de processamento para normalizao espacial de imagens de face.


2.1. Rotao
A etapa de rotao inicializa a padronizao da posio da face dentro da imagem e
define os parmetros para execuo das etapas seguintes. O objetivo desta etapa
fundamentalmente alinhar a posio das pupilas com relao ao eixo horizontal, utilizando
as medidas de seno e cosseno do ngulo que descreve a inclinao da reta imaginria que
passa atravs dos pontos de referncia (AMARAL; THOMAZ, 2008).
Pode-se utilizar para este processo um mtodo de clculo do ponto de destino (x
d
,y
d
)
de um pixel atravs de seu ponto de origem (x
o
,y
o
), similar a abordagem apresentada em
(CONCI; AZEVEDO; LETA, 2008, p. 120), atravs da seguinte equao:


cos sen
sen cos
o o
d
o
o d
y x y
y x x
+ =
+ =
(1)
Entretanto, essa abordagem gera na imagem destino um rudo conhecido como
impulsivo (tambm denominado de sal e pimenta) (CONCI; AZEVEDO; LETA, 2008,
p.173), pois o endereo (x
d
,y
d
) dos pixels formado por nmeros inteiros e o
arredondamento de um valor decimal atravs da equao (1) pode gerar sobreposio de
pixels na imagem destino e deixando-a, assim, com alguns pontos sem preenchimento
(AMARAL; THOMAZ, 2008). Este tipo de rudo pode ser eliminado de forma eficaz
atravs de um filtro de mediana (CONCI; AZEVEDO; LETA, 2008, p.173), porm, isso
acarretaria em mais uma etapa de processamento. Portanto, utilizou-se uma abordagem
inversa descrita em Amaral e Thomaz (2008), onde cada ponto na imagem destino
identifica seu ponto correspondente na imagem origem, evitando a sobreposio de pixels e
rudos.
O mtodo inverso foi desenvolvido a partir da equao (1), utilizando uma tcnica
conhecida como rotao em duas passadas (CONCI; AZEVEDO; LETA, 2008, p.120),
onde o endereo de um dos eixos origem identificado inicialmente para compor a equao
que resultar no endereo do segundo eixo (AMARAL; THOMAZ, 2008). Em outras
palavras, utilizando a equao (1), uma das variveis correspondentes s coordenadas de
origem pode ser isolada, ou seja



cos
sen
sen cos
o d
o
o
o d
y x
x y x x

= + = , (2)
onde 0 cos = , e aplicada na equao da segunda varivel:


cos
cos
sen
sen
cos
sen
cos sen
cos
sen
|
.
|

\
|
|
.
|

\
|

= + |
.
|

\
|
=
d
d
o o
o d
d
y
x
y y
y x
y . (3)
Para finalizar a tcnica de rotao em duas passadas, o resultado obtido na equao
(3) de y
o
aplicado na equao (2) de x
o
. Os resultados deste mtodo para (x
o
,y
o
)
correspondem ao endereo original do pixel que ser alocado na posio (x
d
,y
d
) da imagem
destino (AMARAL; THOMAZ, 2008). Dessa forma, a rotao aplicada sem a perda de
informaes da imagem original, mas pode gerar um efeito de serrilhado na imagem que
ser tratado na penltima etapa do processamento, ou seja, na etapa de suavizao de
contorno descrita na subseo 2.5
2.2. Escala
A alterao de escala nas imagens de face derivada da padronizao da distncia
entre os pontos de referncia (pupilas), que visa corrigir desvios causados durante a captura
e aumentar a correspondncia dos pixels entre as imagens de face processadas (AMARAL;
THOMAZ, 2008).
Esta etapa identifica a coordenada de um pixel na imagem original atravs da
multiplicao de cada pixel da imagem destino por um valor definido pela razo entre a
distncia interpupilar original e uma distncia padro pr-definida, conforme exemplo
apresentado na Figura 2. As dimenses da imagem final so especificadas aplicando a
multiplicao pela razo inversa, ou seja, a distncia padro pela distncia interpupilar
(AMARAL; THOMAZ, 2008).


Figura 2: Distncia interpupilar original (esq.) e ajustada para 100 pixels (dir.).

2.3. Recorte
Esta etapa essencial normalizao, pois elimina inmeros artefatos
desnecessrios e preserva as informaes e caractersticas mais relevantes aos estudos sobre
biometria de faces frontais. Utilizou-se neste trabalho a razo urea (ALVES,
2008)(MORIHISA, 2006), tambm conhecida como nmero de ouro e representada pela
letra , onde = 1,618, para estabelecer uma relao entre as medidas nas imagens
frontais de faces. A Figura 3 ilustra este processo. Manteve-se para a distncia interpupilar
o valor de 100 pixels, tambm utilizada em Amaral e Thomaz (2008), ajustando-se as
outras medidas experimentalmente e de acordo com a proporo ilustrada na Figura 3.
Aplicou-se, com relao a posio da pupila, a proporo x/2* para as margens laterais e
superior e a proporo 2* para margem inferior, gerando imagens com resoluo de
162x193 pixels que representam essencialmente a face das pessoas, excluindo, por
exemplo, a testa, o cabelo e o pescoo.
Figura 3: Relao das medidas de recorte, onde x = 100 pixels e = 1,618.

2.4. Descolorao
A etapa de descolorao foi includa na normalizao visando reduzir o esforo
computacional, atravs da substituio do sistema RGB que trabalha com 3 (trs) canais de
cores (Red, Green and Blue) para um sistema de uma nica camada utilizando a escala de
cinza. Este processo representado pela seguinte equao:
) , ( 114 . 0 ) , ( 587 . 0 ) , ( 299 . 0 ) , ( o o o o o o d d y x y x y x y x + + = . (4)
As constantes 0.299, 0.587 e 0.114 correspondem ao modelo YIQ (Luminance, In-
phase and Quadrature), projetado com base no percentual de sensibilidade da viso humana
(GONZALES; WOODS, 2000, p.162). Portanto, esta expresso fornece um resultado mais
adequado que a diviso proporcional, com 33% para cada cor (AMARAL; THOMAZ,
2008).
2.5. Suavizao de Contorno
A tcnica de suavizao de contorno aplicada para eliminar o efeito de serrilhado
gerado pela etapa inicial de rotao, tornando a imagem mais similar original aps esse
processamento. Utilizou-se nesta etapa um janelamento (ou kernel) de 3x3 pixels, para
substituir o tom do pixel central pela mediana dos pixels ao seu redor. Conforme exemplo
apresentado em Amaral e Thomaz (2008), dada a seguinte matriz 3x3:
|
|
|
.
|

\
|
107 99 89
115 111 95
196 110 101
,
os valores contidos no kernel so ordenados e o valor central do conjunto se refere
mediana, conforme conjunto abaixo:
[89; 95; 99; 101; 107; 110; 111; 115; 196].
No exemplo dado, o valor da mediana o quinto elemento do conjunto ordenado e possui
valor 107, que dever substituir o antigo valor central 111 da matriz.
2.6. Equalizao de Histograma
Segundo Conci, Azevedo e Leta (2008), a equalizao de histograma tem como
objetivo melhorar o contraste das imagens atravs da representao dos nveis de cinza de
maneira uniforme e distribuda. Portanto, ao final do processamento de normalizao
espacial de imagens foi acrescentada esta tcnica visando otimizar imagens de face com
baixo contraste, muito comuns em ambientes no-controlados onde a fonte de iluminao
aleatria e muitas vezes precria. Outro benefcio que esta tcnica proporciona aos estudos
biomtricos se deve ao realce de rugas e outros detalhes da face, aumentando assim a
distino entre faces de indivduos diferentes.
Para a aplicao desta tcnica, calcula-se inicialmente um histograma, normalizado
entre 0 e 1 (CONCI; AZEVEDO; LETA, 2008, p.95), que define a probabilidade original P
de distribuio dos nveis de cinza presentes na imagem atravs da seguinte equao:
c l
n
k P
k

= ) ( , (5)
onde n
k
a quantidade de ocorrncias do nvel de cinza k, e l e c so os nmeros de linhas e
colunas da imagem, ou seja, c l igual ao nmero total n de pixels. Em seguida, para
obter o histograma acumulado normalizado utiliza-se a seguinte funo de distribuio:

=
=
k
i
i
n
n
k T
0
) ( . (6)
O resultado desta funo descrita na equao (6) gera uma escala probabilstica
uniformemente distribuda entre 0 e 1.
De acordo com Gonzales e Woods (2000), a converso dos nveis de cinza para
valores probabilsticos realizada atravs da diviso de cada nvel pelo nmero de valores
possveis. Portanto, a converso da escala probabilstica para nveis de cinza obtida
atravs da operao inversa e o nvel de cinza equalizado de um pixel qualquer u da
imagem original dado por:
b u T u
o e
* ) ( = , (7)
onde u
e
o pixel equalizado, u
o
o pixel original, e o parmetro b o nmero de valores
possveis na escala de cinza. Nas imagens utilizadas neste trabalho, b = 256. O efeito deste
procedimento nos ambientes controlado e no-controlado analisados pode ser verificado na
Figura 4.
Figura 4: Imagem com histograma original e equalizada para exemplos de faces
capturadas em ambientes controlado (esquerda) e no-controlado (direita).

3. Bancos de Imagens de Face
Neste trabalho foram empregadas imagens de duas fontes distintas, uma em
ambiente controlado e outra em ambientes no-controlados. As imagens geradas em
ambiente controlado compem um banco de imagens frontais de faces, criado e mantido
pelo Departamento de Engenharia Eltrica do Centro Universitrio da FEI e composto de
2800 imagens com resoluo de 640x480 pixels, capturadas de acordo com o procedimento
descrito no relatrio desenvolvido por Oliveira Junior e Thomaz (2008). Entretanto, neste
trabalho utilizaram-se somente as imagens frontais neutras, totalizando 200 imagens. As
imagens geradas em ambientes no-controlados so procedentes de cadastros de crianas e
adolescentes desaparecidos, disponveis publicamente no site da Redesap (Rede Nacional
de Identificao e Localizao de Crianas e Adolescentes Desaparecidos), em diversas
resolues, poses e nveis de exposio luz. Para este artigo utilizaram-se 125 faces
provenientes de ambientes no-controlados. A Figura 5 ilustra alguns exemplos dessas
duas fontes distintas de imagens usadas.



Figura 5: Exemplos de imagens utilizadas neste trabalho: ambiente controlado (em
cima); ambiente no-controlado (embaixo).

4. Implementao
Os processos apresentados foram implementados em um aplicativo desenvolvido na
linguagem C#, atravs da ferramenta Microsoft Visual C# 2008 Express Edition, utilizando
apenas os recursos disponveis na .NET Framework at a verso 3.5. O programa foi
compilado e executado em um PC Intel Dual-Core 1.86 GHz, 2 GB de RAM e 160 GB de
HD, rodando sistema operacional Windows XP Service Pack 3 (AMARAL; THOMAZ,
2008).
5. Resultados Obtidos
Os resultados de normalizao espacial descritos neste artigo foram quantificados
atravs do clculo da correlao mdia entre os conjuntos de faces analisados (AMARAL;
THOMAZ, 2008). Utilizou-se para esta comparao o mdulo de correlao em pares para
todas as faces de cada conjunto, segundo a equao abaixo:

=
N
i
i
j
ij
N N
2
1
1
) 1 (
2
,
(8)
onde N o nmero de imagens analisadas por conjunto, ou seja, para faces no ambiente
controlado N = 200 e para faces no ambiente no-controlado N = 125. O valor da correlao
ij
foi obtido com base no coeficiente de Pearson (BRITO; COELHO; 2002), atravs da
seguinte equao:


= =
=


=
n
k
k
n
k
k
n
k
k k
ij
j j i i
j j i i
1
2
1
2
1
) ( ) (
) )( (
,
(9)
onde i
k
e j
k
correspondem, respectivamente, ao pixel k das imagens i e j, e i e j
representam os valores mdios de todos os pixels das imagens i e j. Neste trabalho,
266 . 31 = n pois a resoluo final das imagens aps a normalizao igual a 162x193.
Devido necessidade de padronizao dimensional para o clculo de correlao entre as
faces de cada conjunto, a escala das imagens capturadas em ambientes no-controlados foi
ajustada escala padro das faces normalizadas, com resoluo tambm de 162x193 pixels.
A Tabela 1 apresenta os resultados da correlao dos conjuntos analisados. Pode-se
observar pela Tabela 1, que os valores gerados possuem a mesma tendncia dos resultados
apresentados por Amaral e Thomaz (2008), onde a mdia da correlao entre imagens
normalizadas , pelo menos, 20% maior que a mdia da correlao entre as imagens
originais. Entretanto, as adaptaes propostas neste artigo proporcionaram um aumento da
correlao entre as imagens analisadas por Amaral e Thomaz (2008), que pertencem ao
conjunto de imagens oriundas de um ambiente de captura controlada exclusivamente. Este
aumento da correlao mdia se deve principalmente a eliminao de artefatos atravs do
novo procedimento de recorte proposto neste artigo e descrito em detalhes no item 2.3.
Tabela 1: Mdias das correlaes em pares das imagens analisadas.
Ambiente Originais Normalizadas
Controlado 0,562454506 0,712162609
No-Controlado 0,262074469 0,351251183
A Figura 6 ilustra atravs das faces mdias o resultado visual gerado pelo processo
de normalizao dos conjuntos de imagens capturadas em ambientes controlados e no-
controlados.
Figura 6: Imagem mdia das faces frontais antes e aps a normalizao espacial:
ambiente controlado (esquerda); ambiente no-controlado (direita).

6. Concluso
Este artigo props um procedimento de normalizao espacial de imagens frontais
de face em ambientes cujos processos de captura de imagens so controlados e no-
controlados. Verificou-se que tal procedimento funcional tanto em termos visuais como
quantitativos, em ambas as situaes. Os resultados dos mtodos aplicados so mais
perceptveis em imagens oriundas de ambientes no-controlados, onde a presena de
artefatos e desvios muito comum. Constatou-se tambm que as alteraes sugeridas neste
trabalho proporcionaram um resultado superior ao apresentado por Amaral e Thomaz
(2008), que analisou exclusivamente imagens em ambientes controlados sem as adaptaes
de recorte implementadas neste trabalho.
Referncias Bibliogrficas:
ALVES, Walison Jos Barber. Identificao de pessoas atravs de algoritmos genticos
aplicado em medidas das propores ureas da face humana. 2008. 454 f. Dissertao
(Mestrado em Engenharia Eltrica) Escola de Engenharia de So Carlos da Universidade
de So Paulo, So Carlos. 2008.

AMARAL, Vagner; THOMAZ, Carlos E. Normalizao espacial de imagens frontais de
face. Relatrio Tcnico 2008/01, So Bernardo do Campo: Centro Universitrio da FEI,
2008. 13 p. (disponvel em http://www.fei.edu.br/~cet/publications.html).

BRITO, Jorge; COELHO, Luiz. Fotogrametria Digital. 1 ed. Instituto Militar de
Engenharia, Rio de Janeiro, 2002.

CONCI, Aura; AZEVEDO, Eduardo; LETA, Fabiana. R. Computao Grfica. Rio de
Janeiro, Editora Campus/Elsevier, 2008. v. 2. 432 p.

GONZALES, Rafael C.; WOODS, Richard E. Processamento de imagens digitais. So
Paulo: Edgard Blcher, 2000. 509 p.

MORIHISA, Olivia. Avaliao comparativa entre agradabilidade facial, proporo
urea e padro facial. 2006. 352 f. Dissertao (Mestrado em Odontologia) Faculdade
de Odontologia da Universidade Metodista de So Paulo, So Bernardo do Campo. 2006.

OLIVEIRA JUNIOR, Leo L.; THOMAZ, Carlos E. Captura e Alinhamento de Imagens:
Um Banco de Faces Brasileiro. Relatrio, So Bernardo do Campo: Centro Universitrio
da FEI, 2005. 10 p. (disponvel em http://www.fei.edu.br/~cet/publications.html).

RUECKERT, D. et al. Non-rigid registration using free-form deformations:Application
to breast MR images. IEEE Transactions on Medical Imaging, vol. 18, no. 8, pp. 712-721,
1999.

Vous aimerez peut-être aussi