Académique Documents
Professionnel Documents
Culture Documents
marcos.barretto@gmail.com
Resumo
Tendo por objetivo a identificao
automtica das expresses faciais, o
foco principal deste projeto estar
na anlise frame a frame dos sinais
de vdeo obtidos por uma cmera
online e a produo de uma resposta
adequada por parte do rob socivel.
Deseja-se que o resultado do processo
possa ser monitorado, atravs de uma
interface que mostre tanto o vdeo em
si
quanto
o
quo
prximo
de
determinada emoo a expresso est
classificada.
Sero
utilizados
os
classificadores de Haar em cascata
para a deteco de faces, os mtodos
de
reconhecimento
de
emoo
por
textura e o modelo de superfcies
emocionais
dinmicas
(traduo
literal do ingls Dynamic Emotional
Surface) para a anlise de expresses
faciais em seres humanos ao longo do
tempo. Testes de otimizao do filtro
de Kalman utilizado no processo de
reconhecimento contnuo e testes de
validao do sistema realizados com
voluntrios resultaram em taxas de
acerto por volta de 70% no melhor
caso. Ainda existem melhorias que
podero ser aplicadas ao projeto e a
escolha correta de cada um dos blocos
que permeia a soluo levar a um
desempenho do sistema similar quele
apresentado
por
uma
pessoa
sem
treinamento
especfico
na
identificao de emoes.
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
2. Reviso Bibliogrfica
Pantic [3], divide o reconhecimento de emoo em trs
etapas principais: a extrao de uma face da imagem, a
extrao de dados relativos a emoo e a classificao
destes dados.
Dada uma imagem de uma face, necessrio extrair os
dados relativos emoo da mesma, ou seja, representar
os dados da imagem original da face em um conjunto de
componentes que a caracterize, minimizando as
diferenas dentro de uma classe de emoes e
maximizando a diferena entre as classes [4]. Tal anlise
pode ser feita tanto extraindo informaes numa face
como um todo, de forma holstica, ou de forma
localizada, analisando-se somente alguns pontos que
tem uma maior importncia com relao a emoes [5].
Como apontado em [6], dois tipos distintos de
propriedades podem ser extrados de faces, propriedades
geomtricas e propriedades de aparncia. Os mtodos
baseados em propriedades geomtricas pontos
caractersticos na face, tais como o contorno dos olhos,
representando a forma e geometria das caractersticas
que se pretendem estudar. Em [3] e [7] cita-se o uso, em
imagens estticas, para a extrao de dados emoes, de
mtodos que se baseiam em pontos caractersticos da
face e em mapas previamente montados. J com relao
extrao de dados em vdeos, a abordagem feita ou
por fluxo tico, assim como tambm visto em [8], com
monitoramento de pontos caractersticos, ou por
mtodos tridimensionais [9], este ltimo desenvolvido
juntamente com o crescimento da oferta de tecnologias
que possibilitam a obteno de imagens tridimensionais
nos ltimos anos.
J em mtodos baseados em aparncia, buscam
mudanas na textura e mudanas tais como rugas na
face. Estes mtodos podem estudar tanto a face como
um todo ou regies de interesse especficas. Estudos na
rea se utilizam e desenvolvem estes mtodos, com [10]
e [11] se utilizando do mtodo de aparncia de
ondulaes de Gabor por exemplo. Outro mtodo que
pode ser utilizado e se encaixa nesta categoria o da
anlise de componente principal (PCA) e da anlise de
discriminante linear (LDA) [12].
Extrado os dados relativos emoo na face deve-se
classific-los em cada uma das emoes propriamente
ditas. Existem algoritmos que determinam a emoo em
cada um dos instantes do vdeo e aqueles que analisam
as expresses faciais correspondentes a uma emoo ao
longo de um perodo de tempo, e, assim, podemos
dividir tal classificao nas chamadas classificaes
instantneas e classificaes contnuas.
No caso da classificao instantnea, existem solues
baseadas em redes neurais, Support Vector Machines,
por cadeias de Markov ocultas e anlise de
discriminante lineares [3][9][10]. Existem tambm
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
Felicidade
Tristeza
Raiva
Medo
(%)
(%)
(%)
(%)
Felicidade
20,00
33,33
20,00
73,33
Tristeza
6,67
13,33
26,67
46,67
Raiva
20,00
6,67
0,00
46,67
Medo
0,00
26,67
6,67
53,33
Tabela 1: Matriz de confuso para o teste do mtodo eigenfaces.
Felicidade
Tristeza
Raiva
Medo
(%)
(%)
(%)
(%)
Felicidade
0,00
26,67
6,67
80,00
Tristeza
6,67
13,33
26,67
60,00
Raiva
0,00
6,67
6,67
46,67
Medo
13,33
33,33
13,33
60,00
Tabela 2: Matriz de confuso para o teste do mtodo fisherfaces.
Felicidade
Tristeza
Raiva
Medo
(%)
(%)
(%)
(%)
Felicidade
0,00
6,67
6,67
80,00
Tristeza
0,00
20,00
26,67
60,00
Raiva
13,33
20,00
20,00
73,33
Medo
6,67
20,00
0,00
46,67
Tabela 3: Matriz de confuso para o teste do mtodo histograma de
padres binrios locais.
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
Faces
Pessoas
Emoo
instantnea
Emoo
Contnua
Total
Sem
52,254
8,141
44,901
13,254
118,549
JADE
Com
66,873
15,817
55,775
16,056
154,521
JADE
Tabela 4 Tempos em milissegundos de cada uma das etapas de
reconhecimento do sistema.
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
Otimizao
Validao
Vdeo
Emoo
Vdeo
Emoo
s4_ha_2.avi
Alegria
s2_ha_2.avi
Alegria
s4_ha_4.avi
Alegria
s29_ha_3.avi
Alegria
s12_ha_4.avi
Alegria
s43_ha_1.avi
Alegria
s25_ha_2.avi
Alegria
s25_fe_2.avi
Medo
s24_fe_3.avi
Medo
s38_fe_3.avi
Medo
s36_fe_2.avi
Medo
s43_fe_2.avi
Medo
s42_fe_1.avi
Medo
s38_an_1.avi
Raiva
s24_fe_4.avi
Medo
s43_an_2.avi
Raiva
s43_an_2.avi
Raiva
s43_an_3.avi
Raiva
s14_an_1.avi
Raiva
s43_an_4.avi
Raiva
s4_an_2.avi
Raiva
s42_sa_1.avi
Tristeza
s4_an_5.avi
Raiva
s43_sa_1.avi
Tristeza
s4_sa_1.avi
Tristeza
s43_sa_3.avi
Tristeza
s36_sa_2.avi
Tristeza
s43_sa_4.avi
Tristeza
s33_sa_2.avi
Tristeza
s43_sa_5.avi
Tristeza
s29_sa_1.avi
Tristeza
Energia
500
1500
2500
3500
Iterao
eNTERFACE'05
CK+
Acertos na
otimizao(%)
validao(%)
CK+
45,1
20,1
eNTERFACE05
72,5
31,4
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
5. Concluso
Existem deficincias tanto com relao ao mecanismo
de reconhecimento instantneo de emoo quanto o do
mecanismo de reconhecimento contnuo de emoo.
Aquele teve sua deficincia apontada principalmente
durante a otimizao dos parmetros de Kalman, se
apresentando bastante sensvel a mudanas do conjunto
analisado. Este ainda necessita de aprimoramentos
referentes ao movimento de longa durao da partcula.
Mesmo com limitaes, em vdeos de curta durao
observou-se uma tendncia na classificao das
emoes por pessoas e isto permitiu a comparao com
a sada do sistema. O teste com pessoas reais mostrou
que existe um grau de compatibilidade entre aquilo que
percebido por um ser humano e aquilo que estimado
pelos algoritmos de classificao, traduzido numa taxa
de acerto de 66,77% para o vdeo que obteve uma taxa
de correlao mais elevada.
6. Trabalhos Futuros
Os resultados obtidos neste projeto apontam para a
necessidade de aprimoramento dos mtodos utilizados
AGRADECIMENTOS
Agradeo ao professor Marcos Ribeiro Pereira-Barretto
por toda a orientao e tempo que disponibilizou para
me ajudar ao longo deste projeto.
Referncias Bibliogrficas
[1] EKMAN, P. A Linguagem das Emoes. So Paulo:
Lua de Papel, 2011.
[2] MEHRABIAN, A. Communication Without Words.
Psychology Today, v. 2, n. 4, p. 53-56, 1968.
[3] PANTIC, M.; ROTHKRANTZ, L. J. M. Automatic
Analysis of Facial Expressions: The State of Art. IEEE
Transactions on Pattern Analysis and Machine
Inteligence, Dezembro 2000. 1424-1445.
[4] SHAN, C.; GONG, S.; MCOWAN, P. W. Facial
expression recognition based on Local Binary Patterns:
A comprehensive study. Image and Vision Computing,
p. 803-816, 2009.
[5] DUDA, R. O.; HART, P. E.; STORK, D. G. Pattern
Classification. 2 Edio, 2001.
[6] LI, S. Z.; Jain A. K.. HandBook of Face
Recognition. Springer, 2005.
[7] HAMM, J. et al. Automated Facial Action Coding
System for dynamic analysis of facial expressions in
neuropsychiatric disorders. Journal of Neuroscience
Methods, 2011. 237-256.
[8] DONATO, G. et al. Classifying Facial Actions.
IEEE Transactions on Pattern Analysis and Machine
Intelligence, Outubro 1999.
[9] LIU, S.-S.; TIAN, Y.-T.; LI, D. New Research
Advances of Facial
Expression Recognition.
Proceedings of the Eighth International Conference on
Machine Learning and Cybernetics, Baoding, Julho
2009. 1150-1155.
[10] VALSTAR, M.; PANTIC, M. Fully Automated
Facial Action Unit Detection and Temporal Analysis.
Proceedings of the 2006 Conference on Computer
Vision and Pattern Recognition Workshop, 2006.
[11] DU, S.; TAO, Y.; MARTINEZ, A. M. Compound
facial expressions of emotion. Proceedings of the
National Academy of Sciences Early Edition, 28 fev.
2014. 1-9.
[12] BARTLETT, M. S. et al. Recognizing Facial
Expression: Machine Learning and Application to
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
Spontaneous Behavior.
[13] GONALVES, R. A. M. et al. A Model For
Interference of Emotional State Based on Facial
Expressions. Journal of Brazillian Computer Society,
2012.
[14] RUSSEL, J. A. Is There Universal Recognition of
Emotion From Facial Expression? A Review of the
Cross-Cultural Studies. Psychological Bulletin, v. 115,
p. 102-141, 1994.
[15] OPENCV. Disponivel em: <http://opencv.org/>.
Acesso em: 16 mar. 2014.
[16] JADE. Disponivel em: <http://jade.tilab.com/>.
Acesso em: 06 abr. 2014.
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231
SYSTEM FOR THE IDENTIFICATION OF EMOTIONS BY FACIAL EXPRESSIONS WITH LIVE OPERATION
Bruno Tinen
tinen.bruno@gmail.com
Advisor: Prof. Dr. Marcos Ribeiro Pereira-Barretto
marcos.barretto@gmail.com
ABSTRACT
Facial expressions are a clear picture of what happens in someones conscious and
unconscious mind in a given situation, having a fundamental role in every social
interaction. The emotions are a direct cause of the change in the neurobiological state
of a person, particularly, modifying the human expressions. Aiming social robots, the
adequate interpretation by them of the emotions experienced by the human being with whom
they are in contact is indispensable, so that the adequate reactions are made and humans
and robots could live peacefully together. Having, as the objective, the automatic
identification of emotions by facial expressions, main focus of this project will be in
the frame-by-frame analysis of video signals obtained from an online camera and in the
production of an adequate reaction for the social robot. The result is monitored by an
interface that shows to the user the video that is being analyzed and how close an
emotion is of a given expression, regarding both the instantaneous and continuous
dynamics. There are three main questions to be solved so that emotion analysis could be
made possible: the face detection, the emotion extraction and the emotion analysis
itself. These problems will be addressed by the use of cascade Haar classifiers for the
face
detection
algorithms,
by
texture-based
methods
for
the
instant
emotion
classification and by the Dynamic Emotional Surface Modal for the emotion extraction in
human beings over the time. Optimization tests run over the Kalman filters used by the
continuous classifier and the validation tests of the system done with the cooperation of
volunteers resulted in an approximate best of 70% correct classification. There still are
improvements that could be applied to this project and the correct choice in each of the
blocks that compose the solution could lead to a performance similar to the one presented
by a person without a specific training in emotion identification.
KEYWORDS: Emotions
surface.
identification,
facial
expression,
automatic
system,
emotional
TCC-2014 Trabalho de Concluso de Curso - Novembro de 2014; Coordenadores: Prof. Dr. Lucas Moscato Profa. Dra. Larissa Driemeier; Prof. Dr. Arturo
Forner Cordero, Prof. Dr. Thiago de Castro Martins.
Escola Politcnica da Universidade de So Paulo; Depto. Engenharia Mecatrnica e de Sistemas Mecnicos; Disciplinas: PMR2500 e PMR2550
Av. Prof. Mello Moraes 2231