Académique Documents
Professionnel Documents
Culture Documents
I. I NTRODUO
Na rea de Viso Computacional, um problema recorrente
o mapeamento de superfcies. Este pode ser definido como
mapear um ou mais objetos reais, gerando um modelo de
representao virtual dos mesmos. De forma geral, esse
processo pode ser realizado atravs de Scanners 3D, porm
o alto custo destes aparelhos pode representar um empecilho sua utilizao. Com o Kinect, dispositivo utilizado
no trabalho aqui apresentado, tem-se uma alternativa mais
econmica para a realizao dessa tarefa.
Outro problema muito explorado na viso computacional
o registro de superfcies. Neste problema o objetivo
determinar as transformaes espaciais que otimizam os
alinhamentos entre conjuntos de pontos que representam um
determinado objeto. Um dos algoritmos mais utilizados para
fazer registro de superfcies o ICP (Iterative Closest Point).
O objetivo deste trabalho desenvolver uma tcnica
utilizando K-D Trees, para otimizar a busca do vizinho mais
prximo no algoritmo ICP, utilizando nuvens de pontos 3D
obtidas com um Kinect. Esta otimizao resulta em uma
melhoria significativa em relao ao algoritmo de busca
original.
Figura 1.
Microsoft Kinect
emissor infravermelho, uma cmera RGB, um sensor de profundidade (infravermelho) e uma sequncia de microfones
utilizada para capturar udio direcional. A cmera e o sensor
funcionam na frequncia de 30Hz, ambas com resoluo de
640x480.
O Kinect apresenta algumas limitaes tcnicas em seu
funcionamento. So mapeados os pontos cuja distncia em
relao ao Kinect est entre aproximadamente 70 centmetros e 6 metros. Pontos fora dessa faixa no so reconhecidos.
A. A nuvem de pontos
Tanto a cmera RGB quanto o sensor de profundidade
possuem resoluo 640x480, ou seja, a cada frame gerada
uma nuvem de pontos que possui 307200 pontos. Para cada
ponto mapeado, so fornecidas informaes de profundidade
e de cor (RGB). A Figura 2 apresenta um exemplo de nuvem
de pontos obtida pelo Kinect sem informao de cor.
B. Framework Utilizado
II. Kinect
O Kinect (Figura 1) um dispositivo de controle baseado em movimentos e fala para o console Xbox 360,
desenvolvido pela Microsoft em colaborao com a empresa
israelita Primesense. O dispositivo composto por um
Aps o lanamento do Kinect a comunidade movimentouse no sentido de desenvolver um meio de uso do dispositivo
em plataformas alm do Xbox 360. Em pouco tempo, foram
desenvolvidos drivers para simplificar o acesso s informaes obtidas pelo Kinect em um ambiente de programao.
Figura 2.
Exemplo do ICP
~p =
Np
1 X
p~i
Np i=0
~y =
Np
1 X
~yi
Ny i=0
Np
1 X
=
(~
pi ~yit ) (~
p
~ ty )
Np i=0
.
t
py + py tr(py )I3
tr(py )
Q(py ) =
2(q1 q2 q0 q3 )
2(q2 q3 q0 q1 )
q02 + q32 q12 q22
2(q1 q3 + q0 q2 )
R(~qr )12
R(~qr )13
R(~qr )22
R(~qr )23
R(~qr )32
R(~qr )33
~qt1
~qt2
~qt3
1
Essa matriz T deve ser aplicada a todos os pontos do conjunto P . Como os pontos de P so tridimensionais, so usadas as coordenadas homogneas (xi , yi , zi , 1) e normaliza-se
o ponto pela quarta coordenada aps a transformao. Mais
detalhes podem ser encontrados em [6].
O resultado do alinhamento entre duas malhas salvo
e em seguida uma nova malha representando um novo
ponto de vista do objeto alinhada a esta, compondo uma
representao completa do objeto.
C. Otimizao do processo
Devido ao tamanho das malhas geradas pelo Kinect, o
algoritmo original de busca do vizinho mais prximo muitas
vezes se torna invivel. Desse modo, possvel otimizar
essa etapa do algoritmo utilizando uma estrutura eficiente
de indexao. Nesse trabalho, utilizou-se a K-D Tree, por
sua simplicidade e eficincia [12] [7].
IV. K-D T REE
A K-D Tree uma estrutura de indexao espacial, para
pontos de K dimenses. uma rvore binria facilmente
balancevel, que realiza buscas em aproximadamente log(n)
[2].
Figura 4.
Figura 5.
NM
6820
10243
NP
7621
11202
Toriginal
7.738s
15.740s
Totimizado
0.109s
0.100s
Tabela II
R ESULTADOS DO ICP COM E SEM A K-D T REE , COM FATOR DE
REDUO DE 3 X
NM
2274
3415
Reduo 3x
Caneca
Pelcia
NP
2541
3734
Toriginal
0.873s
1.778s
Totimizado
0.047s
0.030s
Tabela III
R ESULTADOS DO ICP COM E SEM A K-D T REE , COM FATOR DE
REDUO DE 5 X
NM
1364
2049
Reduo 5x
Caneca
Pelcia
NP
1525
2241
Toriginal
0.343s
0.655s
Totimizado
0.031s
0.010s
Figura 8.
Figura 6.
Figura 7.