Académique Documents
Professionnel Documents
Culture Documents
CUSTO
Marcelo Archanjo Jos
Roseli de Deus Lopes
USP Universidade de So Paulo, Departamento de Engenharia de Sistemas
Eletrnicos da Escola Politcnica
marcelo.jose@poli.usp.br, roseli.lopes@poli.usp.br
RESUMO
ABSTRACT
1 Introduo
A Reconstruo 3D um ramo da Viso Computacional que tem por objeto prover informaes
tridimensionais de ambiente reais, estas informaes podem ser do volume como um todo
incluindo seu interior ou somente da superfcie. A Reconstruo 3D aplicada em:
Medicina - Melhor visualizao e diagnstico
Arquitetura Reconstruo 3D de fachada e ambientes
Cartografia Mapas 3D
Robtica
Automao industrial
Reconhecimento de padres
Navegao
A grande aplicabilidade da Reconstruo 3D a torna uma rea bastante pesquisada,
importante e promissora. Existem diversos desafios nesta rea dentre eles um que se destaca
o custo alto dos aparatos necessrios para a pesquisa muitas vezes inacessveis para
pesquisadores independentes e at para algumas universidades. Existem mtodos baseados
em volume e baseados em superfcie. Sendo que para a reconstruo baseada em superfcie
temos: sistemas de laser scanning, sistemas baseados em imagens.
Atualmente (2007) um Laser Scanner Cyberware Hires Color 3D Scanner 3030/sRGB/MS
custa em torno de US$87.000,00; nos EUA, sem considerar o software e aparato necessrio
para suportar o scanner.
Sistemas baseados em imagens podem ser assistidos, onde se tem fotos em diferentes
ngulos e o usurio do sistema introduz pontos de referncia nas bordas e/ou pontos de
destaque para orientar a reconstruo 3D. Por outro lado os sistemas baseados em imagens
podem ser automticos como ocorre com Viso Estreo.
Viso Estreo sofre diversas dificuldades para encontrar as correspondncias entre as
imagens de entrada. Para conseguir resultados satisfatrios so impostas restries, como a
restrio epipolar, a qual amplamente utilizada, pois facilita o trabalho de procura de
correspondncias. Na prtica ela garante que um determinado ponto na imagem da esquerda
se encontra na mesma linha na imagem da direita, mudando somente a coluna. Esta restrio
exige que as cmeras para Viso Estreo sejam bastante precisas e estejam rigidamente
calibradas, o que geralmente deixa os sistemas de reconstruo 3D baseados em imagens
complexos e por conseqncia caros, por exemplo somente uma cmera digital mtrica custa
atualmente (2007) algo entorno de US$ 3.000,00, esta cmera tem seus parmetros internos
conhecidos e estveis. Outra questo importante o uso intensivo de memria, tanto
algoritmos de procura de correspondncia tradicionais quanto os mais modernos exigem
computadores no convencionais (que so caros) ou trabalham com imagens de baixa
resoluo.
A estratgia para este trabalho realizar a reconstruo 3D com:
Hardware: Trabalhar com cmeras digitais e computadores convencionais;
Software: Utilizar Viso Estreo para obteno de informaes 3D:
Tcnica das Faixas Tcnica que reduz drasticamente o consumo de memria (80% a
95%) durante o processo de procura de correspondncias, permitindo o uso de imagens de
alta resoluo, como por exemplo: 2592x1944;
Procura 2D - Permite trabalhar sem a restrio epipolar, calibragem bsica (duas fotos
paralelas, com a mesma cmera), maior flexibilidade para os parmetros:
o Extrnsecos - Disposio fsica: posio e orientao;
o Intrnsecos - Caractersticas pticas e geometria interna da cmera.
Opo do uso de Operador Gradiente Liberdade para a variao de luminosidade no
momento de retirar as fotos.
O objetivo destas estratgias permitir o uso de sistemas mais baratos e simples de
implementar, do ponto de vista do usurio.
Utilizando uma abordagem menos rgida, isto , o uso de cmeras digitais comuns
respeitando somente que as imagens estreo sejam superfcies Lambertianas (superfcies cuja
aparncia no possui variao significativa com a variao do ponto de vista) temos o
barateamento dos custos para a Reconstruo 3D.
2 Viso Estreo
Reservamos 10 planos com 320x200 posies, criando um espao x,y,d (veja a figura 1) e
realizamos o processo de clculo de correspondncia (soma das diferenas absolutas, soma
dos quadrados das diferenas, ou qualquer outro) para cada pixel, para cada disparidade, isto
, comparamos o pixel (60,50) da imagem da esquerda com o pixel (60,50) da imagem da
direita e armazenamos seu resultado na posio (60,50) do plano 0 (equivale disparidade 0),
em seguida comparamos o pixel (60,50) da imagem da esquerda como pixel (59,50) da
imagem da direita e armazenamos seu resultado na posio (60,50) do plano 1 (equivale a
disparidade 1), e assim por diante. Este processo conhecido como Matching Cost [1][2] aqui
traduzido como Custo de Correspondncia.
y
d
Em seguida so alocados mais 10 planos com 320x200 posies onde sero registrados os
resultados das somas das janelas. Trata-se de somar (considerando uma janela quadrada 3x3)
os nove resultados de cada plano de Custo de Correspondncia na posio central da janela
neste novo plano, se por exemplo estivermos no plano 3 de Custo de Correspondncia e
estamos na posio (60,70) iremos somar o resultados que esto nas posies descritas na
figura 2.
armazenado o resultado desta soma na posio (60,70) do plano 3 recm alocado. Este
processo conhecido como Agregao de Evidncias [1][2]. Ao invs de alocar mais 10 planos
pode-se alocar somente 1 plano que armazena temporariamente o resultado da agregao,
quanto o processo termina de preencher o plano inteiro ele sobrepe o plano de Custo de
Correspondncia original.
Por ltimo criado mais um plano com 320x200 nele armazenado em cada posio o valor
da disparidade que obteve a melhor correspondncia, isto , o menor valor. Suponhamos que
estamos analisando o ponto (40,50) e que nos planos de Agregao de Evidncias temos os
resultados da figura 3 para este ponto:
Plano 0 1 2 3 4 5 6 7 8 9
Valor 101 232 184 609 900 143 7 240 78 93
O menor resultado encontra-se no plano 6, o que significa que a melhor correspondncia foi
encontrada com disparidade de 6 pixels. Neste plano recm criado armazenamos na posio
(40,50) o valor 6. Este processo realizado para os 320x200 pontos e conhecido como
Seleo de Disparidades [1][2]. Deste plano criada uma imagem em escalas de cinza onde,
para o nosso exemplo de disparidade mxima de 10 pixels o 0 seria (0,0,0) (preto em RGB) e o
9 seria (255,255,255) (branco em RGB) e os demais valores os nveis intermedirios
distribudos uniformemente. Escolher o menor como melhor correspondncia conhecido
como winner-take-all (WTA) ou aqui traduzido como vencedor-leva-tudo".
20
Consumo de Memria (GB)
18
16
14
12
10
8
6
4
2
0
0
00
00
00
00
00
00
0
00
10
30
48
70
30
50
10
30
70
90
30
50
90
1
7
x9
x1
x1
x1
x1
x1
x2
x2
x2
x2
x2
x3
x3
x3
x3
x3
3x
0x
0x
3x
00
13
40
64
93
66
33
00
66
33
00
66
33
00
66
33
00
66
33
00
12
14
17
20
22
25
28
30
33
36
38
41
44
46
49
52
Resoluo
Figura 4:Consumo de memria para tcnica tradicional versus resoluo, para busca 1D.
Custo de Correspondncia
Agregao de Evidncias
Seleo de Disparidades
Mapa de Disparidades
4 Procura 2D
A forma tradicional de trabalho com Viso Estreo vinculada restrio epipolar est bem
estabelecida e apresenta resultados muito bons no mbito de desempenho na construo do
mapa de disparidades. Como j descrito, a definio do uso da restrio epipolar exige a
construo de aparatos fotogrficos com preciso tanto em sua disposio fsica, nos ajustes
pticos e tambm nas caractersticas internas da cmera, o que faz com que a pesquisa sobre
Viso Estreo ou Reconstruo 3D se torne cara e em alguns caso at invivel. No utilizar a
restrio epipolar provoca um aumento da complexidade e perda de desempenho do algoritmo
de busca de correspondncias. Por outro lado reduz os custos dos equipamentos e facilita a
disposio dos aparatos fotogrficos na obteno do par de imagens, devido a no exigncia
de preciso e ao fato de permitir trabalhar somente com uma cmera, o que preserva os
mesmos ajustes pticos em ambas as fotos.
Como alternativa a no utilizao da restrio epipolar (que permite uma busca 1D) ser
necessria uma procura mais sofisticada que exigir maior tempo de execuo. realizada
uma busca 2D numa regio de maior probabilidade de encontrar a correspondncia, uma vez
selecionado o ponto na imagem da esquerda definida uma janela de procura na imagem da
direita.
Nesta procura o volume de dados a serem tratados aumenta drasticamente. Se para um
valor de disparidade mxima de 10 pixels for feita a procura por correspondncia em cinco
linhas iremos varrer 50 pixels que 5 vezes mais que no processo normal, no esquecendo
que para cada pixel existe um conjunto de clculos que envolvem sua vizinhana.
A abordagem de procura 2D usada neste trabalho no deixa de considerar que a
disparidade horizontal, o fato de procurar a correspondncia em outras linhas somente
considera que houve trs possveis efeitos, causados pela falta de rigidez na calibragem fsica
da(s) cmera(s) durante o processo de obteno das imagens:
Deslocamento de linha Uma possvel linha horizontal que na imagem da esquerda estaria
na linha 12 na imagem da direita encontrada na linha 15;
Rotao da cmera Uma possvel linha horizontal que na imagem da esquerda estaria na
linha 12 na imagem da direita comea na linha 10 passa pela 11, 12 e termina na linha 14;
Distores na lente Uma possvel linha horizontal que na imagem da esquerda estaria na
linha 12 na imagem da direita comea na linha 14 sobe para linha 13 vai at a 12 e depois
volta para 13 e por fim na 14.
A procura 2D no resolve a distoro causada por fotos tiradas por cmeras no paralelas.
5 Operador Gradiente
1 0 -1 1 2 1
2 0 -2 0 0 0
1 0 -1 -1 -2 -1
6 Reconstruo 3D
Uma vez construdo o mapa de disparidades realizada a criao de uma malha 3D aberta,
supondo uma malha uniforme com 64 vrtices em X, 64 vrtices em Y e um mapa de
disparidades com 320x200, logo h uma relao entre 64 vrtices distribudos uniformemente
pelos 320 pixels horizontais e outros 64 para os 200 pixels verticais. Onde o Z da malha ser
definido pelo valor mximo da disparidade menos a disparidade do pixel do mapa de
disparidades mais prximo do vrtice em questo, lembrando que a disparidade
inversamente proporcional profundidade, veja os resultados deste processo na figura 7.
(a) (b)
7 Resultados
Os resultados obtidos com a Tcnica das Faixas, com a Procura 2D e com o Operador
Gradiente so apresentados, nesta seo.
0,8
Consumo de Memria (GB)
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0
00
00
00
00
00
00
0
0
10
30
48
70
30
50
90
10
70
90
30
50
90
14 90
7
3x
0x
0x
3x
x1
x1
x1
x1
x1
x2
x2
x2
x2
x2
x3
x3
x3
x3
x3
x
00
13
40
64
93
66
33
00
66
33
00
66
33
00
66
33
00
66
33
00
12
17
20
22
25
28
30
33
36
38
41
44
46
49
52
Resoluo
Figura 8:Consumo de memria para tcnica das faixas versus resoluo, para busca 1D.
7.2 Resultados da Procura 2D
A figura 9 apresenta no alto uma referncia [4] para a produo do mapa de disparidades
usando as imagens de entrada originais e realizando uma busca 1D. Abaixo cada tipo de
distoro e o mapa de disparidades gerado tanto para a busca 1D quanto para a busca 2D, fica
claro que a busca 1D sofre muito com as distores simuladas, mas a busca 2D trata muito
bem as distores.
8 Concluses
Referncias
[1] Scharstein, Daniel & Szeliski, Richard. A taxonomy and evaluation of dense two-frame
stereo correspondence algorithms. International Journal of Computer Vision,
47(1/2/3):7-42, April-June 2002.
[2] Scharstein, Daniel. View Synthesis Using Stereo Vision. Springer, 1999.
[3] Gonzalez, Rafael C. & Woods, Richard E. Processamento de Imagens Digitais. Editora
Edgard Blcher Ltda, 2000.
[4] Scharstein, Daniel & Szeliski, Richard. High-accuracy stereo depth maps using structured
light. IEEE Computer Society Conference on Computer Vision and Pattern
Recognition (CVPR 2003), volume 1, pages 195-202, Madison, WI, June 2003.